vendredi 9 décembre 2011

CORRELATION ET CAUSALITE

Je vais être chiant. Vous avez le droit de quitter cette page.

Un article du Monde m’apprend que Claude Bernard a désormais un concurrent : Google. Google a provoqué une révolution épistémologique qui est en train de rendre caduque la méthode hypothético-déductive théorisée par Claude Bernard à partir de sa découverte de la fonction glycogénique du foie.

L’auteur de cette thèse est un mec sérieux et que j’aime bien : Chris Anderson. La thèse est simple : « Avec suffisamment de données, les chiffres parlent d’eux-mêmes ».

Ce n’est pas nouveau et on en a déjà parlé (http://rchabaud.blogspot.com/2011/02/un-et-les-autres.html). C’est juste l’aboutissement de la pensée dominante américaine selon laquelle la technologie est nécessaire et suffisante pour faire avancer la connaissance.

Alors, faisons ce qu’Anderson refuse de faire. Regardons quel est le lieu de parole de l’auteur. Informaticien, Chris Anderson est un spécialiste du e-commerce. Un épicier moderne, un mec qui a passé sa vie à analyser avec pertinence nos comportements commerciaux. De ce savoir purement mercantile, il affirme pouvoir tirer une philosophie et une épistémologie qui vont s’appliquer à tous les domaines du savoir.

C’est dit crûment : « La philosophie fondatrice de Google est que nous ne savons pas pourquoi cette page est mieux que celle-ci : mais si les statistiques des liens entrants disent qu’elle l’est, c’est bien suffisant. Aucune analyse sémantique ou de causalité n’est nécessaire ». Exeunt le sens (la sémantique) et la causalité : la quantité suffit. Dans le commerce, c’est parfaitement exact. Mais ce n’est exact que dans le commerce. Chris Anderson met sur un pied d’égalité Claude Bernard et Aristide Boucicaut. C’est gonflé ! Ceci dit, c’est normal : les épiciers aiment la pensée des épiciers. On appelle ça le poujadisme.

Anderson se met ensuite à dériver : grâce à ses corpus de données, Google peut traduire du klingon en farsi aussi facilement qu’il peut traduire du français en allemand. Rappelons que le klingon est une langue imaginaire utilisée dans Star Trek et que son corpus littéraire est limité. Google peut aider à traduire une notice de tondeuse à gazon, et encore pas très bien. Tous ceux qui ont utilisé les outils de traduction de Google connaissent leur pauvreté et leur médiocrité. Faites le test : essayez de traduire un vers de Shakespeare, vous verrez. Chris Anderson s’en fout : Shakespeare n’est pas un marché et surtout pas un marché publicitaire.

Après, on touche au délire. Anderson utilise l’exemple de Craig Venter lors du séquençage du génome. Américain jusqu’au bout des ongles, Anderson oublie que les techniques de Venter ont été mises au point par Daniel Cohen au Généthon. Américain et moderne : les sources importent peu et les sciences n’ont pas d’histoire. Utilisant les techniques de Cohen, Venter s’est mis en tête de publier toutes les séquences génomiques possibles. C’est en fait assez simple : on utilise des algorithmes pour produire des gènes théoriques dont on ne sait rien et surtout pas s’ils existent. James Watson, le découvreur de l’ADN, affirme qu’un singe pourrait faire ce travail et c’est assez juste. Venter va jusqu’au bout en prétendant que chaque séquence génomique ainsi trouvée par ses machines doit représenter une espèce nouvelle.

Bien entendu, c’est complètement faux. Pour qu’une espèce puisse exister, il ne suffit pas qu’elle ait un génome particulier. Il faut aussi que ce génome lui permette de vivre (condition 1) avec les conditions écologiques dans lesquelles il est apparu (condition 2). Il est certain que des dizaines de milliers de génomes séquencés par Venter sont déjà apparus sur Terre depuis des millions d’années que les gènes mutent, puis ont disparu soit tout bonnement parce que leur combinaison était léthale (condition 1), soit parce qu’ils n’apportaient aucun avantage évolutif dans les conditions écologiques de leur apparition (condition 2). Et donc, on s’en fout. Ils n’ont aucun intérêt en tant que génome c’est à dire en tant que moteur de l’évolution. La base du génome, c’est sa survie puisque sans elle, il ne peut plus muter. Et que, par voie de conséquence, les milliers de génome issus de sa mutation n’apparaîtront pas. Sauf dans la bibliothèque de Venter ce qui suffit à prouver l’inanité de son travail.

Anderson se trompe et un point suffit à le prouver. Voilà des dizaines d’années que les météorologues compilent des milliers de données et les moulinent dans les plus gros ordinateurs disponibles. En trente ans, nous sommes passés de la prévision à trois jours à la prévision à cinq jours, et pas toujours fiable. L’accumulation des données n’a pas permis de mettre en place les modèles pertinents. Pire même : de cette accumulation n’est sorti aucun modèle. Rien ne s’est dégagé. Attendons cependant : si Anderson a raison, ça arrivera peut-être un jour. On reste en droit de douter.

Anderson a raison sur un point : les deux voies de recherche sont inconciliables. On en a parlé six mois avant Le Monde mais on aurait pu en parler plus tôt encore. L’article d’Anderson me donne raison, ce que je craignais. Il n’y aura pas de retour en arrière. La voie décrite par Anderson est la voie de la facilité. On délègue aux machines le soin de tracer les chemins de la réflexion. En écrivant ça, j’ai bien conscience de la dimension morale que j’affecte à la question. La voie de la facilité. C’est du langage de curé. Mais, je n’en ai pas d’autre à ma disposition.

Le conflit est générationnel. James Watson, c’est ma génération. Les gens de ma génération apprécient les outils informatiques mais continuent à réfléchir comme au XIXème siècle. Les jeunes générations s’appuient sur l’outil pour réfléchir. Je peux araser une butte qui gêne ma vue avec une brouette. Je le ferais mieux et plus vite avec un bulldozer. Sauf que la mise en œuvre du bulldozer, son transport sur les lieux, les coûts que cela suppose peuvent rendre économiquement stupide son utilisation. Auquel cas, je peux renoncer à araser la butte. Ce faisant, je soumets une question esthétique (ma vue est gênée) à une contrainte économique. La quantification à outrance n’est rien d’autre que l’affirmation de la primauté de l’économique.

On en a déjà passé les prémices. Il existe une classification des maladies en fonction de leur occurrence. En deçà d’un certain seuil, la maladie est dite « orpheline ». En clair, il n’y a pas assez de malades pour justifier d’un effort économique. Pour les zélateurs d’Anderson, cela signifie qu’il n’y a pas assez de données pour que l’outil soit performant. Ils n’imaginent pas que la maladie orpheline puisse servir de clef à la compréhension de maladies non orphelines.

C’est un conflit générationnel, c’est à dire un conflit de civilisation. La génération Venter veut balayer la génération Watson. Ajoutons que Venter plait à Anderson car il brevète à tour de bras les séquences génomiques découvertes par ses machines. Ce faisant, il est cohérent, fonctionnel et utilitariste. C’est un épicier du vivant comme Anderson est un épicier de l’algorithme.

Anderson nous donne donc deux clés du monde en construction : la première, on la connaissait déjà, c’est l’absolue primauté de l’économique qui est en train d’envahir le dernier territoire préservé, la recherche scientifique. La seconde, c’est le désir de la génération montante d’éradiquer les modes de réflexion de la génération au pouvoir. Conflit parfaitement dialectique et donc marxiste. Rodrigue ne fonctionnait pas autrement et Doubrovsky l’a parfaitement montré.

Mais on a de la chance. En face de ce modèle purement américain, nous avons un modèle contraire, chinois. Même si l’on veut admettre que la Chine n’est pas marxiste, on se doit de souligner deux points. Le premier est que le politique y prime sur l’économique. Le second est que le conflit générationnel n’y existe quasiment pas car la Chine vénère l’âge et l‘expérience. On peut relire Javary pour s’en convaincre. Un troisième point pourrait être l’ancrage dans le réel d’une civilisation dégagée de la religion mais pas de la spiritualité, alors que l’autre, profondément religieuse et fort peu spiritualisée, s’obsède sur le virtuel

Face à face, front contre front, deux modèles de civilisation s’affrontent. Tout les oppose. Laquelle vaincra ? Car ne nous leurrons pas, il s’agit d’une bataille pour la domination du monde.

Les événements les plus récents nous donnent quelques indications. Les armées capitalistes sont bloquées devant le Stalingrad de la crise financière. Les états-majors accumulent les données mais aucune solution ne sort des batteries d’ordinateurs mal programmés. Les enfants d’Anderson s’envoient des statistiques à la figure. Les yield managers lissent des chiffres en espérant que Google fera apparaître la solution et l’enverra sur nos smartphones. Pour y aider, ils vont mettre des bougies devant la photo de Steve Jobs. Bougies livrées avec les Smartphones par les fabricants du Guangdong.

On va bien voir comment ça finira…

Aucun commentaire:

Enregistrer un commentaire