Sur la possibilité de l'interprétation assistée par ordinateur
(1)de Geoffrey Rockwell
Université McMaster (Hamilton, Canada)
La machine peut-elle générer une interprétation textuelle? Dans un message envoyé à la liste de discussion Humanist, Willard McCarty se demandait quelles peuvent être les grandes questions de l'informatique dans les sciences humaines (2). Si l'on considère la question de McCarty comme la première des grandes questions, les réflexions qui suivent se veulent l'élaboration de la deuxième question: est-il possible de créer une machine qui pourrait interpréter automatiquement des textes? En guise de réponse, le présent article se propose de décrire formellement le problème et d'explorer quelques jeux qui pourront nous en apprendre davantage sur l'interprétation.
Pour ce qui suit, je définirai le mot langage tel qu'on le définit en informatique, c'est-à-dire comme un ensemble de chaînes valides générées à partir d'un jeu de caractères. Étant donné le jeu de caractères Sigma (l'alphabet) et les règles pour générer des chaînes valides de ce jeu de caractères, il est possible de construire un mécanisme qui saurait reconnaître si une chaîne quelconque est un élément du langage.
Un tel langage formel n'est pas nécessairement un langage humain. Les langages humains ne se réduisent pas à l'alphabet et aux règles. Cependant, il est possible, étant donné l'alphabet d'un langage humain et les règles convenables, de créer un langage formel modèle qui serait au moins le sous-ensemble d'un langage humain. Autrement dit, toutes les chaînes générées selon les règles de cet alphabet seraient reconnaissables comme des chaînes du langage humain, même si le langage humain comprend bien d'autres chaînes qu'on ne pourrait pas générer avec ces règles. Les règles de génération de chaînes valides représentent la grammaire du langage. Avec cette grammaire, il est possible d'écrire un algorithme pour reconnaître les chaînes qui sont des éléments du langage. Avec cet algorithme, il est possible, du moins en principe, de créer une machine pour reconnaître des chaînes valides.
Il y a un autre type d'algorithme qui, si l'on lui fournit une chaîne valide (une expression valide du langage), peut générer une autre chaîne valide de ce langage. Aux machines qui exécutent ce type d'algorithme, je donnerai le nom de «moteurs de transformation textuelle» (MoTT). Un MoTT utilise une chaîne du langage comme donnée pour générer une autre chaîne du langage selon des règles de transformation:
Chaîne originale > MoTT > Chaîne transformée
De l'ensemble des MoTT, il existe un sous-ensemble de moteurs qui peuvent générer une chaîne qui serait reconnue comme une «interprétation» de la chaîne originale. À de tels moteurs, je donnerai le nom de MaMI ou de «machine de méta-interprétation». Aux moteurs capables d'interpréter n'importe quel texte, je donnerai le nom de «méta» machine. (Il est également possible d'imaginer des machines qui n'interpréteraient que des textes particuliers. À ces machines, je donnerais le nom de MaIL ou de «machine d'interprétation limitée».)
Il s'ensuit que le problème des machines d'interprétation se rapporte au problème de l'existence possible des MaMI. L'approche pragmatique s'interrogerait sur les outils qui existent déjà: s'il y a des machines qui produisent déjà quelque chose comme l'interprétation d'un texte (MaIL), ne pourraient-elles pas interpréter tout texte raisonnable (MaMI)? Le problème de l'approche pragmatique est qu'une vraie MaMI doit pouvoir produire, de manière fiable, une interprétation pour n'importe quelle chaîne valide; le fait qu'une machine génère des interprétations intéressantes pour une chaîne ne veut pas dire que cette machine produira de manière fiable des interprétations intéressantes pour tout texte de tous les temps. Comment prouver qu'une candidate MaMI pourrait traiter tout texte, y compris ceux qui n'ont pas encore été écrits, comme une interprétation de la même sorte que la MaMI produira quand elle sera mise à l'épreuve?

Encore faudra-t-il décider comment déterminer si une donnée de sortie est une interprétation ou, qui plus est, une interprétation intéressante. Si l'on définit l'interprétation comme activité humaine, nulle machine ne pourrait être, par définition, une MaMI. Inutile de viser plus haut que des MoTT. Au fond, c'est le problème auquel Turing a fait face quand il s'est posé la question de l'intelligence artificielle (IA) (3). À la manière de Turing, je contournerai le problème de ce qu'est une interprétation par le biais d'un jeu. J'appellerai ce jeu le test de Galatea d'après Galatea 2.2 de Richard Powers, roman dans lequel un romancier et un informaticien créent une IA qui sait répondre à des questions littéraires formulées pour les étudiants de maîtrise (4). Voici le test de Galatea:
a. On choisit un juge qui se dit capable de reconnaître des interprétations. Ce juge est lié à un interprète humain ainsi qu'à une machine d'interprétation par un terminal ou bien par un autre système qui garantit que le juge ne saura rien de son/sa interlocuteur/trice.
b. Pour commencer le tour, le juge soumet une chaîne valide (définie comme élément du langage L généré par le jeu de caractères Sigma selon la grammaire G) aux deux interprètes. Si l'on voulait simplifier les choses, on pourrait également définir la chaîne valide comme une œuvre littéraire ou poétique qui a déjà été l'objet d'interprétation.
c. Les deux interprètes préparent une interprétation qui est rendue simultanément au juge quand les deux sont prêts.
d. Le juge indique quelle interprétation vient, selon lui, de l'interprète humain (et, du même coup, laquelle vient de la machine d'interprétation ou de la candidate MaMI.)
e. Si, après un certain nombre de tours (étapes b-d), le juge devine correctement cinquante pour cent du temps ou moins, on peut dire que, dans le cas de ce juge et des textes qu'il a utilisés, la machine d'interprétation a réussi le test de Galatea. De même, on peut dire que la machine d'interprétation est, du moins provisoirement, une MaMI.
Si l'on connaît bien le test de Turing ainsi que ses critiques, on émettra sans doute quelques objections à ce jeu:
1. Tout d'abord, le test ne dit pas si la MaMI interprète le texte comme l'être humain interpréterait le texte, peu importe que le résultat soit le même ou pas. En effet, il est fort probable que la réussite de la MaMI dépendrait du moins en partie de techniques non humaines (pensons au cas de Deep Blue et de son jeu aux échecs) qui exploitent le calcul à force brute ou une vaste collection de tactiques amusantes d'interprétation. Tout au plus, il serait question de simuler l'interprétation (l'acte), il ne serait pas question de l'acte lui-même. (Voir, entre autres, le paradoxe de la chambre chinoise chez Searle et les problèmes de la connaissance.)
À une telle objection, je répondrais qu'il n'est pas question de l'acte d'interprétation ici mais de l'interprétation comme résultat, et de la machine comme génératrice possible d'interprétations. L'objectif du test de Galatea est de voir s'il est possible de créer une machine qui peut produire des interprétations (données de sortie) qu'on ne saurait distinguer des interprétations faites par des êtres humains.
2. La deuxième objection qu'on pourrait faire au test est qu'il passe à côté du problème. Comme le signale Alan Key, on ne veut pas automatiser ce qu'on aime faire; on veut automatiser ce qu'on ne peut pas faire ou ce qu'on n'aime pas faire. En général, on aime faire de l'interprétation (sauf l'étudiant de premier cycle qui fait face à une date-limite), mais le test ne dit rien de ce qui devrait nous intéresser, à savoir la possibilité de créer des MaMI qui aideraient à traiter les parties ennuyeuses de l'interprétation ou qui généreraient des interprétations que l'être humain ne pourrait pas générer. Cela soulève la question suivante: serait-il même possible de distinguer une interprétation non humaine en tant qu'interprétation plutôt que «bruit» de machine? Le problème de la machine d'interprétation implique ainsi le paradoxe de ne pas pouvoir reconnaître l'interprétation artificielle générée par une MaMI. Autrement dit, il est possible que les vraies MaMI ne soient pas des mimes de l'interprétation humaine (5).
À cette deuxième objection, je répondrais que de tenter de simuler la richesse de l'interprétation humaine mène à une meilleure compréhension de ce que les machines peuvent faire et de ce qu'on ne veut pas qu'elles fassent. Le test de Galatea cherche à répondre à la question de départ: les MaMI sont-elles possibles? À mon avis, cette question retient tout son intérêt même si les machines qui en résultent ne sont pas intéressantes. En outre, il est fort probable que l'être humain, s'il réussit à créer une MaMI, inventera de nouvelles méthodes d'interprétation qui ne peuvent pas être simulées, du moins pas par la MaMI qui vient d'être créée. Imaginez ce que deviendrait l'interprétation humaine si l'on réussissait? Dommage: il faudrait renvoyer tous les critiques littéraires.
3. Le troisième problème du test tient à ses limites. Il n'est pas difficile d'imaginer des langages et des interprétations où il y a des gestes, des images graphiques et ainsi de suite, que le test ne pourrait donc pas traiter. Le test de Galatea, tout comme le test de Turing, privilégie le texte linguistique et l'interprétation textuelle, et en particulier, le texte écrit dans un langage formel tel que défini en toute simplicité au début du présent travail. Quoi qu'il en soit, cette limite n'est pas déraisonnable, du moins pas pour l'instant, car nous cherchons à déterminer s'il existe une MaMI pour un langage ainsi défini. Par ailleurs, je crois qu'il est possible de modifier le test pour qu'il comprenne des définitions plus larges du langage et du texte mais à quelques conditions près: il faut encore pouvoir spécifier formellement le langage, d'une part, et d'autre part, il faut encore pouvoir isoler le juge de sorte qu'il ne juge l'artificialité des interprètes que par la nature des interprétations générées dans le langage en question. Enfin, il n'y a pas de raison a priori de croire qu'il serait plus difficile de créer des MaMI robotiques capables de traiter et de générer des gestes à l'intérieur d'une interprétation, que de créer des MaMI textuelles.
4. Le problème le plus important du test est qu'il est peu probable qu'on ait quelque chose qui ressemble à une MaMI performante avant bien des années encore, voire jamais. Alors que la communauté de chercheurs en IA semble supporter, avec un brin d'amusement, voire de résignation, le test de Turing et sa forme limitée, le prix Loebner, l'intérêt pour le test de Galatea chez les chercheurs en sciences humaines risque de disparaître rapidement jusqu'à ce que le problème ne soit plus qu'un parmi d'autres dans une vieille pile de banalités poussiéreuses. Une autre manière d'articuler ce problème est de le voir comme une variante de l'objection 2: le test de Galatea établit un modèle si difficile à atteindre que, si l'on prend le test au sérieux, il est peu probable qu'il suscite une recherche intéressante en informatique dans les sciences humaines, que le problème soit fondamental ou pas. Une solution serait d'offrir de l'argent, comme l'a fait Loebner, pour la première MaMI performante. (Conforme à l'esprit des sciences humaines, j'offrirais plutôt une copie des œuvres complètes de Platon.) Une autre solution serait d'imaginer des versions limitées du test qui pourraient contribuer à des projets de recherche dans un proche avenir.
Mais du moins la machine peut-elle générer des aides à l'interprétation? Si l'on n'a pas besoin d'ordinateurs pour faire ce qu'on aime faire et que l'interprétation est quelque chose qu'on aime faire, on peut passer à une forme réduite du problème: y a-t-il des machines qui peuvent aider à l'interprétation? De telles machines ne généreraient pas d'interprétations; elles généreraient des aides d'interprétation. L'exemple évident serait le concordancier qui produirait, à partir d'un texte, une concordance dont l'être humain pourrait se servir pour interpréter le texte original. Mettant de côté la question de ce qui distingue l'aide d'interprétation et l'interprétation elle-même, on constate que les aides, que j'appellerai des Aides-MaMI, sont plus près en principe de ce dont on devrait se contenter, mais elles sont plus difficiles à tester car leur capacité à aider à l'interprétation est également une question d'interprétation. La version limitée du test de Galatea où le juge aurait à identifier des aides d'interprétation générées par l'être humain et des aides générées par la machine serait difficile à réaliser parce que quelque chose pourrait être une vraie aide à l'interprétation mais être clairement généré par l'ordinateur. Par contre, on pourrait imaginer un test à double volet qui serait plus complexe que cette dernière version limitée. Voici la description de ce test, que j'appellerai le test de Busa, d'après Roberto Busa, un des pionniers de l'informatique dans les sciences humaines et des concordances informatisées (6):
a. On choisit un juge qui se dit capable de reconnaître des interprétations. Le juge choisit un nombre de textes à être interprétés.
b. Deux équipes d'interprétation sont établies. L'équipe A se compose d'un interprète humain AH et d'une aide humaine à l'interprétation AAH, alors que l'équipe B se compose d'un interprète humain BH et une machine d'aide à l'interprétation BMA. Les deux interprètes humains ne devraient pas déjà connaître les chaînes textuelles que le juge choisit pour l'interprétation.
c. Pour commencer le tour, le juge soumet une chaîne valide et une question d'interprétation aux deux aides (AAH et BMA). La question et le texte valide peuvent être traités comme un seul texte à deux parties.
d. Les deux aides génèrent une aide d'interprétation qui prend la forme de la question originale suivie d'un texte qui devrait aider les interprètes. Les aides ne peuvent inclure qu'une partie de la chaîne valide dans sa forme originale. Quand les deux aides sont générées, elles sont rendues simultanément aux deux interprètes (AH et BH). Il est à noter que la chaîne textuelle de départ n'est pas donnée aux interprètes.
e. Les deux interprètes ont un temps limité pour générer une interprétation qui répond à la question d'interprétation tout en utilisant les aides reçues. Les deux interprétations sont rendues simultanément au juge.
f. Le juge indique quelle interprétation vient, d'après lui, de l'interprète qui a été aidé par l'être humain.
e. Si le juge devine correctement cinquante pour cent du temps ou moins, après un certain nombre de tours (étapes b-f pendant lesquelles les interprètes changent d'aide), on peut dire que, dans le cas de ce juge, de ces textes, de ces questions et de ces interprètes humains, la machine a réussi le test de Busa. De même, on peut dire que la machine d'aide est provisoirement une Aide-MaMI.
Pour formaliser ce test, il faut encore mettre au point certains de ses éléments, comme le nombre de tours et la quantité de texte original que l'aide peut extraire. Pour ma part, je suggère qu'on joue d'abord le test pour déterminer le nombre optimal de règles, vu la complexité du doublement. Ce n'est qu'ainsi qu'on pourra utiliser le test pour déterminer s'il y a des Aides-MaMI. Conçu comme tel, le test de Busa devrait plutôt s'appeler le jeu de Busa. Après tout, de tels jeux dialogiques ont une longue tradition dans les sciences humaines sous la rubrique de méthodologie.
Le grand mérite du jeu est qu'on peut le jouer avec des outils d'analyse de texte qui existent déjà et qu'on peut apprendre des choses de l'interprétation et des outils d'interprétation au cours du jeu. À ce moment dans l'évolution de la discipline, on peut déjà commencer à faire des progrès avec des Aides-MaMI. Enfin, ce jeu, même s'il ne représente qu'une expérience intellectuelle, va au fond de ce qui importe le plus aux chercheurs en informatique dans les sciences humaines: l'ordinateur peut-il nous aider à comprendre notre propre histoire textuelle?
Comment procéder pour développer une candidate d'Aide-MaMI? Une première possibilité serait de commencer par ce qu'on sait déjà de la reconnaissance et du traitement des expressions régulières. La dernière partie du présent article se veut une proposition pour la mise en place des travaux en collaboration sur la construction et la comparaison des Aides-MaMI.
À l'intérieur de la plupart des langages de traitement de texte, comme Perl, Python et Ruby, il y a déjà la capacité de reconnaître et de manipuler des expressions régulières. En utilisant une syntaxe standard (qui est intégrée dans des langages de programmation très différents et qui représente par là même une forme de méta-langage) pour décrire une expression régulière, on peut décrire des régularités qui sont à reconnaître et à traiter. Les expressions régulières sont en effet une façon de décrire les régularités d'éléments de différents ensembles pour le travail de filtrage et de traitement. Elles peuvent également servir de manière proactive en fournissant la grammaire d'un langage «régulier». Dans ce cas-ci, les expressions régulières représentent en quelque sorte les règles des chaînes valides d'un langage généré à partir d'un certain jeu de caractères. Les langages qui sont définis de par des expressions régulières sont des langages «réguliers» et ils ont déjà été l'objet de recherche chez plusieurs linguistes et informaticiens.
En ce qui nous concerne, il est important que toute candidate d'Aide-MaMI soit capable d'accomplir les tâches suivantes:
1. Analyser le texte. Typiquement, l'Aide-MaMI aura à reconnaître des régularités complexes dans le texte complet. Il est possible que cette étape se compose de plusieurs petites étapes qui divisent d'abord le texte en parties (balisage) et puis qui reconnaissent des parties en utilisant les règles du langage. Les étapes de division et de filtrage peuvent toutes les deux être décrites en termes d'expressions régulières. Quelque chose d'aussi simple que la division du texte en lignes se réduit même à la reconnaissance des sauts de ligne.
2. Synthétiser une aide. Une fois que le texte est analysé, la candidate d'Aide-MaMI devrait synthétiser un nouveau texte qui servira d'aide d'interprétation. La synthèse peut intégrer, comme dans le cas de la concordance, le remontage de certaines parties du texte original dans un nouveau texte, mais elle peut également intégrer des techniques de génération plus sophistiquées ou tout simplement une énorme bibliothèque de remarques drôles pour n'importe quelle donnée d'entrée. Les expressions régulières telles qu'elles sont appliquées dans la plupart des langages de traitement de texte peuvent faire plus que reconnaître des régularités; elles peuvent également les manipuler. Puisqu'on a appliqué la syntaxe d'expressions régulières de GREP à la plupart des langues modernes, il est possible de spécifier non seulement ce qu'il faut chercher mais aussi ce qu'il faut faire avec la chose cherchée - autrement dit, comment synthétiser du nouveau avec ce qu'on a trouvé.
Pour résumer, il est possible de décrire, avec des langages d'expressions régulières, une classe de mécanismes qui analysent et synthétisent un nouveau texte à partir du texte original. Si l'on appelle toute machine qui utilise des expressions régulières pour traiter des données une MaMER (machine à méta-expression régulière), il existe un sous-ensemble de MaMER qui croise l'ensemble d'Aides-MaMI et qui s'appelle des Aides-MaMER (aides de machine à méta-expression régulière). En plus d'être un mélange de l'humain et de l'autre (7), l'Aide-MaMER serait une machine qui utilise des expressions régulières pour analyser et synthétiser des textes afin de nous aider dans l'interprétation. Même si ce n'est qu'un modèle parmi d'autres pour la création d'Aides-MaMI ou de MaMI, l'Aide-MaMER est un modèle accessible fondé sur ce qui est en effet la norme dans les langages de programmation pour la reconnaissance de régularités. Les expressions régulières ont d'ailleurs le grand avantage qu'on puisse les comparer d'une application à l'autre, les échanger dans des applications différentes, et les entourer de code qui traite l'interface et les données d'entrée. Enfin, le traitement d'expressions régulières est supporté par des outils et des langages de programmation standards ainsi que par de nombreux outils gratuits.
Pendant des discussions au ACH/ALLC (l'Association for Literary and Linguistic Computing et l'Association for Computers in the Humanities), Mark Olsen m'a demandé à plusieurs reprises de montrer que la recherche en informatique dans les sciences humaines a contribué aux autres disciplines. Au cours des années, il est passé de l'argument que l'informatique ne sert qu'à la recherche sur des corpus textuels, à l'idée que même là, il est douteux qu'on puisse obtenir des résultats utiles de la machine. Le présent article décrit deux tests formels qui explorent la possibilité de créer des machines qui produisent des interprétations, ce qui me semble être le problème au cœur du défi que Olsen nous lance. Ma réponse est qu'il faut pouvoir créer des machines qui aident à interpréter des données textuelles si l'on veut relever le défi de créer des machines qui produisent des interprétations significatives,
Je ne suis pas aussi déçu que Mark Olsen de l'informatique dans les sciences humaines parce qu'il m'importe peu de générer des résultats intéressants pour d'autres disciplines - à quoi bon si elles ne s'y intéressent même pas? L'informatique dans les sciences humaines représente sa propre discipline avec ses propres problèmes (comme celui qu'explore le présent article) que nous n'avons commencé à articuler en opposition avec des problèmes d'autres domaines que tout récemment. Ce qui importe à notre discipline, c'est de pouvoir poser des questions qui sont uniques à l'informatique dans les sciences humaines, des questions qui nous intéressent et autour desquelles nous pouvons nous réunir en tant que communauté de recherche. Voilà ce qu'est la véritable discipline de l'informatique dans les sciences humaines et voilà comment cette discipline pourrait servir d'inspiration à d'autres disciplines au lieu de servir de servante. Il ne faut pas que la recherche au cœur de l'informatique dans les sciences humaines soit utile aux autres disciplines; il faut qu'elle se concentre sur ce que c'est qu'être humain tout en étant rehaussé par des machines, sur ce que c'est que s'alimenter au sein des MaMI et des MaMER.
Alors, quels sont les autres problèmes de l'informatique dans les sciences humaines?
Notes
1 - Cet article est une traduction de «MIMes and MeRMAids: On the possibility of computer-aided interpretation» réalisée par Stéphanie Posthumus.
2 - L'appel paraît dans un message de Humanist. Voir http://lists.village.virginia.edu/lists_archive/Humanist/v15/0010.html , consulté le 22 novembre 2002 [ce qui suit est traduit de l'original en anglais].
Date: Jeudi le 10 mai 2002 06:57:57 +0100
De: Willard McCarty <willard.mccarty@kcl.ac.uk>
Objet: cadeaux de fête
Chers-ères Collègues:
Merci beaucoup des souhaits d'anniversaire de la part de tous. Je ne connais qu'une seule personne qui orchestre ses propres cadeaux de fête mais la stratégie semble bien marcher, alors j'ai décidé de suivre son exemple. Puis-je donc suggérer que vous envoyiez à Humanist une question ou bien l'explication d'un problème qui porte sur l'informatique dans les sciences humaines et qui vous préoccupe le plus? Une sorte de piqûre cérébrale qui vous agace quand vous tentez de suivre votre chemin intellectuel. Cadeau merveilleux pour Humanist.
Bien à vous,
WM
3 - Turing, Alan, «Computing Machinery
and Intelligence», Mind 59.236 (1950), p. 433-460. Repris dans Turing,
Alan, «Computing Machinery and Intelligence», Mind Design II: Philosophy,
Pyschology, Artificial Intelligence, éd. John Hauggeland, Cambridge,
Massachusetts, MIT Press, 1997, p. 28-56. On peut également trouver des
versions de l'article en ligne. Voir, entre autres, le site
http://www.loebner.net/Prizef/TuringArticle.html , consulté le 22 novembre
2002. On peut trouver la photo de Turing reproduite ici à l'adresse suivante:
http://www.turing.org.uk/turing/scrapbook/test.html
4 - Powers, Richard, Galatea 2.2, New York, Harper Perennial, 1996.
5 - Note de la traductrice: Malheureusement, le jeu de mots dans cette phrase disparaît au cours de la traduction. Dans le texte original, une MaMI s'appelle une MIMe (Meta-Interpretation Machine), ce qui donne la phrase suivante: «In other words, true MIMes may not be mimics».
6 - Busa, Roberto, «The Annals of Humanities Computing: The Index Thomisticus», Computers and the Humanities, 14.2 (1980), p. 83-90.
7 - Note de la traductrice: En anglais, l'acronyme de MaMER est MeREMe (Meta-Regular Expression Machine), ce qui donne MeRMAides (Meta-Regular expression Machine Aides) pour l'aide de la MeREMe. Dans le texte original, l'auteur décrit les MeRMAides (sirènes) comme des êtres hybrides ou monstrueux où se combinent l'humain et l'autre.
2003
Voir dans l'encyclopédie de l'Astrolabe:
La Méthode
informatisée d’analyse de discours «Alceste»