Wikipédia:Traduction automatique

(Redirigé depuis Wikipédia:TA)

Un traducteur automatique est un logiciel, souvent accessible en ligne, tel que Babelfish, DeepL, Google Translate, Promt, Reverso, Systranetc. qui est annoncé comme pouvant traduire un texte d'une langue de départ indiquée à une autre langue. Ces logiciels peuvent être des outils excellents quand ils sont utilisés par des traducteurs qualifiés qui savent exactement ce qu'on peut attendre d'eux ; il ne saurait donc être question de considérer cette page comme une critique, voire comme une condamnation, de cette utile et intéressante innovation : il s'agit seulement de mettre en garde les amateurs. Rien ne leur interdit de se servir des traductions automatiques pour des travaux personnels qui ne prêtent pas à conséquence, par contre un usage dans un but aux enjeux plus sérieux tel que la rédaction d'un article encyclopédique destiné à être lu par une large audience est plus délicat et requière du soin, de la méthode, et une certaine patience.

Avantages escomptés

  • Faire figurer le même article rapidement dans un grand nombre d'éditions linguistiques de Wikipédia :
  •   Non, en général, une telle entreprise d'ajout massif du même sujet à travers plusieurs Wikipédia est considérée comme du spam trans-wiki ;
  • « Combler le retard » de la Wikipédia en français en créant aisément les articles qui lui manquent et existent dans d'autres langues
  •   Non, ajouter des entrées dont le contenu est de qualité médiocre, voire nulle, n'enrichit pas la Wikipédia en français.

Inconvénients

L'utilisation d'un traducteur automatique donne le plus souvent un résultat tout à fait artificiel et non idiomatique dans la langue d'arrivée. Pour certaines langues de départ, par exemple l'allemand, où la phrase se construit avec une partie du groupe verbal rejeté à la fin, le résultat peut être totalement incompréhensible.

Le logiciel ne tient pas compte du contexte pour traduire un mot, ce qui peut résulter en des faux-sens ou des contresens flagrants. Lorsque des noms propres sont concernés, le résultat est souvent hilarant et/ou désolant[1],[2].

Une traduction automatique n'est généralement même pas une ébauche ou un point de départ acceptable : un traducteur humain aura moins de difficulté à traduire directement qu'à essayer de corriger une traduction automatique déficiente. Cette traduction automatique n'est donc pas « un premier pas » vers un nouvel article, mais au contraire un recul par rapport à la création d'un article constitué d'une simple phrase d'introduction et d'un lien interlangue.

Exemple

  • L'expression italienne « al primo piano » sera traduite en « au premier doucement » par un traducteur automatique alors qu'elle signifie « au premier plan » ou « au premier étage ».

L'anglais, langue-pont

La force de Google traduction, qui est en même temps son talon d'Achille, est le grand nombre de langues entre lesquelles elle permet de traduire, réalisant ainsi des combinaisons dont aucun logiciel sur le marché n'est capable : il est ainsi possible de traduire en croate un texte estonien. Le problème est qu'il aurait fallu plus de cinq mille équipes de spécialistes, parfois difficiles à trouver (tagalog-turc, par exemple), pour procéder à des traductions directes. On a donc eu recours à l'anglais comme langue-pont avec les risques d'erreur qui se multiplient à l'occasion de deux traductions successives. C'est ainsi qu'une phrase espagnole comme « Mi hermano podía venir » est correctement rendue en français par « Mon frère pouvait venir », que ce soit par Promt, par Reverso ou par Systran ; mais Google nous donne « Mon frère pourrait venir ». C'est que la phrase a dû faire le tour par l'anglais où elle est devenue « My brother could come », et l'on sait que « could » veut dire à la fois « pouvait » et « pourrait » ; obligé de choisir entre les deux, Google a opté pour le sens le plus fréquent… qui en l'occurrence ne convient pas. L'erreur se retrouve même entre deux langues voisines puisqu'on nous donne en portugais « Meu irmão poderia vir », avec « poderia » au lieu de « podia ».

Voilà qui explique pourquoi un « Giovanni » est traduit par « John » ; c'est encore plus gênant quand on soumet « Accademia della Crusca » : l'expression devient dans notre langue « Académie de Bran », c'est-à-dire « Académie de M... ». Qu'ont fait les membres d'un si illustre aréopage pour se retrouver ainsi embrenés ? Tout simplement « crusca » veut dire « son » en italien, le mot devient « bran » en anglais (pensez aux « Kellogg's All-bran ») et revient sous cette forme dans notre langue sans qu'on se dise que, dans le parler vulgaire, il a pris un bien vilain sens.

À partir du moment où, dans un texte traduit d'une autre langue que l'anglais, on trouve un mot anglais qui n'a rien à y faire, il est quasi-certain qu'il y a eu une traduction automatique.

Nous lisons en allemand : « Bekannt wurde Wallertheim durch archäologische Funde aus der Steinzeit und Keltenzeit » et la « traduction » française est (au 6 mars 2010) : « Wallertheim était connu à travers les découvertes archéologiques de l'âge de la pierre et le Celtic ère ». Ce « était connu » nous étonne puisque Wallertheim est renommé depuis relativement peu de temps et l'est toujours. Le passage par l'anglais nous explique ce mystère puisque l'allemand possède deux verbes « être », « sein » et « werden », mais que l'anglais, qui ne distingue pas entre ces deux nuances, les traduit uniformément par « to be » et Google a donc proposé : « Wallertheim was known through archaeological finds from the Stone Age and Celtic era » d'où le texte en français, alors qu'il aurait fallu écrire : « Wallertheim s'est fait connaître par des découvertes archéologiques de l'âge de pierre et du temps des Celtes » ou « La réputation de Wallertheim lui vient, etc. » C'est évident pour un traducteur humain, mais la machine n'en est pas encore capable.

Un espérantiste a fait remarquer[3] que, par l'ambiguïté de ses expressions, l'anglais est la langue qui se prête le moins à jouer le rôle de langue-pont. Que signifient au juste des phrases comme :

  • « Do british people drive on the right side ? » (conduire à droite ou conduire du bon côté ?)
  • « Free speech and free beer » (« free » veut dire « libre » ou « gratuit », selon le cas)
  • « Join the human race ! » (Demande-t-on de rejoindre la race humaine ou de participer à une course, ce qui était d'ailleurs le cas ?)

Avec Google c'est une catastrophe :

  • « Les Britanniques conduisent-ils du bon côté? »
  • « Discours libre et bière gratuite »
  • « Rejoignez la race humaine! »

Promt est à peine meilleur :

  • « Les gens britanniques conduisent-ils sur le côté juste ? »
  • « Liberté d'expression et bière libre »
  • « Rejoignez la race humaine! »

Systran s'en tire le mieux :

  • « Le peuple anglais conduit-il du côté droit ? »
  • « Liberté de parole et bière gratuite »
  • « Joindre la race humaine ! »

Reverso a l'avantage de signaler les ambiguïtés possibles et de proposer des nuances et des sens alternatifs. Il oblige donc l'humain à faire l'effort de finir la traduction :

  • « Les gens(Le peuple) britanniques conduisent-ils(roulent-ils) sur le côté juste ? »
  • « Liberté d'expression et bière libre(gratuite) »
  • « Joignez(Rejoignez) le genre humain ! »

Mais dans un autre cas, le classement sera différent.

Les contresens

Les non-sens se remarquent facilement et attirent l'attention du relecteur qui doit demander alors une suppression immédiate ; les contresens sont beaucoup plus sournois. Au 6 mars 2010 la phrase « Conard beschäftigt sich mit der frühen Menschheitsentwicklung im eurasischen und südafrikanischen Raum » se voit traduite avec Google par « Conard traite du développement humain au début de l'Eurasie et d'Amérique du Sud région » ; celui qui se contentera de remettre en forme et d'écrire « Conard étudie les débuts du développement de l'humanité en Eurasie et en Amérique du Sud » passera à côté du fait que, pour des raisons mystérieuses, Google a remplacé l'Afrique du Sud par l'Amérique du Sud, ce qui est très grave car dans ce dernier endroit les hommes sont arrivés bien plus tardivement.

Dans l'article néerlandais sur Lilian Baels, la deuxième femme du roi Léopold III, on trouve cette phrase : « Lilian kreeg geen staatsbegrafenis, maar rust - op verzoek van Leopold - naast haar echtgenoot en Koningin Astrid », incompréhensible pour la quasi-totalité des francophones. La traduction Systran donnera : « Lilian a obtenu d'enterrement d'état, mais ne repose pas - à la demande de Léopold - à côté de son conjoint et de la reine Astrid ». On se dira que c'est mal dit mais que c'est très clair : elle a eu droit à des funérailles officielles mais n'a pas été enterrée à côté de son mari, à la demande de celui-ci. C'est exactement le contraire que dit l'article néerlandais : elle n'a pas eu droit à des funérailles officielles mais, à la demande de Léopold, elle a été enterrée à côté de son mari et de la reine Astrid.

Conséquences

Un article créé par traduction automatique d'un article d'une Wikipédia dans une autre langue est souvent supprimé de façon immédiate (selon critère de suppression G1). Si l'article traduit ne provient pas d'une autre Wikipédia et est donc potentiellement protégé par un droit d'auteur incompatible avec ceux de la Wikipédia en français, la suppression doit être systématique (selon critère de suppression G12).

Alternatives viables

Plutôt que d'ajouter une traduction automatique dans un article, il est recommandé de faire cette traduction manuellement. Vous pouvez aussi utiliser l'outil de traduction, qui contient une fonctionnalité de traduction automatisée en contrôlant bien mieux le résultat qu'avec un simple copier/coller depuis un site tiers.

Il est néanmoins possible que vous ne vous en sentiez pas capable. Dans ce cas, si vous avez repéré sur une autre Wikipédia un article qui se prêterait bien à une traduction, vous pouvez toujours demander de l'aide au Projet:Traduction. Ceci peut se faire aisément

  • en ajoutant le modèle {{Suivi de traduction}} sur la page de discussion de l'article que vous souhaitez voir enrichir (puis en suivant les indications),
  • et/ou en contactant un wikitraducteur directement sur sa page de discussion.

Voir aussi

  • {{Traduction automatique}}, un modèle à apposer sur la page de discussion d'un contributeur utilisant un logiciel de traduction automatique pour créer ou augmenter des articles.
  • Wikipédia:Outil de traduction, un outil recommandé pour faciliter la traduction semi-automatisée d'un article de Wikipédia d'une langue dans une autre.

Notes et références

  1. Un exemple parmi tant d'autres : ce diff montre le début de la correction d'une traduction automatique de l'anglais vers le français. C'est quoi, une crique de volonté d'indien ?
  2. Sur un article complet : Wikipédia:Traduction automatique/Exemple
  3. « Quel est le meilleur traducteur en ligne ? »