Mes outils de traduction

Vilain texte russe

Même si je me targue de parler plusieurs langues (le français est ma langue maternelle, mon anglais et mon espagnol sont acceptables, je peux comprendre la plus grande part du portugais ou de l’italien, surtout à l’écrit), dans le cadre professionnel, je doit manipuler de nombreuses langues qui me sont inconnues (des commentaires de clients ou de techniciens, transcrits verbatim dans les bases de données de constructeurs automobiles). Cela implique d’être continuellement mis en face de ce qu’il y a de pire en termes de traduction :

  • De nombreux langages simultanément (dont je n’ai que rarement connaisasnce),
  • Des abréviations et des raccourcis, et des descriptions approximatives et/ou techniques de la part de personnes qui ne sont pas toujours familières du champ technique abordé,
  • Des champs de base de données qui ont été sabotés par des méthodes de saisie inappropriées ou des ratés de transferts de texte d’une base de données à la suivante.

Mais il faut admettre que l’équipe avec laquelle je travaille a une excellente connaissance des problèmes techniques décrits (je reste fasciné de voir comment les produits électroniques défaillent continuellement de la même manière).

J’ai donc dû développer un petit processus qui met en oeuvre des outils et des méthodes pour résoudre les principaux problèmes rencontrés. Et j’ai pensé que vous pourriez apprécier de savoir comment.

Texte brut

Le premier problème observable est souvent la présence de texte présenté de manière erronée (toute l’information est là, mais c’est complètement illisible du fait d’erreurs de transcodage. Par exemple, on peut rencontrer du « texte » comme :

Un texte en russe, écrit en UTF-8. Illisible même pour un russe.

Il faudrait comprendre que le texte original saisi par le rédacteur était :

Le même texte russe, en Unicode, compréhensible par quelqu’un qui lit la langue russe.

A l’origine du problème : une mauvaise manipulation informatique d’un texte dit « international » (le texte utilisant des caractères non-latins sont plus complexes à encoder dans un ordinateur qu’avec l’habituel code ASCII 7-bit ANSI qui ne couvre bien que A-à-Z et a-à-z). Plutôt que de pleurer ou de raler, j’ai trouvé le site web Branah.com, qui héberge un excellent convertisseur de n’importe quoi en n’importe quoi, surlequel il suffit de plus ou moins reconnaître l’allure du pseudo-texte pour choisir dans quelle case le mettre, afin de le voir traduit directement (les petits exemples au dessus de chaque boite de saisie sont terriblement pratiques).

Texte UTF-8 copié dans la case correspondante

Traduction express

Ensuite, il reste encore à traduire le texte devenu reconnaissable. Je pourrais demander à un russophone. Mais que faire si chaque ligne est indifféremment en russe en hongrois, en polonais, en slovaque en coréen, en japonais, etc. ? (c’est bien ce que je rencontre même si d’autres langues sont plus courantes). Il y a vraiment intérêt à accélérer ce processus et là intervient Google Traduction.

La traduction n’est pas parfaite (vocabulaire technique) mais parfaitement reconnaissable.

Evidemment, ce n’est pas toujours parfait (même sans compter les cas, où le technicien nous a gentiment fourni un numéro de code comme toute information). Mais c’est pratiquement toujours exploitable, au moins pour une classification rapide (n’oublions pas que je ne suis pas en train d’écrire un roman pour faire concurrence à Dostoïevski).

Quelques astuces pour mieux utiliser Google Traduction

  • Detection automatique de la langue : cette option marche étonnamment bien, même avec quelques mots seulement. Parfois, il se trompe et vous reconnaîtrez l’original par vous-même, mais ça aide beaucoup.
  • Langue cible : bien sûr vous allez préférer votre langue maternelle. Mais n’hésitez pas à consulter les traductions dans les autres langues que vous pouvez éventuellement comprendre. Par exemple, beaucoup de traductions sont meilleures vers l’anglais. Surtout pour des langues relativement peu communes sur Internet.
  • Simplement cliquer sur la traduction proposée fera apparaître d’autres propositions. La machine n’a pas toujours fait le meilleur choix. Vous serez surpris par les autres possibilités.
  • Parfois couper la phrase en plusieurs parties aide le traducteur à s’y retrouver. Tâtonner un peu reste autorisé.
La liste déroulante offre des traductions alternatives, parfois meilleures.

Encore plus étonnant pour le néophyte, n’oubliez pas que si vous fournissez votre propre traduction (pour un mot, pour un bout de phrase que vous avez fini par reconnaître dans votre vocabulaire technique), elle pourrait bien être apprise par Google en quelques jours seulement (le temps de laisser vérifier par les experts qui participent à la communauté qui aide Google). Ca va vous faciliter la vie la semaine prochaine !

Quelques autres options de traduction

Je ne les utilise pas aussi souvent, mais il y a d’autres outils gratuits que vous voudrez peut-être tester plus complètement. Certains sont assez similaires ou aussi performants. Je recommanderais de commencer par :

En termes de conclusion

Même avec les pires textes, notre équipe réussi quotidiennement des prouesses de traductions que nous n’imaginions pas possibles auparavant.

Je suppose que la prochaine étape serait de passer à une solution d’Intelligence Artificielle (qui exploiterait peut-être le travail déjà fourni sur des dizaines de milliers de textes) pour nous aider à aller plus vite encore. Vous avez des idées à me proposer ?

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.