{"id":10101,"date":"2019-10-23T17:22:04","date_gmt":"2019-10-23T15:22:04","guid":{"rendered":"https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/?p=10101"},"modified":"2020-01-09T19:18:13","modified_gmt":"2020-01-09T17:18:13","slug":"mes-outils-de-traduction","status":"publish","type":"post","link":"https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/2019\/10\/23\/mes-outils-de-traduction\/","title":{"rendered":"Mes outils de traduction"},"content":{"rendered":"\n<p>M\u00eame si je me targue de parler plusieurs langues (le fran\u00e7ais est ma langue maternelle, mon anglais et mon espagnol sont acceptables, je peux comprendre la plus grande part du portugais ou de l&rsquo;italien, surtout \u00e0 l&rsquo;\u00e9crit), dans le cadre professionnel, je doit manipuler de nombreuses langues qui me sont inconnues (des commentaires de clients ou de techniciens, transcrits verbatim dans les bases de donn\u00e9es de constructeurs automobiles). Cela implique d&rsquo;\u00eatre continuellement mis en face de ce qu&rsquo;il y a de pire en termes de traduction :<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>De nombreux langages simultan\u00e9ment (dont je n&rsquo;ai que rarement connaisasnce),<\/li><li>Des abr\u00e9viations et des raccourcis, et des descriptions approximatives et\/ou techniques de la part de personnes qui ne sont pas toujours famili\u00e8res du champ technique abord\u00e9,<\/li><li>Des champs de base de donn\u00e9es qui ont \u00e9t\u00e9 <em>sabot\u00e9s<\/em> par des m\u00e9thodes de saisie inappropri\u00e9es ou des rat\u00e9s de transferts de texte d&rsquo;une base de donn\u00e9es \u00e0 la suivante. <\/li><\/ul>\n\n\n\n<p>Mais il faut admettre que l&rsquo;\u00e9quipe avec laquelle je travaille a une excellente connaissance des probl\u00e8mes techniques d\u00e9crits (je reste fascin\u00e9 de voir comment les produits \u00e9lectroniques d\u00e9faillent continuellement de la m\u00eame mani\u00e8re). <\/p>\n\n\n\n<p>J&rsquo;ai donc d\u00fb d\u00e9velopper un petit processus qui met en oeuvre des outils et des m\u00e9thodes pour r\u00e9soudre les principaux probl\u00e8mes rencontr\u00e9s. Et j&rsquo;ai pens\u00e9 que vous pourriez appr\u00e9cier de savoir comment. <\/p>\n\n\n\n<!--more-->\n\n\n\n<h2 class=\"wp-block-heading\">Texte brut<\/h2>\n\n\n\n<p>Le premier probl\u00e8me observable est souvent la pr\u00e9sence de texte pr\u00e9sent\u00e9 de mani\u00e8re erron\u00e9e (toute l&rsquo;information est l\u00e0, mais c&rsquo;est compl\u00e8tement illisible du fait d\u2019erreurs de transcodage. Par exemple, on peut rencontrer du \u00ab\u00a0texte\u00a0\u00bb comme : <\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"403\" height=\"22\" src=\"https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/Russian-UTF8.jpg\" alt=\"\" class=\"wp-image-10137\" srcset=\"https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/Russian-UTF8.jpg 403w, https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/Russian-UTF8-300x16.jpg 300w, https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/Russian-UTF8-150x8.jpg 150w\" sizes=\"auto, (max-width: 403px) 100vw, 403px\" \/><figcaption>Un texte en russe, \u00e9crit en UTF-8. Illisible m\u00eame pour un russe.<\/figcaption><\/figure>\n\n\n\n<p>Il faudrait comprendre que le texte original saisi par le r\u00e9dacteur \u00e9tait :<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"236\" height=\"26\" src=\"https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/Russian-Unicode.jpg\" alt=\"\" class=\"wp-image-10139\" srcset=\"https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/Russian-Unicode.jpg 236w, https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/Russian-Unicode-150x17.jpg 150w\" sizes=\"auto, (max-width: 236px) 100vw, 236px\" \/><figcaption>Le m\u00eame texte russe, en Unicode, compr\u00e9hensible par quelqu&rsquo;un qui lit la langue russe.<\/figcaption><\/figure>\n\n\n\n<p>A l\u2019origine du probl\u00e8me : une mauvaise manipulation informatique d&rsquo;un texte dit \u00ab\u00a0international\u00a0\u00bb (le texte utilisant des caract\u00e8res non-latins sont plus complexes \u00e0 encoder dans un ordinateur qu&rsquo;avec l&rsquo;habituel code ASCII 7-bit ANSI qui ne couvre bien que A-\u00e0-Z et a-\u00e0-z). Plut\u00f4t que de pleurer ou de raler, j&rsquo;ai trouv\u00e9 le site web <a href=\"https:\/\/www.branah.com\/unicode-converter\">Branah.com<\/a>, qui h\u00e9berge <a href=\"https:\/\/www.branah.com\/unicode-converter\">un excellent convertisseur de n&rsquo;importe quoi en n&rsquo;importe quoi<\/a>, surlequel il suffit de plus ou moins reconna\u00eetre l&rsquo;allure du pseudo-texte pour choisir dans quelle case le mettre, afin de le voir traduit directement (les petits exemples au dessus de chaque boite de saisie sont terriblement pratiques).<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"474\" height=\"600\" src=\"https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/branah-screen-copy-474x600.jpg\" alt=\"\" class=\"wp-image-10138\" srcset=\"https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/branah-screen-copy-474x600.jpg 474w, https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/branah-screen-copy-237x300.jpg 237w, https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/branah-screen-copy-119x150.jpg 119w, https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/branah-screen-copy-768x972.jpg 768w, https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/branah-screen-copy.jpg 984w\" sizes=\"auto, (max-width: 474px) 100vw, 474px\" \/><figcaption>Texte UTF-8 copi\u00e9 dans la case correspondante<\/figcaption><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Traduction express<\/h2>\n\n\n\n<p>Ensuite, il reste encore \u00e0 traduire le texte devenu reconnaissable. Je pourrais demander \u00e0 un russophone. Mais que faire si chaque ligne est indiff\u00e9remment en russe en hongrois, en polonais, en slovaque en cor\u00e9en, en japonais, etc. ? (c&rsquo;est bien ce que je rencontre m\u00eame si d&rsquo;autres langues sont plus courantes). Il y a vraiment int\u00e9r\u00eat \u00e0 acc\u00e9l\u00e9rer ce processus et l\u00e0 intervient <a href=\"https:\/\/translate.google.fr\/\">Google Traduction<\/a>. <\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"600\" height=\"370\" src=\"https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/google-translate-francais-600x370.jpg\" alt=\"\" class=\"wp-image-10141\" srcset=\"https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/google-translate-francais-600x370.jpg 600w, https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/google-translate-francais-300x185.jpg 300w, https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/google-translate-francais-150x93.jpg 150w, https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/google-translate-francais-768x474.jpg 768w, https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/google-translate-francais.jpg 1165w\" sizes=\"auto, (max-width: 600px) 100vw, 600px\" \/><figcaption>La traduction n&rsquo;est pas parfaite (vocabulaire technique) mais parfaitement reconnaissable.<\/figcaption><\/figure>\n\n\n\n<p>Evidemment, ce n&rsquo;est pas toujours parfait (m\u00eame sans compter les cas, o\u00f9 le technicien nous a gentiment fourni un num\u00e9ro de code comme toute information). Mais c&rsquo;est pratiquement toujours exploitable, au moins pour une classification rapide (n&rsquo;oublions pas que je ne suis pas en train d&rsquo;\u00e9crire un roman pour faire concurrence \u00e0  <a rel=\"noreferrer noopener\" href=\"https:\/\/fr.wikipedia.org\/wiki\/Fiodor_Dosto%C3%AFevski\" target=\"_blank\">Dosto\u00efevski<\/a>).<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Quelques astuces pour mieux utiliser Google Traduction<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li> Detection automatique de la langue : cette option marche \u00e9tonnamment bien, m\u00eame avec quelques mots seulement. Parfois, il se trompe et vous reconna\u00eetrez l&rsquo;original par vous-m\u00eame, mais \u00e7a aide beaucoup.<\/li><li>Langue cible : bien s\u00fbr vous allez pr\u00e9f\u00e9rer votre langue maternelle. Mais n&rsquo;h\u00e9sitez pas \u00e0 consulter les traductions dans les autres langues que vous pouvez \u00e9ventuellement comprendre. Par exemple, beaucoup de traductions sont meilleures vers l&rsquo;anglais. Surtout pour des langues relativement peu communes sur Internet.<\/li><li>Simplement cliquer sur la traduction propos\u00e9e fera appara\u00eetre d&rsquo;autres propositions. La machine n&rsquo;a pas toujours fait le meilleur choix. Vous serez surpris par les autres possibilit\u00e9s.<\/li><li>Parfois couper la phrase en plusieurs parties aide le traducteur \u00e0 s&rsquo;y retrouver. T\u00e2tonner un peu reste autoris\u00e9.<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"600\" height=\"161\" src=\"https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/translate-options-768x206-600x161.jpg\" alt=\"\" class=\"wp-image-10143\" srcset=\"https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/translate-options-768x206-600x161.jpg 600w, https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/translate-options-768x206-300x80.jpg 300w, https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/translate-options-768x206-150x40.jpg 150w, https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-content\/uploads\/2019\/09\/translate-options-768x206.jpg 768w\" sizes=\"auto, (max-width: 600px) 100vw, 600px\" \/><figcaption>La liste d\u00e9roulante offre des traductions alternatives, parfois meilleures.<\/figcaption><\/figure>\n\n\n\n<p>Encore plus \u00e9tonnant pour le n\u00e9ophyte, n&rsquo;oubliez pas que si vous fournissez votre propre traduction (pour un mot, pour un bout de phrase que vous avez fini par reconna\u00eetre dans votre vocabulaire technique), elle pourrait bien \u00eatre apprise par Google en quelques jours seulement (le temps de laisser v\u00e9rifier par les experts qui participent \u00e0 la communaut\u00e9 qui aide Google). Ca va vous faciliter la vie la semaine prochaine !<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Quelques autres options de traduction<\/h3>\n\n\n\n<p>Je ne les utilise pas aussi souvent, mais il y a d&rsquo;autres outils gratuits que vous  voudrez peut-\u00eatre tester plus compl\u00e8tement. Certains sont assez similaires ou aussi performants. Je recommanderais de commencer par : <\/p>\n\n\n\n<ul class=\"wp-block-list\"><li> <a href=\"https:\/\/www.babelfish.com\/\">Babel Fish<\/a> (qui emprunte son excellent nom au traducteur auriculaire universel vu dans le roman \u00ab\u00a0<a href=\"https:\/\/fr.wikipedia.org\/wiki\/Le_Guide_du_voyageur_galactique\">Le Guide du voyageur galactique<\/a>\u00ab\u00a0, que je pr\u00e9f\u00e9rais voir nomm\u00e9 &#8211; avant les proc\u00e8s &#8211; \u00ab\u00a0Guide du routard galactique\u00a0\u00bb).<\/li><li><a href=\"https:\/\/traduction.babylon-software.com\/\">Babylon 10<\/a> (un rapport avec la s\u00e9rie de Science-Fiction d&rsquo;il y a quelques ann\u00e9es, <a href=\"https:\/\/fr.wikipedia.org\/wiki\/Babylon_5\">Babylon 5<\/a> ?)<\/li><li><a href=\"http:\/\/www.bing.com\/Translator\">Bing translator<\/a><\/li><li><a href=\"http:\/\/babelxl.com\/\">BabelXL<\/a> <\/li><\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">En termes de conclusion<\/h2>\n\n\n\n<p>M\u00eame avec les pires textes, notre \u00e9quipe r\u00e9ussi quotidiennement des prouesses de traductions que nous n&rsquo;imaginions pas possibles auparavant.<\/p>\n\n\n\n<p>Je suppose que la prochaine \u00e9tape serait de passer \u00e0 une solution d&rsquo;Intelligence Artificielle (qui exploiterait peut-\u00eatre le travail d\u00e9j\u00e0 fourni sur des dizaines de milliers de textes) pour nous aider \u00e0 aller plus vite encore. Vous avez des id\u00e9es \u00e0 me proposer ?<\/p>\n","protected":false},"excerpt":{"rendered":"<p>M\u00eame si je me targue de parler plusieurs langues (le fran\u00e7ais est ma langue maternelle, mon anglais et mon espagnol sont acceptables, je peux comprendre la plus grande part du portugais ou de l&rsquo;italien, surtout \u00e0 l&rsquo;\u00e9crit), dans le cadre professionnel, je doit manipuler de nombreuses langues qui me sont inconnues (des commentaires de clients [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":10141,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[937,1],"tags":[1715,1862,1863],"class_list":["post-10101","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-google","category-inclassable","tag-google","tag-google-traduction","tag-traduction"],"_links":{"self":[{"href":"https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-json\/wp\/v2\/posts\/10101","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-json\/wp\/v2\/comments?post=10101"}],"version-history":[{"count":0,"href":"https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-json\/wp\/v2\/posts\/10101\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-json\/wp\/v2\/media\/10141"}],"wp:attachment":[{"href":"https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-json\/wp\/v2\/media?parent=10101"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-json\/wp\/v2\/categories?post=10101"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.roumazeilles.net\/news\/fr\/wordpress\/wp-json\/wp\/v2\/tags?post=10101"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}