An artificial neural network

SYSTRAN : 50 ans d’innovation et de savoir-faire au service de la traduction automatique

Dossier : Dossier FFEMagazine N°733 Mars 2018
Par Jean SENELLART (X92)

SYSTRAN, dont le cœur de métier est la traduction automatique, va fêter son cinquantième anniversaire en 2018.
Quelles sont les principales évolutions connues par la société ?

SYSTRAN a ini­tiale­ment vu le jour dans un con­texte de Guerre Froide pour fournir de la tra­duc­tion du russe vers l’anglais. Notre méti­er a ensuite évolué et a été porté par le développe­ment d’Internet et des out­ils de communication. 

De nou­veaux besoins de tra­duc­tion pro­fes­sion­nelle sont apparus. Nous sommes restés très présents dans le monde de la défense et de la sécu­rité où la tra­duc­tion joue un rôle pri­mor­dial dans le traite­ment mas­sif et l’analyse de don­nées provenant de mul­ti­ples sources. 

Nous opérons aus­si large­ment dans le secteur privé. Nous avons notam­ment lancé le pre­mier moteur de tra­duc­tion en ligne Babel Fish et nous avons équipé, entre autres, les por­tails de tra­duc­tion automa­tique de Google et Yahoo. 

Jusqu’en 2007, la tra­duc­tion en ligne, c’était essen­tielle­ment SYSTRAN ! 

Dès 2005, nous avons com­mencé à être util­isés comme un out­il de pro­duc­tiv­ité par les ser­vices de tra­duc­tion. Grâce à notre tech­nolo­gie qui avait atteint une cer­taine matu­rité, les tra­duc­teurs pou­vaient accélér­er la vitesse de tra­duc­tion, par la post-édi­tion de tra­duc­tion automa­tique et l’utilisation de mémoires de traduction. 

En par­al­lèle, au sein des entre­pris­es, la com­mu­ni­ca­tion est dev­enue de plus en plus mul­ti­lingue avec un besoin de solu­tions de tra­duc­tion en temps réel et inté­grées aux sys­tèmes bureau­tiques et de mes­sagerie avec une prise en compte de la ter­mi­nolo­gie pro­pre à la société. 

La par­tic­u­lar­ité de SYSTRAN est en effet de pro­pos­er une tra­duc­tion spé­cial­isée. Nous pro­posons à nos clients du sur-mesure, une solu­tion adap­tée à leurs métiers en reprenant leur ter­mi­nolo­gie interne, leur style et en nous alig­nant sur leurs critères de qualité. 

Pour cette rai­son, les dernières tech­nolo­gies per­me­t­tant de spé­cialis­er automa­tique­ment la tra­duc­tion sur la base de textes déjà traduits ont per­mis de faire un bond énorme en ter­mes de qual­ité et de réduire les temps néces­saires à la pro­duc­tion de moteurs spécialisés. 

Comment s’inscrivent les évolutions technologiques dans l’histoire de SYSTRAN ?

Aujourd’hui, le Big Data, la per­for­mance des algo­rithmes et la puis­sance des machines, offrent de nou­veaux leviers de développe­ment et de per­for­mance pour la tra­duc­tion automatique. 

Cepen­dant, c’est sur la tech­nolo­gie elle-même que les change­ments majeurs sont apparus. Au fil des années, nous nous sommes dévelop­pés en con­ser­vant tou­jours un temps d’avance tech­nologique. Les années 70 ont été mar­quées par la mul­ti­pli­ca­tion des sociétés de tra­duc­tion automa­tique. Par­mi toutes ces sociétés, nous sommes les seuls à avoir tra­ver­sé les décennies. 

Dans cette pre­mière phase, la tech­nolo­gie util­isée pour la tra­duc­tion automa­tique était celle des sys­tèmes experts, qui s’appuyaient sur des règles décrivant les langues. Ces règles étaient ensuite implé­men­tées dans un pro­gramme. Il s’agissait d’une tech­nolo­gie coû­teuse qui néces­si­tait des finance­ments sur plusieurs années et beau­coup de ressources humaines. 

Pen­dant plus de 20 ans, c’est ce sys­tème que nous avons dévelop­pé et qui a notam­ment été util­isé par la Com­mis­sion Européenne. 

Trente ans plus tard, en 1998, IBM lance une nou­velle tech­nolo­gie de tra­duc­tion pure­ment sta­tis­tique se bas­ant sur des textes déjà traduits pour recon­stru­ire des tra­duc­tions par fragments. 

En 2007, Google pour­suit sur cette même voie, en réal­isant un exploit tech­nologique à l’échelle du Web avec une sec­onde généra­tion de Google Trans­late qui fait entr­er les acteurs du marché dans la con­quête des don­nées (the big­ger, the better). 

De son côté, SYSTRAN se posi­tionne en con­ce­vant une tra­duc­tion hybride qui com­bine les deux tech­nolo­gies mis­ant sur la qual­ité adap­tée à chaque domaine. 

Il y a environ deux ans, votre positionnement a complètement évolué avec la découverte de la traduction neuronale…

En effet, les résul­tats de recherche menée par l’Université de Mon­tréal en tra­duc­tion neu­ronale ont ouvert de nou­velles per­spec­tives que nous n’avons pas hésité à saisir : la tra­duc­tion neu­ronale qui s’appuie sur l’apprentissage pro­fond, une des tech­niques de l’intelligence artificielle. 

En sep­tem­bre 2016, nous étions, avec Google les pre­miers à lancer des sys­tèmes opéra­tionnels basés sur ces moteurs neu­ronaux. Alors que la recherche sur ce domaine con­tin­u­ait de pro­gress­er à une vitesse con­sid­érable, nous avons décidé de con­tribuer à cet essor et de lancer en par­al­lèle un frame­work open source « OpenNMT ». 

Après avoir accu­mulé plus de 48 ans de tech­nolo­gie, nous avons donc ren­du notre tech­nolo­gie publique… Open­N­MT a été dévelop­pé en col­lab­o­ra­tion avec Har­vard NLP et met à dis­po­si­tion des développeurs et chercheurs des algo­rithmes neu­ronaux à l’état de l’art du traite­ment du lan­gage naturel. 

Ce frame­work a déjà reçu des prix académiques et fédère plusieurs cen­taines de mem­bres act­ifs : pas­sion­nés, chercheurs, développeurs et industriels. 

Même si nos clients peu­vent avoir accès libre­ment à cette tech­nolo­gie, ils font appel à nous car ils recherchent une solu­tion clé en main. Nous sommes avant tout un édi­teur de solu­tions logi­cielles et déten­teurs d’un véri­ta­ble savoir-faire. 

Quels sont vos principaux défis ?

Aujourd’hui, nous sommes sur un posi­tion­nement inédit : en mis­ant sur l’Open Source, nous avons en quelque sorte ouvert le marché à de nou­veaux acteurs. Nous allons accom­pa­g­n­er les prochaines évo­lu­tions. En ambi­tion­nant d’être un leader sur ce marché, nous ne pou­vons pas nous refer­mer sur nous-mêmes. 

Con­crète­ment, pour main­tenir notre posi­tion­nement sur ce domaine à la pointe de la recherche, nous nous appuyons sur une équipe dédiée d’une dizaine d’ingénieurs doc­teurs. Aujourd’hui, nous enten­dons beau­coup par­ler de l’intelligence arti­fi­cielle pour le traite­ment de la voix, des images et des textes. Très vite, les nou­velles décou­vertes tech­nologiques vont sûre­ment nous per­me­t­tre de pou­voir traiter ces 3 dimen­sions ensemble. 

CHIFFRES CLÉS

  • 50 ans d’existence
  • 3 bureaux à Paris, San Diego et Séoul
  • 200 collaborateurs
  • 50+ langues couvertes

Dans cette optique, il est aus­si impor­tant de com­pren­dre que l’intelligence arti­fi­cielle n’est pas seule­ment une ques­tion de bon paramé­trage des réseaux de neu­rones. Ce sont des mod­èles qui doivent être entraînés sur le long terme. 

Le prochain défi est donc de dévelop­per et d’accompagner sur plusieurs années cet appren­tis­sage infi­ni de nos mod­èles neu­ronaux et « d’élever » des IA multilingues. 

Poster un commentaire