Machinevertalingen: de toekomst

We hebben het recent gehad over de geschiedenis van machinevertalingen en hoe het werkt. Het digitale tijdperk heeft grote gevolgen voor bijvoorbeeld de taxi’s vs Uber, of denk aan de mogelijkheden van blockchain en bitcoin. Maar wat brengt de toekomst van machinevertalingen voor vertalingen?

Neural Machine Translation (NMT) is de meest geavanceerde, door een computer gegenereerde vertaalmethode op dit moment. Daarnaast heeft NMT de afgelopen jaren grote vooruitgang geboekt dankzij de op AI, Big Data en Deep Learning gebaseerde, zelflerende eigenschappen. Dat betekent dat we NMT-engines nu kunnen inzetten als basis voor professionele vertalingen.

De engine kan niet alleen betrouwbare vertalingen produceren, maar ook talen leren. Dit zorgt voor doorlopende verbetering van de kwaliteit van de vertalingen. Om operationeel te worden, moet de machine echter wel worden getraind door mensen. Dat betekent in de praktijk dat het programma gevoed moet worden met een aanzienlijke hoeveelheid data. Hoe meer data, hoe beter het eindresultaat.

De engine kan ook worden getraind op specifieke sectoren, zoals de juridische, financiële of zelfs de medische sector met de daarbij horende specifieke vakgebonden terminologie.

Twee van de grote vijf GAFAM-bedrijven (Google, Apple, Facebook, Amazon en Microsoft) werken al met hun eigen geverifieerde machinevertalingen:

  • Google gebruikt Google Neural Machine Translation(GNMT), een neuraal netwerk dat beschikbaar is in 101 talen.
  • Microsoft gebruikt de mobiele app Microsoft Translator, die kan worden ingezet om documenten te vertalen naar zestig verschillende talen.

Een ander voorbeeld is Skype, dat Skype Translator op de markt bracht en daarmee chatgroepen faciliteert met tot wel 100 deelnemers.

Het mag duidelijk zijn dat de toegevoegde waarde van NMT invloed zal hebben op vertalingen voor verschillende sectoren – en dan met name e-commerce.


Machinevertalingen worden steeds betrouwbaarder

 

De beperkingen van Neural Machine Translation

Om aan de hand van NMT een kwalitatieve vertaling neer te zetten, moeten de zinnen in de brontekst niet alleen erg duidelijk, maar ook coherent zijn. Niet alleen NMT, maar ook de andere automatische vertalingssystemen kampen hiermee. Zelfs de kleinste dubbelzinnigheid moet in het programma worden geïntegreerd om onsamenhangende of zelfs onbegrijpelijke vertalingen te voorkomen. Zo heeft Neural Machine Translation moeite met het vertalen van zeer technische teksten, of met zeldzame woorden of eigennamen in een tekst. Daarom is het belangrijk om rekening houden met de volgende punten:

  • Duidelijkheid van de tekst: om problemen met dubbele betekenissen te voorkomen.
  • Gevoel, ervaring en menselijk oordeel: bij specifieke sectoren (juridisch, medisch, marketing, etc.).
  • Cybersecurity: publiekelijk toegankelijke vertaalmachines slaan alle data die zij verwerken in hun systemen op. Het is dus vrijwel onmogelijk om de veiligheid van de data te garanderen.
  • Het creatieve aspect: een vertaalmachine traint zichzelf met wat de machine verstaat onder de norm. Daardoor stelt de machine dus altijd een vertaling voor die het beste aansluit bij wat deze tot nu toe heeft geleerd. Dit pakt echter niet altijd goed uit. Denk bijvoorbeeld aan verschillende merken in de e-commerce: een ‘top’ bij de Zeeman, zou bij de Zara wel eens een ‘T-shirt’ kunnen heten, terwijl het eigenlijk om twee gelijksoortige producten gaat.
  • Tijd: herinnert u zich nog dat de Nederlandse voorkeursspelling ‘kommunikatie’ voorschreef in plaats van ‘communicatie’? Taal leeft en bruist. Taal verandert. We hebben het woord van het jaar; de Van Dale voegt ieder halfjaar 500 nieuwe woorden toe aan het woordenboek. Een machine leert in principe sneller, maar de machine kijkt naar wat het meest gebruikt wordt en niet naar wat de nieuwe regels zijn.

Dit soort kwesties maken menselijke interactie essentieel. Livewords biedt deze interactie.


Machinevertalingen garanderen uw cybersecurity niet

 

Waarom de mens onmisbaar is

We hebben gezien dat machinevertalingen, dus ook NMT, enkele tekortkomingen hebben als het gaat om context. Bepaalde subtiliteiten zijn nog altijd ongrijpbaar voor vertaalmachines en daarom is menselijke inmenging dan ook een onmisbare stap in het proces.

Machinevertalingen moeten dus altijd worden gecontroleerd door een mens. Dit noemen we ook wel Post-Edited Machine Translation, of PEMT. Post-editors zijn professionele vertalers die precies weten wat de valkuilen zijn van NMT. De post-editor corrigeert de automatische vertalingen van de machine een maakt er zo een samenhangende en vloeiende doeltekst van.

Er bestaan twee soorten post-editing:

  • Lichte post-editing: fouten in de machinevertaling worden gecorrigeerd, zonder de diepte in te gaan.
  • Volledige post-editing: de machinevertaling wordt volledig doorgenomen, waarbij alle fouten worden gecorrigeerd en er een goedlopend, consistent geheel van wordt gemaakt.

Bij lichte post-editing worden bijvoorbeeld spel- en grammaticafouten, foutieve, beledigende of niet passende vertalingen en ontbrekende woorden gecorrigeerd. Bij volledige post-editing wordt dit nog aangevuld met fouten in terminologie, de zinsstructuur, interpunctie en schrijfstijl, zodat de tekst niet alleen correct is, maar ook natuurlijk en vloeiend leest.

Lichte PEMT is dus meer dan voldoende als u alleen wilt weten waar een bepaalde tekst om draait. Volledige PEMT wordt ingezet om zinnen die zijn geproduceerd door automatische vertaalmachines te perfectioneren en de tekst tot een geheel te maken. Een tekst waarop volledige PEMT is gedaan, wordt ook wel een geverifieerde, ofwel proofread-machinevertaling genoemd.


Menselijke interactie bij machinevertalingen blijft nodig

 

Verandering

De voordelen van PEMT voor bedrijven op een rijtje:

  • Bedrijven kunnen met machinevertalingen behoorlijk besparen op de vertaalkosten. Vertaalbureaus adverteren inmiddels met tot voor kort ondenkbaar lage tarieven, dit soort tarieven zijn vaak gebaseerd op het gebruik van NMT zonder post-editing.
  • Daarnaast kunnen bedrijven aanzienlijk besparen op tijd. Een professionele vertaler kan gemiddeld 1500 à 2000 woorden per dag vertalen, terwijl een vertaalmachine slechts enkele seconden nodig heeft om een groot volume te vertalen. Daarna moet natuurlijk nog wel tijd worden gerekend voor de post-editor, maar ook die zal sneller zijn dan een reguliere vertaler.


Machinevertalingen kunnen geld besparen

We benadrukken dat het belangrijk is dat NMT-machinevertalingen altijd nog worden nagelopen door een post-editor met de expertise van een vertaalprofessional. Het eindresultaat liegt er echter niet om: NMT in combinatie met volledige post-editing brengt snelle, goedkopere, goedlopende vertalingen binnen handbereik.

Om NMT zakelijk toe te passen moet u over een vertaalgeheugen beschikken en de digitale organisatie hebben die voldoet aan de strengste voorwaarden. Bij Livewords hebben we zo’n geheugen, zijn we AVG/GDPR compliant, hebben we vier (daar zijn we trots op) ISO certificaten en hebben we eigen systemen gebouwd (zoals FLOW). Daarom kunnen we maatwerkoplossingen bieden voor grote en kleine vertaaltrajecten. Offerte of informatie gewenst? Klik hier!