Spring naar de content

Hoe Google een eigen interlingua ontwikkelde

In september kondigde Google een doorbraak in het vertaalprogramma aan, de ‘Neural Machine Translation’. Hiermee vertaalt het systeem niet langer woord voor woord, maar kijkt het naar de context en patronen van zinnen waardoor de vertalingen een stuk nauwkeuriger zijn. Onlangs is gebleken dat dit nieuwe systeem ook in staat is om vertalingen te geven voor talenparen waarvoor het niet geïnstrueerd is middels een zelf gecreëerde tussentaal.

Gepubliceerd op: Geplaatst in de volgende categorieën: door Door Postma

Het bestaan van zoveel talen vormde een groot probleem voor vertaalcomputers, waar eerder nog geen oplossing voor werd gevonden die niet tijdrovend was. Een systeem dat geprogrammeerd is om te vertalen tussen bijvoorbeeld Engels en Duits en Engels en Spaans kan nog geen vertalingen maken tussen Duits en Spaans. Een tussentaal – interlingua – biedt de oplossing; bij het toevoegen van een nieuwe taal hoeft deze alleen naar de interlingua te vertalen.

google translate

De pogingen zo’n tussentaal te ontwikkelen slaagde niet, totdat de makers van het Neutral Machine Translation systeem ontdekte dat de computer zelf een interlingua hadden ontwikkeld. Het Google vertaalprogramma was geprogrammeerd om tussen het Engels en Koreaans, en tussen het Engels en Japans te vertalen, maar heeft nooit ‘geleerd’ om dat tussen het Koreaans en Japans te doen. Door de uit eigen beweging geconstrueerde tussentaal kan het programma dat nu wel.

Google denkt dat hun systeem een raakvlak heeft gevonden waarbij zinnen met dezelfde betekenis zich op een bepaalde vergelijkbare manier presenteren, ongeacht de taal. Dit kan volgens de onderzoekers van Google gezien worden als interlingua die niet leesbaar is voor mensen. Deze methode, die zero-shot translation wordt genoemd, is nog niet zo precies als het vertalen via een bestaande taal, maar gezien de snelheid waarmee de techniek zich ontwikkelt zal dit een kwestie van tijd zijn.

Onderwerpen