Digitale Techniek: Vertaalmachines (1958 – 1960)

Ideeën over automatische vertaalmachines (1960)

Vanaf 1947 werd op het Physisch Laboratorium onderzoek gedaan aan digitale rekentechniek, een techniek die op dat moment nog in de kinderschoenen stond. In 1951 werd een klein rekenapparaat gemaakt.

Een eerste flip-flop van discrete componenten
Een eerste flip-flop van discrete componenten
Eerste flip-flop bord
Eerste flip-flop bord

 
Bij het nadenken over digitale mogelijkheden exploreerde de Directeur van het Laboratorium, Ijsbrand Boxma, de theoretische mogelijkheden van automatisch vertalen van teksten uit andere (red. niet op de HBS of het lyceum geleerde) talen [1,2]. Highlights uit de gerefereerde voordrachten geven goed weer op welke wijze Laboratorium de mogelijkheden van de digitale technologie verkende. Wonderlijk is dat alle literatuur “machinaal leesbaar” gemaakt kon worden door deze op een “teletype” of “telexmachine” in te typen.

De omstandigheid dat het onmogelijk is alle wetenschappelijke literatuur, die in vele talen verschijnt, te lezen werkt sterk belemmerend op de vooruitgang van de wetenschap. Dit is natuurlijk vooral duidelijk voor Russische, Japanse en andere niet-Westeuropese talen. Maar in Frankrijk, Engeland en Amerika is ook niet altijd de literatuur in het Engels, Frans of Duits direct toegankelijk.

Hieronder volgt een extractie uit zijn voordrachten in de jaren 1958 – 1960 over dit onderwerp. 

Zijn inleiding

Bij de studie van vertaalmachines komt men op het grensgebied van de wis- en natuurkunde en techniek enerzijds en de taalwetenschappen anderzijds. Men zal namelijk de eigenschappen van de taal moeten leren kennen en· moeten trachten deze te omschrijven op een zodanige wijze dat ze fysisch kunnen worden vastgelegd. Voor de fysische verwezenlijking van een vertaalmachine denkt men momenteel uitsluitend aan de moderne informatieverwerkende apparatuur. De omschrijving van de taaleigenschappen zal dan een mathematisch karakter moeten hebben en in de vorm van programmeringsregels en constanten in de machine moeten worden ingevoerd.
De eerste suggestie het machinaal vertalen eens met een elektronische rekenmachine te proberen werd omstreeks 1947 gedaan door Warren Weaver van het Rockefeller Foundation in een brief aan professor Norbert Wiener van het Massachusetts lnstitute of Technology. Hij schreef onder meer: ‘When I look at an article in Russian, I say: This is really written in English. but it has been coded in some strange symbols. I will now proceed to decode.

Ontcijferen van een code, waarbij de taal onveranderd blijft, is echter een ander proces dan vertalen. Het gehele systeem van het uitdrukken van gedachten wordt hierbij namelijk gewijzigd. We zien dan ook een geleidelijke overgang van de studie door rekenmachinedeskundigen naar de studie door taalkundigen, nadat op vele elektronische rekenmachines in Engeland, de Verenigde Staten van Amerika, en Rusland was gedemonstreerd, dat met een zeer beperkt woordenboek de machinale vertaling van passende zinnen mogelijk is. Boxma geeft vervolgens in het kort aan waarom de elektronische rekenmachines min of meer geschikt zijn vertaalwerk uit te voeren en welke problemen men ontmoet wanneer men een programma voor het automatisch vertalen zou moeten opzetten. Vervolgens gaat Boxma in op de stand van de techniek in die dagen: transistorschakelingen, geheugenmedia en -opslag als ponsband, ringkerngeheugens en codeschijven: “In veel gevallen zullen de getallen met behulp van een ponsband in de rekenmachine worden ingevoerd, waarbij een gaatje een 1 voorstelt. ln het geheugen van’ de machine moeten de ingevoerde, evenals de te onthouden enen en nullen worden vastgelegd, waarvoor vele systemen in gebruik zijn afhankelijk van de eisen die men stelt.” en “Tegenwoordig past men dikwijls magnetische geheugenelementen toe. Een uitvoeringsvorm is een magnetische trommel waarvan de mantel bedekt is met een laagje nikkel. Terwijl de trommel snel ronddraait, wordt door een zogenaamde schrijfkop een klein oppervlakte-elementje van de mantel gemagnetiseerd. Door zeer korte impulsen toe te passen kan dit gemagnetiseerde oppervlak zeer klein worden gehouden, zodat langs de omtrek een groot aantal cijfers kan worden geschreven.
Enkele van de destijds state-of-the-art technieken worden getoond op bijgaande foto’s. 
Een fotografische plaat of film is ook bruikbaar als permanent geheugen waarbij de enen en nullen door doorschijnende en ondoorschijnende blokjes worden voorgesteld. Het opzoeken van informatie kan lang duren wanneer het afleessysteem geherpositioneerd moet worden. Een voordeel is de grote capaciteit: met verfijnde fotografische technieken kunnen 10.000 bits per mm2 worden vastgelegd! Uit de tabel blijkt dat toenemende snelheid [red. destijds] gepaard gaat met een toename van het volume.

Type geheugen Tijd in seconden Volume in cmper bit
Schrijven Lezen
Transistor flip-flop 10-6 10-6 200
Magnetische ringkernen 10-5 10-5 2
Magnetische trommel 10-5 10-5 –  10-2 0.2
Fotografische schijf 10-4 – 10-1 0.04

 

Oplopende binaire waarden (9 bits) voor 0 - 360 graden (0-511) op een fotografische glasplaat
Oplopende binaire waarden (9 bits) voor 0 – 360 graden (0-511) op een fotografisch gedrukte glasplaat

Technische problemen bij het gebruik van de rekenmachine·als vertaalmachine

Om een elektronische rekenmachine te kunnen gebruiken als vertaalmachine rnoet het mogeljjk zijn woorden in te voeren in plaats van getallen. Dit gaat zeer eenvoudig door iedere letter te vervangen door een·getal onder de 32. In tweetallige vorm kunnen deze getallen dan in de machine worden vastgelegd. In feite gebeurt iets dergelijks reeds bij de telex. Op deze wijze zal een woord van 10 letters in de machine worden ingevoerd als een getal met 10 x 5 = 50 enen en nullen. Zou bijvoorbeeld een codering worden gebruikt waarin a = 1 , b = 2, enz., dan zou het woord ‘tafel’ worden gecodeerd als 20, 1, 6, 5, 12 en dus in de machine worden ingevoerd als 10100 00001 00110 00101 01100.
In Rusland wordt op oyereenkomstige wijze een Chinese tekst ingevoerd door gebruik te maken van de telegraafcode. Elk Chinees karakter is namelijk genummerd ten behoeve van het telegrafisch overseinen.

Het is dus mogelijk een tekst in de vorm van getallen in de· machine in te voeren, terwijl ook in het geheugen van de machine woorden kunnen worden vastgelegd. Wordt in het geheugen achter ieder woord het ermee overeenkomende woord in de andere taal geschreven, natuurlijk ook in de vorm van een getal, dan ontstaat een woordenboek. Komt een woord, dat vertaald moet worden, de machine binnen, bijvoorbeeld op een ponsband, dan kan dit woord – of zo men wil dit getal – worden afgetrokken van de woorden in het geheugen. Is de uitkomst nul dan is het juiste woord gevonden. Naar de uitgang van de machine kan dan het overeenkomstige woord in de andere taal worden gevoerd, waarna het met behulp van bijvoorbeeld een telexmachine kan worden getikt.

Het is nuttig hierbij nog te wijzen op twee technische problemen, die zich voordoen wanneer we een woordenboek in het geheugen willen vastleggen. Het ene probleem betreft het benodigde volume, het andere de snelheid.

Het volume van het woordenboekgeheugen

Stel dat men 60.000 woorden wil vastleggen en hierbij ook 60.000 woorden in een andere taal. Deze 120.000 woorden hebben bijvoorbeeld een gemiddelde lengte van 6 letters, dus 30 bits. In totaal moeten dan 3.600.000 bits worden onthouden. In werkelijkheid zal dit aantal door dubbele betekenissen en andere oorzaken aanzienlijk groter zijn, zodat wel op 4*167 bits mag worden gerekend. Wegens dit grote aantal tracht men op allerlei manieren het woordenboek te beperken.

Komt met de ponsband via het ingangsorgaan een woord in de machine binnen, dan moet dit woord worden vergeleken met de woorden uit het geheugen, Dit kan op verschillende manieren gebeuren:

  1. Wordt het binnenkomende ‘woordgetal’ achtereenvolgens afgetrokken van de N ‘woordgetallen’ in het geheugen, dan zullen gemiddeld N/2 aftrekkingen moeten worden uitgevoerd voordat de uitkomst nul is, dus voordat het juiste woord is gevonden. Stel dat 0,001 seconde nodig is voor het uitlezen van het woord en het· uitvoeren van de aftrekking, dan kost bij N = 60.000 het opzoeken van elk woord gemiddeld 30 seconden.
  2. Een sneller resultaat bereikt men door de woorden te plaatsen in een volgorde die wordt bepaald door de frequentiedistributie van de woorden in de betreffende taal, of eventueel in die van het betreffende vakgebied. Indien we veronderstellen dat in een bepaalde tekst een woord met rangnummer r, k/r malen voorkomt (k is volgens de regel van Zipf constant verondersteld), dan zal, indien het woordenboek N woorden bevat, het totaal aantal woorden in deze tekst gelijk zijn aan de sommatie van k/r voor r=1 .. N. Dit aantal woorden moet dus worden opgezocht en is ongeveer gelijk aan k.
    Het woord r komt k/r maal voor en heeft r opzoekprocedures nodig. Dit is dus in totaal voor alle woorden r een aantal van k opzoekprocedures; en voor alle N woorden k, N procedures. Gemiddeld zijn dus per woord N/ ln(N) procedures nodig. Voor N = 60.000 wordt dit 5.500 waarvoor een tijd nodig is van 5.5 seconden.
  3. Een aanzienlijk snellere methode verkrijgt men door de ‘woordgetallen’ te plaatsen als een opklimmende getallenreeks en gebruik te maken van de mogelijkheid dat de machine uit het vorige resultaat zijn volgende bewerking kan bepalen. Trekken we nu namelijk het binnenkomende woord af van het middelste woord uit hef geheugen, dan kan de uitkomst positief of negatief zijn. Het gezochte woord zal zich dan dus in de eerste of tweede helft van het geheugen bevinden. Het proces wordt herhaald voor het midden van die helft, waardoor het juiste kwart vastligt. Zo doorgaande geven 16 aftrekkingen de plaats aan tot op l:65.536 nauwkeurig. Deze binaire zoekmethode is dus voldoende voor 60.000 woorden. Op deze wijze wordt het woord gevonden in 16 x 0,001 sec = 0,016 seconde. De tijd die nodig is om de juiste positie in het geheugen te bereiken is nu ongetwijfeld groter dan de tijd die nodig is voor de aftrekkingen. Het resultaat zal daardoor minder gunstig zijn dan in het bovenstaande wordt gesuggereerd.

Taalkundige problemen bij het ontwerpen van een vertaalmachine

Vertalen is eigenlijk niets anders dan het vervangen van de ene taal door de andere met de bedoeling dezelfde ideeën uit te drukken. Zowel wanneer dit vertalen door de mens als wanneer het door een machine gebeurt, is het woordenboek hiervoor de basis. Met de woord voor woord vertaling, bereikt men echter vrijwel nooit volledig het beoogde doel. Onder andere komt dat doordat vele woorden meer dan een betekenis hebben, die met verschillende woorden in de andere taal overeenkomen. Er is echter nog een andere reden waarom woord voor woord vertaling niet voldoende is; de grammatica bevat namelijk ook een aanzienlijk deel van de over te brengen informatie, wat onder andere tot uiting komt in een min of meer streng voorgeschreven zinsbouw en in de verbuigingen. Men drukt het wel als volgt uit: de woorden geven aan waarover wordt gesproken, de grammatica wat erover wordt gezegd.
Uit het bovenstaande volgt dat het noodzakelijk is naast een woordenboek grammaticale regels voor het vertalen in de vertaalmachine in te voeren. Deze regels moeten evenals het woordenboek in het geheugen worden vastgelegd en dienen op een zodanig logische wijze te zijn opgesteld dat ze door een machine kunnen worden opgevolgd. Dit probleem is zeker niet eenvoudig en heeft een nauwkeurige bestudering van de opbouw van de taal nodig gemaakt. Hierbij kan worden opgemerkt dat de nauwkeurigheid en volledigheid van de grammaticale regels afhankelijk zijn van het vermogen van de samensteller om algemeenheden af te leiden uit een groot aantal taaldetails.

Enkele oplossingsrichtingen voor machinevertalingen van teksten van redelijke omvang en gecompliceerdheid worden hierna aangegeven:

Verbuigingen

Het is aan de ene kant nodig de verbuigingen en vervoegingen in de tekst te herkennen om er conclusies voor de vertaling uit te kunnen trekken. Aan de andere kant is het nodig de woorden van de vertaling op de juiste wijze te verbuigen. Deze beide zijden van het verbuigingsprobleem dekken elkaar slechts ten dele. Zo kunnen verbuigingen in sommige talen door woorden wcrden vervangen, zoals voorzetsels of lidwoorden.
Voorbeeld 1: Duits ‘der’ kan ‘van de’ betekenen, Voorbeeld 2: Noors kake => koekje; kaken => het koekje; kaker => koekjes; kakene· => de koekjes.
Men kan zich afvragen of alle verbuigingsvormen in het geheugen aanwezig moeten zijn. Bij het gebruiken van elektronische rekenmachines voor het vertalen dient men namelijk te woekeren met de geheugencapaciteit, hoe groot deze geheugens ook lijken te zijn. Daarom zijn er vele pogingen gedaan voor- en achtervoegsels af te snijden. De machine kan bijvoorbeeld proberen of de laatste twee letters ‘en’ zijn en dan in het woordenboek nazoeken of de rest voorkomt. Deze rest draagt dan in de een of andere code een aanduiding voor de woordsoort, terwijl de machine in een achtervoegselwoordenboek vindt wat in de vertaling het gevolg van deze uitgang moet zijn. Om na te gaan welke winst we in volume en tijd behalen met deze splitsing, zullen we veronderstellen dat het oorspronkelijke woordenboek met N woorden wordt vervangen door n stamwoordenboeken, elk met Ni woorden, terwijl bij elk stamwoordenboek mi– uitgangen behoren (i = 1, 2, 3, – – – n).
Volgens de binaire zoekmethode is voor een woordenboek met N woorden het aantal opzoekprocedures P gelijk aan het kleinste getal boven 2log N. Een benadering voor P wordt dan bij het gesplitste woordenboek gegeven door P= 2log (sommatie van Ni voor i=1 .. N maal sommatie van mi voor i=1 .. n). Om verschillende redenen is deze formule niet exact geldig. In [2] wordt een voorbeeld gegeven van een woordenboek met 60.000 woorden gesplitst in vier stamwoordenboeken met een verschillend aantal vormen (4.000 x 5; 3.000 x 10; 2.000 * 4 en 2.000 * 1). De som over Ni is dat 11.000; som over mi is 20 en som Ni*mi is 60.000. De winst in het aantal procedures is een factor 2 ten opzichte van 16 (2log 50.000). De winst valt tegen als de zoektijd beschouwd wordt. Het geheugenbeslag is kleiner. Het lijkt echter waarschijnlijk dat het geheugen van een echte vertaalmachine zo groot gemaakt zal worden dat alle verbuigingen die kunnen voorkomen in het woordenboek kunnen worden opgenomen. 

Zinsbouw

Ook het probleem van de zinsbouw heeft twee kanten. In de eerste plaats kan de zinsbouw van de ingevoerde tekst van groot belang zijn, bijvoorbeeld bij het bepalen van de juiste betekenis van woorden met meer dan een betekenis. In de tweede plaats kan de zinsbouw van de vertaling voor het goede begrip van groot belang zijn.
Het ligt het meest voor de hand de machine een analyse te doen uitvoeren van de zinsbouw van de tekst. Hiervoor zal elk woord in het geheugen een aanduiding noeten hebben, zoals ‘lidwoord’ of ‘werkwoord’ voor zover dit mogelijk is. Voor·die woorden, waarvoor dit niet mogelijk is, kan toch meestal de combinatie met de bekende woorden enig gegeven opleveren. Daarna zal met de opbouwregels van de tweede taal de zins­bouw van de vertaling moeten worden opgezet.
 

Woorden met meer dan een betekenis

Het vinden van de juiste vertaling van de woorden waarvoor meer dan een vertaling mogelijk is, is wel het moeilijkste probleem voor de constructeur van een vertaalmachine. Dit probleem is al door verschillende onderzoekers op vele manieren aangepakt. Het is onmogelijk om hier meer dan een indruk te geven van het probleem. Het aantal woorden dat meer dan een betekenis heeft is zeer groot, zelfs wanneer men er genoegen mee neemt, dat synoniemen niet worden gebruikt. Vermoedelijk heeft ieder woord gemiddeld twee betekenissen. Dit vermindert wel aanzienlijk wanneer de vertaalmachine slechts bestemd is voor een bepaald vakgebied, zoals wiskunde.
Het heeft zin een verdeling te maken tussen grammaticale en niet-grammaticale meervoudige betekenissen. Het onderscheid maken tussen de betekenissen is in de eerste groep (weer – het weer) eenvoudig, indien de woordsoort reeds is bepaald. Indien de woordsoort niet is bepaald en ook voor de niet-grammaticale dubbele betekenissen (bijvoorbeeld as of bloem), moet het onderscheid blijken uit de rest van de tekst. De woordsoort is nog wel eens te bepalen uit karakteristieke verbindingen tussen woordsoorten (bijvoorbeeld bijvoeglijk naamwoord – zelfstandig naamwoord), of zelfs doordat er nog geen werkwoord in de zin voorkomt en het betreffende woord naar alle waarschijnlijkheid dit werkwoord is. In sommige gevallen zal de hele zin of zullen zelfs meer zinnen moeten worden afgezocht naar een aanduiding waar uit de betekenis kan worden bepaald. Een dergelijke aanduiding kan zijn het behoren tot een bepaald vakgebied. Als deze met nummers worden aangeduid kan bijvoorbeeld worden nagegaan welk nummer het meeste voorkomt in de tekst. De kans is groot dat de vertaling van het betreffende woord ook dit nummer moet dragen.
Men kan woorden verdelen over twee groepen. De ene groep geeft de wezenlijke inhoud van de tekst. Het zijn woordsoorten als werkwoorden, zelfstandige naamwoorden, bijvoeglijke naamwoorden. Ze hebben meestal weinig verschillende betekenissen. De andere groep woorden wordt wel aangeduid als ’cementwoorden’ omdat ze de woorden uit de eerste groep aan elkaar lijmen, bijvoorbeeld voorzetsels, behoren hiertoe. Ze hebben gewoonlijk vele betekenissen en komen veel vaker voor dan de woorden uit de eerste groep (het Engelse woordje ‘to’ kan bijvoorbeeld betekenen te, tot, ten, van, naar, tegen, in, tot aan, voor, bij, in vergelijking met. Opgemerkt kan worden dat ook bij het opstellen van een woordenboek ermee rekening moet worden gehouden dat de woorden, die het meeste voorkomen, niet altijd het belangrijkste zijn. Het weglaten van een weinig voorkomend woord kan wel eens ernstiger gevolgen hebben dan het weglaten van een cementwoord.
Ook de woorden, die in combinatie met een ander woord een speciale vertaling hebben (o.a. in idiomatische uitdrukkingen), kan men tot die woorden met meer dan één betekenis rekenen. Zo kan de combinatie ‘private person’ worden vertaald met ‘particulier’. Het woord ’private’ zal in het woordenboek dus een aanwijzing moeten bevatten om na te gaan of het wordt gevolgd door ‘person’.
Eigennamen geven in deze groep van woorden met meer dan een betekenis een eigenaardige moeilijkheid. Het zal namelijk niet kunnen worden vermeden dat de machine tracht het eigennaam-woord in zijn geheugen te vinden. Als hij daarin slaagt zal de vertaling ervan worden afgegeven. Als het niet in het geheugen voorkomt, wordt het zonder meer naar de uitgang gevoerd, zoals trouwens elk woord waarvoor geen vertaling aanwezig is. Een hoofdletter kan soms een indicatie voor een eigennaam zijn, maar geeft uiteraard niet altijd zekerheid.
Tenslotte kunnen hier nog de woorden worden genoemd die van betekenis veranderen bij het vertalen. Zo zal het woord ’vier’ in de zin ’Het woord twee heeft vier letters’ bij vertalen in het Engels niet kunnen worden gehandhaafd. [red. Een test in juli 2021 laat zien dat Google Translate de te vertalen tekst niet inhoudelijk interpreteert en daardoor op dit punt faalt]

Enige beschouwingen over vertaalmachinemogelijkheden

De huidige situatie [1960]

De grootste belangstelling voor vertaalmachines komt van de zijde van mathematici, fysici en technici, gevolgd door de beoefenaars van andere wetenschappen en militaire instanties. De verklaring hiervoor ligt enerzijds in het feit dat dezen het meest vertrouwd zijn met de mogelijkheden die universele rekenmachines bieden, en anderzijds het meest de behoefte gevoelen kennis te nemen van wetenschappelijke publicaties in andere talen. Hiermee hangt samen dat de woordenlijsten, die zijn ontworpen om een elektronische rekenmachine als vertaalmachine te gebruiken, gebaseerd zijn op een gebruik in deze speciale vakgebieden. Het aantal woorden vermindert daardoor aanzienlijk, terwijl vooral de meervoudige betekenissen sterk afnemen. Een niet geheel correcte zinsbouw wordt wel geaccepteerd als de inhoud van het artikel maar kan worden begrepen. Een goede vertaler daarentegen zal bij het zien van het resultaat waarschijnlijk opmerken dat hij het sneller en beter zelf kan doen. Het gebrek aan goede vertalers geeft echter de vertaalmachines zeker een bestaansrecht.
Een machine, die wordt ontworpen om te vertalen, dus geen geprogrammeerde rekenmachine, zal men aan zijn taak geheel kunnen aanpassen en de resultaten, die zo’n machine levert, zullen dan ook bevredigend kunnen zijn. De vertaalmachine, die momenteel wordt gebouwd in de Verenigde Staten van Amerika voor het Rome Air Development Center is voorzien van een fotografisch geheugen voor 30 miljoen bits, waarmee ongeveer een half miljoen woorden worden vastgelegd [Red. zie AN/GSQ-16]. Hij is bestemd voor vertalingen van het Russisch in het Engels. Voor zover bekend zal dit de eerste echte vertaalmachine zijn.

Zowel uit Amerikaanse als uit Russische literatuur blijkt dat men een onderzoek instelt naar de mogelijkheid een vertaalmachine te construeren, die niet slechts geschikt is voor het vertalen van een taal in een andere, maar die meer talen kan verwerken in beide richtingen. Bij N talen heeft men dan N * (N – 1) vertaalmogelijkheden. Indien men echter een taal als een centrale taal behandelt, kan men alle vertalingen via deze taal leiden, en behoeft men dus slechts 2 * (N-1) vertaalmogelijkheden te hebben. De (N-2) * (N-1) mogelijkheden, die hier niet onder vallen, vinden dus in twee stappen plaats, waaraan uiteraard nadelen verbonden zijn. In Rusland overweegt men dit systeem voor de talen Duits, Chinees, Japans en Russisch, waarbij het Russisch de centrale taal is, zodat het meeste vertaalwerk toch in één stap kan plaatsvinden. Opgemerkt wordt dat een systeem van vertaalregels slechts geldt voor twee talen in één richting.

Tegenstanders van het gebruik van Engels of Russisch als tussentaal wijzen op de vreemde consequentie ook een vertaling van Chinees in Japans via deze tussentaal te moeten uitvoeren. Dan zouden dus eerst de neutrale Chinese woorden in enkel- of meervoud moeten worden overgebracht en lidwoorden eraan worden toegevoegd, om daarna de woorden weer in de oude staat terug te brengen. Men denkt daarom in dit verband ook wel aan een concentratie per taalgebied.

In Amerika is wel voorgesteld een logisch opgebouwde taal zonder- woorden met meer dan een betekenis als tussentaal te gebruiken. Omdat dan toch vrijwel al het vertaalwerk in twee stappen plaatsvindt, lijkt het voor de hand te liggen voor dit doel een kunstmatige machinetaal op te stellen, waarvoor men wel de naam ,,Machinees” heeft gebruikt. Ook de naam ‘Metalanguage’ is voorgesteld. Bij gebruik van een dergelijke kunstmatige tussentaal moet uiteraard het aantal vertaalmogelijkheden 2 N worden indien de machine voor N talen geschikt moet zijn. Naast een echte taal en een logisch opgebouwde taal als tussentaal kan ook een taal met·logische symbolen gebruikt worden. Voor het vastleggen van een half miljoen begrippen is we niet meer nodig dan 19 bits per begrip. Dat komt overeen met nog geen vier letters zodat een dergelijke taal relatief weinig geheugenruimte vraagt.

Toekomstmogelijkheden [in 1960]

De omstandigheid dat men de te vertalen tekst altijd op een soort van telexmachine moet overtikken, teneinde hem op een ponsband in de vertaalmachine te kunnen invoeren, zal ongetwijfeld aanleiding zijn net invoerprobleem nader te onderzoeken. Of vertaalmachines zullen kunnen worden ontwikkeld die van proza, of zelfs van poëzie, een voortreffelijke vertaling kunnen geven, zal moeten worden afgewacht.
 

Bronnen
  1. IJ. (IJsbrand) Boxma (1959), Wat is en doet een vertaalmachine?, Natuurkundige voordrachten: Nieuwe reeks 1958-1959 (37).
  2. IJ. (IJsbrand) Boxma (1960), Vertaalmachines, Tijdschrift van het Nederland Radiogenootschap, deel 25(3), pp 131-146.