- Project Runeberg -  Teknisk Tidskrift / Årgång 85. 1955 /
744

(1871-1962)
Table of Contents / Innehåll | << Previous | Next >>
  Project Runeberg | Catalog | Recent Changes | Donate | Comments? |   

Full resolution (JPEG) - On this page / på denna sida - H. 33. 13 september 1955 - Översättning med maskin, av GAH

scanned image

<< prev. page << föreg. sida <<     >> nästa sida >> next page >>


Below is the raw OCR text from the above scanned image. Do you see an error? Proofread the page now!
Här nedan syns maskintolkade texten från faksimilbilden ovan. Ser du något fel? Korrekturläs sidan nu!

This page has never been proofread. / Denna sida har aldrig korrekturlästs.

744

TEKNISK TIDSKRIFT

skulle vara av betydelse inte endast i
översättningsmaskiner utan också i teleprintersystem, bokföringsmaskiner
m.m. är under utveckling i flera laboratorier.

Metoder

Det största problemet vid översättningsmaskiner är att
minska sökningstiden så långt som möjligt. Detta innebär
att antalet uppslagsord skall reduceras, att uppslagsorden
skall lagras på sådant sätt att de blir tillgängliga i den
ordning de är allmänt förekommande i språket samt att
där så är möjligt ordinformation ersätts med den i regel
mindre utrymmeskrävande grammatik- eller
syntaxinfor-uiationen, dvs. av logiska regler.
Som redan framhållits kan antalet uppslagsord minskas
betydligt genom att inan skiljer på stam och ändelse.
Gången vid en översättning av ett ord blir då att maskinen
identifierar den första bokstaven i det givna ordet med
motsvarande bokstav i minnet. Därefter fortsätter
maskinen med successiva identifieringar av påföljande
bokstäver tills den funnit den längsta stam i minnet som
stämmer med det givna ordet. Denna stam och dess
översättning förs över i ett mellanminne (räknemaskinernas
snabba minne). Maskinen avskiljer sedan ändelsen av det givna
ordet och går över till att söka dess betydelse i det
särskilda ändelseregistret. De två översättningarna av stam
och ändelse förs så samman i mellanminnet där de lagras
i väntan på behandling enligt syntaxregler och på utskrift.

Inte antalet uppslagsord men väl antalet nödvändiga
minnespositioner kan också minskas avsevärt genom att
ordstammar eller bokstavskombinationer som är
gemensamma för ett mycket stort antal ord ges en gemensam
symbol. Man skulle då utveckla en särskild maskinskrift som
vore ett mellanting mellan kinesisk stavelseskrift och
alfabetisk skrift.

Sökningstiden kan ytterligare nedbringas om man ordnar
orden efter ett nytt alfabet där varje bokstav ger en
position som motsvarar dess frekvens i språket. Denna
teknik är välbekant för alla chifferlösare. Detta är för övrigt
icke den enda punkt där ett samarbete mellan språkmän,
tekniker och kodspecialister kan löna sig.

Orden kan också ordnas i formklasser eventuellt på
parallellt arbetande minnen. Man får då två distinkta
grupper av formklasser, en innehållande klasser med många
ord t.ex. substantiv, adjektiv, de flesta verb m.fl. och en
andra med klasser med få ord t.ex. bestämda artiklar,
hjälpverk, personliga pronomen, räkneorden ett och två,
vissa adverb, prepositioner, konjunktioner och
interjektioner. En språkanalys ger lätt klarhet i den inbördes ordning
som dessa klasser skall avsökas i om man vill lägga dem
i serie i minnet. En uppdelning i formklasser kommer
också att avsevärt underlätta kodningen av den
syntaktiska informationen eftersom man slipper att för varje
ord inregistrera i minnet och under arbetet avläsa
uppgifter om formklass och satsdel.

De sammansatta ordformerna kan oftast upplösas i sina
beståndsdelar. I stället för att i minnet ta upp "hundhår,
hundhuvud, hundpiska, hundkoppel" osv. kan man
registrera enheterna var för sig "hund, hår, huvud" osv. Som
synes krävs för en rationellt uppbyggd
översättnings-maskin en helt ny språkanalys.

De angivna sökningsprinciperna ger upphov till
svårigheter t.ex. då en böjningsform på en stain stavas likadant
soin böjningsformen på en annan. I latinet finns t.ex. de
båda stammarna "desid" (vara sysslolös) och "desider"
(önska). Verbformen "desideremus" är gemensam och
maskinen måste här få särskilda instruktioner att avsöka
ordets omgivning för att bestämma betydelsen om man ej
inför den böjda formen i dess helhet och ger båda
översättningarna i registret.

Eftersom det största behovet av översättningar har
anmälts av naturvetare och tekniker som oftast rör sig med
speciella termer och uttryck torde det också vara praktiskt
att ställa upp speciallexikon inlästa på minnen som bara

används för denna speciella litteratur. Så t.ex. finns redan
ett rysk-engelskt lexikon för matematisk text som endast
innehåller 2 800 uppslagsord men som likväl är tillräckligt
för de flesta översättningar. Det vill sålunda synas som
om den erforderliga minneskapaciteten för en god
översättningsmaskin väl skulle vara tillfinnandes även i
befintliga automatiska räknemaskiner.

Utförda experiment

R H Rickens och A D Booth har från 20 olika språk till
engelska översatt meningar tagna ur växtgenetisk text. De
har använt en metod där de skiljer på stam och ändelse
samt ger översättningen av stammen och indikerar
informationen i ändelsen med olika tecken (t.ex. v = översätts
icke, p = perfektum, q = passiv form). Några egentliga
syntaxregler har de icke infört. Då ett ord haft
dubbelmening har båda betydelserna angetts, skilda med
snedstreck. översättningen har skett för hand enligt ett schema
som kunde tillämpats på en automatisk räknemaskin.
Deras svenska exempel lyder: "Om jorden varit tjälad länge
och djupt, har ingen skadegörelse av klöverrötan erhållits."
Råöversättningen till engelska så som den skulle levereras
av maskinen blir: round/if earth v been freeze p long and
deep, has no injury of clover rot v get p q. I detta fall
måste texten hyfsas vilket dock kan göras av en person
som icke känner ursprungsspråket. Denne har föga
svårighet att ge den riktiga översättningen: "lf the earth has
been frozen for a long time and to a considerable deep,
no injury due to clover rot has resulted."
A G Oettinger har gjort ett liknande försök men har
inskränkt sig till en ren översättning ord för ord, varje ord
i originalspråket representerat med sina flerfaldiga
betydelser. I hans översättning som alltså icke ger någon
grammatikalisk information lyder en typisk mening ur en
matematisk text översatt från ryskan: "(In, at into, to, for
ön) (Last, latter, new, latest, lowest, worst) (Time, tense)
For Analysis and Synthesis Relay-Contact Electrical
(Circuit, diagram, scheme) Parallel- (Series, successive,
con-secutive, consistant) (Connection, junction, combination)
(With, from) (Success, luck) (To be utilise, to be take
advantage of) Apparatus Boleean Algebra." Att detta skall
betyda "In recent times Boolean algebra has been
success-fully employed in the analysis of relay networks of the
series-parallel type" är icke omedelbart klart. Av tretton
studenter som fick en på detta sätt översatt text jämte
vissa instruktioner om hur översättningen i princip skulle
läsas kunde dock alla få ett rätt gott begrepp om vad för
fråga som behandlades. En av de tretton gav en god
engelsk version av den ryska texten.

Flera liknande experiment har utförts att enligt för
logiska maskiner lämpade metoder översätta främmande
text. Ett av dessa var avsett för en hålkortsanläggning.
Man antog att en hålstans, en sorterare, en jämförande
apparat, en hålkopierande apparat och en hålkortstyrd
skrivmaskin fanns tillgängliga, dvs. samma apparatur som
nu finns på många större kontor. Vid
översättningsarbetets början hade man tillgängliga en packe kort med
ordstammar och en med ändelser, sorterade i alfabetisk
ordning.

Texten som skall översättas stansas ord för ord på kort
tillsammans med nummer som anger ordens position i
texten. Textens ord ordnas i alfabetisk ordning och
sorteras så mot lexikonkorten över ordstammar varefter
översättningen från lexikonkortet, ordnumret från textkortet
och den kvarblivande ändelsen från textkortet stansas på
nya kort. Därpå sorteras textkort och lexikonkort isär och
lexikonkorten ordnas alfabetiskt på nytt. Proceduren
upprepas med de nystansade korten och lexikonkorten över
ändelser. Man har nu fått en hög med kort som innehåller
översättningar av stammar och ändelser. Denna sorteras
tillbaka i nummerordning och innehållet skrivs ut.
Metoden ger en översättning enligt Rickens och Booth.
Ett enda försök till översättning med verklig maskin har

<< prev. page << föreg. sida <<     >> nästa sida >> next page >>


Project Runeberg, Tue Dec 12 02:39:56 2023 (aronsson) (download) << Previous Next >>
https://runeberg.org/tektid/1955/0764.html

Valid HTML 4.0! All our files are DRM-free