Maskinoversættelse
Maskinoversættelse bliver mere og mere populært i oversættelsesbranchen, i takt med at teknologien udvikler sig og bliver bedre og bedre. Maskinoversættelse bruges dog sjældent alene og egner sig ikke nødvendigvis til alle projekter. På denne side kan du læse mere om, hvad maskinoversættelse er, hvordan det fungerer, og hvilke slags maskinoversættelsesservices vi tilbyder her hos COMUNICA.
Hvad er maskinoversættelse?
Maskinoversættelse er en automatiseret oversættelsesproces, hvor et softwareprogram oversætter tekst fra ét sprog til et andet uden menneskelig indblanding. Det adskiller sig fra computerassisteret oversættelse (eller CAT). Computerassisteret oversættelse betegner brugen af et specielt oversættelsesprogram, et såkaldt CAT-tool, som hjælper den menneskelige oversætter i oversættelsesprocessen.
Man begyndte at forske i maskinoversættelse i 1950’erne med Georgetown-IBM-eksperimentet. Siden da har teknologien udviklet sig betydeligt. I starten blev det primært brugt i screeningprocesser til at identificere relevante tekster. For eksempel blev det brugt i Sovjetunionen til at få en idé om indholdet af videnskabelige artikler skrevet på engelsk. Tekster, der umiddelbart virkede til at være interessante, blev derefter sendt videre til menneskelige oversættere, som oversatte teksterne med større præcision, end maskinen kunne.
I dag er maskinoversættelsesværktøjer så avancerede, at de kan bruges til at oversætte alt fra hjemmesider til mere tekniske tekster, og brugeren vil i langt de fleste tilfælde nemt kunne forstå, hvad teksten handler om. Men selvom det går an at bruge disse tekster direkte i deres maskinoversatte form, kan de ofte lyde unaturlige, og det kan indimellem kræve en vis mængde gætteri at dechifrere maskinoversatte teksters betydning.
Hvordan fungerer maskinoversættelse?
Lad os kigge på, hvordan maskinoversættelse fungerer. Svaret på det spørgsmål har ændret sig gennem tiden og afhænger af, hvilken type maskinoversættelsessystem der bruges. Oprindeligt byggede de fleste maskinoversættelsessystemer på såkaldt regelbaseret maskinoversættelse. For at kunne producere tekst krævede denne form for maskinoversættelse et sæt ordbøger for de enkelte sprog og et komplekst sæt regler for, hvordan hvert sprog fungerer.
Eftersom alle reglerne var skrevet og programmeret af lingvister og let kunne tilpasses, gav regelbaseret maskinoversættelse en højere grad af kontrol. Men regelbaseret maskinoversættelse oversatte stadig tekster ord for ord, hvilket betød, at resultatet ofte var unaturligt og stift. Det menneskelige sprog er et flydende og foranderligt fænomen. Derfor var det fortsat nødvendigt at have lingvistiske eksperter til konstant at overvåge, opdatere, rette og udvide reglerne. Nogle gange var det tilmed nødvendigt at skræddersy systemet til specifikke emner eller brancher for at sikre, at det rigtige ord på ét sprog blev parret med den rigtige ækvivalent på et andet.
Efterhånden blev regelbaseret maskinoversættelse erstattet af statistisk maskinoversættelse. Dette sætningsbaserede system er mere fritænkende og kontekstdrevet end det ordbaserede maskinoversættelsessystem, vi netop har beskrevet. Statistisk maskinoversættelse bruger både tosprogede og etsprogede korpusser til at generere statistiske modeller og identificere den mest sandsynlige måde at oversætte bestemte sætninger på i den givne kontekst. Det betyder, at statistisk maskinoversættelse trækker på og dermed er afhængig af store mængder eksisterende menneskelige oversættelser for at kunne producere automatiserede oversættelser.
Statistisk maskinoversættelse er den form for maskinoversættelse, der har gjort det muligt for tjenester som Google Translate at blomstre. Selvom dette system generelt anses for at være bedre end regelbaseret maskinoversættelse, er det ikke uden fejl. Den statistiske oversættelsesteknologi kan kun oversætte det, der er blevet oversat før, og derfor er den afhængig af løbende adgang til nye tekster for at holde sig ajour med ændringer i sprog og kultur. En anden ulempe ved denne teknologi er, at den gentager menneskelige fejl, hvis disse fejl optræder tilstrækkeligt mange gange i det tekstmateriale, det statistiske maskinoversættelsessystem tager udgangspunkt i.
Neural maskinoversættelse
Neural maskinoversættelse er den nyeste innovation inden for maskinoversættelse. Det er en avanceret teknologi, der lærer sig selv at oversætte ved hjælp af et stort neuralt netværk. I modsætning til regelbaseret maskinoversættelse, hvor maskiner følger regler skrevet af menneskelige lingvister, kan neurale systemer producere resultater af højere kvalitet, fordi de har lært sig alle trinnene i oversættelsesprocessen, fra input til output (dette kaldes end-to-end learning).
Derfor kræver neural maskinoversættelse heller ikke nær det samme niveau af supervision og menneskelig indgriben som regelbaseret maskinoversættelse. Neural maskinoversættelse kan desuden tilpasse sig nye kontekster gennem automatiserede processer. Værktøjer, der bygger på neural maskinoversættelse, tager højde for den bredere kontekst i en tekst i stedet for blot et par ord på hver side af det ord, der er i fokus.
Ligesom statistisk maskinoversættelse er neural maskinoversættelse dog stadig afhængig af datasæt og færdige oversættelser. Ifølge Microsoft skal neural maskinoversættelse bruge flere millioner oversatte sætninger for at fungere. Fordelen ved denne form for maskinoversættelse er, at den kan træne sig selv – jo flere oversættelser den udfører inden for et bestemt domæne eller sprog, desto bedre bliver den.
Vores maskinoversættelsesservices
COMUNICA tilbyder forskellige maskinoversættelsesservices alt afhængigt af, hvilken type tekst der skal oversættes, og hvilke behov kunden har.
Her er de tre forskellige niveauer af maskinoversættelse, vi kan hjælpe dig med hos COMUNICA:
- Rå maskinoversættelse
- Maskinoversættelse og efterredigering
- Maskinoversættelse, efterredigering og revision
I tabellen nedenfor kan du få en mere detaljeret oversigt over disse tre services (i tabellen har vi anvendt forkortelsen “MT”, som står for machine translation). De efterfølgende afsnit beskriver forskellene mellem vores maskinoversættelsesservices, og hvilke indholdstyper de hver især egner sig bedst til.
Rå MT | MT + efterredigering | MT + efterredigering + revision | |
Indholdstyper |
|
|
|
Kvalitet | ⭐ | ⭐⭐ | ⭐⭐⭐ |
Pris | 💲 | 💲💲 | 💲💲💲 |
Tid | 🏁 | 🏁🏁 | 🏁🏁🏁 |
Rå maskinoversættelse
Rå maskinoversættelse er den mest basale form for maskinoversættelsesservice, der findes. Med denne service lægges teksten ind i et maskinoversættelsesværktøj, og der foretages ikke yderligere gennemgang eller redigering. Det er altså det rå output, der anvendes. Fordelen ved dette er, at det både er hurtigt og billigt. Men det indebærer også en større risiko for fejloversættelse, og dele af teksten vil formentligt lyde unaturlige.
Rå maskinoversættelse anses derfor generelt for at være uegnet til kreative indholdstyper som reklamer og marketing eller ekstern kommunikation, men kan være velegnet til interne e-mails, brugergenererede tekster som produktanmeldelser og spørgeskemabesvarelser eller til oversættelse af store mængder tekst, hvor kvalitet ikke er en prioritet.
Maskinoversættelse + efterredigering
Efterredigering (også kendt som post-editing) af maskinoversættelse er den mest almindelige service inden for maskinoversættelse. Med denne service oversættes teksten først ved hjælp af et maskinoversættelsesværktøj, hvorefter resultatet bliver efterredigeret af en professionel oversætter. Oversætteren kan ændre sætninger, der lyder unaturlige, og rette eventuelle fejloversættelser. Slutresultatet er derfor en hybridtekst skabt af både menneske og maskine, der kombinerer fordelene ved begge.
Takket være den menneskelige indblanding er kvaliteten typisk højere sammenlignet med rå maskinoversættelse. Maskinoversættelsen er dog stadig mere bundet af originalens syntaks og ordstilling. Det begrænser maskinens evne til at skabe tekster, der lyder som om, de oprindeligt er skrevet på måltekstens modersmål. Denne service kan derfor stadig være uegnet til oversættelse af tekster, der skal have en mere naturlig klang, eller kreative tekster, der skal engagere læseren med et malerisk og levende sprog.
Klik her for at læse mere om efterredigering.
Maskinoversættelse + efterredigering + revision
Maskinoversættelse med efterfølgende efterredigering og revision er det samme som beskrevet i afsnittet ovenfor, men med tilføjelsen af en afsluttende revision. Det er med til at øge kvaliteten yderligere og eliminere eventuelle fejl. Korrekturlæseren kan også besidde en særlig ekspertise, f.eks. inden for jura eller medicin, for at sikre, at de anvendte termer er korrekte inden for dette område. Denne service egner sig til kunder, som ønsker at reducere omkostningerne ved oversættelse og oversætte større mængder tekst uden at skulle gå for meget på kompromis med kvaliteten.
Problemer med maskinoversættelse
Selvom maskinoversættelse er kommet langt, er teknologien stadig ikke helt fejlfri. Nedenfor gennemgår vi nogle af problemerne ved maskinoversættelse.
- Forståelse for kontekst: Ord kan have forskellige betydninger afhængigt af kontekst, og selvom maskiner er gode til at gætte, hvilke ord der skal bruges i en bestemt sammenhæng, kan de stadig tage fejl.
- Mekanisk syn på sprog: Sprog er et menneskeligt fænomen og kan have flere lag. Maskiner kan have svært ved at forstå underliggende betydning, ironi og metaforiske udtryk. Nogle gange oversætter de talemåder bogstaveligt, hvilket giver ret morsomme, men ofte ubrugelige resultater.
- Overflod af ord og unaturlig syntaks: Maskiner har en tendens til at bruge flere ord end nødvendigt. Dette står i kontrast til den menneskelige oversætter, hvis job det er at skære unødvendige ord fra. Grundet maskinernes manglende evne til at forstå kontekst læner de sig ofte tæt op ad kildeteksten, især hvad angår syntaks, hvorimod menneskelige oversættere har en mere fri og kreativ tilgang.
Fordele og ulemper ved maskinoversættelse
Der er mange fordele og ulemper ved maskinoversættelse. De største fordele er de lavere omkostninger og muligheden for at oversætte mere tekst på kortere tid, mens de største ulemper er risiciene for fejl og misforståelser. Derudover vil der altid være et behov for at involvere menneskelig ekspertise i et vist omfang for at forhindre, at dyre eller pinlige fejl slipper gennem maskinens (relativt store) nåleøje.
Der er flere faktorer, som spiller ind, når du skal vurdere, om maskinoversættelse er det rigtige valgt til dit oversættelsesprojekt. Start med at kigge på formålet med din tekst, de sprog, du arbejder med, og din målgruppe. Du er også mere end velkommen til at kontakte os her hos COMUNICA. Vi tager gerne en faglig snak eller sender dig et uforpligtende tilbud på vores maskinoversættelsesservices.