Hvordan Skype Translator fungerer

Innholdsfortegnelse:
- Teknologien som gjør det mulig
- Fra ett talespråk til et annet på noen få sekunder
- Testprogrammet som utgangspunkt
Science fiction er full av referanser til teknologisk avanserte enheter hvis drift, for å parafrasere det mytiske uttrykket, ikke kan skilles fra magi. Som følge av forfatternes kreative sinn, er det vanskelig å forestille seg når slike oppfinnelser kan være i våre hender og vi ender opp med å akseptere at deres eksistens ikke vil bli en del av vår livssyklus. Men av og til sniker en av dem seg inn i livene våre for tidlig. Det er tilfellet med sanntidsoversettelsen som Microsoft og Skype er i ferd med å gjøre mulig
"Oppgaven er alt annet enn enkel.Det involverer Skypes evne til videokonferanser, Microsoft Azures enorme nettverk av skyservere, Microsoft Researchs teknologiske nyvinninger og nylige fremskritt innen flere områder som statistikk og maskinlæring. Alt dette står til tjeneste slik at systemet gjenkjenner det du sier så snart du uttaler en setning på språket ditt, oversetter det og overfører det til kontakten din på et annet språk. Hvordan er det mulig?"
Teknologien som gjør det mulig
… . Skype Translator er resultatet av flere tiår med forskning innen talegjenkjenning, maskinoversettelse og maskinlæringsteknikker. På alle disse områdene hviler driften av et system som ikke ville vært mulig uten de siste fremskrittene innen dem. Skype Translator er resultatet av flere tiår med forskning innen talegjenkjenning, maskinoversettelse og maskinlæringsteknikker.Begynner med Talegjenkjenning, en teknologi som har vært under etterforskning en stund, men som alltid har blitt påvirket av det store antallet av feil og overdreven følsomhet i eksisterende systemer. Et sekund med tvil, små variasjoner i aksenten, eller et minimumsstøy var nok til å forvirre datamaskinen og få den til å forstå hva den ville. Slik var det helt til utviklingen av «deep learning»-teknikker og etableringen av kunstige nevrale nettverk eksploderte, noe Microsoft Research vet noe om. Takket være dem har det vært mulig å redusere feilfrekvensen betraktelig og forbedre påliteligheten og robustheten til talegjenkjenning, et nødvendig første skritt for at Skype Translator skal fungere.
maskinoversettelse er den andre åpenbare grunnpilaren som Skype Translator hviler på. Her bruker Microsoft igjen intern teknologi og bruker Bing-oversettelsesmotoren til å oversette tekst fra ett språk til et annet.Systemet hans bruker en kombinasjon av syntaksgjenkjenningsteknikker og statistiske modeller for å avgrense resultatet. I tillegg er motoren ved denne anledningen spesi altrent til å gjenkjenne den type språk som forekommer i muntlige samtaler, langt fra den korrektheten og ryddigheten som vanligvis antas skriftlig. Dermed kombinerer Skype Translator-systemet den enorme språkkunnskapsbasen til Bing Translator sammen med et omfattende lag med ord og setninger som vanligvis brukes i dagligtale.
Men tale og språk er komplisert terreng. De endrer seg hele tiden, de kommer i flere smaker og varianter, hver person har sin egen spesielle stil, etc. Skype Translator må holde tritt med alt dette, og krever konstant opplæring og optimalisering av både talegjenkjenning og maskinoversettelse. For å gjøre dette systemet er bygget på en robust 'maskinlæringsplattform', en gren av kunstig intelligens som tar sikte på å utvikle teknikker som lar maskiner og algoritmer lære ved å trene med prøvedata.Bruken av disse teknikkene, som er vanlig innen statistikkområdet, gjør at tjenesten kan forbedres etter hvert som den brukes, ved å dra nytte av dataene som genereres når de brukes til å avgrense talegjenkjenning og automatisk oversettelse.
Noen av disse testdataene genereres automatisk fra en lang rekke kilder, inkludert sosiale nettverk som Facebook, oversatte nettsider, videoer med undertekster, eller til og med samtaler opprettet for formålet og transkribert og oversatt manuelt . Men en annen del av dataene kommer fra faktiske samtaler holdt gjennom tjenesten. Dette er viktig fordi, ettersom Microsoft varsler deg med hver samtale, bør du vite at Skype Translator kan ta opp samtaler, holde dem anonyme, slik at de senere kan analyseres av algoritmene og introdusert i opplæringsprosessen for deres statistiske modeller.
Skype Translator kan bare fungere ordentlig hvis den er i stand til å lære gjennom en prosess basert på bruken i ekte menneskelige samtaler
"Systemet kunne ikke fungere uten denne læreprosessen. Mens mennesker snakker pauser vi og gjentar ting, gjør feil og endrer tankegangen vår mens vi går, introduserer ahs, ehms, uhms>bare å lære om den faktiske bruken kan gjøre den bedre "
Fra ett talespråk til et annet på noen få sekunder
Støttet av alle disse fremskrittene, nøkkelen er at Skype Translator er i stand til å utføre hele gjenkjennings- og oversettelsesprosessen raskt og transparent for brukeren Hver gang vi snakker, må systemet gjenkjenne det vi sier, oversette det til mottakerens språk og kommunisere det til ham på en måte som forblir tro mot det vi i utgangspunktet prøvde å kommunisere.Jo mindre vi legger merke til mellomtrinnene, jo bedre.
Så snart systemet oppdager at vi snakker begynner det å registrere hva vi sier og starter talegjenkjenningsprosessen Dette er ikke om ikke bare å gjenkjenne hvert ord vi uttaler, men også å eliminere alt overflødig, slette meningsløse uttrykk og støy, oppdage inndelingen av teksten i setninger, med inkludering av skilletegn og store bokstaver, og gi den en kontekst som hjelper på din tolkning. Når du tenker deg litt om, skjønner du hvor vanskelig det er å bestemme alt dette fra talespråket.
Skype Translator trenger at talegjenkjenningen er så nøyaktig som mulig, fordi det som følger er forbereder den innsamlede informasjonen for å sammenligne den med de statistiske modellene som har blitt bedre gjennom sitt maskinlæringssystem.Her består prosessen i å finne likheter mellom det systemet har forstått at vi sa og ordene og kontekstene som finnes i modellene, for deretter å anvende tidligere lærte transformasjoner som vil konvertere lyden til tekst og oversette den til fremmedspråket.
I det siste trinnet har Skype forberedt et par roboter, med kvinnelige og mannlige stemmer, som fungerer som tolker i samtalen Når en er valgt av brukeren, vil han være ansvarlig for å kommunisere vår oversatte melding til mottakeren, slik at ikke bare de skriftlige transkripsjonene og oversettelsene vises på skjermen, men han kan også høre dem høyt som om et tredje menneske var formidler mellom oss.. Disse botene er i stand til raskt å kommunisere meldingen, slik at den som lytter på den andre siden av skjermen mottar meldingen noen sekunder etter at vi har utt alt den.
Testprogrammet som utgangspunkt
Nettopp tilstedeværelsen av roboter som tredjepartstalere i samtalen er en av detaljene som fortsatt gjenstår å finpusse. Microsoft erkjenner at det er enkelt for folk som er vant til å snakke gjennom en tolk å tilpasse seg dem, men for andre krever det en læringsperiode. Og det er at Microsoft og Skype kan være fast bestemt på å skape den beste sanntidsoversettelsesopplevelsen som finnes, men for å gjøre det trenger de at vi lærer både oss selv og maskineneForhåndsvisningen av Skype Translator er bare ett trinn til i den prosessen.
Testprogrammet ble publisert i midten av desember, og introduserte t alt oversettelse mellom to språk: engelsk og spansk, og skriftlig oversettelse på mer enn 40 For å få tilgang til den er det nødvendig med en invitasjon, som vi kan be om ved å registrere oss på programmets nettside. Hvis vi er glade for det, kan vi prøve Skype Translator fra Skype-applikasjonene for Windows 8.1 eller Windows 10 Teknisk forhåndsvisning. Ellers må vi vente på at tjenesten utvides og offentliggjøres offisielt.
"Uansett, Skype Translator har startet akkurat da vi skal ta farvel med 2014. Før du avslutter, stopp her et øyeblikk og tenk på året du nettopp leste: to tusen fjorten>"
Via | Skype Blogs I, II