Microsoft julkistaa yleiskääntäjän, joka muuntaa äänesi toiselle kielelle

Spock

Microsoft Research on esittänyt ohjelmiston, joka kääntää puhutut sanasi toiselle kielelle säilyttäen todellisen äänesi aksentin, sävyn ja intonaation.

Jonkin sisällä prototyyppiohjelmiston demo (alkaa noin 12 minuutin kohdalla), Microsoftin tutkimusjohtaja Rick Rashid sanoo pitkän lauseen englanniksi ja kääntää sen sitten espanjaksi, italiaksi ja mandariiniksi. Voit varmasti kuulla digitalisoidun Microsoft Samin reunan, mutta kaiken kaikkiaan on huomattavaa, kuinka nämä kolme käännöstä kuulostavat edelleen aivan kuin Rashid.



Käännösjärjestelmän tehtävän suorittaminen vaatii noin tunnin koulutuksen, jonka avulla se voi luoda äänimallin. Tämä malli yhdistetään sitten Microsoftin vakiomuotoiseksi tekstistä puheeksi -malliksi kohdekielelle. Esimerkiksi Microsoftin espanjankielisen vakiomallin ääni on oletusarvoinen S (ess), mutta harjoitusprosessi korvaa sen S-äänelläsi. Tämä tehdään jokaiselle yksittäiselle äänelle (foneemille) Microsoftin espanjan kielestä puheeksi-puhemallissa. Ohjelmiston luoja Frank Soong sanoo, että tätä lähestymistapaa voidaan käyttää kääntämään kaikkien 26 kielen välillä, joita Microsoft Speech Platform tukee, joka kattaa suurimman osan maailman tärkeimmistä kielistä.





Kun koulutusjakso on poissa tieltä, ei ole mitään syytä, että käännöstä ei voitu suorittaa reaaliajassa älypuhelimella tai lähes reaaliajassa, jos ulkoistit työn pilvitietoklusteriin, kuten Microsoft Azure.

Kuvittele nyt tämä tekniikka kaksisuuntaisessa asennuksessa. Puhut älypuhelimeesi, ja se tulee heidän kielellään. Sitten henkilö, jonka kanssa puhut, puhuu älypuhelimeesi ja hänen äänensä tulee sinun kielelläsi. Pari vuotta sitten Microsoft esitteli puhelimia, jotka voisivat kääntää puhelut lähes reaaliajassa ; voit soittaa jollekin puolivälissä maailmaa, ja vaikka sinulla ei olisikaan yhteistä kieltä, voit silti kommunikoida. Tätä tekniikkaa ei ole vielä esiintynyt todellisessa maailmassa, mutta ei tietenkään olisi yllättävää, jos Windows Phone 8 (tai 9) oli se sisäänrakennettu.



Riittää, kun sanotaan, että yksisuuntainen laite olisi hyödyllinen matkoilla, mutta kaksisuuntainen, Babelin kala, yleiskäännöslaite, a la Star Trek tai Doctor Who olisi jotain muuta kokonaan. Se voi myös olla juuri sitä, mitä maailma tarvitsee säilyttääkseen pienemmät kielet, joita raskaat lyöjät, kuten englanti, kiina ja espanja, järjestelmällisesti hallitsevat.



Lue lisää osoitteessa Gizmodo tai katso video Rick Rashidista, joka esittelee ohjelmistoa TechFest 2012 -ohjelmassa

Päivitetty @ 11:51: Alun perin tämän tarinan mukana olleet äänileikkeet olivat huonoja. Jos haluat nähdä käännöksen käytännössä, katso yllä oleva video tai lataa pääpuheen MP3-versio ; demo alkaa noin 12 minuutin kohdalla.