Car-tech

Con S-Translator, Samsung punta a raggiungere un vecchio obiettivo del settore in tempo reale

Leap Motion SDK

Leap Motion SDK

Sommario:

Anonim

Il Samsung Galaxy S4 sarà disponibile in 155 paesi entro la fine del mese prossimo, e la sua traduzione vocale in tempo reale per aiutare le persone a comunicare oltre confine potrebbe essere una delle sue caratteristiche più ambiziose.

Tradurre le conversazioni vocali in tempo reale è stato un obiettivo per dispositivi e software per anni, e Samsung afferma di l'ho raggiunto Con la sua app S-Translator integrata, il Galaxy S4 promette di catturare le parole pronunciate in una lingua e quindi riprodurle in un'altra lingua, tutte alla velocità di una conversazione. Samsung afferma che offrirà supporto per 10 lingue non appena il telefono raggiunge la strada.

C'è una ragione per cui la traduzione vocale in tempo reale è in corso da tanto tempo. Comporta tre diversi processi che sono tutti almeno moderatamente difficili da fare bene. Nel 2008, il colosso della rete Cisco Systems ha promesso il proprio sistema di traduzione in un anno, progettato per entrare nella sua piattaforma di videoconferenza TelePresence. L'azienda dovette tornare indietro un anno dopo, dicendo che il lavoro era più difficile del previsto. Cisco sta ancora lavorando a questa funzione oggi.

[Ulteriori letture: i migliori telefoni Android per ogni budget.]

Anche se S-Translator e altri strumenti sono migliorati e continueranno ad essere più intelligenti, la tecnologia non ha ancora eliminato la barriera linguistica, dicono analisti e ricercatori. Le lingue sono troppo complesse e aperte all'interpretazione errata.

"Anche se gli esseri umani lo fanno, la traduzione in tempo reale rimane piuttosto dura, e non penso che abbiamo visto un passo avanti", ha detto l'analista di Opus Research Dan Miller.

Come funziona

S-Translator è progettato per messaggi di testo, e-mail e voce, ma sono gli scenari faccia a faccia che generano il fattore "wow". Al lancio del Galaxy S4 al Radio City Music Hall, gli attori hanno drammatizzato le capacità di S-Translator con una scenetta in cui un viaggiatore zaino in spalla americano ha chiesto a un uomo a Shanghai quale autobus prendere per un museo. Lo zaino in spalla parlava la domanda inglese nel suo Galaxy S4 e tornava fuori in mandarino parlato. Dopo che l'uomo ha ascoltato la domanda, ha risposto al telefono e le sue parole sono state convertite in testo inglese.

La conversione delle conversazioni richiede tre processi separati: conversione del discorso in testo, traduzione di quelle scritte in un'altra lingua e conversione del testo Il testo tradotto torna in parola, ha detto Ananth Sankar, un distinto ingegnere del Cisco Collaboration and Technology Group. Il primo è particolarmente difficile da decifrare quando si parla di conversazioni naturali, secondo Sankar.

Samsung

Il cuore del problema è il modo in cui parliamo alle persone, rispetto al modo in cui parliamo al pubblico o ai computer, disse Sankar. Sta parlando delle "ums e ahhs", delle false partenze e delle auto-correzioni, che interrompono la fluidità del linguaggio naturale. Rendono molto più difficile per il software interpretare una conversazione rispetto a un comando o dettato, ha detto.

La traduzione del testo ha altre sfide, e variano in base alla lingua, ha detto Sankar. Un modo comune per perfezionare tale processo è un approccio statistico, confrontando documenti di grandi dimensioni che gli umani hanno tradotto tra due lingue. Ma alcune coppie di lingue hanno più documenti tradotti disponibili di altri, quindi la precisione varia, ha detto.

Dove la traduzione in tempo reale è più vicina alla realtà è in settori specifici come business, tecnologia, diritto e assistenza di viaggio. Ad esempio, ha detto Sankar, trascrivere e tradurre discorsi preparati che coprono determinati argomenti è accurato al 90 percento in tempo reale. Impressionante, Samsung afferma che il vocabolario di S-Translator non si limita ai soggetti di viaggio.

Un altro avvertimento sulla traduzione è che il supporto di una lunga lista di lingue non significa necessariamente che il sistema possa tradurre liberamente tra tutti. Poiché il processo si basa su traduzioni già fatte, ciò che conta sono le combinazioni linguistiche. In S-Translator, gli Stati Uniti o l'inglese britannico possono essere tradotti reciprocamente con ciascuna delle altre otto lingue incluse: francese, tedesco, italiano, spagnolo latino-americano, portoghese brasiliano, coreano, mandarino e giapponese. Inoltre, coreano, mandarino e giapponese possono essere reciprocamente tradotti tra loro.

Abbattimento delle barriere

Per la traduzione, S-Translator utilizza la tecnologia Samsung, non Google Translate o qualsiasi altra piattaforma di terze parti. Una limitazione dell'interpretazione in tempo reale del sistema è che richiede una connessione dati a un server di traduzione online. Samsung non è il solo a questo, secondo Miller dell'Opus Research. Questo può essere un problema per una funzionalità che viene spesso utilizzata, come nell'esempio di Samsung, durante il viaggio.

"A meno che non stiano facendo cose localmente sul dispositivo, molte aziende ignorano il fatto che a volte può avere una connessione dati rivelarsi piuttosto costoso ", ha detto Miller. Un'eccezione rara è Jibbigo, una startup che crea un'app per iOS e Android. Jibbigo è un'app gratuita che chiama un server, ma gli utenti possono acquistare moduli per la traduzione offline di specifici gruppi di lingue. S-Translator sul Galaxy S4 include le traduzioni di alcune frasi utili incorporate nel telefono.

Sia il riconoscimento vocale che la traduzione stanno migliorando costantemente, hanno detto Sankar e Miller. Per prima cosa, il software basato su modelli statistici apprende da ogni traduzione che fa, ha detto Miller.

Cisco vede la traduzione in tempo reale delle videoconferenze all'orizzonte, ha detto Sankar, sebbene entro i limiti di qualcosa come una discussione formale e preparata tra due diplomatici.

"Crediamo qui a Cisco che arriverà un giorno in cui saremo in grado di organizzare una conferenza Web con qualcuno dall'altra parte del mondo, oltre i confini linguistici, in uno stile molto naturale di conversazione e fluidità ", Ha detto Sankar. La cattiva notizia è che le sue previsioni per questo traguardo vanno dai cinque ai dieci anni.

"Devi solo mostrare pazienza e capire che non è perfetto, ma migliorano costantemente", ha detto Miller.