Car-tech

Windows Phone 7 a Excel on Speech

Excel by Voice. Magic Speech Recognition for spreadsheets. (Dragon NaturallySpeaking)

Excel by Voice. Magic Speech Recognition for spreadsheets. (Dragon NaturallySpeaking)
Anonim

Sperando di scavalcare su Google e i successi di Apple nel mercato degli smartphone, Microsoft prevede di utilizzare il riconoscimento vocale basato sul cloud e la tecnologia di elaborazione del linguaggio naturale per offrire funzionalità di interfaccia utente non presenti su iPhone o dispositivi Android.

"Crediamo che il parlato non sia un'applicazione separata. è parte integrante dell'esperienza utente ", ha dichiarato Zig Serafin, general manager delle comunicazioni unificate di Microsoft, davanti a un pubblico alla conferenza SpeechTEK 2010, che si terrà questa settimana a New York.

Al fine di potenziare le capacità di Windows Phone 7 per comprendendo un comando vocale e fornendo il risultato richiesto, la società prevede di legare i telefoni Windows Phone 7 con il servizio di riconoscimento vocale basato sulla cloud di Tellme e il servizio di elaborazione del linguaggio naturale, ha affermato Se rafin, in una successiva intervista con IDG News Service.

[Ulteriori letture: i migliori telefoni Android per ogni budget.]

Microsoft ha acquistato la società che ha creato questo servizio, Tellme Networks, nel 2007.

Prima del pubblico di SpeechTEK, Serafin ha castigato i sistemi operativi Android e iPhone per l'utilizzo delle icone come principale forma di interazione. "La maggior parte degli smartphone è una griglia di icone, molto simile a Windows 3.1", ha detto.

Parlare al telefono è un modo più naturale di dirgli cosa fare, ha detto. "Quando ti sposti a un dispositivo che non dispone di una tastiera grande, la voce è un complemento irresistibile per quell'esperienza", ha detto Serafin.

Poi ha fatto il marketing director di Microsoft Ilya Bukshteyn a eseguire una dimostrazione di come un Windows Phone 7 potrebbe usare il riconoscimento vocale e l'elaborazione del linguaggio naturale, o il modo con cui un computer interpreta ciò che una persona dice. Bukshteyn chiese al telefono di chiamare "Paul" e una voce che emetteva dal telefono rispose con un numero di contatti diversi con il primo nome di Paul. Bukshteyn ha risposto con il nome completo specifico e il telefono ha provveduto a chiamare quella persona.

Bukshteyn ha anche detto al telefono di aprire un album di immagini, e una schermata di visualizzazione delle immagini è apparsa sullo schermo, mostrando non solo le foto scattate dall'utente, ma anche preso dagli amici dell'utente che sono stati pubblicati sui siti di social networking.

In un terzo esempio, Bukshteyn ha chiesto un elenco di ristoranti cinesi vicini. La richiesta è stata inviata al servizio di ricerca di Bing, che ha restituito un elenco di ristoranti e le loro posizioni su una mappa.

Mentre le varianti di iPhone e Android utilizzano alcune funzionalità di riconoscimento vocale, il servizio telefonico di Microsoft sarà diverso in un numero di Rispetta, ha detto Serafin. Per uno, non sarà limitato ad essere utilizzato in poche app, ma potrebbe essere usato per controllare l'intero telefono. Il secondo modo in cui questo servizio sarà unico è che sarà interattivo. Se viene dato un comando ambiguo, il telefono o il servizio appropriato può chiedere all'utente di chiarire la richiesta.

Il componente vocale è una parte di ciò che Serafin ha chiamato "interfaccia utente naturale" o NUI. Il NUI si basa sulla voce, sul tocco e persino sul movimento come forme di input.

"Il linguaggio è il cuore del NUI", ha affermato. Parte della dimostrazione ha mostrato come la tecnologia Kinnect XBox di Microsoft potesse interpretare i gesti delle mani per attivare azioni sul computer. Questa tecnologia verrà utilizzata nei prodotti Microsoft oltre la XBox, ha detto Bukshteyn in una successiva intervista con IDG.

Serafin ha detto che l'azienda è nei primi processi di interazione vocale a rotazione in diversi componenti di Windows Phone 7, a partire da quelli più pesanti usato: cerca, chiama le persone e guida gli utenti alle raccolte di foto.

Un utente può attivare il telefono per ascoltare i comandi vocali tenendo premuto un solo tasto sul telefono. Alcune delle elaborazioni della lingua verranno eseguite sul telefono e alcune saranno eseguite da Tellme. "Onestamente, l'utente non dovrebbe sapere o preoccuparsi di" dove vengono elaborati i comandi vocali, ha detto Bukshteyn.

Serafin ha affermato che il servizio Tellme è il più grande sistema di elaborazione del linguaggio naturale utilizzato oggi. Microsoft offre il servizio a grandi organizzazioni per il supporto di help desk basato su telefono. Il servizio supera i 2,5 miliardi di chiamate all'anno per i clienti aziendali, ha affermato.

Joab Jackson copre le ultime novità del software aziendale e della tecnologia generale per Il servizio News IDG. Segui Joab su Twitter all'indirizzo @Joab_Jackson. L'indirizzo e-mail di Joab è [email protected]