Jelenleg egy kis hangparancsnoki csata folyik a mobil térben, az Apple digitális Siri asszisztense és a Google hangkeresésével. A felhasználók érzelmeire való felhasználása egymás ellen használva. Mindkettő saját előnyeivel és hátrányaival jár, és csak jobb lesz, amikor előrelépünk a jövőbe, de úgy tűnik, hogy a Microsoft kutatási és fejlesztési csapata valami hangon dolgozik, amely a színfalak mögött álló saját hangon alapul, amely megváltoztathatja az utat. Az emberek kölcsönhatásba lépnek egymással.
Noha a Siri sokkal erősebb, mint a Google hangkeresésének az iOS platformon, mindkettő általában ugyanúgy működik, ha a felhasználó hallható parancsait rögzíti, mielőtt közzéteszi és feldolgozza a parancsot egy háttér-kiszolgálón, mielőtt az eredményt köpte volna Vissza a felhasználóhoz, és a kérés alapján cselekszik. A Microsoft közzétette egy videót, amelyben Rick Rashid előadása szerepel, amely felvázolja azokat a javításokat, amelyeket a vállalat a természetes felhasználói interfészek területén végzett az emberi beszéd segítségével.
Az emberi beszédet megértő számítógépes rendszerek nem új találmány. Láttuk az évek során sok olyan kiadást, amelyek jelentős előrelépést mutatnak ezen a területen, mivel a Siri és a Google Voice Search néhány legfrissebb példa arra, hogy ezt a technológiát hogyan lehet alkalmazni a való világban. A Microsoft azonban csendben megpróbálta néhány lépést megtenni néhány lépéssel azáltal, hogy olyan technológiák körül olyan rendszert épít, amely nemcsak felismeri az emberi beszédet, hanem egy idegen nyelv szövegévé is lefordítja, majd megismételje a szavakat az adott nyelven egy szintetizált hang segítségével, amelyet generált szintetizált hang segítségével generált. hogy úgy hangzzon, mint a hangszóró.
A színpadi demonstráció, amelyben a Microsoft kutatási vezérigazgatója bemutatja a cselekvési technológiát, felismerve beszélt angol szavait, átalakítva őket kínaivá a tervezett kijelzőn, majd hallhatóan bejelenti ugyanazt a mondatot a mandarinban. Mindez eléggé fúj, de akkor a dolgokat egy kicsit veszik fel, amikor rájössz, hogy Rashid és kollégái több mint egy órás saját hangjait táplálták a rendszert, hogy a rendszer megismételhesse a mandarin mondatát az övével. Saját hang!
A technológia nem a legjobb, és még mindig hibákat követ el, de valóban megdöbbentő rájönni, hogy ez lehetséges. Az emberi interakció jövője abszolút a láthatáron van.
(a TechetBlog segítségével)
Köveshet minket a Twitteren, hozzáadhat minket a köréhez a Google+ -on, vagy kedvelheti a Facebook oldalunkat, hogy naprakészen tartsa magát a Microsoft, a Google, az Apple és az Web minden aktuálisján.