通過語言和聲音來表達自己的意愿是人與人溝通的基本方式,而人與機器間卻一直存在著溝通上的種種障礙,如何突破這種限制,形成像人與人之間充滿智慧、溫情的人機交互則是人類一直努力的方向。iPhone 4S的推出則開創(chuàng)了這種先河,Siri的語音人機互動功能讓機器不再冰冷,然而遺憾的是中國消費者還無福消受。不過目前上汽推出了一個應(yīng)用于汽車上且類似Siri系統(tǒng)的iVoka語音云交互技術(shù),中文的語音系統(tǒng)讓國人可以率先體驗到人機交互系統(tǒng)的魅力與樂趣。
1.jpg (53.9 KB, 下載次數(shù): 14)
下載附件
保存到相冊
2012-6-22 09:54 上傳
iVoka是已經(jīng)搭載在上汽榮威車型上inkaNet系統(tǒng)的3.0版本,相比上一代系統(tǒng),它的亮點是加入了智能語音交互系統(tǒng),即通過語音命令來代替?zhèn)鹘y(tǒng)按鍵的輸入方式。不過這種語音交互方式也對系統(tǒng)提出了更高的要求,如果想取得更好的用戶體驗,系統(tǒng)就需要準確的識別人類語言所要表達的意思,同時做出合理且人性化的反饋,而且系統(tǒng)的思考時間也不可過長等等。當然要實現(xiàn)這些并不容易,我們可以把這些目標看作一個標桿,越接近它,就說明這套系統(tǒng)的人機智能化越發(fā)達和人性化。
目前iVoka系統(tǒng)可以對打電話、發(fā)短信、導(dǎo)航、資訊查詢、聽音樂、聽廣播實現(xiàn)語音控制,其它功能暫時仍需要手動輸入指令,下面我們就來看看iVoka語音控制功能的表現(xiàn)究竟如何。
2.jpg (33.43 KB, 下載次數(shù): 16)
下載附件
保存到相冊
2012-6-22 09:54 上傳
簡單來說,我們可以把裝載在車輛上的這套iVoka系統(tǒng)看成是一部安裝有安卓系統(tǒng)的智能手機,通過觸摸式屏幕我們可以對其進行隨心所欲的控制。其中的人機交互系統(tǒng),更像是你的一個貼心助手,對你的命令或者需求作出相對人性化甚至是幽默式的回應(yīng),而且用戶無需拘泥于死板的語法結(jié)構(gòu),只需用簡單或者日常用語向機器表達自己的訴求。
● 接/打電話
3.jpg (28.32 KB, 下載次數(shù): 11)
下載附件
保存到相冊
2012-6-22 09:54 上傳
要實現(xiàn)這個功能首先需要通過藍牙將手機中的聯(lián)系人信息傳送到iVoka車載系統(tǒng)中,通過語音命令iVoka來撥打電話。當有電話打進來時,系統(tǒng)也會通過語音來詢問用戶是否接聽此電話。
● 接收/發(fā)送短信
4.jpg (47.25 KB, 下載次數(shù): 13)
下載附件
保存到相冊
2012-6-22 09:54 上傳
通過語音來發(fā)送和獲取短信內(nèi)容,可以使駕駛員的注意力更多的集中在車輛駕駛上。但是在語音輸入短信內(nèi)容時,用戶必須使用標準的普通話(當然也不至于到新聞聯(lián)播的水平),否則系統(tǒng)會產(chǎn)生錯誤識別的情況發(fā)生,同時由于中文多音字的原因,也會偶爾使系統(tǒng)對用戶的語音命令產(chǎn)生誤解。
● 導(dǎo)航
5.jpg (47.9 KB, 下載次數(shù): 8)
下載附件
保存到相冊
2012-6-22 09:54 上傳
進入導(dǎo)航功能后,在搜索具體目的地時有兩種途徑,一是通過語音與iVoka車載系統(tǒng)進行人機交互;另一種則可以遠程呼叫客服人員,通過人與人的溝通,將目的地信息下載到導(dǎo)航地圖中來實現(xiàn)車輛導(dǎo)航。
● 資訊查詢
6.jpg (46.14 KB, 下載次數(shù): 12)
下載附件
保存到相冊
2012-6-22 09:54 上傳
通過語音交互系統(tǒng)可以實現(xiàn)的資訊查詢包括了當前時間、日期、某城市的天氣情況以及航班信息,應(yīng)該說內(nèi)容相對有限。不過隨著功能的逐漸豐富,未來還會加入如股票、新聞等更多的可以通過人機交互系統(tǒng)來完成的資訊查詢和獲取。
● 聽音樂、廣播
7.jpg (31.98 KB, 下載次數(shù): 9)
下載附件
保存到相冊
2012-6-22 09:54 上傳
收聽音樂分為兩種情況,一是讀取本機,即SD卡上的音樂文件,并且可以通過語音命令直接說出想要聽的歌曲名稱,此時iVoka系統(tǒng)便會播放此音樂。另一種是通過系統(tǒng)的3G網(wǎng)絡(luò)在線收聽網(wǎng)絡(luò)音樂,只是還不支持網(wǎng)絡(luò)音樂搜索功能。
8.jpg (30.24 KB, 下載次數(shù): 13)
下載附件
保存到相冊
2012-6-22 09:54 上傳
收聽廣播時,用戶只需說出電臺的頻率,系統(tǒng)便可直接轉(zhuǎn)入相應(yīng)的電臺,同時可以將喜愛的電臺通過語音命令進行收藏。今后用戶還可以發(fā)出“收聽北京音樂臺、北京交通臺”的類似指令,讓系統(tǒng)直接跳轉(zhuǎn)至對應(yīng)電臺,無需用戶記下電臺的頻率。
9.jpg (42.62 KB, 下載次數(shù): 15)
下載附件
保存到相冊
2012-6-22 09:55 上傳
● 像操作智能手機一樣來實現(xiàn)其它功能
10.jpg (25.66 KB, 下載次數(shù): 8)
下載附件
保存到相冊
2012-6-22 09:55 上傳
這套iVoka車載智能系統(tǒng)采用開放式的安卓系統(tǒng),通過安裝各種第三方軟件可以豐富它的功能,再加上觸控式的屏幕,對于年輕人來說,上手很容易,且就像操作智能手機一樣輕松自如。
● 日后與CAN總線的融合為用戶提供更多行車數(shù)據(jù)
11.jpg (35.78 KB, 下載次數(shù): 9)
下載附件
保存到相冊
2012-6-22 09:55 上傳
● 目前它還像一個兩三歲的孩子 日后通過“教育”會讓它變得更加聰明和智能化
這套系統(tǒng)目前仍處于測試階段,所以還存在諸多不完善的地方,而主要問題集中在以下幾點:
① 雖然iVoka系統(tǒng)已經(jīng)可以識別一個意思的多種表達方式,使用戶不必糾結(jié)于嚴謹?shù)恼Z法結(jié)構(gòu),但是由于中文的博大精深,難免會出現(xiàn)無法識別的語言表述情況。
② 目前iVoka系統(tǒng)只支持普通話,而且每一個語音指令都需要用戶字正腔圓的朗讀清楚,否則系統(tǒng)就會出現(xiàn)識別錯誤或者無法識別的情況。
③ 系統(tǒng)的反應(yīng)速度受制于硬件的原因還不夠令人滿意,用戶發(fā)出的每條指令,系統(tǒng)都需要至少2秒鐘的時間才可以做出反應(yīng)。
④ 在人機交互系統(tǒng)方面還不夠人性化,由于iVoka的語音回復(fù)詞庫是預(yù)先植入到系統(tǒng)內(nèi)的,而詞庫的豐富程度也就決定了它是否可以像人類交談那樣賦有多種情感。
⑤ 這套iVoka系統(tǒng)通過語音交互來實現(xiàn)的功能還比較有限,像接、打電話等常用到的功能外,其它諸多功能仍需通過傳統(tǒng)的手寫方式來實現(xiàn)。
12.jpg (45.19 KB, 下載次數(shù): 9)
下載附件
保存到相冊
2012-6-22 09:55 上傳
目前iVoka的理解力、表達能力以及智商還像一個兩三歲的孩子,成人之間的話語可能并不能被它所理解,自然也無法做出合理的回應(yīng),更談不上深入或者帶有情感的交流。不過通過不斷對它進行語言上的“教育”以及邏輯思維能力的“培養(yǎng)”,相信它會越來越接近人類的智商,使人與機器間實現(xiàn)更輕松的互動。
● 使用費用
該系統(tǒng)采用聯(lián)通3G套餐業(yè)務(wù),頭兩年免費,其中每月有100分鐘通話時間和400兆流量。根據(jù)目前所反饋的情況,這樣的資費內(nèi)容可以滿足絕大部分用戶的使用需求。
全文總結(jié):
這套系統(tǒng)相當于已經(jīng)構(gòu)筑好了一個架構(gòu)或者平臺,隨著更多新功能的加入以及對人機交互系統(tǒng)的不斷完善,未來它的功能會更加豐富且人性化。但是讓機器去讀懂已經(jīng)有成千上萬年歷史的人類語言,并非一朝一夕之事,這種認知少不了對人類文明的深刻了解,只有這樣,機器或許才能深入理解人類每句話、每個詞的含義,做到類似人與人之間那樣充滿智慧、溫情、幽默的溝通方式。
|