http://m.casecurityhq.com 2012-02-20 16:02 來源:二十一世紀(jì)商業(yè)評論
2011年剛結(jié)束,CNN預(yù)測2012年的十大科技趨勢中,與自然用戶界面相關(guān)的技術(shù)發(fā)展趨勢占據(jù)三席,觸屏電腦名列榜首,聲控技術(shù)和體感技術(shù)分列六、七位。人機(jī)交互的再一次變革就發(fā)生在你身邊。
你能想象身體是計(jì)算機(jī)的輸入設(shè)備嗎?
體溫、脈搏、肌肉都是向計(jì)算機(jī)傳遞指令的信號,佩戴于手臂上端的傳感器能收集肌肉信號,再通過肌點(diǎn)信號識別器解讀手勢動作,從而識別手掌和手指點(diǎn)擊在皮膚上的信號,向計(jì)算機(jī)傳遞無線信號,進(jìn)而控制電腦,這就是肌肉-計(jì)算機(jī)界面,研究人員將它命名為“帶有生理感知的自然用戶界面”。
這個略顯生疏的長短語是自然用戶界面的一種新形態(tài),雖然自然用戶界面并不是新鮮事物,但它的流行足以改變你和機(jī)器互動方式,隨著自然用戶界面應(yīng)用的廣度和深度的擴(kuò)展,人機(jī)交互的技術(shù)革命必將引發(fā)一場新的科技產(chǎn)業(yè)變革。
早期的自然用戶界面是命令行界面和圖形用戶界面的補(bǔ)充。早在1970年代起,多位美國計(jì)算機(jī)學(xué)家進(jìn)行了手勢、多點(diǎn)觸摸系統(tǒng)的實(shí)驗(yàn),而彼時正是命令行界面和和圖形用戶界面的時代,用戶需要借助鍵盤輸入指令,或者用鼠標(biāo)點(diǎn)擊圖形下達(dá)命令讓機(jī)器完成相應(yīng)的動作。
而在自然用戶界面,用戶下達(dá)的指令是日常的行為,例如,手指觸碰圖標(biāo)開啟程序;與機(jī)器對話下達(dá)口頭命令,如開機(jī)、關(guān)機(jī)、跳轉(zhuǎn)窗口等;圖標(biāo)隨著手指而移動……總的來說,自然用戶界面利用手勢、機(jī)器推斷和意識情景以及豐富的3D環(huán)境讓計(jì)算變得更簡單、便捷,讓用戶的體驗(yàn)變得更加直觀。
IBM的科學(xué)家曾在2007年預(yù)測,5年后,人們不再需要密碼。在沒有傳統(tǒng)字符密碼的環(huán)境中,生物識別變得尤為重要,如指紋識別、視網(wǎng)膜識別、人臉識別。
人臉識別技術(shù)的基礎(chǔ)技術(shù)已經(jīng)得到較成熟的發(fā)展,在公安、安防領(lǐng)域?qū)崿F(xiàn)了較為廣泛的應(yīng)用。網(wǎng)易的最新研究則實(shí)現(xiàn)了基于互聯(lián)網(wǎng)的人臉識別應(yīng)用,人臉的錄入、掃描、匹配工作均可通過互聯(lián)網(wǎng)來完成。未來,你可能像《霹靂嬌娃》中女戰(zhàn)士在進(jìn)入密室時那樣輸入郵箱、游戲賬戶的密碼——通過人臉或者視網(wǎng)膜的匹配登錄。網(wǎng)易稱這項(xiàng)技術(shù)將有望在2012年上半年投入到網(wǎng)易郵箱登錄上,“人臉識別技術(shù)不存在將軍令、手機(jī)密碼等傳統(tǒng)密碼使用中常出現(xiàn)的遺失、被盜的難題。”網(wǎng)易杭州研究院副總監(jiān)汪源說,“用戶可以選擇傳統(tǒng)的字符和人臉兩種密碼登錄郵箱。”
相比指紋識別、視網(wǎng)膜識別,人臉識別技術(shù)在密碼保護(hù)領(lǐng)域有先天不足。雖然理論上說,配備超級計(jì)算機(jī)和超高清圖像設(shè)備后,人臉識別精準(zhǔn)度能達(dá)到99.9%,但現(xiàn)實(shí)條件很可能是室內(nèi)光線、普通計(jì)算機(jī)和攝像頭的組合。如果僅核對臉部圖像是否匹配,一張照片就能破解密碼了。
但人臉識別技術(shù)在其他商業(yè)領(lǐng)域和社交媒體應(yīng)用中的前景廣闊。三電株式會社和岡谷株式會社研制了一款最新自動販賣機(jī),一旦顧客靠近機(jī)器,人臉識別系統(tǒng)將自動分析顧客的容貌來判定顧客的年齡,并播放適合該年齡層的廣告。自動販賣機(jī)2.0版將會推向北美市場。
語音識別技術(shù)是也人機(jī)交互應(yīng)用中的重要一環(huán)。人機(jī)對話的前提在于語音識別技術(shù)——語音識別和語義識別。語音識別即是機(jī)器捕捉到用戶的話語,并將其在后臺轉(zhuǎn)化成計(jì)算機(jī)語言,而語義識別則是讓計(jì)算機(jī)聽懂用戶所表達(dá)的含義。語音識別技術(shù)中的兩個難點(diǎn)在于提高準(zhǔn)確度和實(shí)現(xiàn)人工智能。
UC優(yōu)視研發(fā)出一款適用于手機(jī)的語音瀏覽器,它能減少用戶在使用手機(jī)瀏覽網(wǎng)頁時的輸入動作,而把語言作為指令,包括前進(jìn)、語言搜索、跳轉(zhuǎn)網(wǎng)頁等。
但通常人們說的同一個詞語能表達(dá)多個含義。“讓機(jī)器在不同的場景下識別語義是語言識別系統(tǒng)的難點(diǎn)所在。”UC優(yōu)視產(chǎn)品總監(jiān)鄭叢威說,“這就是人工智能需要解決的問題。”在現(xiàn)階段,人工智能是基于對用戶的使用習(xí)慣進(jìn)行統(tǒng)計(jì)分析的結(jié)果而達(dá)到的智能。
但如何讓瀏覽器理解用戶所說的指令是搜索相關(guān)網(wǎng)頁,還是跳轉(zhuǎn)到相應(yīng)的網(wǎng)站呢?UC優(yōu)視對用戶使用UCweb瀏覽器的習(xí)慣進(jìn)行統(tǒng)計(jì)分析,并選用概率最大的結(jié)果作為語音瀏覽器的指令。而遇到語音瀏覽器無法識別的場景,瀏覽器會出現(xiàn)多個選項(xiàng)共用戶選擇,這時用戶還是需要手勢等其他操作。
2007年Google為了測試、改進(jìn)其語音搜索技術(shù),發(fā)布了免費(fèi)的語音搜索服務(wù)。百度在2008年效仿Google公開測試了“百度語音搜索”的電話業(yè)務(wù),但最終沒有普及。2009年,Google便發(fā)布了中文版的語音搜索軟件,運(yùn)用于諾基亞塞班操作平臺,但一直沒有得到更廣泛應(yīng)用。
事實(shí)上,移動互聯(lián)網(wǎng)的快速發(fā)展是手機(jī)領(lǐng)域人機(jī)交互興起的催化劑。受限于手機(jī)屏幕的尺寸,語音識別、語音搜索逐漸成為手機(jī)人機(jī)交互的新寵。在智能手機(jī)領(lǐng)域,UC語音瀏覽器僅是數(shù)目龐大的推廣語音識別的軟件之一,Siri的發(fā)布,掀起了人機(jī)對話的熱潮,騰訊QQ、微信等即時通訊工具都具備了語音識別功能。為了省去用戶在不到5英寸的小屏幕上打字的麻煩,韋伯斯特詞典、有道詞典都配備了語音識別功能。鄭叢威預(yù)計(jì)語音識別和語音搜索的市場前景相當(dāng)廣闊,UC在2012年第一季度正式發(fā)布UC語音瀏覽器后,20%的用戶會選擇替代目前使用的版本。
除了語音、人臉識別,捕捉人們的動作是自然用戶界面的另一個重點(diǎn)領(lǐng)域。游戲終端設(shè)備已經(jīng)在這一領(lǐng)域取得突破,Kinect游戲終端實(shí)現(xiàn)了人臉識別、手勢、動作等綜合自然用戶界面技術(shù)。2010年11月4日微軟發(fā)布Kinect的60天內(nèi),Kinect累計(jì)銷售800萬臺,總銷量突破1000萬臺,足可見其受歡迎程度。
自然用戶界面讓人們甩掉鼠標(biāo)和鍵盤玩游戲成為可能,這無疑挑逗著玩家的好奇心。
智能游戲終端發(fā)布后,市場普遍認(rèn)為Kinect可以實(shí)現(xiàn)更多的價(jià)值。由于機(jī)器可以捕捉并反應(yīng)用戶肢體動作,研究人員可以操控機(jī)器人進(jìn)行科學(xué)研究,例如代替自己進(jìn)入危險(xiǎn)的事故現(xiàn)場進(jìn)行操作。而Top Shop莫斯科旗艦店則打起了智能試衣鏡的主意,用戶只需要站在屏幕前,點(diǎn)擊對應(yīng)的商品,就可以“試穿”所有的衣服、鞋子,借助這一應(yīng)用,服裝電子商務(wù)能夠得到更好的展示機(jī)會。
自然用戶界面強(qiáng)調(diào)用戶通過語言、手勢、動作,而不是鍵盤、鼠標(biāo)操控計(jì)算機(jī),以此來標(biāo)榜“自然”。但不得不注意的是,自然用戶界面也可能會帶來一些“不自然”的結(jié)果。
將捕捉到的動作傳遞到計(jì)算機(jī),再由計(jì)算機(jī)反映在屏幕上的時滯引起了用戶的不滿,智能游戲終端機(jī)的反應(yīng)速度和鼠標(biāo)的反應(yīng)速度還是有一定的差距。而一些對力道、角度要求嚴(yán)格的應(yīng)用場合中,例如,遠(yuǎn)程醫(yī)療手術(shù),自然用戶界面所提供的體驗(yàn)還有很大的提升空間。此外,人工智能的研究還處于公司各自為營的分散階段,也就是各個公司的統(tǒng)計(jì)結(jié)果存在差異,缺乏一個統(tǒng)一的人工智能標(biāo)準(zhǔn),這可能會成為制約業(yè)界技術(shù)精準(zhǔn)化的因素之一。
“自然用戶界面在目前還處于‘點(diǎn)’的突破階段,要實(shí)現(xiàn)‘面’上的廣泛應(yīng)用尚需假以時日。”鄭叢威說。
但毋庸置疑,自然用戶界面將會成為未來技術(shù)發(fā)展的主流。