http://m.casecurityhq.com 2012-02-20 16:02 來源:二十一世紀商業(yè)評論
2011年剛結(jié)束,CNN預測2012年的十大科技趨勢中,與自然用戶界面相關的技術發(fā)展趨勢占據(jù)三席,觸屏電腦名列榜首,聲控技術和體感技術分列六、七位。人機交互的再一次變革就發(fā)生在你身邊。
你能想象身體是計算機的輸入設備嗎?
體溫、脈搏、肌肉都是向計算機傳遞指令的信號,佩戴于手臂上端的傳感器能收集肌肉信號,再通過肌點信號識別器解讀手勢動作,從而識別手掌和手指點擊在皮膚上的信號,向計算機傳遞無線信號,進而控制電腦,這就是肌肉-計算機界面,研究人員將它命名為“帶有生理感知的自然用戶界面”。
這個略顯生疏的長短語是自然用戶界面的一種新形態(tài),雖然自然用戶界面并不是新鮮事物,但它的流行足以改變你和機器互動方式,隨著自然用戶界面應用的廣度和深度的擴展,人機交互的技術革命必將引發(fā)一場新的科技產(chǎn)業(yè)變革。
早期的自然用戶界面是命令行界面和圖形用戶界面的補充。早在1970年代起,多位美國計算機學家進行了手勢、多點觸摸系統(tǒng)的實驗,而彼時正是命令行界面和和圖形用戶界面的時代,用戶需要借助鍵盤輸入指令,或者用鼠標點擊圖形下達命令讓機器完成相應的動作。
而在自然用戶界面,用戶下達的指令是日常的行為,例如,手指觸碰圖標開啟程序;與機器對話下達口頭命令,如開機、關機、跳轉(zhuǎn)窗口等;圖標隨著手指而移動……總的來說,自然用戶界面利用手勢、機器推斷和意識情景以及豐富的3D環(huán)境讓計算變得更簡單、便捷,讓用戶的體驗變得更加直觀。
IBM的科學家曾在2007年預測,5年后,人們不再需要密碼。在沒有傳統(tǒng)字符密碼的環(huán)境中,生物識別變得尤為重要,如指紋識別、視網(wǎng)膜識別、人臉識別。
人臉識別技術的基礎技術已經(jīng)得到較成熟的發(fā)展,在公安、安防領域?qū)崿F(xiàn)了較為廣泛的應用。網(wǎng)易的最新研究則實現(xiàn)了基于互聯(lián)網(wǎng)的人臉識別應用,人臉的錄入、掃描、匹配工作均可通過互聯(lián)網(wǎng)來完成。未來,你可能像《霹靂嬌娃》中女戰(zhàn)士在進入密室時那樣輸入郵箱、游戲賬戶的密碼——通過人臉或者視網(wǎng)膜的匹配登錄。網(wǎng)易稱這項技術將有望在2012年上半年投入到網(wǎng)易郵箱登錄上,“人臉識別技術不存在將軍令、手機密碼等傳統(tǒng)密碼使用中常出現(xiàn)的遺失、被盜的難題。”網(wǎng)易杭州研究院副總監(jiān)汪源說,“用戶可以選擇傳統(tǒng)的字符和人臉兩種密碼登錄郵箱。”
相比指紋識別、視網(wǎng)膜識別,人臉識別技術在密碼保護領域有先天不足。雖然理論上說,配備超級計算機和超高清圖像設備后,人臉識別精準度能達到99.9%,但現(xiàn)實條件很可能是室內(nèi)光線、普通計算機和攝像頭的組合。如果僅核對臉部圖像是否匹配,一張照片就能破解密碼了。
但人臉識別技術在其他商業(yè)領域和社交媒體應用中的前景廣闊。三電株式會社和岡谷株式會社研制了一款最新自動販賣機,一旦顧客靠近機器,人臉識別系統(tǒng)將自動分析顧客的容貌來判定顧客的年齡,并播放適合該年齡層的廣告。自動販賣機2.0版將會推向北美市場。
語音識別技術是也人機交互應用中的重要一環(huán)。人機對話的前提在于語音識別技術——語音識別和語義識別。語音識別即是機器捕捉到用戶的話語,并將其在后臺轉(zhuǎn)化成計算機語言,而語義識別則是讓計算機聽懂用戶所表達的含義。語音識別技術中的兩個難點在于提高準確度和實現(xiàn)人工智能。
UC優(yōu)視研發(fā)出一款適用于手機的語音瀏覽器,它能減少用戶在使用手機瀏覽網(wǎng)頁時的輸入動作,而把語言作為指令,包括前進、語言搜索、跳轉(zhuǎn)網(wǎng)頁等。
但通常人們說的同一個詞語能表達多個含義。“讓機器在不同的場景下識別語義是語言識別系統(tǒng)的難點所在。”UC優(yōu)視產(chǎn)品總監(jiān)鄭叢威說,“這就是人工智能需要解決的問題。”在現(xiàn)階段,人工智能是基于對用戶的使用習慣進行統(tǒng)計分析的結(jié)果而達到的智能。
但如何讓瀏覽器理解用戶所說的指令是搜索相關網(wǎng)頁,還是跳轉(zhuǎn)到相應的網(wǎng)站呢?UC優(yōu)視對用戶使用UCweb瀏覽器的習慣進行統(tǒng)計分析,并選用概率最大的結(jié)果作為語音瀏覽器的指令。而遇到語音瀏覽器無法識別的場景,瀏覽器會出現(xiàn)多個選項共用戶選擇,這時用戶還是需要手勢等其他操作。
2007年Google為了測試、改進其語音搜索技術,發(fā)布了免費的語音搜索服務。百度在2008年效仿Google公開測試了“百度語音搜索”的電話業(yè)務,但最終沒有普及。2009年,Google便發(fā)布了中文版的語音搜索軟件,運用于諾基亞塞班操作平臺,但一直沒有得到更廣泛應用。
事實上,移動互聯(lián)網(wǎng)的快速發(fā)展是手機領域人機交互興起的催化劑。受限于手機屏幕的尺寸,語音識別、語音搜索逐漸成為手機人機交互的新寵。在智能手機領域,UC語音瀏覽器僅是數(shù)目龐大的推廣語音識別的軟件之一,Siri的發(fā)布,掀起了人機對話的熱潮,騰訊QQ、微信等即時通訊工具都具備了語音識別功能。為了省去用戶在不到5英寸的小屏幕上打字的麻煩,韋伯斯特詞典、有道詞典都配備了語音識別功能。鄭叢威預計語音識別和語音搜索的市場前景相當廣闊,UC在2012年第一季度正式發(fā)布UC語音瀏覽器后,20%的用戶會選擇替代目前使用的版本。
除了語音、人臉識別,捕捉人們的動作是自然用戶界面的另一個重點領域。游戲終端設備已經(jīng)在這一領域取得突破,Kinect游戲終端實現(xiàn)了人臉識別、手勢、動作等綜合自然用戶界面技術。2010年11月4日微軟發(fā)布Kinect的60天內(nèi),Kinect累計銷售800萬臺,總銷量突破1000萬臺,足可見其受歡迎程度。
自然用戶界面讓人們甩掉鼠標和鍵盤玩游戲成為可能,這無疑挑逗著玩家的好奇心。
智能游戲終端發(fā)布后,市場普遍認為Kinect可以實現(xiàn)更多的價值。由于機器可以捕捉并反應用戶肢體動作,研究人員可以操控機器人進行科學研究,例如代替自己進入危險的事故現(xiàn)場進行操作。而Top Shop莫斯科旗艦店則打起了智能試衣鏡的主意,用戶只需要站在屏幕前,點擊對應的商品,就可以“試穿”所有的衣服、鞋子,借助這一應用,服裝電子商務能夠得到更好的展示機會。
自然用戶界面強調(diào)用戶通過語言、手勢、動作,而不是鍵盤、鼠標操控計算機,以此來標榜“自然”。但不得不注意的是,自然用戶界面也可能會帶來一些“不自然”的結(jié)果。
將捕捉到的動作傳遞到計算機,再由計算機反映在屏幕上的時滯引起了用戶的不滿,智能游戲終端機的反應速度和鼠標的反應速度還是有一定的差距。而一些對力道、角度要求嚴格的應用場合中,例如,遠程醫(yī)療手術,自然用戶界面所提供的體驗還有很大的提升空間。此外,人工智能的研究還處于公司各自為營的分散階段,也就是各個公司的統(tǒng)計結(jié)果存在差異,缺乏一個統(tǒng)一的人工智能標準,這可能會成為制約業(yè)界技術精準化的因素之一。
“自然用戶界面在目前還處于‘點’的突破階段,要實現(xiàn)‘面’上的廣泛應用尚需假以時日。”鄭叢威說。
但毋庸置疑,自然用戶界面將會成為未來技術發(fā)展的主流。