語音播報
楊明浩
中科院自動化所模式識別
國家重點實驗室副研究員
什么是人機交互?簡單來說,就是“人和機器打交道的方式”。人和計算機打交道根源于人類把計算機當成一種有效的計算服務工具。計算機自產生以來,計算能力日益強大,人類對計算機的態(tài)度也開始在計算機只是呆板的“機器”,還是可能變得像“人”一樣聰明,甚至比人更聰明之間搖擺。這種模糊的態(tài)度伴隨著計算機的進化不斷演變。
人機交互的前世今生
目前,計算機的發(fā)展經歷過幾種典型形態(tài):算盤、繼電器計算器、計算機、個人電腦、智能移動終端等,計算機形態(tài)的演變直接導致了人機交互形式的變化。
算盤是中國特色的計算工具,由于無法存儲中間計算結果,算盤具有使用方式復雜、計算過程緩慢的缺陷。而繼電器計算器是現(xiàn)在計算機的雛形,但其計算速度和實用有很大限制。
第一臺真正意義的計算機產生于1946年,它占地170平方米,重30多噸,體型有半個足球場那么大,通過穿孔紙帶的方式輸入和輸出。早期計算機交互方式不僅復雜,同樣計算緩慢。
1983年11月,蘋果公司的喬布斯在Comdex大展上首次展示了Macintosh計算機,從此,個人電腦千篇一律的黑屏字符界面逐漸被生動、極富個性的圖形界面代替。圖形界面使得鼠標、鍵盤變成用戶自由操作電腦的有力工具,也使得觸覺和筆式交互成為可能。
1971年,肯塔基大學研究基金會的一名青年教師塞繆爾·赫斯特開發(fā)出一款觸摸傳感器“AccuTouch”,為后來透明觸摸屏發(fā)展奠定了基礎。3年后,赫斯特研制出了真正意義上的觸摸屏。
1985年出現(xiàn)了第一臺現(xiàn)代意義上的移動電話,它將電源和天線放置在一個盒子中,重達3公斤,笨重且不方便,交互操作無從談起。
1993年,隨著手機迅速瘦身以及觸摸屏技術的發(fā)展,IBM公司與貝爾電話(南方)公司合作推出了帶觸摸屏的IBMSimon手機。這是歷史上第一款真正意義的觸摸屏智能手機。但此時的觸摸屏手機無論是從成本、耐用性、可維護性還是使用習慣上看,比之普通的按鍵手機都沒有明顯的優(yōu)勢。這種局面直到蘋果公司開發(fā)的iPhone手機問世,才被徹底改變。至此,觸摸方式成為手機交互的主流。
自上世紀90年代以來,隨著手寫識別、語音識別、網(wǎng)絡通信技術的發(fā)展,人機交互已發(fā)生了巨變,一個完全不懂編程以及網(wǎng)絡通信原理的普通小孩,可能會比計算機科學家和網(wǎng)絡工程師更好地使用計算機。方式的變革使得人機交互變得簡單,而這個變革,就發(fā)生在短短不到30年內??深A見的是,未來計算機會更加智能,人類使用它會更加自然和簡單。
未來的機器人比人還聰明?
就像一些科幻電影里描述的那樣,未來的人機交互模式是“自由”“智能”“自然”的?!冻荜憫?zhàn)隊》中的暖男型智能健康看護機器人“大白”、《鋼鐵俠2》中的人工觸碰交互技術實驗室的人工智能管家“賈維斯”、《星際穿越》中能干、聰明又幽默的“塔斯”等,這些未來的計算機通過語音識別等技術理解人類語言,通過姿態(tài)識別和情感檢測技術判斷人的情緒,通過非接觸生物特征檢測與識別技術判斷當前人的生理活動狀態(tài)……借助專家知識庫,智能計算機可以對人的健康、當前情緒、當前狀態(tài)做決策和判斷。從一定程度上講,未來的機器人甚至比人還聰明,比如大白可以采用非觸碰方式獲得脈搏和心跳數(shù)據(jù),并察覺腦電活動情況;賈維斯可以聽從鋼鐵俠的指令,采用全息投影的方式在空氣中展示原子核的內部模型,甚至糾正鋼鐵俠的口誤。
未來,這些健康聰明的智能“人形”計算機使得計算機比人更完美,人機交互的未來是美好的、讓人期待的。
當然,科幻作品中歷來不缺乏對人類濫用科技成果拷問的作品,比如《2001太空奧德賽漫游》中的深空探索太空旅行管家“HAL500”,《異形》中只聽命于主人設定任務的人工智能艾什(Ash)和主教(Bishop),還有《普羅米修斯》中為了完成任務背叛人類的人工智能David。這類計算機違反了機器人三定律,從人類的道德審判角度看,它們是邪惡的。但是從主人制造它們時賦予的使命看,它們是正確的。究竟計算機的智能發(fā)展以及人機交互何去何從,是一個值得深思的問題。
告別單一模式
多模態(tài)自然人機交互是下一代人機交互的發(fā)展趨勢。融合視覺、聽覺、觸覺、嗅覺甚至味覺的多模態(tài)交互方式,其表達效率和表達的信息都優(yōu)于單一的視覺或者聽覺模式。
多模態(tài)自然人機交互主要分為3個模塊,分別是信息多模態(tài)交互信息輸入、多模態(tài)交互信息融合和處理、多模態(tài)交互信息反饋。其中,信息輸入模塊主要接收來自人的“視聽觸嗅味”五感信息,然后借助多模態(tài)信息融合和理解模塊,形成“感”覺和認知,并根據(jù)專家知識庫系統(tǒng)和檢索技術形成對用戶的信息反饋,構建出多模態(tài)自然人機交互系統(tǒng)。
從自然人機交互的未來趨勢看,高度便利的多模態(tài)自然人機口語對話模式是最為自然和最理想人機交互方式。比如,利用中科院自動化所構建的一個多模態(tài)自然人機交互系統(tǒng),用戶可以自由地和兩個設置有不同聊天主題的數(shù)字虛擬人交互,對話主題包括咖啡、天氣、科普、娛樂等主題。這種新型的多通道融合的人機對話模式,是下一代新型人機界面操作模式的有效探索。
目前,盡管多模態(tài)自然人機對話已經獲得了很大進展,但由于環(huán)境噪聲、用戶方言口音及光照變化遮擋情況下的影響,計算機對人類視聽覺信息獲取、理解還存在一定誤差,加上目前計算機在自然語言理解方面還存在一定困難,這使得計算機在與人交互的時候,存在答非所問的情形。這類現(xiàn)象嚴重影響了人機交互的體驗。其根本原因在于,計算機雖然計算能力越來越強,然而對人而言很簡單的推理、聯(lián)想和夸張,計算機卻很困難。因此,讓計算機具有“智能”或者讓計算機具有“思維”能力,是計算機是否能與人自由交互的關鍵。
計算機是否會發(fā)展出意識?
隨著近幾年深度神經網(wǎng)絡學習算法在學術界和工業(yè)界的成功,很多人愿意相信計算機會進化出和人一樣的意識和思維能力。2009年,歐盟(瑞士洛桑理工學院)在藍腦計劃(Blue Brain)中用微電路芯片模擬了36萬個細胞的大腦皮質,當給這些微電路芯片群“看”或者“聽”一些大自然的照片和聲音時,微電路芯片群自發(fā)地產生了伽馬振蕩波。伽馬波是大腦中一種快速的電振蕩,它可能涉及到學習過程、記憶力和注意力。這種周期為每秒25~80次的伽馬波腦電波不能就說是意識,但卻是驗證類大腦意識活動存在的重要特征。
藍腦計劃的確促使很多科學家和工程師們堅信計算機會“進化”出意識,一些研究機構(甚至政府)都啟動了相應的類腦計劃。
計算機是否會發(fā)展出意識會帶來人機交互發(fā)展的多種可能性。
如果計算機產生意識,并通過進化發(fā)展出機器人自己的語言、視覺以及情感等“生理”系統(tǒng),則說明人類最引以為自豪的“思維”能力是可以按照一定模式被設計然后進化出來。如果機器人是被人類創(chuàng)造出來的,那么人類是否也是被設計然后進化出來的?
在同一個星球上,如果機器人進化能力始終超不過人類進化能力,人類可以借助完全智能的計算機在深海探索、深空外星移民等領域獲得重大突破。那么未來的人機交互技術主要在于研究:向外怎么利用人工智能進行太空探索,向內怎么利用微型智能機器人進入人體為人類健康服務。當然,由于智能機器人有自己的情感系統(tǒng),人機交互技術也有可能演變?yōu)槲幕涣鞯氖侄?,比如,人機交互技術可能會成為論證人是否可以與“機器人”結婚之類的倫理問題的基礎。
如果人工智能進化超過人類,一旦機器人具有“生死”的意識,因為資源競爭,那么一些科幻電影中的常見橋段就會成為現(xiàn)實:機器戰(zhàn)勝人類導致人類成為機器的工具。這種情況下,人機交互技術將是用于研究人類抵抗機器人的手段和武器的重要工具。
如果計算機不能產生意識,則說明目前人類尚沒發(fā)現(xiàn)宇宙中的類人智能的產生規(guī)律?;蛟S人類智能產生的規(guī)律本身除了外在條件之外,本身就是一個隨機的問題。沿著這個方向發(fā)展的人機交互技術,將是人類利用計算機的在工業(yè)控制、計算服務、醫(yī)療診斷、外空探索等重要工具。即便這樣,人類探索人工智能還任重而道遠。
究竟人機交互何去何從,我會說“我會永遠欣賞,未來你的任何模樣”。
《超能陸戰(zhàn)隊》中的暖男型智能個人健康看護機器人“大白”眼中的男主人公
?。ㄔd于《中國科學報》 2015-06-19 第7版 科普)
© 1996 - 中國科學院 版權所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話: 86 10 68597114(總機) 86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn
© 1996 - 中國科學院 版權所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話: 86 10 68597114(總機) 86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn
© 1996 - 中國科學院 版權所有
京ICP備05002857號-1
京公網(wǎng)安備110402500047號
網(wǎng)站標識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話:86 10 68597114(總機)
86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn