加快打造原始創(chuàng)新策源地,加快突破關(guān)鍵核心技術(shù),努力搶占科技制高點,為把我國建設(shè)成為世界科技強國作出新的更大的貢獻。

——習近平總書記在致中國科學院建院70周年賀信中作出的“兩加快一努力”重要指示要求

面向世界科技前沿、面向經(jīng)濟主戰(zhàn)場、面向國家重大需求、面向人民生命健康,率先實現(xiàn)科學技術(shù)跨越發(fā)展,率先建成國家創(chuàng)新人才高地,率先建成國家高水平科技智庫,率先建設(shè)國際一流科研機構(gòu)。

——中國科學院辦院方針

首頁 > 傳媒掃描

人工智能讓機器從“能聽會說”到“能理解會思考”

【中國青年報】科大訊飛胡郁:中國需要更多“爬山型”公司

2016-10-25 中國青年報 王林
【字體:

語音播報

  自從1956年美國達特茅斯會議提出概念以來,人工智能(Artificial Intelligence)已經(jīng)從科學家的假設(shè)變得觸手可及,siri語音助手、叮咚智能音箱、賢二機器僧等人工智能產(chǎn)品讓普通人感受到人工智能帶來的智慧便利,也創(chuàng)造了更多的創(chuàng)業(yè)創(chuàng)新機會。

  根據(jù)新智元近日發(fā)布的《中國人工智能產(chǎn)業(yè)發(fā)展報告》(以下簡稱《報告》)的統(tǒng)計,中國人工智能領(lǐng)域的創(chuàng)業(yè)公司約有200~250家,大部分創(chuàng)建于2010年后,絕大多數(shù)融資仍處于天使輪或者A輪,語音和視覺依然是人工智能創(chuàng)業(yè)公司的兩大方向,深度學習、機器學習都占據(jù)了絕對重要的地位,其次是計算機視覺、自然語言處理和語音識別。

  在這些創(chuàng)業(yè)方向上,現(xiàn)在的人工智能已經(jīng)發(fā)展到了什么程度?人工智能領(lǐng)域的創(chuàng)新創(chuàng)業(yè)機會和難點在哪里?圍繞這些問題,近日,中國青年報·中青在線記者專訪了科大訊飛輪值總裁、訊飛研究院院長胡郁。

  作為企業(yè)家,胡郁在1999年參與創(chuàng)立了科大訊飛,負責科大訊飛公司的智能語音及語言核心技術(shù)的研究工作,總體牽頭科大訊飛的人工智能前瞻項目——訊飛超腦計劃;作為科學家,胡郁擔任設(shè)在中國科技大學的語音及語言信息處理國家工程實驗室執(zhí)行主任,憑借在語音合成與識別、自然語言理解等領(lǐng)域的研究成果,他曾獲得國家信息產(chǎn)業(yè)重大技術(shù)發(fā)明獎、國家科學技術(shù)進步二等獎各兩次。

  現(xiàn)在還是“弱智能”,期待“漣漪效應(yīng)”

  上述新智元發(fā)布的《報告》稱,人工智能在60年的發(fā)展中經(jīng)過了“三起三落”:20世紀50年代到80年代初仍處于誕生和基礎(chǔ)階段,神經(jīng)元模型得以提出,感知器得以發(fā)明;從20世紀80年代到21世紀初,人工智能成功商用但跨越式發(fā)展失??;當今,隨著摩爾定律和云計算帶來計算能力的提升,以及互聯(lián)網(wǎng)和大數(shù)據(jù)廣泛應(yīng)用帶來海量數(shù)據(jù)的積累,人工智能有望實現(xiàn)規(guī)?;瘧?yīng)用,并將深入到金融、交通、醫(yī)療、工業(yè)等各個領(lǐng)域。

  《報告》的觀點跟胡郁的判斷不謀而合。在他看來,如果將來的人工智能可以發(fā)展到一定程度,就會像現(xiàn)在日常生活所用的水、電、煤氣、互聯(lián)網(wǎng)一樣成為日常生活中的必需品。

  事實上,科大訊飛的語音智能技術(shù)已經(jīng)在教育、醫(yī)療、汽車、客服等領(lǐng)域應(yīng)用和融合。據(jù)科大訊飛董事長劉慶峰介紹,目前科大訊飛的人工智能機器已經(jīng)替代了30%的人工客服,安徽移動甚至有75%的客服內(nèi)容都被人工智能的機器替代了。

  人工智能的大時代已經(jīng)到來。但胡郁認為,目前的人工智能技術(shù)還處于“弱智能”階段,大多還只能達到語音助手的水平,要想獲得與人類大腦類似或同等的智慧,擁有自主學習、舉一反三的能力,人工智能還需要將深度學習、大數(shù)據(jù)等技術(shù)相結(jié)合,實現(xiàn)“漣漪效應(yīng)”。

  他進一步解釋稱,以目前的技術(shù)水平生產(chǎn)出的人工智能產(chǎn)品在剛開始投入市場的時候,有些性能和體驗往往不夠好,比如難以實現(xiàn)人機互動。但隨著更多人使用,不斷累積的真實數(shù)據(jù)和使用經(jīng)驗就會幫助人工智能產(chǎn)品自我學習和更新。“當它擴散到更多人群的時候,就像波紋覆蓋的水面擴大,這時候就已經(jīng)是改進以后的系統(tǒng)了”。

  他把這種“漣漪效應(yīng)”的優(yōu)化歸功于第一批用戶的貢獻。“前一千萬人免費使用的同時也貢獻了寶貴的數(shù)據(jù)和經(jīng)驗,當?shù)谝磺f零一個人使用的時候,他往往會驚異于系統(tǒng)的優(yōu)異性能”。

  實際上,科大訊飛最為人熟知的產(chǎn)品——訊飛語音輸入法也是在這種“漣漪效應(yīng)”的作用下才逐漸成長的。

  2010年以前,科大訊飛的語音識別技術(shù)無法在真實場景下使用,在實驗室里,科大訊飛語音輸入法的測試識別準確率是90%,在真實的環(huán)境下識別準確率只能達到55.8%,但是在“漣漪效應(yīng)”的優(yōu)化下,現(xiàn)在的語音識別準確率已經(jīng)達到95%,并且識別錯誤率還在以每年30%的速度降低。

  讓機器從“能聽會說”到“能理解會思考”

  在國內(nèi)的人工智能領(lǐng)域中,百度和科大訊飛是體量最大、投入最早的公司。依托資金、科研等實力,這兩家公司的選擇往往會帶動和影響國內(nèi)的人工智能發(fā)展和創(chuàng)業(yè)方向。

  在今年9月舉行的百度世界大會上,百度公司首席科學家吳恩達宣布將開放百度機器學習方面的能力,推出深度學習和百度大腦兩大開放平臺,讓開發(fā)者不用再從頭寫代碼。與百度從機器學習入手的考慮不一樣,胡郁希望科大訊飛能以語音和語言為入口,掀起一場人工智能的認知革命。

  “七萬年前人類發(fā)生了‘認知革命’,其中的核心是當時的智人擁有了豐富的語言,從而更好地描述自然世界,執(zhí)行更復雜的計劃,可以描述他們腦子里面想到的東西,產(chǎn)生虛構(gòu),產(chǎn)生宗教,產(chǎn)生各種概念?!焙舯硎荆暗娜斯ぶ悄苁且浴吧钏{”計算機為代表的邏輯計算階段,現(xiàn)在則還處于可以精準識別圖像和語音的感知階段,未來更高級的人工智能應(yīng)該是讓機器學會認知。

  在他看來,要想讓人工智能走出“弱智能”階段的瓶頸,就必須讓機器從“能聽會說”到“能理解會思考”,這就需要讓人工智能也來一次“認知革命”,讓機器和人能對話溝通,讓機器學會認知,而以語音和語義為代表的自然語言理解技術(shù)應(yīng)該是一個突破口。

  從國際經(jīng)驗看來,他的這一判斷也是人工智能的一種實現(xiàn)路徑。今年6月初,美國“互聯(lián)網(wǎng)女皇”Mary Meeker發(fā)布的《2016年互聯(lián)網(wǎng)趨勢報告》也認為,語音將成為最重要的交互入口。今年年初,美國麻省理工學院評選出的十大創(chuàng)新預(yù)測中,語音接口也被列為第三名,被認為是能解決重大問題、帶來全新機遇的希望所在。

  胡郁所負責執(zhí)行的“訊飛超腦計劃”就是想實現(xiàn)感知智能和認知智能的突破:在感知智能方面,語音識別、手寫識別技術(shù)要保證每年30%~50%的錯誤率下降,要能夠識別方言,還要能理解人和機器、人和人之間的對話;在認知智能方面的關(guān)鍵則是讓機器能理解、會思考,這就必須在自然語言理解、聯(lián)想推理、自主學習等多個方面實現(xiàn)突破。

  作為“訊飛超腦”計劃的重要組成部分,由訊飛牽頭的科技部863重大專項——“基于大數(shù)據(jù)的類人智能關(guān)鍵技術(shù)與系統(tǒng)”相關(guān)研發(fā)工作也在有序進行。這個項目的目標是讓機器也能參加高考,并且考上一本,甚至清華、北大和中科大。

  “當人工智能掌握的技能越來越多的時候,希望我們?nèi)祟惪梢杂懈嚅e暇的工夫去玩,而不是被機器人奪去工作。”胡郁說。

  中國需要更多“爬山型”公司

  雖然科大訊飛語音輸入法等產(chǎn)品已經(jīng)獲得了用戶的歡迎,離線和在線的交互次數(shù)每日達到20億,合作開放伙伴突破15萬,但在胡郁眼中,科大訊飛并不是一家互聯(lián)網(wǎng)公司,而是一家正在爬山的科技公司。

  之所以要強調(diào)二者的區(qū)別,是因為在他眼中,做人工智能的公司很像爬山者,需要堅持目標、不改方向,一步步地爬到頂峰,“我們今天是人工智能公司,昨天是人工智能公司,明天還會是人工智能公司”。但互聯(lián)網(wǎng)公司更像是個沖浪選手,互聯(lián)網(wǎng)的每一波浪潮都不一樣,它要不停地迎接下一個浪潮,“如果下個浪潮不是人工智能,也許他們就換了(方向)”。

  此外,胡郁還認為,人工智能的發(fā)展需要跟傳統(tǒng)產(chǎn)業(yè)深入磨合,就像爬山時要走穩(wěn)每一步、摸清每一塊石頭一樣,雖然過程繁瑣但卻是必不可少的?!盎ヂ?lián)網(wǎng)公司要有很高的收益性,這些是累活兒,互聯(lián)網(wǎng)公司不一定愿意去干”。

  作為科學家轉(zhuǎn)型創(chuàng)業(yè)的代表,胡郁認為人工智能領(lǐng)域的創(chuàng)業(yè)更加需要長期的堅守和持之以恒的投入?!澳莒o下心來坐10年板凳的這種決心,我覺得更重要”。

  他堅持認為,中國還需要更多“爬山型”公司:“不管外部環(huán)境是PC互聯(lián)網(wǎng)還是移動互聯(lián)網(wǎng),公司爬山的本質(zhì),你要征服的這個東西是不可變的。如果你堅守都沒有,你后面做創(chuàng)新是不可能的?!?/p>

  在期待“漣漪效應(yīng)”能給人工智能帶來更多優(yōu)化的同時,胡郁還呼吁中國的人工智能研究應(yīng)該從兩個方面發(fā)力:研究院所、高校應(yīng)該更加著重于理論鉆研,而產(chǎn)業(yè)界不僅要應(yīng)用人工智能技術(shù),還應(yīng)該去做技術(shù)方面的大規(guī)模的融合創(chuàng)新。

  這樣的呼吁源自他對中外人工智能的差異對比:中國的產(chǎn)業(yè)界、媒體界對人工智能的了解更多的是應(yīng)用特性和娛樂特性,而美國則深入鉆研人工智能的理論研究,這些研究成果大多難以產(chǎn)業(yè)化,但卻是最原始的理論基礎(chǔ)上的創(chuàng)新。

  為什么中外人工智能領(lǐng)域的差異這么明顯?胡郁分析,國內(nèi)人工智能學術(shù)界因為要跟產(chǎn)業(yè)對接,所以做了許多技術(shù)應(yīng)用和創(chuàng)新;而產(chǎn)業(yè)界還沒有更加深入、原創(chuàng)的研究能力,所以很少有單位能做整體性的系統(tǒng)創(chuàng)新。

  “我們的很多創(chuàng)新其實只是停留在應(yīng)用或者技術(shù)層面上,但沒在科學的層面上去發(fā)現(xiàn)和創(chuàng)新,如果我們只在這個層面的話,得不了圖靈獎也得不了諾貝爾獎,也不可能創(chuàng)造信息論這些東西?!?/p>

  在他看來,在人工智能的研究上,學術(shù)界的理論深度還應(yīng)加強,也應(yīng)該花更長的時間去研究人工智能的本質(zhì)性基礎(chǔ)科學。“實際上我們還太少了一點,還應(yīng)該增強”。

 ?。ㄔd于《中國青年報》 2016-10-25 10版)

打印 責任編輯:麻曉東

掃一掃在手機打開當前頁

© 1996 - 中國科學院 版權(quán)所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標識碼bm48000002

地址:北京市西城區(qū)三里河路52號 郵編:100864

電話: 86 10 68597114(總機) 86 10 68597289(總值班室)

編輯部郵箱:[email protected]

  • © 1996 - 中國科學院 版權(quán)所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標識碼bm48000002

    地址:北京市西城區(qū)三里河路52號 郵編:100864

    電話: 86 10 68597114(總機) 86 10 68597289(總值班室)

    編輯部郵箱:[email protected]

  • © 1996 - 中國科學院 版權(quán)所有
    京ICP備05002857號-1
    京公網(wǎng)安備110402500047號
    網(wǎng)站標識碼bm48000002

    地址:北京市西城區(qū)三里河路52號 郵編:100864
    電話:86 10 68597114(總機)
       86 10 68597289(總值班室)
    編輯部郵箱:[email protected]