語音播報
從“懂方言”到“懂更多方言”、從“會翻譯”到“支持多語種翻譯”、從無到有上線文字掃描功能……科大訊飛正在為“訊飛輸入法”加碼更多人工智能(AI)能力。6月12日,科大訊飛在京舉辦主題為“AI輸入 更懂你”媒體見面會,披露了訊飛輸入法的一系列升級與更新。其中,趕在世界杯之前及時上線的“面對面翻譯”及方言識別增至23種等功能成為焦點。
“面對面翻譯”是本次訊飛輸入法升級的新增功能。記者通過下載體驗發(fā)現(xiàn),該功能支持中英、中俄、中日、中韓四種對話翻譯模式,并配備有真人發(fā)音,中文用戶通過它可以直接與外國友人面對面交流。這對于世界杯期間赴俄看球的球迷而言無疑是一大福利。
文字掃描識別是訊飛輸入法新上線的又一功能。顧名思義,文字掃描識別即通過掃描,便捷地提取圖上的文字。該功能可通過拍照和上傳已有圖片實現(xiàn)。記者在體驗中發(fā)現(xiàn)其對某彩頁上的文字識別準確率并不理想,對此訊飛輸入法的負責人翟吉博回應記者稱,受限于文字特別是藝術字體文字的顏色及陰影等變量的干擾,該功能目前尚不能實現(xiàn)較高的識別率。不過他表示隨著廣大用戶的使用、迭代,該功能的“聰明度”會得到極大提高。
方言識別一直以來都是科大訊飛在AI能力開發(fā)上獨具特色的“賣點”。記者了解到,目前訊飛輸入法支持22種方言,其中粵語、四川話、東北話、河南話等方言的識別率均已超過90%。本月底,訊飛輸入法還將新增蘇州話識別,將方言識別語種擴充至23種。
科大訊飛多語種高級研究員祖漪清介紹說,口音和方言是語音識別中的難點,不僅學習模型技術門檻高,識別對建模、音素、聲學相似性等方面的研究水平也有著極高的要求。換言之,要針對性地提高某種方言的識別率,需要對該方言文化、語素等有深厚的造詣。
目前世界上的語言有6000~10000多種,而據(jù)語言學家預測,大部分語言將于本世紀末消失。祖漪清告訴記者,當前,瀕危語言保護(簡稱“語?!保┮殉蔀橐豁椫匾惹械墓ぷ鳌樽畲蟪潭壤萌斯ぶ悄鼙Wo瀕危語言,會上科大訊飛還啟動了“方言發(fā)音人招募”公益活動,以助力利用AI技術實現(xiàn)對瀕危語言、方言的“復制”。
此外,針對多樣化的場景,科大訊飛還分別推出了長文本輸入、可在嘈雜環(huán)境下使用的耳語輸入等工具;針對用戶習慣和個性化,推出了個性化的訓練模型、中英文混合輸入等方案。值得一提的是,科大訊飛董事長劉慶峰曾在多個場合表態(tài),訊飛輸入法將長期堅持“免費獲取”“暫不考慮盈利”的原則,但每年的投入均在8位數(shù)量級。
另據(jù)科大訊飛官方給出的數(shù)據(jù),訊飛輸入法用戶數(shù)已經突破6億。
© 1996 - 中國科學院 版權所有 京ICP備05002857號-1 京公網安備110402500047號 網站標識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話: 86 10 68597114(總機) 86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn
© 1996 - 中國科學院 版權所有 京ICP備05002857號-1 京公網安備110402500047號 網站標識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話: 86 10 68597114(總機) 86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn
© 1996 - 中國科學院 版權所有
京ICP備05002857號-1
京公網安備110402500047號
網站標識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話:86 10 68597114(總機)
86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn