1. 首頁 > 財經 > 正文

    科大訊飛陷AI同傳造假疑云:從機器朗讀到機器翻譯還有多遠?

    2018年09月22日  07:00   21世紀經濟報道   倪雨晴  

    2018世界人工智能大會剛落幕,科大訊飛卻陷入了“AI同傳造假”的風波。

    2018世界人工智能大會剛落幕,科大訊飛卻陷入了“AI同傳造假”的風波。

    9月20日,一位同傳譯員在知乎上發文稱,在上海的一場會議中,訊飛的翻譯其實為人工同傳,并非機器智能翻譯,并且譯文由機器進行朗讀。

    這容易讓觀眾產生“都是人工智能翻譯”的錯覺,而忽略背后同傳譯員們的勞動成果。對此,9月21日,科大訊飛的回復是,“科大訊飛從來沒有把同傳翻譯包裝成機器翻譯。”

    9月21日,科大訊飛董秘、高級副總裁江濤接受21世紀經濟報道記者采訪時說道:“盡管機器翻譯獲得發展,明年能達到英語專業8級的水平,但依然沒辦法代替同傳。科大訊飛沒有提到AI同傳,并沒有造假吹牛,目前的情況是一個誤會。”

    他進一步解釋道,科大訊飛的智能會議系統有兩種工作模式,一種是全自動翻譯,系統識別中文并轉化成英語、日語、韓語等同步顯示在屏幕上;另外一種就是在專業的會議上,直接獲取現場同傳的聲音,再同步到大屏幕上。“科大訊飛沒有做混淆,而同傳的對接是由會議主辦方聯系的。”

    科大訊飛方面還提到,當機器同時提供轉寫和翻譯服務時,文字展示區Logo顯示為“訊飛聽見—離線翻譯系統”;機器僅提供轉寫服務時,文字展示區Logo顯示為“訊飛聽見”。訊飛聽見是科大訊飛旗下提供語音轉寫、翻譯的平臺。

    盡管目前語音識別成為AI的先行領域,但是語音翻譯依舊是一大難題,現階段無法精準翻譯屬正常現象。據21世紀經濟報道記者了解,識別同傳的譯文在業內屬于普遍的做法,不少公司以此進行夸大宣傳。

    人工還是智能?

    談及人工智能時代,機器能否代替人工是關注焦點。在語音領域,科大訊飛表示,希望通過語音轉寫和翻譯技術幫助同傳提高工作效率、減少失誤,形成人機耦合的同傳新模式,并不是去替代同聲傳譯。而科大訊飛董事長劉慶峰在不同場合均表示,人機協同、人工智能+行業,才是未來人工智能最有希望做成的。

    在走向人機耦合的操作過程中,智能固然離不開人工,但是,雙方在配合工作中發生了“摩擦”。

    對于此次同傳譯者的“投訴”,Ledge同聲翻譯創始人王民杰告訴21世紀經濟報道記者:“除了用機器人的聲音把譯文讀出來不太普遍之外,其他(機器識別同傳譯文)都很普遍。對于外國人的英文演講,基本上采取的模式就是由我們人工同傳翻譯成中文,然后他們再把我們的中文從聲音轉換成文字顯示在大屏幕上。”

    “因此,同傳界的很多人都覺得是科大訊飛剽竊了我們的勞動成果,讓觀眾誤以為是機器在同傳,而不是人工同傳。”王民杰繼續說道,“但是我們在處理問題上也是兩難,我們希望科技能夠發展,幫助我們進行翻譯。但是現在人工智能被過度夸大,我們身份特殊,也擔心外界說自己由于害怕失業而進行攻擊。”

    王民杰的翻譯公司和科大訊飛合作密切,此次事件發酵后,他也向科大訊飛提出意見,希望對方在大屏幕上顯示他們只是語音識別,聲音來自同傳。

    另一位資深同傳譯者告訴21世紀經濟報道記者:“個人覺得機器代替人工同傳還要很長時間,人機結合更實際。”

    訊飛翻譯產品經理劉晨璇則向21世紀經濟報道記者復盤道:“事情發生在9月19-20日舉行的2018創新與新興產業發展國際會議上,我們向主辦方提供了兩種方案,一種是自動翻譯,另一種是對同傳語音進行識別,屏幕是轉寫的同傳語音,我們并沒有對此進行包裝。”

    也有人工智能業內人士告訴21世紀經濟報道記者,其實大家都用這種方式進行,有“偷換概念”的嫌疑。但是同傳譯者的知識產權有待商榷,一般其產權屬于雇用了同傳的公司。

    在近年來大眾對于人工智能、人工翻譯的期望頗高。而反觀公司,也有將產品“趕鴨子上架”的情況出現。當然,語音方面有不少成熟的解決方案,然而觀眾的預期和企業產品效果之間差異過大,也導致此次風波發酵。

    語音識別仍存瓶頸?

    在2017年,科大訊飛就曾表態:現階段人工智能技術發展不需要“被神化”。 “目前,機器翻譯已經取得非常大的進步,在衣食住行等常用生活用語上的中英翻譯可以達到大學六級的水平,能夠幫助人們在一些場景處理語言交流的問題,但距離會議同傳以及高水平翻譯所講究的‘信、達、雅’還存在很大的差距。”

    對于人工耦合,江濤告訴21世紀經濟報道記者,科大訊飛的人工智能系統會結合聽和看的信息,也會針對關鍵詞進行解釋,相當于有一個助手在幫助譯者進行翻譯,降低了同傳口譯者的工作強度。而科大訊飛已經和上海外國語大學成立了研究院,探討人機協同模式。在本周的2018世界人工智能大會上,就有三個嘉賓發言采取了人工耦合的模式。

    應該說,科大訊飛在語音領域技術領先,但是仍面臨著不少瓶頸。

    首先從科大訊飛的產品技術方向來看,主要包括語音交互、機器翻譯、文本識別。其中,語音交互是科大訊飛的老本行,包括語音識別、語音合成等。另外,采用日趨成熟的自然語言理解,也為語音交互提供了更強的支撐。

    尤其是語音合成方面,科大訊飛在業界比賽中屢次奪冠。其通過機器學習提取聲音的特征,通過聲學波形合成出仿真聲音。該技術的難點之一,就是如何能夠騙過耳朵達到真人說話的效果。

    但是在技術成熟的同時,仍有難題需要攻克。比如,遇到同音字識別、環境比較嘈雜的情況以及中文和英文夾雜的時候,語音的識別率就會下降。

    劉慶峰在2018世界人工智能上表示,科大訊飛是全球唯一在語音合成中機器超過人工的公司,在安靜的環境下,演講主題確定的情況下語音準確率高,但是多人說話噪音環境下的識別率是關鍵。在他看來,通過大規模后臺服務集群,語音識別正在走向實用。同時,用戶也對方言、多人說話、安全保護等方面提出了新要求。

    一位人工智能從業者告訴21世紀經濟報道記者,自然語言處理技術需要得到攻克,這就涉及到機器的知識、情感、邏輯等能力。而這三個人類在幼兒時期就能掌握的機能,對于機器來說是難上加難。語音本身不是最難,但是語言背后需要人類的知識系統以及專業領域的能力,這些數據的掌握并非易事。而人工智能公司目前對翻譯的野心很大,短時期內系統性地解決還是較為困難。(編輯:包芳鳴)

     返回21經濟首頁>>

    分享到:
    相關新聞
    網友評論
    正在加載評論...
    20选5开奖结果