科技行者很遺憾,自然語言理解是AI尚未攻克的領域

很遺憾,自然語言理解是AI尚未攻克的領域

很遺憾,自然語言理解是AI尚未攻克的領域

很遺憾,自然語言理解是AI尚未攻克的領域

2021年1月19日 15:58:08 科技行者
  • 分享文章到微信

    掃一掃
    分享文章到微信

  • 關注官方公眾號-科技行者

    掃一掃
    關注官方公眾號
    科技行者

事實證明,人類語言仍是一項獨特且深邃的難題,亦是AI技術所面對的最為艱巨的挑戰之一。

來源:科技行者 2021年1月19日 15:58:08

關鍵字:AI

短短幾年之內,深度學習算法得到了長足發展,不僅在棋類游戲中擊敗了全球最頂尖的選手,也能夠以等同于、甚至超越人類的準確率識別人臉。但事實證明,人類語言仍是一項獨特且深邃的難題,亦是AI技術所面對的最為艱巨的挑戰之一。

很遺憾,自然語言理解是AI尚未攻克的領域

但是,突破能否如期而至?

一旦計算機可以有效理解人類語言內容,則必將徹底顛覆全球各品牌、企業與組織之間的交互方式。如今,大多數企業拿不出充裕的資源為每位客戶提供一對一解答服務。但在語言AI真正成熟之后,企業將能夠在任意時間通過任意渠道聽取、理解并回應每一個問題。這是一項激動人心的發展愿景,但距離達成目標仍有漫長的道路要走。

直到2015年,人們才構建出一種足以在準確率方面與他類相匹敵的人臉識別算法。Facebook的DeepFace準確率為97.4%,僅略低于人類的97.5%。作為參考,FBI以往的人臉識別算法準確率僅為85%,意味著其做出的判斷有超過七分之一概率是錯的。

FBI算法是由一組工程師手工開發而成。其中每項特征(例如鼻子大小以及眼睛的相對位置)皆由手動編程而來。Facebook算法則真正實現了特征學習,其利用一種被稱為卷積神經網絡的特殊深度學習架構,模擬出人類視覺皮層通過復雜的多層結構處理圖像內容。事實上,我們并不清楚這些皮層之間是如何聯系的,因此一切“奧秘”都由算法自主探索得來。

Facebook之所以能夠達成這一成就,依靠的正是實現類人級人工智能的兩個基本思路:首先建立一套能夠學習特征的架構,再將數百萬張經過標記的高質量圖像作為訓練素材供其學習。

語言難關就在眼前

視覺的誕生雖然困難,但已經有數百萬種物種在進化過程中攻克了這道難關。相比之下,語言似乎更為復雜。據我們所知,人類是目前唯一能夠使用復雜語言交流想法的物種。

不到十年之前,出現了單憑某些詞匯的出現頻率即可大致推理出語義的AI算法。但這種方法顯然忽視了同義詞元素的存在,也無法應對某些表達在不同上下文中具有不同表意的問題。

2013年,Tomas Mikolov和他的谷歌團隊創造出一種能夠學習單詞含義的架構。他們的word2vec算法能夠將同義詞相互映射,借此對大小、性別、速度等語義進行建模,甚至能夠將國家與首都等特征關聯起來。

但其中仍然缺少至關重要的一環——理解上下文。語言理解領域的真正突破誕生于2018年,谷歌公司在這時推出了BERT模型。Jacob Devlin和他的團隊仍然沿用傳統機器翻譯中的架構,但向其中引入了學習句子內上下文信息的能力。

通過教育該模型填補維基百科文章中的遺漏單詞,該團隊得以將語言結構嵌入BERT模型。只需要使用數量有限的高質量標記數據,他們就成功完成了對BERT的調優,借此完成從為問題找到正確答案、到真正理解句子表意的多種任務。也憑借這一壯舉,他們成為破解語言理解謎題的先驅:正確架構,加上大量可供學習的高質量數據。

2019年,Facebook的研究人員在此基礎上又更進了一步。他們同時使用100種語言訓練出類似的BERT模型。此模型能夠以一種語言(例如英語)進行特征學習,再將成果應用于其他任意一種語言(例如阿拉伯語、漢語及北印度語)。這種具有語言中立性的模型能夠在實際訓練所選定的語種上實現與BERT完全一致的性能,并在遷移至另一種語言時將影響控制在較低程度。

這些技術本身確實給人留下了深刻印象。但在2020年初,谷歌研究人員最終得以在廣泛的語言理解任務上超越了人類的表現。谷歌引入規模更大的網絡架構與更多訓練數據,終于將BERT架構推向了極限。如今,這套被命名為T5的架構在標記句子與尋找答案方面的表現已經超越人類。去年10月發布的多語種mT5模型已經能夠在雙語種間互譯方面實現與人類相近的表現,更恐怖的是它能夠支持多達100種語言。谷歌本周又公布了新的萬億級參數模型,整體架構規模更上一層樓,性能也進一步提升。

可能性

設想一下,未來的聊天機器人也許能夠理解您用任何一種語言書寫的內容,真正理解上下文并記住之前聊過的內容。這意味著我們得到的不再只是幾條簡單粗暴的預定義回應,而是真正的關切與解答。

搜索引擎也將能夠理解您的問題,給出正確答案,而且不再糾結于您的用詞是否嚴格準確。您可能還會迎來一位AI同事,它了解關于業務流程的所有知識。更重要的,如果能夠使用正確的術語,那么單靠谷歌搜索沒準就能解決客戶的具體問題。連篇累牘的內部文檔終將成為過去,留給AI模型快速瀏覽即可。

數據庫的新時代即將來臨。我們將徹底告別構造數據的繁瑣工作——一切備忘錄、電子郵件、報告都將由AI模型自動解釋、存儲與索引。由于數據庫能夠理解人類表達,您不需要求助于IT部門即可直接查詢并創建報告。

這一切還只是冰山一角。目前一切依賴于人類語言理解能力的流程,都有可能被自動化功能所徹底顛覆。

沒那么簡單

但這里還有個問題。既然這么出色了,為什么這些算法還沒得到普遍應用?因為單靠云計算資源訓練T5算法,就花掉了谷歌約130萬美元。幸運的是,谷歌研究人員慷慨地分享了這些模型。但如果要對當前任務進行調優,還需要額外承擔一大筆資源開銷,外加漫長的訓練周期。

不過隨著時間的推移,企業對于調優工作的不斷探索,相信未來會有更多應用方案陸續涌現。另外,如果大家相信摩爾定律,那么五年左右之后我們就會迎來更復雜的語言AI應用,屆時也會有新的模型全面超越T5算法。

2021年,我們距離AI技術的轉折性突破還有遙遠的距離。但只要能夠邁過這道難關,AI技術必將釋放出無窮的可能性。

    无码自拍