你好,游客 登錄 注冊 搜索

背景:
閱讀內容

這4位不懂日語的工程師開發出日文識別軟件

[日期:2016-04-15] 來源:新浪科技  作者:維金 [字體: ]

  導語:彭博社網站今天刊文稱,利用深度學習技術,4名不懂日語的工程師開發出了一款日文手寫識別軟件。這表明了深度學習人工智能的潛力。

  以下為文章全文:

  現實世界的人工智能正在以出乎意料的方式呈現在用戶眼前,而發展速度也要比人們想象中更快。

 

  盡管AlphaGo贏得圍棋比賽令人印象深刻,但機器學習技術的應用還有更多。在幾個月時間里,4名完全不懂日語的工程師開發了一款軟件,能準確識別日文的手寫文字。

  來自Reactive的這些程序員開發的應用識別準確率高達98.66%。這家位于東京的創業公司成立只有18個月。近期,全球開發者和投資者都在試圖挖掘神經網絡的潛力,將人工智能應用至更貼近現實的場景,而不僅僅是回答問題或贏得棋類游戲。

  作為機器學習專業的博士生,大衛·馬爾金(David Malkin)表示:“幾年前,只有真正的天才才能去做這件事。目前,聰明人都能開發出有用的工具。未來更多的是發揮想象力,將這一技術應用至真實的商業場景。”

  神經網絡通過模擬的多層神經元去“看到”信息,這一技術正越來越復雜,與人類的視覺神經類似。

  人工智能的開發以往只屬于谷歌Facebook和其他科技巨頭。目前,任何深度學習創業公司都可以使用云計算平臺,而微軟、英偉達和亞馬遜將人工智能當作一種應用工具去銷售。

  Reactive的技術表明,在某個領域沒有太多經驗的小團隊也能開發出復雜的應用。困難之處在于找到商業模式。關于這一問題,Reactive希望幫助日本的學校批閱試卷。日本目前的考試仍基本采用手寫答卷,而這項技術有可能變革這一領域。

  馬爾金和他的同事,包括喬伊·布拉德(Joe Bullard)、菲利普·萊米(Philippe Remy)和菲利普·伊里(Philip Irri)正迅速取得進展。布拉德今年早些時候在谷歌日本總部的聚會上向人工智能的愛好者展示了該團隊的成果。軟件表現得非常完美。

  盡管英文的手寫識別對深度學習技術來說難度不大,但日文的手寫識別情況完全不同。這是由于,日文中包含日本漢字,需要單獨處理。日文中常用的漢字達到2000多個,而這些漢字往往有多個筆畫。Reactive的算法利用神經網絡進行模式匹配,逼近最準確的結果。該公司用約180萬個手寫漢字對這一神經網絡進行了訓練。

 

  富士通實驗室項目負責人岡本青史(Seishi Okamoto,音)表示:“這項技術能在某個領域獲得專業性,在商用的速度和可擴展性方面取得優勢。”該實驗室正在開發軟件去識別中文。岡本青史表示:“用于手寫中文識別的深度學習已達到人類的水平,很有可能即將超過人類水平。”

  盡管Reactive的技術已經在谷歌等公司的活動上進行了公開展示,但數據尚未得到獨立驗證,或是獲得同行業人士的評價。

  與基于硬性規則的傳統算法不同,深度學習人工智能技術模仿了人腦處理信息的方式。只要給予足夠多的數據作為輸入,并設定期望的輸出結果,神經網絡就能自動進行中間過程的處理,從而找到不同于傳統方法的解決方案,例如語音表達和照片標記。

  蒙特利爾大學計算機科學教授約書亞·本吉奧(Yoshua Bengio)表示:“這涉及到多方面因素:高性能計算成為了廉價商品,大規模數據集成為了可能,而基礎科學研究也在不斷進步。工具的民主化幫助第二層用戶更方便地開發新應用和新產品。”

  所有這一切都在加速人工智能技術的開發。根據CB Insights的數據,2015年,專注于教育、零售和農業等領域的人工智能創業公司獲得的投資達到了3.1億美元,在5年時間增長了近7倍。

 


     往下看有更多相關資料

推薦文章 收藏 推薦 打印 | 整理:gddq | 閱讀:
查看相關資料       工程師 
本文評論   查看全部評論 (12)
表情: 姓名: 字數
點評:
       
評論聲明
  • 尊重網上道德,遵守中華人民共和國的各項有關法律法規
  • 承擔一切因您的行為而直接或間接導致的民事或刑事法律責任
  • 本站管理人員有權保留或刪除其管轄留言中的任意內容
  • 本站有權在網站內轉載或引用您的評論
  • 參與本評論即表明您已經閱讀并接受上述條款
專題文章
熱門評論

香港内部免费透码