AI 人工智能問世之初曾經狂妄自大,令人失望,它如何突然變成當今最熱門的技術領域?

ImageNet Challenge的比賽結果證明深度學習大有可為。突然之間,人們開始給予關注,不只是在AI圈子裡,還有整個技術界。此後,深度學習系統變得越來越強大:深度達到20或30層的網絡不再罕見,微軟(微軟)的研究人員甚至打造了一個152層的網絡。層數更多的網絡具有更強的抽象能力,能夠產生更好的結果。事實證明,這些網絡善於解決非常廣泛的問題。

“人們之所以關注這個領域,是因為深度學習技術具有廣泛的用途,”谷歌機器智能研究主管,負責谷歌搜索引擎的約翰·詹南德雷亞(John Giannandrea)說。

谷歌正在利用深度學習來提高其網絡搜索結果的質量,理解用戶向智能手機發出的語音命令,幫助人們搜索包含特定影像的照片,自動生成電子郵件智能回复,改善網頁翻譯服務,幫助自動駕駛汽車識別周圍環境。

 

AI 的學習如何學習

深度學習分很多種,其中使用最廣泛的一種是“監督學習”,該技術利用標記樣本來訓練系統。

例如,就垃圾郵件過濾而言,這項技術可能會建立一個龐大的樣本信息數據庫,每條樣本信息被標記為“垃圾郵件”或者“非垃圾郵件”。深度學習系統可以使用這種數據庫進行訓練,通過反复研究樣本和調整神經網絡內部的權值,改善垃圾郵件的識別準確率。

這種方法的優點在於,不需要人類專家制定一套規則,也不需要程序員編寫代碼執行規則。系統能夠直接從標記數據中學習。

使用標記數據進行訓練的系統被用來分類圖像,識別語音,發現信用卡欺詐交易,識別垃圾郵件和惡意軟件,定向投放廣告。對於這些應用,正確的答案已經存在於先前的大量樣本中。

當你上傳照片時,臉譜可以識別和標記你的朋友和家人。近期,該公司發布了一個系統,可以為失明用戶描述照片的內容(“兩個人,笑,太陽鏡,戶外,水”)。

監督學習能夠用於各種各樣的數據。通過採用這項技術,現有的金融服務,計算機安全和營銷公司可以貼上AI公司的新標籤。

另一種技術是非監督學習,同樣是使用大量樣本來訓練系統,但這些樣本沒有經過標記。系統學習識別特徵和聚類相似樣本,發現數據中隱藏的集合,聯繫或模式。

非監督學習可以用來搜尋沒有具體形象的東西,比如監督網絡流量模式,探測可能與網絡攻擊有關的異常現象,或者檢查大量的保險索賠,揭露新的欺詐手法。

再舉一個著名的例子。

2011年在谷歌工作時,吳恩達領導了一個名為Google Brain的項目,要求一個龐大的無監督學習系統尋找數千個非標記YouTube視頻中的共有圖案。

一天,吳恩達的一位博士生給他帶來了一個驚喜。“我記得他把我叫到他的電腦前,對我說”瞧這個’“,吳恩達回憶道,屏幕上有一張毛茸茸的臉,那是從數千個樣本中提取的圖案。系統發現了貓。

強化學習介於監督和非監督學習之間,只使用偶爾的獎勵反饋來訓練神經網絡與環境互動。

從本質上講,訓練涉及到調整網絡的權值,尋找一個持續產生更高獎勵的策略.DeepMind是這方面的行家。

2015年2月,該公司在“自然”(自然)雜誌上發表了一篇文章,描述了一種強化學習系統,它能夠學會玩49款雅達利經典電子遊戲,只使用屏幕像素和遊戲得分作為輸入數據,其輸出數據與虛擬控制器連接。該系統從頭開始學習玩這些遊戲,在29款遊戲中都達到或超過了人類的水平。

 

AI 讓系統玩遊戲

DeepMind的德米斯·哈薩比斯(Demis Hassabis)說,對AI研究而言,電子遊戲是理想的訓練場,因為“它們就像現實世界的縮影,但更加明亮,更有約束”。

德米斯·哈薩比斯(Demis Hassabis)

遊戲引擎也能非常輕鬆地產生大量的訓練數據。

哈薩比斯曾從事電子遊戲行業,後來獲得認知神經科學博士學位並創建DeepMind。這家公司現在是谷歌旗下的AI研究部門,辦公地點位於倫敦國王十字車站附近。

2016年3月,DeepMind研發的AlphaGo系統擊敗了圍棋頂尖高手李世石,在五局比賽中取得4:1的壓倒性勝利。

AlphaGo是強化學習系統,具有某些不同尋常的特徵。它由幾個相互連接的模塊組成,包括兩個深度神經網絡,分別擅長不同的領域,就像人腦的左右半球。

其中一個網絡接受的訓練是分析數百萬盤圍棋棋局,從而在實戰中給出贏面最高的幾種下一步落子選擇,然後交由另一個網絡進行評估,後者採用隨機取樣的技術。因此, AlphaGo同時結合了仿生技術和非仿生技術。

關於哪種方法更好的問題,AI研究人員爭論了幾十年,但AlphaGo雙管齊下。

“這是個混合系統,因為我們相信,我們將不止需要深度學習來解決智力問題,”哈薩比斯說。

哈薩比斯和其他研究人員已經在著手下一步,也就是遷移學習。這可以使強化學習系統把先前已獲得的知識作為基礎,而不必每次都從頭訓練。

哈薩比斯指出,人類可以毫不費力地做到這一點。詹南德雷亞回憶說,他四歲的女兒知道大小輪腳踏車也是一種自行車,即使她以前從未見過。“計算機做不到這一點,“他說。

被Salesforce的收購的AI初創公司MetaMind致力於另一種相關的方法,名為多任務學習,也就是同一個神經網絡架構被用來解決幾種不同的問題,解決其中一種問題的經驗使它能夠更好地解決另一種問題。

和DeepMind一樣,MetaMind也在探索模塊化架構,其中一種架構名為“動態記憶網絡”,能夠獲取一系列陳述,然後回答有關這些陳述的問題,推斷出它們之間的邏輯聯繫(柯密是青蛙,青蛙是綠色的,所以克米特是綠色的)。

MetaMind還把自然語言和圖像識別網絡整合進同一個系統,能夠回答有關圖像的問題(“這輛車是什麼顏色的?”)。其技術可以用於面向Salesforce的客戶的自動化客戶服務機器人或者呼叫中心。

以前,原本形勢大好的AI新技術往往會迅速失勢。但深度學習不同。

“它確實很有用,”MetaMind的理查德·索赫爾(Richard Socher)說。人們每天都在使用它,但並沒有意識到它的存在。

理查德·索赫爾(Richard Socher)

哈薩比斯和索赫爾等人的長期目標是打造“通用人工智能”(AGI),也就是能夠處理多種任務的系統,而不是為每個問題都單獨創造一個新的AI系統。

索赫爾說,AI研究多年來聚焦於解決具體狹隘的問題,但現在研究人員正在“以新的方式拼湊更先進的樂高積木”。

哪怕是最樂觀的人也認為,還得再需要十年才能實現具備人類水平的AGI但哈薩比斯說:“我們覺得,我們知道實現AGI需要哪些關鍵的東西。”

AI 已經在發揮實際作用,並且將很快變得越來越有用。

谷歌的Smart Reply系統(利用兩個神經網絡自動生成電子郵件回复)在短短四個月的時間內,就從深度學習研究項目變成了現實產品(不過剛開始的時候不得不阻止它對幾乎每封郵件都生成“我愛你”的回复)。

“你在學術期刊上發表論文,毫不誇張地說,隨後的一個月就會有公司使用那個系統,”索赫爾說。

來自大大小小的AI公司的學術論文持續不斷.AI研究人員被允許在同行評審期刊上發表他們的研究結果,即使是在轉化投產之後也可以。他們中的很多人一邊為企業工作,一邊發表學術文章。

“如果你不讓他們發表,他們就不會為你工作,”安德森 – 霍洛維茨基金(Andreessen Horowitz)的克里斯·迪克森(Chris Dixon)說。

谷歌,臉譜,微軟,IBM,亞馬遜,百度和其他公司提供了免費的開源深度學習軟件。一個原因是這些公司的研究人員希望公佈他們正在做的事情,這有助於招募人才。

另一個原因在於,大型互聯網公司能夠承擔免費提供AI軟件的後果,因為他們可以從其他地方獲得巨大好處:獲取大量用戶數據用於訓練目的。

投資基金Bloomberg Beta的席翁·齊利斯(Shivon Zilis)說,這使他們在某些領域具有優勢。而初創公司則想辦法進入特定市場。例如,無人機初創公司利用模擬數據來了解如何在擁擠環境中飛行。

創業孵化器Y Combinator總裁薩姆·阿爾特曼(Sam Altman)說,在互聯網上能夠找到很多訓練數據。他指出,人類可以從不算多的數據中學習,“這說明沒有大量的訓練數據也可能產生智慧“。致力於使用較少數據來訓練AI的初創公司包括Numenta和Geometric Intelligence。

 

AI 選取和組合

各公司爭先恐後地為AI淘金熱的參與者們提供鏟子。迪克森說,其中最頻繁出現的一個名字是英偉達。

每家AI初創公司似乎都在使用英偉達的GPU芯片來訓練神經網絡。也可以通過亞馬遜和微軟的雲服務租借GPU容量。

同時,IBM和谷歌專門設計了新的芯片,使AI軟件運行更快,更有效。