在Deepmind和AlphaGo獲得的巨大成功吸引了全世界的目光的同時,新一代人工智能德比大戰已經開始。
Deepmind之前開發的玩雅達利(Atari)街機游戲的人工智能是全新一代的智能技術——大數據驅動通用人工智能(Big Data-driven Artificial General Intelligence)。
就像這個名字所提到的,這里有兩個重要的因素,一是“大數據”驅動,二是通用人工智能。大數據驅動的機器學習使得機器盡量脫離人類的經驗指導,自動在海量數據和工作環境中挖掘知識取得進步。而通用人工智能基于端對端(end-to-end)的深度強化學習(Deep Reinforcement Learning),幫助機器能在不同的任務中共享一套學習框架,無需人類進一步調試。
這兩個因素同時作用出一個效果,即人需要的干預越來越少,而機器在與環境交互反饋中的自主學習比重越來越大。
“大數據”驅動的機器學習
AlphaGo的圍棋棋力來自于30萬張人類對弈棋譜以及3千萬次自我對弈,這是一個典型的大數據機器學習產物。
相比之下,1996年擊敗國際象棋大師卡斯帕羅夫的IBM深藍(DeepBlue)人工智能,其依賴的是大量人類總結出來的走子規則的手動輸入,以及基于超級計算機每秒上億次搜索的全寬度(full-width)搜索解決方案。
簡單地說,深藍的人工智能相當于人類把自己下象棋的知識和經驗手動輸入電腦中,而AlphaGo的人工智能是人類把一堆棋譜“丟”給電腦,后者自己學習總結出來甚至進一步超出人類圍棋認知范疇的知識。
基于機器學習來搭建人工智能,人類不需要通過顯示地編程來教機器如何工作,而是給出一個學習框架,告訴機器如何根據自身當前設置以及提取環境的反饋去進一步更新參數,進而達到一個更好的工作表現。
然后人類只需要把大量數據“喂”進機器,機器就可以不斷學習不斷優化自身的參數了。這樣,人類就不需要自己首先去總結經驗再交給機器,而是變成了“甩手掌柜”,在一邊看著機器學習起來就行。
隨著機器學習的模型先進性以及機器處理大數據的能力不斷升級,基于大數據的人工智能已經在人們的生活當中扮演越來越重要的角色。
過去10年間,基于大數據的人工智能已經在各個領域展露頭角,包括在線廣告的精準投放、搜索引擎個性化網頁排序、電商的個性化商品推薦、社交網絡的好友建議、人臉識別、圖像識別、自然語言理解、機器翻譯、語音識別、無人機跟蹤技術、汽車自動駕駛等等。
很明顯,未來的10年內,越來越多的應用場景會裝配上人工智能,而且機器會不斷學習,做得越來越好。
通用人工智能
Deepmind和其它做機器學習的科技公司的不同在于它提出來的通用人工智能(ArtificialGeneralIntelligence)的概念和產品。通用人工智能背后的技術是深度強化學習,其主要有兩個特點,一是端對端(end-to-end)的學習,二是自適應,無需人類調參而勝任不同的任務。
Deepmind之前推出的玩街機游戲的通用人工智能技術就完美地詮釋了這兩個特點。
首先,機器的輸入直接是游戲屏幕的像素,不需要任何特征設計和編碼。這里要歸功于最近4年來名聲大噪的深度學習技術。深度學習通過建立較深層數的人工神經網絡模型,使機器能夠自動從原始輸入信息中提取、學習出適用于預測、決策的高層特征。
例如在人臉識別這一場景中,深度卷積網絡(deepconvolutionalnetworks)輸入層得到圖片像素本身,底層網絡學習出點、直線、曲線、拐角等初級特征,中層網絡在這些點、線、角的基礎上學習出眼睛、鼻子、嘴等器官特征,高層網絡則進一步組合這些器官特征判斷出圖片是否包含人臉。
其次,同樣設置的機器可以做不同的任務,只要“喂”進去的數據不同,無需人類調參或者只需要極小的人類工作花銷。Deepmind使用同一個深度Q學習網絡(DQN,deep-q-network)模型可以玩不同的街機游戲,只需要讓機器玩某個游戲幾天,它就能學會并超過人類玩家。
通用人工智能可以理解為是在強化學習的框架下,結合其在不同任務下的適應性、模型零耦合(model-free)的優勢和深度學習的特征自動提取的優勢,實現出的能勝任多種任務端對端學習的超級人工智能。這已經十分接近人類學習和工作的方式了。
正是由于以上兩點優勢,人類在開發新一代人工智能的過程中需要做的干涉越來越少,交給機器去自動完善的學習比重越來越大,這為人工智能的工作水平的提升以及在各個領域的普及帶來了本質的飛躍。
萬物互聯的人工智能時代
最近這三年,我們總是被各種耀眼的技術詞匯轟炸著:大數據、機器學習、人工智能、物聯網、工業4.0、互聯網 ……我認為,這些五花八門的詞匯其實都在指向同一個未來:一個萬物互聯的人工智能時代。
我希望從三個維度上的趨勢來解釋這個觀點:互聯化、數據化和智能化。
互聯化是指我們真實世界的設備與設備互聯,而不只是一臺服務器上的網站和另一臺服務器的網站相連。以汽車舉例,我們的汽車可以連接到家里的空調,這樣我們在回家的路上就可以發出指令啟動房間里的空調;汽車也可以和路邊的建筑設施互聯,找到適合的停車位或者商場中的服務。
汽車之間也可以互聯,通訊汽車間距、速度等信息,自動保障行車安全。這就是物聯網(在汽車垂直領域稱作車聯網),其在制造業的應用被德國稱為工業4.0,在生活上的應用則被我們中國稱為互聯網 。
數據化是指盡可能多的設備信息、工作狀態被量化成數據并可在設備之間通訊。同樣舉汽車的例子,司機每天開車的路徑、其中各個地點的速度、加速度、油門深淺、剎車輕重、路況等信息都可以通過傳感器產生可記錄、通訊和分析的數據。
目前,以特斯拉為代表的新能源汽車已經在數據化進程上走得很遠了。其他領域,例如家居、健康,也在推進數據化進程。由于越來越多的設備互聯,各個設備的狀態也進一步數據化,人類在接下來的10年內產生的數據量將會比互聯網時代更上一個新臺階。
從大數據的角度來講,“大”不但指數據規模大,更指的是數據維度高。而設備的互聯化和數據化將會產生比當今互聯網大數據更加名副其實的大數據。
智能化則是在設備互聯化、數據化的基礎上通過數據驅動的人工智能解決各種各樣的快速有效的預測和決策問題。從機器學習的角度來講,用于訓練的數據規模越大、維度越高,就越能學習出更復雜的高級模型,勝任更高難度的智能工作。
大數據是原材料,機器學習是原材料加工廠,而新一代人工智能服務則是工廠出爐的產品被消費在越來越多的日常生活中。我們看到最近這三年這樣一個新型產業鏈的每個環節都在蓬勃發展,而在AlphaGo戰勝李世石的今天,更多的人開始注意到這條產業鏈帶來的人工智能產品將會在未來10年間給人們的生活帶來翻天覆地的改善。
學術界與產業界雙贏
結合真實大數據并在人們日常生活中發揮作用的人工智能研究是目前最有效率并最符合整個產業鏈發展趨勢的研究方式。研究大數據驅動的人工智能,首先得有“活的”大數據可供研究,才在真實環境中不斷嘗試研發新的人工智能模型。
這樣一個交互式的研究環境最能夠促進新成果的誕生。這也是當今許多世界級并且奮戰在人工智能研究一線的大學教授會選擇在一家科技企業兼職的原因。
而幾年前高校的數據挖掘和機器學習研究仍然傾向于靠著一個許多年前生成的數據集不斷地測試新模型。從實踐經驗來看,這樣工作在一個老的小數據集上的模型很難勝任現實生活中的大規模動態數據。而高校實驗室需要作出最前沿的人工智能技術就需要奮斗在大數據處理的第一線。“Gethandsdirty。”這樣才能切身感受到最真實最野性的數據,才能真正理解數據和基于數據搭建起來的人工智能。
我認為在大數據驅動的人工智能研究中,大學科研團隊與工業界算法團隊相比,其優勢在于能將主要精力投入在算法研究中,能在擁有大數據和測試平臺的基礎上,產出一般企業想不到的有效算法;另外大學研究者由于長期保持相關文獻的收集整理,對領域內的最新技術以及新舊技術的全局理解有很深的體會。
大數據驅動的人工智能是一個產業界和學術界雙贏合作的領域。
我在倫敦大學學院的博士課題是互聯網精準展示廣告算法。互聯網廣告領域的數據由于涉及廣告拍賣交易中的價格信息而十分敏感,所以該領域在2012年之前并不存在任何互聯網廣告領域的公開數據集可供高校研究者做研究。該領域絕大多數研究論文皆來自涉足互聯網廣告的科技公司,例如谷歌、微軟、雅虎等等。
對于高校研究者來說,做互聯網廣告大數據的研究,首要任務就是同相關企業建立研究合作,獲取最新的廣告投放數據,并在合作企業的商業平臺上直接做面向真實用戶流量的實驗。我們研究組在倫敦、北京和硅谷尋找到了多家廣告科技企業進行合作,其中既有業務量和數據龐大的IT巨人,也有迭代速度極快的初創公司。
我在博士期間發表的數篇互聯網廣告技術方面的論文,都包含了在這些企業平臺上做的在線實驗。我也在和企業的交互中學習到了很多在高校實驗室無法接觸到的實踐經驗。根據我們的研究產出,合作的企業也都有效提升了廣告投放的效益。
(審核編輯: 智慧羽毛)
分享