作為第四次工業革命的引領性領域,近年來的人工智能和大數據持續升溫。最近的AlphaGo事件更是將人工智能的前沿技術呈現于大眾面前。
大數據概念被熱炒多年之后,我們是時候開始關注大數據與人工智能在具體領域中的應用問題。那么,目前大數據和人工智能領域還存在著哪些技術挑戰?如何找到大數據和人工智能的創業入口,利用數據挖掘和機器學習的能力創造出更大的商業價值?
近期,天天投聯合騰訊眾創、清華啟迪之星舉辦了“人工智能和大數據投融資面對面”活動。在圓桌論壇環節,幾位學術專家、投資人、創業者分別以各自的視角發表了自己的觀點。
人工智能和大數據投融資面對面活動圓桌論壇
大數據和人工智能領域的技術障礙
大數據技術本身的不可讀性
清華大學機算機系崔鵬教授多年深耕于數據挖掘和信息處理領域的研究,他認為不管是大數據還是人工智能,從學術研究的角度來講不是新的概念,核心基本都是圍繞在數據分析和挖掘、數據建模等工作。
目前在大數據的不同層面,都出現了一些提供標準化服務的公司。但大數據的核心部分,也就是數據的處理和分析,恰恰不容易用一個通用的框架來實現。
大數據有很多的數據來源,不同領域的數據也呈現出非常強的領域特性,我們不可能搞找到一個通用的數據模型,來解決所有的問題。因此,大數據如果想真正地投入到產業應用的話,一定是需要將懂大數據技術的人,與某一領域背景很強的人結合起來,才能夠使大數據的分析和處理層面實現比較大的突破。
其實硅谷現在有些公司正在試研發一些大數據的標準化工具,但是就我們了解到的情況來看,盡管能夠獲得投資,他們的存活狀態并不是太好。因為從企業的角度來講,它并沒有很好的應用場景。規模比較大的企業完全有能力自己構建一個數據分析團隊,不太可能把所有的數據都交給專門做數據分析的服務商;而小公司采用這些些服務,還是會面臨工具通用性上的問題。
另外,大數據技術本身的不可讀性,使它目前存在著技術風險。目前幾乎所有大數據的分析,都是基于關聯算法進行預測。也就是說,以前有大量的數據證明發生A就是發生B,基于這種邏輯的關聯,我們就會預測在下次發生A時也會發生B。
但這些所謂的預測是存在精確度方面的限制的,并且整個過程是一個黑盒子,我們沒有辦法控制。因此,目前的大數據分析還不能實際應用于某些領域的一些嚴肅決策之中。2011年,JudeaPearl憑借因果推理模型拿到圖靈獎,這也預示著計算機技術的發展將有可能打開黑盒子模型,使大數據分析變成一種可解釋的行為。這與目前的大數據完全是兩條線。
今年我們也看到一個標志性的事件,就是2015年10月份《科學》雜志出現的文章,只需要非常少量的樣本,只用了幾百個樣本的數據,加上人的推理能力在里邊,它的性能比用數十萬的樣本得到的效果還是好,這也預示著我們盡管目前大數據很熱,在很多領域已經實現了實際應用,但從技術的發展來講,目前的大數據技術并不是一個進口;以前瞻性的投資視角來看,還是應該關注更前沿的技術發展。
機器學習如何運用于數據治理
原英特爾中國研究院院長、馭勢科技CEO吳甘沙認為,目前大數據與人工智能領域存在的技術障礙主要有以下兩點:
一是大數據工具與特定領域的結合。過去幾年大數據關注的是最底層的存儲,去解決分布式運算的基礎設施的問題。現在是時候考慮如何進入到具體運用的問題。太計算機化的工具,絕大多數用戶是不知道如何使用的。從某種程度上來說,如何提供實際可用的工具給不同領域的用戶,有針對性地提取數據中的價值,這是現在很多廠商都要試圖解決的問題。
第二是數據治理問題。目前大家很少談論大數據的數據治理環節。在傳統的數據分析流程中,數據清洗花費的時間可能占到整個流程的60%-70%,消耗了大量精力和資源。現在,已經有一些機器學習運用于數據治理方面的研究和產業化的嘗試出現,機器學習可以從非結構化的結構中學習出結構化的數據,并通過不斷的學習把一些歧義消除。未來大數據和人工智能將出現一個交匯點,大數據解決通古曉今、見微知著的問題,人工智能則解決認知的問題,二者的結合會對一些重要領域的發展起到里程碑式的作用。最近IBM提出了“認知商業”的概念,某種程度上我們可以將其理解為人工智能和大數據的結合,相信這兩種技術的組合將會有非常好的發展前景。
深度學習很好地反映了技術上面的發展,但它未必是一種終極狀態。如何把深度學習和推理、邏輯這些模型、算法結合起來,把人工智能與現代應用的需求結合起來,對已有的技術進行重新組合,搭出一些獨特的架構,將人工智能從傳統的感知帶入到擁有決策能力的階段,來實現工程上的創新,是未來非常值得期待的。
人工智能和大數據創業的建議
行業垂直類的大數據項目受青睞
在創勢資本創始合伙人湯旭東、極客邦創始人蔣濤看來,現在一些行業垂直類的大數據項目更被看好,通過三個維度對項目進行評估。
第一是要有基于自然語言處理的核心技術,二是擁有更多的數據源,三是要解決客戶的實際問題,實現數據變現。即使是目前的市場容量還不大,但如果能真正解決用戶的實際問題,就是值得投資的項目。
集中精力做到領域化和專業化
雖然吳甘沙創業的時間不長,但卻深有感觸。在吳甘沙看來,創業者首先要明確要解決的問題和自身專注的領域分別是什么。每個領域都有不同的問題,你要解決的問題是不是用戶真正的需求。
第二是短期內,你的目標能不能實現。有時不光是技術上的問題,還要對市場和政策等方面進行綜合考量。
第三個就是合伙人。在人工智能領域創業還是存在一定的技術壁壘。如想想做出與眾不同的產品,還是需要能力很強的專業人才,如果能忽悠到很強的人和你一起創業,一定是事半功倍的。
利用技術實現產業上的創新
圖靈機器人創始人俞志晨認為,在人工智能和大數據領域創業,不僅技術壁壘很強,對創新能力要求同樣很高,人工智能和大數據是一個長線的發展過程,怎樣用技術創造出符合當前環境要求、更具創新性質的產品,是最值得關注和探索的。
憑借數據的力量提升領域競爭力
不管是零售還是商城,許多行業都可以受益于數據驅動的方法和技術。崔鵬教授分析到,大數據的投資熱也持續了很長一段時間,“大數據”的概念也慢慢被透支。如何判斷這個公司是不是真正利用大數據技術的本質在做產品,利用數據的力量提升在某一垂直領域競爭力,而不是只扣一個概念。
對于用戶來說,自己做大數據分析是一什非常奢侈的事情,因為它不是買幾個工具就可以做成的,而是要真正懂得怎么樣對數據進行建模,怎么樣進行數據分析,并和公司里其他部門深度耦合才能解決。一些初創公司不具備這樣的實力,可以向一些研究機構或是高校尋求“產學研”方面的合作,這也是很好的方式。
利用已有的能力和基礎加速進展
數據堂CEO齊紅威坦言,他在創業的過程中同樣經歷了很多的失敗和挫折,總結出三點建議和大家分享。
專注。尤其是在創業初期,精力和時間都是有限的,領域化、專注化非常重要。
開放的思維。尤其是在VR、AR和大數據領域,一定要想辦法利用已有的能力和基礎,比如數據層面的基礎或者技術層面的技術,這樣會加速你的進展,不要所有的事情都自己從頭做。
耐心。這件事情不比其他的領域,尤其移動互聯網靠一定模式砸出來,要累積技術能力,要有很強的耐心。
結語
AlphaGo令人震撼的思維能力背后,是大數據挖掘和學習能力。隨著硬件的達標,算法的進步,數據的積累,也使我們在人工智能的垂直領域看到了更多新的機遇和想法。大數據與人工智能將成為企業發展的強大助力,產生更大的商業價值。
(審核編輯: 智慧羽毛)
分享