謝耘認為,在1956年,一群來自于神經學、邏輯學、數學計算機等的牛人,在美國開了兩輪會提出了人工智能的概念,這是人工智能研究的標志性時間
在日前的中關村創業講壇上,神州數碼首席科學家謝耘對人工智能進行了主題演講;在演講時,謝耘分享了人工智能研究的幾個階段,并表示,隨著讓計算機運算的速度越算越快,IT產業迎來了第二個關鍵性的轉變,就是在讓計算機越算越快的道路上又出現了一個重大的轉折——今天基礎技術平臺在絕大多數的情況下足夠富裕了,不再成為應用的瓶頸。
謝耘認為,在1956年,一群來自于神經學、邏輯學、數學計算機等的牛人,在美國開了兩輪會提出了人工智能的概念,這是人工智能研究的標志性時間;隨后一直到上世紀八十年代,科學家們一直認為模擬人的大腦神經做一個網絡,就會出現智能,但這個在90年代遭遇了重大挫折;在九零年,IT產業發生了一次歷史性的轉折,就是從對智能的追求回歸到了對計算能力的追求,而到目前為止,IT產業仍在讓機器越算越快、把機器越做越小、用機器把所有的設備都連起來;因此謝耘認為,但凡能變成計算的問題,計算機都可以解決。如果一個人沒有本事把一個問題變成計算問題的話,計算機就解決不了。
謝耘認為,大數據引發了對智能的無限遐想,大家覺得用了云計算成本可以降低,其實這個話可以倒過來說,因為成本降低了今天才可以用云計算的方式提供這種服務。云計算本質是產業服務層面的變化,不是有了云計算技術突破了開始搞云計算,而是因為里面的技術和產品不斷的進步,而導致整個計算資源、通訊資源、存儲資源成本大幅度降低了,所以今天才開始搞云計算,這是這個產業真正發展的邏輯。大數據也是一樣,因為無所不在才產生了大數據,就是因為計算資源很便宜了,處理器很便宜了,所以才會產生大量的數據。我一個人帶了好幾臺計算機,現在手機也是一臺計算機,現在手機計算機的能力,相比八零年花天文數字的投資造出的第一臺銀河一號巨型計算機的能力快了不只一個量級,今天的計算資源就是如此的豐富,所以產生了云計算和大數據。
以下是謝耘演講實錄:
各位來賓,大家好!剛才涂老師把大數據的情況跟大家做了很好的介紹,而且涂老師快到最后了,講到大數據會進入到智能的社會。我的話題是從智能開始講。
今年年初我參加了一個年輕朋友的讀書會,咱們中組部的一個朋友就問了我一個問題,謝老師,現在都大數據時代了,你能不能幫我們設計一個系統,我把一個局長的材料等等的信息全放在系統里,然后你就能告訴我這個人能不能當副部長,以后能不能當部長?大數據確實引發了我們對智能的這種無限的遐想。當時我給他的回答,如果一件事情沒有人知道該怎么做的話,其實計算機也不會替你做。大家聽懂這句話了嗎?在座的朋友可能很奇怪,計算機做的很多事我就不知道該怎么做啊,不是還替我做了嘛。但是一定有某個人知道這件事該怎么做,計算機才會來做。
為什么講這個題目?也就是因為大數據引發了很多對智能的議論,所以我今天就想圍繞這個話題講一下,看看能不能講清楚。這也是我個人的觀點,不一定對,供大家參考。
其實人類創造的工具分成兩大類,一類是輔助體能的工具,計算機其實是作為一個計算的工具輔助人的智能活動。能不能以后代替智能活動,這是很多人夢寐以求的活動,下面我會做一些分析。
因為計算機是輔助智能的一種工具,而且計算本身其實是人的智能活動的一部分。上個世紀四十年代計算機誕生之后,整個的產業很快把興趣從制造能計算的機器,而轉向了制造有智能的機器。這件事情的一個標志性的時間,就是在1956年的時候一群來自于神經學、邏輯學、數學計算機等等的牛人,在美國開了兩輪會提出了人工智能的概念。當時人類對造智能的機器還是非常樂觀的,這是兩個典型的牛人。一個是已經不在世了,叫做hebert,他獲得過諾貝爾將來學將,1965年講20年內機器能完成人能做的一切工作。另外一個牛人還在世,叫做Minsky,1970年時講在三到八年的時間里將得到一臺具有人類平均智能的機器,他們在說什么?大家知道前一段美國一臺機器在答問題的時候還贏了,還有一臺機器通過了圖靈測試,他們說的是不是這樣的機器?不是,當年討論人工智能的時候講的不是我們現在看到的事情。
當機器能完成人能做的一切工作的時候意味著什么?意味著當年科學家想造一臺機器,這臺機器就和人一樣在開始的時候內置了一些機制,但是是很蒙昧狀態,什么也不知道。讓這臺機器和外界的交互能夠學習,能夠擁有智慧,能夠獲得知識,這是當年討論智能時候最原始的想法。當年認為這種機器花一二十年能造出來,結果是什么?在九十年代的時候這個努力遭到了重大的挫折。底下那臺是日本造的第五代計算機,1981年開始的,當時引起了全世界的轟動。這臺計算機當時日本傾全國之力來造,他們認為從九十年代開始人類在人工智能領域已經積累了大量的經驗,再經過十年的時間我就能夠造出這么一臺機器來。這臺機器只需要內置基本的機制和人工接口,它就會自己獲得智慧和知識,不需要你去編程。到1990年的時候這個項目徹底失敗了。
八十年代人工神經網絡,號稱模擬人的大腦神經做一個網絡就有智能,當年我做博士就是研究這個問題,在九零年前后冷下去了,事實證明并不能達到我們的期望。所以IT整個產業其實是在九零年發生了一次歷史性的轉折,就是從對智能的追求回歸到了對計算能力的追求。發現造一臺和人大腦一樣的計算機不靠譜,什么靠譜嗎?讓計算機越算越快比較靠譜。IT產業今天我們看到的格局是在1990年的時候發生了根本的轉折才變成這樣的,在那之前對智能的追求是非常熱的。
這就是我們看到的今天IT產業在做什么?就是讓機器越算越快,把機器越做越小,機器可以把所有的設備都連起來,為什么?就是因為計算機越做越小。計算機核心還是在做計算,但凡能變成計算的問題,計算機都可以解決。如果一個人沒有本事把一個問題變成計算問題的話,計算機就解決不了。剛才中組部的人問我,一個局長能不能當副部長,如果沒有人能夠把這個問題當作計算問題的話,對不起解決不了,給計算機灌多少數據都沒有用,一定有人懂這個事情怎么做計算機才能算。
隨著讓計算機越算越快,做到今天整個IT產業迎來了第二個關鍵性的轉變,就是在讓計算機越算越快的道路上又出現了一個重大的轉折,什么轉折呢?就是今天基礎技術平臺在絕大多數的情況下足夠富裕了,不再成為應用的瓶頸。所以IT產業從現在開始往未來看,基礎技術平臺主宰整個產業發展的階段已經結束了。在九十年代買PC會問主頻多少,主頻不夠有的銷售商說可以給你升頻,為什么?因為計算能力不夠。但是到今天買手機或Pad的時候知道主頻是多少嗎?沒有人關心了,為什么?基礎技術平臺的能力在絕大多數的情況下已經足夠的富裕,不成為應用的限制瓶頸。從今天開始在IT產業里面基礎技術平臺將不再主宰未來產業的發展,真正主宰未來產業發展的將會是應用。為什么發生這件事情?就是因為集成電路技術的發展導致這個樣子。
現在集成電路線寬做到最小22納米,就是在一個大頭針的針頭上可以放一億個晶體管,為什么做這么小已經做成了立體的。原來的晶體管是平面二維的,現在已經是立體的了。
再往下做,集成電路還能做到多小?我和英特爾的人談過,他們說最小做到2納米,也是可以在未來十年里再降低一個數量級,十年里硅走到頭了,可以再用別的。
IT產業之所以發生第二個轉折就是因為集成電路走到了這個程度,在今天開始IT產業真正進入了青年時期,也就是真正開始了黃金時代。在此之前無論IT產業創造了什么樣的不可思議的奇跡,那都是序幕。真正的奇跡將會在未來發展,整個IT產業波瀾壯闊的前景還剛剛掀開一角。現在好多人在談產業替代的問題,就是IT之后誰來驅動社會的發展,我覺得談論這個話題還太早了,IT產業對于整個社會整個顛覆性的影響剛剛開始。
舉一個很簡單的例子,《阿凡達》都看過對吧?IT在顛覆一個很傳統的產業,就是咱們的電影,可以不用演員了。以前做不到,為什么?因為需要超級計算能力,原來的基礎計算能力做不到,它會非常昂貴。現在基礎計算能力以后足夠富裕,我可以完全用電腦把片子做出來,不需要演員了,以后演員可能會事業,這是完全典型的例子。未來IT將會在各個領域里產生今天可能想不到的現象。
另外整個產業的格局不會像今天這樣,比如數據庫由甲骨文來統治,你只要想做這個東西就要用甲骨文的東西。未來也會散開,散的面會非常之大,在各個領域會有專門獨特技術的公司在一個領域里把應用真正做好。這是我看到未來IT產業的基礎,當一個領域的基礎技術不再是瓶頸的時候就會真正成熟,我們的汽車產業是這樣,我們的航空產業也是這樣,比如說波音和空客是做什么的?做應用的,它不是做核心技術的,不生產發動機。空客想造出任何的飛機,發動機公司都能給你配一個合適的發動機,這就是基礎技術、核心技術不再構成瓶頸,這個產業在真正繁榮。
IT產業到今天我認為剛剛進入門檻,未來會非常熱鬧,大家可以好好在這個產業干。
因為這個原因產生了大數據、云計算,大家覺得用了云計算成本可以降低,其實這個話可以倒過來說,因為成本降低了今天才可以用云計算的方式提供這種服務。云計算本質是產業服務層面的變化,不是有了云計算技術突破了開始搞云計算,而是因為里面的技術和產品不斷的進步,而導致整個計算資源、通訊資源、存儲資源成本大幅度降低了,所以今天才開始搞云計算,這是這個產業真正發展的邏輯。大數據也是一樣,因為無所不在才產生了大數據,就是因為計算資源很便宜了,處理器很便宜了,所以才會產生大量的數據。我一個人帶了好幾臺計算機,現在手機也是一臺計算機,現在手機計算機的能力,相比八零年花天文數字的投資造出的第一臺銀河一號巨型計算機的能力快了不只一個量級,今天的計算資源就是如此的豐富,所以產生了云計算和大數據。
大數據引出的是大家對智能的遐想,下面專門講一下智能,我怎么看智能,包括在大數據環境下未來到底要怎么做。這兩個圖一邊是計算機系統,一邊是人的系統,人腦底層是不是計算?這個問題現在沒有辦法回答。我們不知道人腦最底層的機制是不是計算,但是計算機很簡單,計算機最底層的機制就是計算,底層是計算的能力。往上走有一個中間層,這個中間層是架在計算能力和應用之間的,包括了操作系統、數據庫等等,本身并不直接是應用,它有一個中間層。在中間層之上才是我們看到的各種各樣的應用,大腦是什么樣的?大腦最底層是神經原,一個一個神經原連接在一起,現在心理生理學家可以測這些信號,但是說不清楚到底是不是計算,只是可以測一些信號。
大腦再往上還有一層,這一層更說不清楚,在這一層之上是平時的表現,我們會說話、學習,也有各種各樣的心理過程,就是所謂的心理學講的顯意識過程,這個過程是可以監測、分析,也可以看到的。最關鍵是大腦中間這一層是什么?2009年中央十臺放了一個節目講的是半腦人,孩子一歲的時候得了病,最后醫生說他得了腦膜炎,實際說不是,而是他得了癲癇。到了十幾歲這個孩子開始犯癲癇病,一直很正常,沒有太大的毛病。癲癇犯病的就是抽風,咱們俗話說是羊角風。原來是一年到一年半犯一次,后來間隔越來越短,一兩個月犯一次,到十七八歲的時候家長就受不了,帶他去醫院檢測,發現孩子是癲癇。最有意思的是這個照片,大家能夠看到左邊的大腦已經萎縮了,看不到了。醫生最后就決定給他開顱,干了件什么事呢?把他左邊大腦切掉,切掉之后怎么著了呢?這個孩子基本上還是正常的。在從小生病這段時間大腦整個完成了重構,因為大腦左右是分工的,一邊管邏輯,一邊管形象思維,最關鍵是右邊的運動受左腦控制,左邊的運動受右腦控制,所以人中風之后看哪一側腦袋中風,這一側腦袋中風,這側的肢體運動受影響。但是現在醫生把整個大腦的一半切掉之后而沒有受影響?這說明什么?說明大腦有中間一層。底下神經原一層出現故障以后,像云計算中心一臺機器出現故障云平臺重構,保證系統上面的應用可以正常跑,實際上大腦有這樣的功能,也就是中間有一層。中間這一層到底是什么?其實到現在神經心理、生理學家都不知道。
為什么講這件事情?我們今天對智能本質的理解還是非常膚淺的,對于人的大腦中到底在發生什么,對于整個過程的理解是非常膚淺的。包括今天世界上的很多科學家經過了九十年代所謂人工智能的冬天,到今天大數據時代又開始蠢蠢欲動,試圖構造一個號稱是和人一樣有聰明、能夠學習、能夠獨立、具有智能的機器。我聽說有一家企業放了一臺這樣的機器到大學課堂跟著學生去學習,認為還是很有可能造出和人完全有一樣智能的機器。我認為這個理想還是非常之遙遠,以后能不能造出來我不知道,但是從人類今天對整個自身智能過程理解的局限,我認為我們不足以支撐造出這樣的系統。
我們現在能夠實現的所謂的智能還是在上面的一層,就是能夠觀察到、測量到、分析到的人的智能活動。對不起,人的智能活動更重要的是底下這一層,為什么呢?剛才我說了這個孩子剛生下來是蒙昧無知的,腦子里沒有任何東西,完全憑著和外界的交互成長起來。但是今天的計算機不行,我們要內置很多的東西。
下面就講一下人在實現智能的這條路上有幾個基本的方法,實際上有三個。第一個是形式上的模仿,剛才我說的是人工神經網絡,什么意思呢?我們發現人的神經原是有巨量的神經原,他們之間有大量的連接。從五十年代開始搞人工智能的有一批人認為,我也造一些很簡單的處理單元,然后把大量的處理單元連接在一起,我覺得就可能會有智能。這句話聽起來有點像開玩笑,大家不要驚喜,科學家經常也搞不靠譜的事情。如果你們仔細讀科學史的話,其實科學發展歷史上有很多不靠譜的事情,包括很有名的科學家也干很不靠譜的事情,所以大家要記住不要把科學變成一種宗教迷信。