close

新浪科技訊 3月22日上午消息,2015年IT領袖峰會今日在深圳正式開幕,百度首席科學家吳恩達發表題為《深度學習與人工智能》的主題演講。

吳恩達指出,新的人工智能技術出現,我們把它稱為深度學習,深度學習給我們帶來了巨大的價值,給很多的IT公司也帶來很多的價值。

吳恩達為大家闡述,為什麼現在人工智能的發展非常迅速?怎樣進行投資來推動人工智能的發展?我們在全球看到的人工智能發展趨勢,以及我們面臨的機會和挑戰。

以下為吳恩達演講實錄:

吳恩達:大家好!我還是每天學習一點中文,不過我現在普通話還是不夠好,所以如果有這個耳機,我今天還是講英語,請翻譯者幫我翻譯。

我們看到新的人工智能技術出現,我們把它稱為深度學習,深度學習給我們帶來了巨大的價值,給很多的IT公司也帶來很多的價值。我相信人工智能,我指的是 新的人工智能,也就是深度學習給我們帶來的影響將會越來越深遠。在座的各位很多是企業的領袖,所以未來大家可能會做出對你的組織有利的很多重要的決定,可能是公司,也可能是大學,這都是在深度學習方面的,所以我想分享一些對大家有用的東西。首先我講一下為什麼現在人工智能的發展非常迅速,第二要怎樣進行投 資來推動人工智能的發展。我們在全球看到的人工智能發展趨勢,以及我們面臨的機會和挑戰。

我希望在我的演講當中關注三個領域,我覺得 這 三個領域正在發生重大的創新,一個是圖像,第二個是語音,第三個是行為。我們先從圖像開始,很多年前我還在斯坦福大學教課的時候,我問學生一個問題,就用 當時一個人工智能的技術找到一個咖啡杯,結果非常亂,他們覺得整個廚房檯面上放的都是咖啡倍。可是過去幾年技術已經取得了巨大的發展,在這些年當中,人工 智能的發展曾經一度比較低迷或者比較慢,而在最近幾年當中有一類新的人工智能技術出來了,我們把它稱為深度學習,也就是使計算機學習了更多人類的神經系 統,來更好地解決比如圖形識別的問題。我們有時候不是很清楚人腦究竟是如何工作的,而我們要真正把深度學習做好,就必須要了解人腦在做什麼,人腦當中發 生了什麼,這對我們來是非常重要的。我們使用這些計算的結果,我們可以給他們提供很多的數據,比如咖啡倍圖像的數據,這樣我們可以獲得更好的計算機視 覺。做更好的辨識,我們對於網絡神經的研究,對於人工智能的研究進行了好多年,所以有些人問我為什麼在最近幾年,比如最近五年才獲得比較快速的發展,要回 答這個問題我需要打一個比方。

比如如何構建火箭,火箭的形狀包括兩件事情,一個是發動機,另外一個是燃料,這兩部分是非常重要的,必 須 把這兩方面做好,我們才能有機會把這個火箭發射到太空中去。如果你的發動機太小,燃料太大不行,發動機太大燃料不夠也不行。所以火箭發動機和火箭的比例非 常好才能夠確保火箭準確地發射到軌道當中,這給我們深度學習也帶來了一些啟示。我們在深度學習的過程當中就像發射火箭那樣研究巨大的神經網絡在我們的社會 當中每天都發生巨大的活動,而且人們的活動多數都是圍繞他們的手機和電腦來開展的。我們如何利用這種新的情況呢,或者新的環境更好地幫助我們了解巨大 的神經網絡呢?

我們的社會越來越多地進行數據化或者數字化,我剛才已經了人們很多生活都是圍繞手機和電腦來開展的。我想和大家分 享一下我過去的一些經驗,在IT世界發生什麼,來構造更好的IT行業的火箭發動機和燃料的比例配比。在很多年前,當深度學習這個概念剛剛開始的時候,更多 的 是使用CPU技術,構建小的神經元網絡只有100萬或1000萬的連接。我所的是計算機連接的數目,之后我們取得了一些進展。其中在2008年發生改變 的事情就是GPU技術的發展,我們看到它的連接數目也發生了巨大的增長,GPU是手機上、pad上的硬件來幫助你做計算,有些人意識到硬件對我們加速深度 學習非常重要,發揮非常重要的作用。我們借助GPU可以構造越來越大的神經元網絡。在往后,我們看到了更多大規模的發展,像谷歌的深度學習項目,使我們 更多地了解相關的知識,我們有了更多的雲,更多的CPU來推動相關的發展。現在我們看到的,我也認為這是下一階段的趨勢,就是我們要從雲技術,或者僅僅 利用純技術跳到HPC或者叫高性能的計算技術,超性能的計算技術。我不想講過多的細節,因為它會偏重於技術,讓我們更多地來看今天所關注的話題,HPC和 雲,這可能是兩個比較分離的社區,研究雲和研究HPC的人也是兩類人。隨雲技術的發展,你可以同時使用上千台計算機,不用擔心這麼多計算機會發生崩潰, 這種情況是不會發生的,現在已經認證了這點。而HPC技術比較小數目,但是更貴、更高性能的硬件,而我們也認為這對於我們構造更好比例的火箭引擎也是更佳 的一個解決方案。

在中國,我們其實在一些領域是比較領先的,甚至領先於世界很多其他先進國家。HPC到深度學習的跳越,而其他國家也 確 實進行大量的投資,這也是需要我們注意的。使用這些火箭引擎,再做一個類比,我還想給大家舉一個這樣的例子,看我們究竟能做什麼。比如計算機系統對人臉 的識別,這對我們來也是比較重要的計算機應用。比如針對安全的目的,還有保安的目的,這都是在未來會越來越多的應用。大家對這張臉都很熟,美國著名的影 星,通過人臉識別可以告訴我們是同一張臉,這當然是最佳的結果,不同的組織使用不同的技術,他們得到的結果也是不一樣的,這是因為有時候這個軟件的計算也 會發生不同。

我希望大家參考一下這個柱狀圖就可以了解相關的計算結果了,我們是這周才宣佈我們能夠在這方面表現得比其他大多數公司都要好。謝謝大家鼓掌鼓勵!

和其他公司相比,比如和谷歌、臉書相比,谷歌和臉書的火箭燃料比我們多,也就是他們的數據比我們多。但是我們在發動機上的投資比他們多,我們在發動機 上的投資多給我們帶來巨大的好處。我們在發動機和燃料的比例方面要做得好才能確保這是一個好的火箭,我們正是在發動機方面進行大量的投資。所以我們才在人 臉識別領域和其他領域比其他國際上領先的大公司要做得好。我們在人臉識別只有0.3幾的錯誤率,大家可以看到我們的比例多麼高,我給大家演示一下我們所發 生的錯誤。看一下這張臉,你覺得哪兩張臉是動一個人的臉,還是都不同的?比如在左邊的女人的臉,和其他哪張臉是相同的,大家能告訴我嗎?我們所犯的9個 錯誤,其實就是發生在這裏面,這些都是一個人,大家根本想象不到,他們都是一個人,發生錯誤可能是數據的關係,不是我們自身的關係。而下面是不同的人,大 家能看出來了。我剛才提到了識別,像咖啡杯,還有人臉的東西,除了這些電腦能夠做的事情,還有很多,它能夠理解圖片還有很多,如果我們能夠在這方面做得很 好的話,這張圖片能夠告訴我們很多東西。比如我們看左邊,如果要求你寫字幕的話會怎麼寫呢?你可能會寫有一輛黃色的車在路上開。如果要為右邊的圖片寫字 幕的話會怎麼寫呢?你可能會寫起居室充滿了下午的陽光。這個還不夠充滿激情,我們還可以通過深度學習讓你了解更多的信息來寫一篇更有吸引力的字幕。

一個計算機能不能了解你我了解的圖片信息呢,或者能不能像人腦一樣工作了解我們想了解的信息呢。可能結果是非常讓大家吃驚的。現在我在圖片上顯示的字幕 並不是人寫的,而是機器寫的,這就是我們百度可以提供的技術,也是我們起步的技術。而其他公司甚至還沒有搞清相關的概念,他們有一個籠統的想法要提高電腦 圖像的識別,在過去幾年,具體來大概三年的時間內,計算機圖像的技術發展非常迅速,現在計算機在圖像識別上,比更多年以前要做得好得多。現在很多計算機 公司甚至比很多人腦眼睛一眼看上去了解的信息還多。我們有一些想法、有一些品,也有一些技術,我想的是這些技術給我們開啟了無限的可能,可以使我們來 了解一下哪些品領域是大有可為的。我們可以在圖上了解一些相關的領域,比如百度還有其他的搜索引擎正在做的事情。我不知道一個非常清晰的路線圖是怎樣 的,或者哪個領域會發展得更加迅速。

比如百度在衣服的搜索方面做很多東西。還比如對老年人的照顧方面,我們也做了一些探索,因為中國現在面臨人口老齡化的問題。還有在可穿戴設備方面也有一些新的舉措。我們希望在這些新領域的探索開啟更多的機會,使我們可以創造更大的業。

來看一下計算機的發展,我想跟大家分享一下第二個領域語音識別方面我們做的東西。在移動互聯網方面,大家對互聯網的使用,對手機的使用越來越多的結合起 來。我們過去是用鍵盤,包括手機鍵盤來敲字,這是比較浪費時間的,大家現在用話音來進行溝通,所以語音識別是一個非常重要的發展方向。大家可以試一下百度 上面有相關的應用,現在已經做得比較好了。而大家現在普遍反應在手機上進行語音通信的時候,如果手機離得比較遠的話效果不是很好,要比較近的時候語音識別 才做得比較好。我們在相關的IT技術方面也做一些探索,從傳統領域來看,這是語音識別所做的事情,基本上所有做語音識別的公司都是使用非常複雜的管道。我 們來改善它的話音系統,突出聲音特徵,有一些不同的模組,不的的模組組合起來識別這個人到底講了什麼。

我們百度做的是什麼事情呢?我 們 把所有這些東西都替代掉,用先進的人工智能技術替代掉,用先進的深度學習技術來替代掉,這就是我們百度的深度語音,我們的火箭發動機。大家看到這個話音識 別的結果如下,很多公司用的是依靠大量的數據,而百度忘掉那些數據吧,我們將用1萬的數據集進行人工智能處理,這就是我們的火箭燃料,我們形成了一些研究 的結果。大家可以看到,基本上結果是不可想象的。

人們之前從來不會想到能利用這麼多的數據,我們使用神經元系統以及數據燃料,我們發 布 了這樣一個結果,我們可以極大地提高語音識別的準確性。根據我們的計算結果,我們的調查結果,我們現在正處於這樣一個環境,如果你對手機話提出你的要 求,我們的介面是做得越來越好了。我們可以很好地處理背景噪音,使手機更好地識別你自己講出的話。我非常興奮,我們能夠在這方面做得越來越精確,做得越來 越好。在百度,我們已經看到了使用話音識別的用戶越來越多了。因此在這個領域,我們還有很多要提高的。很多人是低估了95%的準確率和99%的語音識別準 確率的差別。如果我們能夠做到95%的話,也就是今天的狀況,你話要非常清楚,要離話筒非常近,必須這樣才能識別出來。如果我們將來能做到99%的準確 率的話,這和95%簡直是天壤之別,這會徹底改變我們的玩法。如果我們能真正做到99%,我們甚至可以把所有手機的介面做重新的設計和修改,使我們自己更 加習慣於語音通話指令的發送方式,這可以推動這個領域的革新。你手裏的東西將不是傳統上的手機了。

在手機之外,我覺得我們的話音識別 還 會推動物聯網的革命,從汽車界面到家用設備到可穿戴設備將會發生很多的改變。我在家裏有5個遙控可以控制的東西,我想再過幾年再回過頭來看,我們會覺得這 5個遙控太少了,比如你只是遙控電視,只是遙控空調,簡直不夠了,看來都是小兒科的東西。在幾年的時間內,或者在未來幾年,我們將能夠和電視通話,和更多 的家電通話,這將是未來面臨的發展,我們將有很多的路由器內置到這些機器當中。

這是對語音識別的介紹,下面再看一下最後一個部分,也就是行為這塊。

我們看到很多技術公司現在都能夠獲取到一些大數據來了解人們在互聯網的環境當中究竟是什麼樣的行為,這是技術的發展。我們可以從這些數據當中挖掘更多的 價值。正如很多人都知道的,我們百度的廣告也是在人工智能方面下了很大的工夫,我們有很多數據搜集過來是關於人的行為的,而這些深度學習可以使我們了解人 們的行為是什麼樣的,他們傾向於做什麼事情,他們喜歡做什麼事情。因為我們的數據中心還有很多數據搜集起來,使我們了解不僅僅是人的行為,還有機器人行 為。今天的深度學習確實是一個非常強大的工具,使我們可以了解機器在做什麼,來更好地管理數據中心。比如我們可以使用這方面我們了解的信息來更好地使機器 運作。我們也可以更好地了解計算機是如何工作的,我們還可以使用深度學習來提高計算機的安全性。

這是我們百度正在做的事情,我們覺得 很 多行為數據給我們帶來的機會,包括人的行為,包括機器的行為,可能比我們今天所了解到的要廣得多。美國、中國和歐洲現在都越來越多使用深度學習來了解人的 行為,了解機器的行為。在IT世界當中以及IT世界之外挖掘更多的機會,這也推動了我們未來的成功。我非常興奮地了解到深度學習在上述三個領域都給我們帶 來了巨大的改變或者將會帶來巨大的改變,我剛才用了火箭的引擎和燃料來做類比,使大家更生動地了解我們所面臨的改變。

最後我跟大家分 享 一個框架,人工智能能給我們帶來什麼,人工智能的循環發展是非常迅速的,在15年前,我們有這張圖,我們有這個想法,這就是AI人工智能的良性循環。那時 候我們如果能夠構造優秀的品可以吸引更多的用戶,有了更多的用戶就可以獲得更加大量的數據。現在這個良性循環確實已經就位了,現實就是這樣。而還沒有發 生的事情,我們以前想過但還沒有發生的事情,更多的數據通過人工智能被你更好地利用,來推動更多的優秀品被生出來,而這個只是在最近幾年我們才做的事 情。而我們的火箭引擎現在不夠大了,而我們的燃料變得越來越大了,現實世界是這種情況。大家搜集到的數據越來越多了,可是引擎不夠大,所以不能深度地利用 這些數據。在我們搜集更多數據的過程中,推動更多應用發生的過程中,這是我們之前那些老的算法是連想都不會想的。而深度學習之所以能給我們帶來更多的價值 就是因為我們現在可以從越來越多的數據當中受益,獲得越來越好的結果,開發越來越多的潛能。所以我深度學習確實改變我們的生活,改變傳統的人工智 能,使我們最終可以把連結做得特別好,把發動機和燃料的連結做得特別好,把品、大量用戶和海量數據之間的連接做得更加通暢。

最後我 想 的是,在這個介紹當中,我主要是關注了圖像、語音和行為。但是對於人工智能的機會來遠不止這三個方面,我們看到在自然語言的處理方面有很多的事情可以 做,在生物技術方面人工智能也有很多東西可以做,這些創新都在發生的過程當中,人工智能也可以更多地被應用到機器人的開發。百度大腦大家都聽過吧,還有這 也是最近大家比較熟的中國大腦緊密聯繫起來的概念。在很多年前,百度可以從應用當中吸取更多的價值,在百度專門有一個團隊,他是余凱和王晶領導的,這個團 隊主要是構建深度學習的內部平台,這個平台可以做的事情是什麼呢?可以支持百度的工程師獲取CPU、GPU和深度學習的平台資源,他們可以使用這些技術來 推動他喜歡的應用。而這些在公司當中就推動了深度學習的繁榮發展。因為我們創造的東西那麼多,我們人工智能很多應用的領域,我們甚至還想象不到,還不知 道。我想面對未來,可能機會會更大,能想象到的和不能想象到的機會會更多。我們可以抓住的方面也很多,可以真正幫助我們重塑經濟結構。面向未來,如果想看 一下人工智能給我們帶來的潛在影響的話,我不得不想到第一次工業革命,第一次工業革命是在英國,最後蔓延到整個歐洲的。我想這次工業革命在當時也是推動了 一些新技術的發展,最初在英國,最後整個歐洲都採用了這些技術,這是一百多年前,快兩百年的事情了。我也希望大家能把眼光放在未來的工業革命上面,它給我 們帶來的影響是非常深遠的。這些工業革命也可以把人們從日常重覆繁重的工作當中解放出來,把人性解放出來,把人的思想解放出來,使人們不再成為思想的奴 隸。這些變革,這些工業革命將會使我們的生力獲得極大的提升。

剛才我和大家分享了很多機會,我真的是很期待未來的發展,當那麼多的人力,人的思想和大腦被解放出來之后,我們能做的事情很多。我非常興奮能在百度繼續進行大量的投資,投到人工智能方面,也希望我們做的東西能給大家有所幫助,能對社會有所幫助,謝謝!

 

新聞來源:鉅亨網 http://news.cnyes.com/Content/20150322/KKHTCI8K4KD5I.shtml

arrow
arrow
    全站熱搜

    台灣全球商務中心 發表在 痞客邦 留言(0) 人氣()