生成式人工智能的火爆出圈,再次引發(fā)全球?qū)θ斯ぶ悄馨l(fā)展的廣泛關(guān)注,更讓人們體會(huì)到大模型對(duì)人工智能發(fā)展的重要意義。
在5月18日天津舉辦的第七屆世界智能大會(huì)上,百度CEO李彥宏發(fā)表了題為《大模型改變?nèi)斯ぶ悄堋返难葜v。李彥宏表示,“我不擔(dān)心大模型會(huì)導(dǎo)致人類(lèi)工作機(jī)會(huì)減少?!薄叭祟?lèi)最大的危險(xiǎn),最大的不可持續(xù),并不是創(chuàng)新帶來(lái)的不確定性。相反的,我們停止創(chuàng)新,不發(fā)明不創(chuàng)造不進(jìn)步,按照慣性走下去,所帶來(lái)的各種各樣不可預(yù)知的風(fēng)險(xiǎn),才是人類(lèi)最大的威脅?!?br />
李彥宏認(rèn)為,大數(shù)據(jù)、大算力、大模型,導(dǎo)致了智能涌現(xiàn)。同時(shí),人工智能發(fā)生了方向性改變,從辨別式AI走向生成式AI。大模型還重新定義了人機(jī)交互,重新定義營(yíng)銷(xiāo)和客服。任何一個(gè)公司,誰(shuí)擁有最佳的跟客戶(hù)溝通的方式,誰(shuí)就會(huì)擁有客戶(hù)。
百度是全球大廠中,第一個(gè)做出對(duì)標(biāo)ChatGPT的大模型文心一言的公司。也是全球唯一在人工智能四層架構(gòu),即芯片層、框架層、模型層和應(yīng)用層都有全棧布局的公司。文心大模型,體現(xiàn)了百度在人工智能技術(shù)領(lǐng)域的領(lǐng)先實(shí)力。
以下為李彥宏演講實(shí)錄:
各位領(lǐng)導(dǎo)、各位嘉賓:我今天給大家?guī)?lái)的題目叫做《大模型改變?nèi)斯ぶ悄堋?。剛才龔克也講了,人工智能在過(guò)去這半年當(dāng)中,受到的關(guān)注度比以前高了很多,最主要的是因?yàn)槌霈F(xiàn)了生成式的人工智能。而生成式人工智能底層技術(shù),實(shí)際上就是大模型。
那么大模型為什么會(huì)改變?nèi)斯ぶ悄苣?#xff1f;是大算力、大模型、大數(shù)據(jù),導(dǎo)致了智能涌現(xiàn),什么叫智能涌現(xiàn)呢?過(guò)去的人工智能是,我想讓機(jī)器學(xué)會(huì)什么技能,就教它什么技能。教過(guò)的有可能會(huì),沒(méi)教過(guò)的就不會(huì)。大模型出現(xiàn)所謂的智能涌現(xiàn)之后,以前沒(méi)教過(guò)的技能,它也會(huì)了。這就是為什么有人講,我們現(xiàn)在朝著通用人工智能方向發(fā)展。
與此同時(shí),人工智能發(fā)展方向從辨別式走向生成式。什么叫辨別式?我們過(guò)去比較熟悉的人工智能的應(yīng)用,基本上都是辨別式。比如說(shuō)人臉識(shí)別,過(guò)來(lái)一個(gè)人,我識(shí)別這個(gè)人是誰(shuí),或者不是誰(shuí)。這個(gè)是典型的辨別式。搜索引擎也是典型的辨別式人工智能。用戶(hù)輸入關(guān)鍵字或者一段話(huà),他要找的東西,我們?cè)谌W(wǎng)進(jìn)行匹配,哪一個(gè)網(wǎng)頁(yè),哪一段內(nèi)容是他需要的,這是辨別式人工智能。
什么叫生成式人工智能?今天我想寫(xiě)一份申請(qǐng)書(shū),你給我寫(xiě)一下?;蛘哒f(shuō),我周末請(qǐng)客,10個(gè)人,需要出一份菜單,這個(gè)無(wú)所謂對(duì)錯(cuò),但是它能給你一些感覺(jué),給你一些創(chuàng)意,給你一個(gè)好的基礎(chǔ)去發(fā)展你的思路?;蛘哒f(shuō),給我畫(huà)一幅車(chē)水馬龍的圖片。這種東西,過(guò)去人們不覺(jué)得是人工智能應(yīng)該做的事,現(xiàn)在可以做了。
那么這樣會(huì)導(dǎo)致什么呢?導(dǎo)致人們的工作效率大幅度地提升。比如說(shuō),在內(nèi)容創(chuàng)作、客戶(hù)服務(wù)、翻譯這些工作,它的效率會(huì)大幅度地提升。所以我們也看到,很多研究機(jī)構(gòu)都認(rèn)為,在未來(lái)的10年,很多工作它的效率會(huì)成倍成倍的提升。同時(shí)也帶來(lái)一些擔(dān)心,是不是這樣的效率提升,會(huì)使得很多人的工作就沒(méi)了?這些人工作丟掉之后,會(huì)不會(huì)給我們?nèi)祟?lèi)帶來(lái)不可預(yù)知的問(wèn)題。
其實(shí)這個(gè)事兒我也講過(guò)很久,最好的去探知答案的方法,實(shí)際上是回顧過(guò)去。因?yàn)楹芏嗳艘灿X(jué)得,人工智能是第四次產(chǎn)業(yè)革命的標(biāo)志,我們可以看看之前的產(chǎn)業(yè)革命都取代了哪些工作?
200年前,從井下背水的工作基本上消失了。第一次產(chǎn)業(yè)革命是蒸汽機(jī)的發(fā)明,蒸汽機(jī)發(fā)明第一個(gè)應(yīng)用就是采礦的水,怎么能夠把它用機(jī)器弄上來(lái)。井下背水這些工作的消失,帶來(lái)了什么?我們來(lái)看一下,實(shí)際上產(chǎn)生了很多新的工作。
這100年,我們看到世界人口出現(xiàn)了高速增長(zhǎng),跟之前的一兩千年人口增長(zhǎng)速度相比,快了很多。與此同時(shí),人均GDP也幾乎是在同樣地快速增長(zhǎng)。這說(shuō)明什么?說(shuō)明雖然有些工作機(jī)會(huì)沒(méi)了,但是更多的機(jī)會(huì)出現(xiàn)了。人們工作效率的提升,可以養(yǎng)活更多的人,而每個(gè)人的生活又變得比以前更好了。從井下背水那個(gè)工作,真的不是什么好工作。
100年前,馬車(chē)夫的工作消失了。這張圖片是1913年紐約第五大道的一張圖片,這張圖片里幾乎已經(jīng)全部都是汽車(chē),只有一輛馬車(chē)。那會(huì)兒,紐約到處都是賣(mài)馬肉的,馬也沒(méi)用了,后來(lái)出現(xiàn)了很多新的工作。1900-1990接近90年,同樣的規(guī)律,世界人口繼續(xù)高速增長(zhǎng),每一個(gè)人創(chuàng)造的價(jià)值繼續(xù)高速地增長(zhǎng)。
30年前,我們這一代人親身經(jīng)歷,也就是我大學(xué)畢業(yè)前后,什么工作消失了?打字員的工作消失了。現(xiàn)在年輕一代沒(méi)有見(jiàn)過(guò)打字機(jī)的,但也出現(xiàn)了很多新的工作。同樣的規(guī)律,世界人口繼續(xù)高速增長(zhǎng),人均GDP繼續(xù)高速增長(zhǎng)。
歷史雖然不會(huì)重復(fù),但是確實(shí)有它的規(guī)律。那么這一次,為什么那么多人會(huì)擔(dān)心AI會(huì)讓工作機(jī)會(huì)減少呢?我覺(jué)得是因?yàn)?#xff0c;大家能夠看到現(xiàn)在的工作會(huì)消失,但是我們看不到什么新的工作機(jī)會(huì)會(huì)被創(chuàng)造出來(lái)。就像100年前、200年前那些人,看不到后來(lái)產(chǎn)生的新的工作機(jī)會(huì)一樣。我個(gè)人是屬于樂(lè)觀派,我不擔(dān)心大模型會(huì)導(dǎo)致人類(lèi)工作機(jī)會(huì)減少、生活會(huì)變差。
那么大模型怎么重新定義的人工智能?剛才萬(wàn)鋼主席也講了,人機(jī)交互的方式發(fā)生了變化。其實(shí)過(guò)去幾十年信息產(chǎn)業(yè)的發(fā)展,人機(jī)交互的方式發(fā)生了三次變化。
更早我們就不說(shuō)了,命令行是我讀大學(xué)讀研究生的時(shí)候,主要的工作界面。人機(jī)進(jìn)行交互,是通過(guò)命令行。我輸入一個(gè)命令,它給我想要的反應(yīng)。我當(dāng)時(shí)覺(jué)得這個(gè)東西效率很高,但是大多數(shù)人不會(huì)這種操作。
更簡(jiǎn)單的人機(jī)交互方式是什么?是圖形用戶(hù)界面(GUI)。這個(gè)起碼很多人能看懂了,比第一個(gè)要更友好一些。但它仍然不是最自然的交互方式。我要想搞清楚怎么重設(shè)一下電腦的自動(dòng)睡眠時(shí)間,我得經(jīng)過(guò)四級(jí)菜單,一層一層地點(diǎn)進(jìn)去,才能找到這個(gè)位置。有多少人能記住四級(jí)菜單以后,每一個(gè)功能在哪?
人工智能的誕生,讓我們可以用自然語(yǔ)言跟電腦進(jìn)行交互。當(dāng)我有需求的時(shí)候,比如說(shuō)我想查一下上個(gè)月,2023年4月,我的公司每一個(gè)產(chǎn)品線,有哪些產(chǎn)品的毛利率超過(guò)了疫情前的水平?這樣一個(gè)課題,在過(guò)去很可能需要我的助理花半天一天的時(shí)間才能獲得。今天,如果計(jì)算機(jī)懂你的自然語(yǔ)言,一秒鐘之內(nèi)就可以給你一個(gè)表格。
大模型也會(huì)重新定義營(yíng)銷(xiāo)和客服。其實(shí)道理很簡(jiǎn)單,就是誰(shuí)擁有最佳的跟客戶(hù)溝通的方式,誰(shuí)就會(huì)擁有這個(gè)客戶(hù)。這個(gè)道理不是因?yàn)锳I的產(chǎn)生,不是因?yàn)榇竽P偷漠a(chǎn)生,只不過(guò)技術(shù)使得我們實(shí)現(xiàn)的可能性,變得比以前多了很多。今天即使你有70億個(gè)客戶(hù),你的每一個(gè)客戶(hù)也都可以有一個(gè)專(zhuān)屬的7×24小時(shí)的、什么都知道的助理去服務(wù)他。
大模型是一個(gè)基礎(chǔ),大模型之上會(huì)有各種各樣人工智能的應(yīng)用。最近這段時(shí)間討論比較熱的是,AI時(shí)代的原生應(yīng)用到底長(zhǎng)什么樣子?我給大家舉幾個(gè)例子:
比如說(shuō)像DoNotPay,這是什么呢?比較典型的應(yīng)用場(chǎng)景是人工智能律師。比如說(shuō),你在美國(guó)開(kāi)車(chē)超速了,超速之后警察給你一個(gè)罰單,一般交幾百塊錢(qián)。其實(shí)你可以不交,你請(qǐng)一個(gè)律師幫你打官司,就可以不交了。但是請(qǐng)一個(gè)律師的錢(qián),可能是罰單錢(qián)的兩倍,所以你不請(qǐng)了。今天請(qǐng)AI當(dāng)律師,你就可以不交那個(gè)錢(qián)。
Jasper是營(yíng)銷(xiāo)創(chuàng)意的生成工具,你的公司想要出什么樣的創(chuàng)意,它來(lái)幫你出,所以效率高很多。
Speak是韓國(guó)的軟件應(yīng)用,實(shí)際上是教你學(xué)外語(yǔ)的,模擬各種場(chǎng)景,你要到餐館點(diǎn)餐,跟對(duì)方談判,你要跟對(duì)方怎么交互,上百種語(yǔ)言都可以做得非常好。
對(duì)于百度來(lái)說(shuō),我們的大模型叫文心一言,兩個(gè)月之前發(fā)布的,應(yīng)該說(shuō)是在全球大廠當(dāng)中是第一個(gè)發(fā)布的。之所以我們要盡快地發(fā)布出來(lái),是因?yàn)槭袌?chǎng)有非常強(qiáng)的需求。目前有200多萬(wàn)的用戶(hù)在排隊(duì)等待進(jìn)行測(cè)試,也有十幾萬(wàn)家企業(yè)希望接入文心一言進(jìn)行測(cè)試。
當(dāng)然百度在這方面的投入,實(shí)際上不是剛剛開(kāi)始的,不是這半年才開(kāi)始的。我們從2019年發(fā)布了文心大模型的1.0,到現(xiàn)在已經(jīng)有四年的時(shí)間。更早的時(shí)候,我們從2013年左右就開(kāi)始人工智能投入了。
人工智能之所以有這么大的變化,其實(shí)不僅僅是它的應(yīng)用場(chǎng)景的變化,實(shí)際上背后的技術(shù)棧也發(fā)生了非常根本的變化。
我們每個(gè)人都熟悉的IT的技術(shù)棧是這三層,底層是芯片層,典型的公司是英特爾、AMD、高通,它的芯片叫做CPU;中間層是操作系統(tǒng),在PC時(shí)代就是Windows,在手機(jī)時(shí)代是安卓和iOS;上面是應(yīng)用層,PC時(shí)代所有的人都給Windows開(kāi)發(fā)軟件,在移動(dòng)時(shí)代所有的人都給安卓和iOS開(kāi)發(fā)應(yīng)用。
今天人工智能時(shí)代的到來(lái),改變了這個(gè)格局。現(xiàn)在的IT技術(shù)棧變成了四層,底層仍然是芯片層,但是主要的芯片已經(jīng)不是CPU,而是以GPU為代表的,新一代適合并行大規(guī)模浮點(diǎn)運(yùn)算的芯片。上面我們叫做框架層,就是深度學(xué)習(xí)的框架,像百度的PaddlePaddle飛槳,Meta的PyTorch,谷歌的TensorFlow都是在這一層。再上面一層是模型層,今天的ChatGPT、文心一言等等,這些是屬于模型層,以后AI時(shí)代的原生應(yīng)用,都會(huì)基于大模型來(lái)進(jìn)行開(kāi)發(fā)。
這方面百度有比較明顯的優(yōu)勢(shì),我們?cè)谒膶赢?dāng)中每一層都有比較領(lǐng)先的產(chǎn)品,比如說(shuō)芯片層有昆侖芯。這個(gè)也做了有十年之久,最早是因?yàn)樗阉鲬?yīng)用需要,我們買(mǎi)別人的芯片,畢竟太貴了,所以自己開(kāi)發(fā)了。框架層是飛槳,飛槳今天在中國(guó)的市場(chǎng)份額第一。在模型層是文心大模型,其實(shí)除了文心一言,它是對(duì)標(biāo)ChatGPT的之外,我們還有很多行業(yè)大模型,如交通大模型、能源大模型等。應(yīng)用層的話(huà),像百度搜索等都是我們比較領(lǐng)先的應(yīng)用。
這四層都有比較領(lǐng)先的產(chǎn)品或者技術(shù),有什么好處呢?就是你可以進(jìn)行端到端的優(yōu)化,每一層可以給其他層反饋,根據(jù)這些反饋你可以綜合的、統(tǒng)籌的去考慮怎么優(yōu)化。
百度在芯片層的布局,就是昆侖芯,我們已經(jīng)有兩代產(chǎn)品,幾萬(wàn)片的部署,無(wú)論是公司內(nèi)還是公司外都在應(yīng)用。昆侖芯第三代,會(huì)在明年年初上市。
在框架層,飛槳的框架在中國(guó)人工智能領(lǐng)域已經(jīng)有了500多萬(wàn)開(kāi)發(fā)者,也越來(lái)越獲得大家的認(rèn)同。
模型層剛才講了文心一言,在各種使用場(chǎng)景都有不少的應(yīng)用。未來(lái),我相信會(huì)有更多的應(yīng)用會(huì)基于文心大模型開(kāi)發(fā)出來(lái)。
在應(yīng)用層大家比較熟悉的是百度的搜索,百度不可能在應(yīng)用層什么都做,我們除了搜索之外,還做了跟交通有關(guān)的應(yīng)用。交通也是非常復(fù)雜,而且影響非常廣泛的方向。
百度做的其實(shí)主要是兩件事,一個(gè)是自動(dòng)駕駛,或者是無(wú)人駕駛的技術(shù),一個(gè)是智能交通。無(wú)人駕駛我們做了有十年時(shí)間,現(xiàn)在在武漢、在重慶都可以進(jìn)行商業(yè)化的無(wú)人的運(yùn)營(yíng)。智能交通我們也做了有好幾年了,在不少城市都證明了效果,通過(guò)智能的調(diào)整紅綠燈變燈的時(shí)間,可以讓我們的城市的交通效率有15%到30%的明顯提升。五一長(zhǎng)假之前最后一個(gè)工作日,很多人也注意到,北京是大堵車(chē),從二環(huán)到五環(huán),甚至在六環(huán)都是紅的,唯一一片綠的是亦莊,亦莊有智能交通的人工智能系統(tǒng),可以動(dòng)態(tài)調(diào)整交通流,所以效率確實(shí)是被證明有明顯的提升。
我們也很期待未來(lái)在大模型之上,會(huì)有各行各業(yè)各種應(yīng)用能夠找到好的應(yīng)用場(chǎng)景,能夠獲得效率大幅度的提升。
最后,我想說(shuō)對(duì)于人類(lèi)來(lái)說(shuō),最大的危險(xiǎn),最大的不可持續(xù),并不是創(chuàng)新帶來(lái)的不確定性。相反的,我們停止創(chuàng)新,不發(fā)明不創(chuàng)造不進(jìn)步,按照慣性走下去,所帶來(lái)的各種各樣不可預(yù)知的風(fēng)險(xiǎn),才是人類(lèi)最大的威脅。這就是為什么,百度在這么多年長(zhǎng)期持續(xù)的在人工智能方面進(jìn)行投入,也是我們?yōu)槭裁匆寻俣鹊氖姑?#xff0c;在多年前就定義成“用科技讓復(fù)雜的世界更簡(jiǎn)單”。
謝謝!
相關(guān)稿件