-
張維為《這就是中國(guó)》第197期| 人類智能時(shí)代:從中華文明中汲取智慧
孫茂松:
我長(zhǎng)期從事人工智能研究,現(xiàn)在嘗試從技術(shù)角度延展談一下。
去年年底ChatGPT異軍突起、一鳴驚人,標(biāo)志著通用人工智能開(kāi)始走進(jìn)人類的視野。而這一點(diǎn),在一年以前還是不可想象的。
下面簡(jiǎn)單討論一下ChatGPT的主要技術(shù)特點(diǎn)。它的核心算法是“下一個(gè)詞預(yù)測(cè)”,是由這個(gè)基本策略驅(qū)動(dòng)的語(yǔ)言生成模型,貌似簡(jiǎn)單,但其實(shí)不簡(jiǎn)單。
舉個(gè)例子,你隨便給機(jī)器一句話,然后在任何一個(gè)地方停下來(lái),比如說(shuō),我昨天晚上吃了?!白蛱焱砩铣粤恕苯猩衔模o定這個(gè)上文去猜下一個(gè)詞應(yīng)該是什么詞,這叫“下一個(gè)詞預(yù)測(cè)”。但下一個(gè)詞我是告訴電腦了,就是“飯”,所以算法就會(huì)調(diào)動(dòng)它的人工神經(jīng)網(wǎng)絡(luò)機(jī)制,使得下一個(gè)詞出現(xiàn)的應(yīng)該是“飯”。
聽(tīng)起來(lái)就這么簡(jiǎn)單,但“把這個(gè)事告訴它”這件事,實(shí)際上是一個(gè)了不起的策略,叫自監(jiān)督學(xué)習(xí)。不需要人告訴它,機(jī)器自己就知道答案。這一點(diǎn)保證了這個(gè)算法可以對(duì)互聯(lián)網(wǎng)上任何一個(gè)句子來(lái)做這個(gè)操作,不需要人的絲毫介入。
chatGpt/資料圖
我在互聯(lián)網(wǎng)規(guī)模的語(yǔ)料庫(kù)上去統(tǒng)計(jì),就會(huì)得到不同概率分布,比如我昨天晚上吃了“飯”,它有一個(gè)概率分布,比如說(shuō)3.5%;我昨天晚上吃了“菜”,比如說(shuō)2.8%;我昨天晚上吃了“桌子”,這個(gè)概率分布一下就變很小??傊?,你可以得到一個(gè)給定了上文、它下一詞的概率分布。那么,這大概有多少詞呢?詞典有多大,它就有多大。比如,《現(xiàn)代漢語(yǔ)詞典》大概有五六萬(wàn)詞,它就有五六萬(wàn)個(gè)選項(xiàng)。比如你要基于字來(lái)生成,《康熙字典》四萬(wàn)八千個(gè)字左右,它就有四萬(wàn)八千個(gè)選項(xiàng)??恐@個(gè)大數(shù)據(jù),概率統(tǒng)計(jì)就可以做得比較準(zhǔn)確。
如果再往前挪一個(gè)詞,上文就變了。比如“我昨天晚上吃了北京”,第一你知道它肯定沒(méi)說(shuō)完,第二大概率后面就應(yīng)該出現(xiàn)“烤鴨”“烤肉”這類詞?!翱绝啞钡母怕饰夜烙?jì)能到百分之二三十。如果說(shuō)“我昨天晚上吃了上?!?,那后面出現(xiàn)“小籠包”,也是大概率;第二估計(jì)是上海小餛飩。這樣它的分布就變了。所以在大數(shù)據(jù)的加持下,我任意給定一個(gè)上文,就會(huì)得到一個(gè)比較合理的下一個(gè)詞的概率分布。這一點(diǎn)實(shí)際上是了不得的,因?yàn)樯衔氖菬o(wú)限的。
這件事實(shí)際上,一是靠大數(shù)據(jù),再一個(gè)是靠大模型,即深層神經(jīng)網(wǎng)絡(luò),也就是基于Transformer架構(gòu)的深層神經(jīng)網(wǎng)絡(luò),才可以把這件事做出來(lái)。當(dāng)然,要做出來(lái)還需要大算力。大家都很熟悉,要做出來(lái),這“三個(gè)大”缺一不可。一旦有了這套東西,你就可以讓機(jī)器生成任何你想生成的句子。這是它的一個(gè)基本機(jī)理。
這種生成式算法具有強(qiáng)大的文本內(nèi)容生成能力。舉個(gè)例子,比如我們現(xiàn)在讓機(jī)器寫(xiě)五言律詩(shī),每句五個(gè)字,一共四十個(gè)字。你對(duì)每一個(gè)字的選擇,就好像你走路走到一個(gè)路口,有多少個(gè)分叉呢?比如《康熙字典》四萬(wàn)八千個(gè)字,大概是四萬(wàn)八千個(gè)選項(xiàng),這里邊有的路比較寬,那接續(xù)比較自然;有些路是很窄的,可能根本不能接續(xù),那四萬(wàn)八千個(gè)選項(xiàng)不可能都是通暢的。
我假設(shè)平均一個(gè)路口后邊有一百個(gè)字的選擇,這應(yīng)該是比較保守的估計(jì),那么能夠產(chǎn)生多少首不同的比較通順的五律,我們可以簡(jiǎn)單算一算,一個(gè)路口,如果有一百種可能性,總共連續(xù)四十個(gè)路口就是一百的四十次方,理工科同學(xué)一看這個(gè)數(shù)就害怕了。給大家一個(gè)形象的比較,全宇宙中的原子加起來(lái)大概是這個(gè)數(shù)。換句話說(shuō),我們?nèi)祟愖怨诺浇窳鱾飨聛?lái)的五律不超過(guò)五十萬(wàn)首,和我剛才講的數(shù)相比,這五十萬(wàn)首只是什么?不能叫滄海一粟,叫“銀河系一粟”。所以它有巨大的創(chuàng)作空間,大多數(shù)五律我們?nèi)祟惗紱](méi)有來(lái)得及寫(xiě)出來(lái)。
這種方式就使得我們的創(chuàng)作形式產(chǎn)生了變化。比如以前要寫(xiě)詩(shī),你自己殫思竭慮,會(huì)去琢磨怎么寫(xiě)出新意。但人工智能這個(gè)模型就變成,我可以把整個(gè)空間生成出來(lái),天文數(shù)字的五律詩(shī)詞生成出來(lái),然后你來(lái)挑。如果你對(duì)其中個(gè)別字不滿意,就去改一改,所以它的模式就變了。挑的過(guò)程既可以讓人去挑,也可以讓機(jī)器去挑。比如說(shuō)我們?nèi)绻讲砜?,就找寬的道去走,肯定是通順的,但新意就不夠;如果按窄的道路去走,非常具有新意,但有可能不通順??梢?jiàn),這種模型的創(chuàng)造能力不可限量。
以ChatGPT為典型代表的通用人工智能會(huì)催生重大的技術(shù)和產(chǎn)業(yè)創(chuàng)新。比如ChatGPT和搜索引擎結(jié)合就很有可能催生下一代搜索引擎。它也可能帶來(lái)產(chǎn)業(yè)生態(tài)的重新洗牌,比如ChatGPT最近把插件和一些大的知名公司合作,比如跟旅游公司合作,用戶去訂酒店訂機(jī)票的時(shí)候,就用人類語(yǔ)言去跟它講,可以表達(dá)非常復(fù)雜的訴求,假設(shè)我想在王府井附近訂一個(gè)酒店,最好離購(gòu)物區(qū)近一點(diǎn),但又不要太吵,價(jià)錢(qián)適中,這個(gè)訴求以前可能需要費(fèi)半天勁才能解決,但如果和ChatGPT合作,就有可能比較好地理解你的意愿,然后快速給你訂到你希望的酒店。剛開(kāi)始可能還不太行,但你在跟它的交互過(guò)程中,最后訂了這家酒店,相當(dāng)于你給它做了深層次的語(yǔ)義標(biāo)注,它就會(huì)越做越好??梢栽O(shè)想它如果能夠很好地理解用戶訂酒店的訴求,一句話把這事搞定,那么其他的辦旅游的網(wǎng)站應(yīng)該機(jī)會(huì)就不大了?,F(xiàn)在ChatGPT和衣、食、住、行、用、教育等行業(yè)有影響的網(wǎng)站結(jié)合,未來(lái)會(huì)影響行業(yè)生態(tài),可能導(dǎo)致行業(yè)生態(tài)的重新洗牌。這是更值得我們警惕的,因?yàn)樯鷳B(tài)競(jìng)爭(zhēng)是最高形態(tài)的競(jìng)爭(zhēng)。
4月,中共中央政治局召開(kāi)會(huì)議,提出要重視通用人工智能發(fā)展,營(yíng)造創(chuàng)新生態(tài),重視防范風(fēng)險(xiǎn),不管我們?cè)敢膺€是不愿意,人類通用人工智能之路已經(jīng)開(kāi)啟,它是不以人的意志為轉(zhuǎn)移的。正如張維為教授所指出的,前路充滿著巨大的機(jī)遇和挑戰(zhàn),確定性與不確定性并存,這將是對(duì)人類智慧的一次重大考驗(yàn)。我就講到這里,謝謝大家。
【圓桌討論】
主持人:謝謝兩位教授的演講,因?yàn)樯墒饺斯ぶ悄艿某霈F(xiàn),也讓普通人覺(jué)得人工智能離我們并不遙遠(yuǎn)。想問(wèn)一下孫教授,人工智能將來(lái)到底會(huì)怎么樣地進(jìn)入我們的生活?
孫教授:其實(shí)只要是人和機(jī)器用人類的語(yǔ)言打交道,所有這些場(chǎng)合它都會(huì)發(fā)揮重要作用。比如說(shuō)現(xiàn)在中國(guó)老齡化程度越來(lái)越嚴(yán)重,老年人很孤獨(dú),如果設(shè)計(jì)一個(gè)人形機(jī)器人,配上ChatGPT,讓機(jī)器人去理解并根據(jù)人的某種偏好,來(lái)產(chǎn)生回答,就可以用作陪伴老人的機(jī)器人,而且是個(gè)性化的。這就是一個(gè)很大的產(chǎn)業(yè)。
華為發(fā)布盤(pán)古大模型3.0
主持人:因?yàn)槲覀兌贾乐袊?guó)正在邁入一個(gè)老齡化社會(huì),未來(lái)健康產(chǎn)業(yè)是巨大的一片藍(lán)海,人工智能在這個(gè)領(lǐng)域里會(huì)有很大的作用。
張教授:最近華為發(fā)布的盤(pán)古大模型,賦能千行百業(yè),比方說(shuō)制藥業(yè),它可以降低藥物研發(fā)成本百分之七十,以最快速度從海量藥物分子篩選出最適合的小分子。而且關(guān)鍵是ChatGPT用的是英偉達(dá)的芯片,盤(pán)古用的是華為自己研發(fā)的昇騰芯片,這也是一個(gè)重要的突破。
|舉報(bào)-
違反法律法規(guī) -
垃圾信息、廣告 -
色情、淫穢信息 -
人身攻擊 -
謠言、不實(shí)信息 -
冒充,冒用信息 -
破壞社區(qū)秩序 -
其他 -
涉未成年人有害信息
-
本文僅代表作者個(gè)人觀點(diǎn)。
- 責(zé)任編輯: 朱敏潔 
-
如果一家公司或者一個(gè)人,利用人工智能把整個(gè)世界毀滅……
2023-08-12 09:45 人工智能 -
碧桂園已籌備債務(wù)重整 近期啟動(dòng)相關(guān)程序
2023-08-11 08:17 觀網(wǎng)財(cái)經(jīng)-房產(chǎn) -
“為了這組高清圖,我們前后花了10年時(shí)間”
2023-08-10 08:24 -
LK-99只是電阻很高的劣質(zhì)材料?北大等團(tuán)隊(duì)研究結(jié)果公布
2023-08-08 22:05 -
香港大學(xué)獲822.6毫克嫦娥五號(hào)月壤樣本
2023-08-08 14:12 香港 -
國(guó)產(chǎn)薄煤層采煤機(jī)打破世界紀(jì)錄
2023-08-08 07:45 科技前沿 -
美國(guó)復(fù)現(xiàn)核聚變點(diǎn)火,并突破凈能量增益紀(jì)錄
2023-08-07 12:04 科技前沿 -
可穿戴!我國(guó)科學(xué)家率先打造出有彈性的鐵電材料
2023-08-04 09:38 科技前沿 -
“如果超導(dǎo)這么容易做,那就讓大家土法煉鋼去”
2023-08-03 10:59 科技前沿 -
專家:韓國(guó)團(tuán)隊(duì)公布的超導(dǎo)體“極大概率”不能實(shí)現(xiàn)室溫超導(dǎo)
2023-07-30 18:28 -
韓團(tuán)隊(duì)室溫超導(dǎo)開(kāi)啟人類新紀(jì)元?3小時(shí)提交兩篇論文,樣品被指有瑕疵
2023-07-28 08:22 科技前沿 -
中國(guó)科學(xué)院上海免疫與感染研究所掛牌,取代原上海巴斯德所
2023-07-27 15:45 -
專訪英特爾高管:量子計(jì)算產(chǎn)業(yè)化,還有哪些“坑”要填?
2023-07-24 09:53 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
我國(guó)載人登月火箭主發(fā)動(dòng)機(jī)試車連續(xù)成功
2023-07-23 20:03 航空航天 -
我國(guó)成功發(fā)射四象01星等4顆衛(wèi)星
2023-07-23 11:24 航空航天 -
我國(guó)載人登月火箭主發(fā)動(dòng)機(jī)完成飛行任務(wù)要求驗(yàn)證
2023-07-23 09:31 航空航天 -
突破國(guó)外長(zhǎng)期封鎖,國(guó)產(chǎn)核磁共振儀實(shí)現(xiàn)量產(chǎn)
2023-07-22 22:00 -
-
神十六航天員圓滿完成出艙任務(wù)
2023-07-20 21:50 航空航天 -
電磁彈射微重力實(shí)驗(yàn)裝置(4秒)啟動(dòng)試運(yùn)行
2023-07-19 15:06 科技前沿
相關(guān)推薦 -
-
習(xí)近平:中方在TikTok問(wèn)題上的立場(chǎng)是清楚的 評(píng)論 7美媒挑事:巴基斯坦與中國(guó)很鐵,你細(xì)品… 評(píng)論 35“訓(xùn)練成本才這么點(diǎn)?美國(guó)同行陷入自我懷疑” 評(píng)論 108中美高層本月頻繁互動(dòng),什么信號(hào)? 評(píng)論 80“為跟中方談,特朗普拒批4億美元對(duì)臺(tái)軍援” 評(píng)論 121最新聞 Hot
-
美媒挑事:巴基斯坦與中國(guó)很鐵,你細(xì)品…
-
“中方最嚴(yán)厲的公開(kāi)回應(yīng)”
-
“挑戰(zhàn)中國(guó)主導(dǎo),美國(guó)把手伸向贊比亞”
-
“訓(xùn)練成本才這么點(diǎn)?美國(guó)同行陷入自我懷疑”
-
普京罕見(jiàn)透露前線俄軍人數(shù)
-
加拿大饞哭了:中國(guó)又從澳方買(mǎi)了,一買(mǎi)就是9船…
-
以防長(zhǎng)威脅:胡塞,你的死期到了
-
主謀已落網(wǎng)
-
簽了!“中國(guó)發(fā)動(dòng)機(jī)替代德國(guó)產(chǎn)品”
-
“對(duì)農(nóng)民來(lái)說(shuō),無(wú)異于千刀萬(wàn)剮!好好和中國(guó)談吧”
-
印媒越吹越離譜:陣風(fēng)領(lǐng)先殲-35A...
-
白宮AI顧問(wèn)急了:這正中華為下懷,居心何在?
-
“為跟中方談,特朗普拒批4億美元對(duì)臺(tái)軍援”
-
針對(duì)個(gè)別“反華”集會(huì),韓總理緊急指令
-
日本空自一架搜救機(jī)降落時(shí)沖出跑道,暫無(wú)人員傷亡
-
獨(dú)山縣委書(shū)記李景寬任上被查
-