-
熊節(jié)、塞爾吉奧·阿馬德烏:DeepSeek為什么要開(kāi)源?這可能與人工智能的領(lǐng)導(dǎo)權(quán)息息相關(guān)
【導(dǎo)讀】 本文由deepseek翻譯,經(jīng)觀察者網(wǎng)編輯加工潤(rùn)色后發(fā)布。
【文/觀察者網(wǎng)專欄作者 熊節(jié)、塞爾吉奧·阿馬德烏】
人工智能領(lǐng)導(dǎo)權(quán)之爭(zhēng)——中國(guó)與開(kāi)源
為什么技術(shù)領(lǐng)導(dǎo)權(quán)如此重要?如何定義人工智能(AI)領(lǐng)域的技術(shù)領(lǐng)導(dǎo)權(quán)?人工智能是一項(xiàng)橫跨多個(gè)領(lǐng)域的技術(shù),其進(jìn)步會(huì)對(duì)經(jīng)濟(jì)、社會(huì)和國(guó)家安全產(chǎn)生深遠(yuǎn)影響。技術(shù)領(lǐng)導(dǎo)權(quán)首先提供了一系列競(jìng)爭(zhēng)優(yōu)勢(shì),因?yàn)榘l(fā)明和創(chuàng)新賦予開(kāi)發(fā)者其他人所不具備的收益和利益。其次,技術(shù)領(lǐng)導(dǎo)權(quán)是一個(gè)關(guān)鍵的地緣政治因素,因?yàn)樗軌蛴绊懭驑?biāo)準(zhǔn)、規(guī)范和法規(guī)的制定。第三,技術(shù)領(lǐng)導(dǎo)權(quán)可以推動(dòng)創(chuàng)新生態(tài)系統(tǒng)的形成,鞏固長(zhǎng)期發(fā)展。第四,領(lǐng)導(dǎo)權(quán)可以在國(guó)際威脅(包括軍事威脅)的背景下增強(qiáng)安全性。第五,領(lǐng)導(dǎo)權(quán)能夠引導(dǎo)技術(shù)發(fā)展,以實(shí)現(xiàn)社會(huì)、環(huán)境和政治目標(biāo)。
從技術(shù)政治的角度來(lái)看,技術(shù)科學(xué)并非中立,它對(duì)權(quán)力關(guān)系和社會(huì)組織具有深遠(yuǎn)影響(Winner,2020)[1]。人工智能的領(lǐng)導(dǎo)權(quán)不僅僅是開(kāi)發(fā)最先進(jìn)的技術(shù),還包括創(chuàng)建一個(gè)能夠?qū)崿F(xiàn)更廣泛社會(huì)價(jià)值和目標(biāo)的社會(huì)技術(shù)環(huán)境,確保創(chuàng)新遵循特定的目的。人工智能的發(fā)展軌跡可能會(huì)優(yōu)先考慮提高經(jīng)濟(jì)系統(tǒng)的生產(chǎn)力,或者旨在尋找社會(huì)公正和環(huán)境可持續(xù)的解決方案。它可能尋求集中權(quán)力并加強(qiáng)國(guó)際不對(duì)稱性,或者促進(jìn)知識(shí)的傳播和公平發(fā)展。它可能抑制人口和文化的創(chuàng)造力,或者確保技術(shù)多樣性。它可能與權(quán)力的集中或分散密切相關(guān)。
目前,人工智能的領(lǐng)導(dǎo)權(quán)掌握在美國(guó)手中,主要由所謂的“科技巨頭”主導(dǎo)。這些公司控制著開(kāi)發(fā)現(xiàn)有人工智能(尤其是以深度學(xué)習(xí)為主導(dǎo)的人工智能)不可或缺的資源。
我們都知道,深度學(xué)習(xí)方法基于統(tǒng)計(jì)學(xué)和概率學(xué),用于從大量數(shù)據(jù)中分類和提取模式。為了執(zhí)行這些操作,人工智能開(kāi)發(fā)者依賴于強(qiáng)大的計(jì)算能力。訓(xùn)練一個(gè)像ChatGPT這樣先進(jìn)的人工智能模型需要數(shù)百萬(wàn)美元,并且需要大量時(shí)間使用專用硬件進(jìn)行處理,例如專為這些任務(wù)設(shè)計(jì)的芯片。這些芯片被稱為“AI推理芯片”或“推理加速器”,它們能夠在更短的時(shí)間內(nèi)取得更好的結(jié)果。例如,谷歌的Tensor Processing Units(TPUs)專為推理和訓(xùn)練優(yōu)化;神經(jīng)處理單元(NPUs)或神經(jīng)網(wǎng)絡(luò)加速器常用于移動(dòng)設(shè)備和邊緣計(jì)算;圖形處理單元(GPUs)則用于訓(xùn)練和推理。
目前,這些芯片對(duì)于圖像識(shí)別、自然語(yǔ)言處理和其他實(shí)時(shí)人工智能任務(wù)至關(guān)重要。
美國(guó)政府長(zhǎng)期以來(lái)一直采取限制尖端芯片獲取的政策,主要目的是延緩中國(guó)和其他被視為對(duì)手國(guó)家的AI發(fā)展,目標(biāo)是保持美國(guó)在AI領(lǐng)域的領(lǐng)導(dǎo)地位。隨著唐納德·特朗普于2025年1月就職,技術(shù)封鎖政策進(jìn)一步加劇。此外,美國(guó)總統(tǒng)宣布了一項(xiàng)5000億美元的“星際之門”項(xiàng)目投資。特朗普的計(jì)劃是與甲骨文、OpenAI和軟銀等公司合作,在美國(guó)開(kāi)發(fā)物理和虛擬的AI基礎(chǔ)設(shè)施,以“推動(dòng)下一代AI的發(fā)展”[2]。英偉達(dá)、Arm和微軟等公司是該項(xiàng)目的合作伙伴,該項(xiàng)目已在德克薩斯州開(kāi)始實(shí)施,并將在未來(lái)四年內(nèi)在美國(guó)各個(gè)地區(qū)建設(shè)“巨型數(shù)據(jù)中心”[3]。
以埃隆·馬斯克為代表的美國(guó)科技精英認(rèn)為,人工智能正在接近“奇點(diǎn)”——即人工通用智能(AGI)的出現(xiàn)。他們聲稱,AGI將完全超越并取代人類在所有智力領(lǐng)域的勞動(dòng),如果美國(guó)率先實(shí)現(xiàn)AGI,其技術(shù)霸權(quán)將不可撼動(dòng)。然而,無(wú)論是ChatGPT還是DeepSeek,都沒(méi)有顯示出接近AGI的跡象。它們是處理自然語(yǔ)言的有用工具,并在特定領(lǐng)域展示了有限的推理能力,但沒(méi)有證據(jù)表明它們——或任何已知的AI研究——正在接近AGI。
AGI比起一般的AI擅長(zhǎng)以更像人類的方式去執(zhí)行任務(wù)
開(kāi)源的轉(zhuǎn)折點(diǎn)
2024年5月,一家名為DeepSeek的中國(guó)小公司推出了其大型語(yǔ)言模型(LLM),該模型受到Llama的啟發(fā),Llama是一個(gè)禁止商業(yè)使用的受限研究協(xié)議下的模型。開(kāi)源模型DeepSeek V2的突出之處在于其前所未有的成本效益。DeepSeek將推理成本降低至每百萬(wàn)個(gè)token僅1元人民幣,約為L(zhǎng)lama3 70B的七分之一,遠(yuǎn)低于GPT-4。
Token是語(yǔ)言模型用于處理和理解人類語(yǔ)言的基本文本單位,根據(jù)上下文和語(yǔ)言,token可以被視為單詞、音節(jié)甚至單個(gè)字符的“塊”。AI模型將文本轉(zhuǎn)換為token,并以數(shù)字形式表示。這些數(shù)字隨后由模型處理以生成響應(yīng)或執(zhí)行任務(wù)。因此,文本中的token數(shù)量直接影響成本和處理時(shí)間。token越多,推理越復(fù)雜且耗時(shí)。
與所有中國(guó)公司一樣,DeepSeek也受到美國(guó)政府尖端芯片封鎖的限制。這促使DeepSeek的領(lǐng)導(dǎo)者及其團(tuán)隊(duì)更加專注于研究和優(yōu)化。梁文鋒在2024年7月的一次采訪中表示:“我們的出發(fā)點(diǎn)不是抓住機(jī)會(huì)發(fā)財(cái),而是推進(jìn)到技術(shù)前沿,以促進(jìn)整個(gè)生態(tài)系統(tǒng)的發(fā)展。”[4] 這家中國(guó)公司試圖引領(lǐng)AI發(fā)展的意圖顯而易見(jiàn)。為了實(shí)現(xiàn)這一目標(biāo),DeepSeek并沒(méi)有局限于組織數(shù)據(jù)并在現(xiàn)有云平臺(tái)上運(yùn)行。團(tuán)隊(duì)努力在尖端芯片稀缺的情況下尋找解決方案。這需要改變架構(gòu)、嘗試新程序以及廣泛的應(yīng)用數(shù)學(xué)。
DeepSeek的年輕領(lǐng)導(dǎo)者梁文鋒表示:“我們?cè)趧?chuàng)新方面缺乏的絕對(duì)不是資本,而是信心和如何組織高密度人才以實(shí)現(xiàn)有效創(chuàng)新的知識(shí)?!盵5] 他繼續(xù)說(shuō)道:“創(chuàng)新并不完全由商業(yè)驅(qū)動(dòng),還需要好奇心和創(chuàng)造力。我們陷入了過(guò)去的慣性,但這也是暫時(shí)的?!盵6] 梁文鋒的理念是減少模仿,增加研究。他主張押注開(kāi)源模型,不是為了使用它們,而是為了改進(jìn)它們,并找到需要更少計(jì)算資源的路徑。
開(kāi)源是DeepSeek戰(zhàn)略的核心,但對(duì)騰訊、百度和阿里巴巴等其他中國(guó)公司來(lái)說(shuō)可能并非如此。然而,開(kāi)源允許知識(shí)在全球范圍內(nèi)傳播,從而以更快、更包容的速度產(chǎn)生新發(fā)現(xiàn)的可能性。梁文峰表示:“實(shí)際上,開(kāi)源和論文的發(fā)表并沒(méi)有損失。對(duì)于技術(shù)團(tuán)隊(duì)來(lái)說(shuō),被追隨是一種巨大的成就感。事實(shí)上,開(kāi)源更像是一種文化行為,而不是商業(yè)行為,因?yàn)榻o予實(shí)際上是一種額外的榮譽(yù),這樣做的公司也會(huì)更具有文化吸引力?!盵7]
開(kāi)源不是一種技術(shù),而是一個(gè)基于知識(shí)共享的開(kāi)發(fā)過(guò)程。通常,它鼓勵(lì)組織愿意協(xié)作解決問(wèn)題并通過(guò)更新維護(hù)解決方案的社區(qū)。像Mistral 7B(Mistral AI)和Falcon(技術(shù)創(chuàng)新研究所)這樣的語(yǔ)言模型是開(kāi)源的,并在Apache 2.0許可下發(fā)布;強(qiáng)化學(xué)習(xí)模型Stable-Baselines3也是開(kāi)源的,采用MIT許可證。
那么,為什么DeepSeek的模型如此重要?因?yàn)樗嵏擦巳駻I領(lǐng)導(dǎo)權(quán)的競(jìng)爭(zhēng)。如何做到的?通過(guò)大幅降低大型語(yǔ)言模型的計(jì)算成本。
開(kāi)源對(duì)于知識(shí)傳播至關(guān)重要,但并不能解決訓(xùn)練和運(yùn)行模型所需的計(jì)算基礎(chǔ)設(shè)施問(wèn)題。DeepSeek展示了一個(gè)高性能且處理需求較低的開(kāi)源模型。
DeepSeek-R1已經(jīng)展示了比OpenAI的ChatGPT o1更強(qiáng)的推理能力,而其成本(包括訓(xùn)練和使用)顯著降低。通過(guò)開(kāi)源其模型,DeepSeek促進(jìn)了大型語(yǔ)言模型的民主化——使技術(shù)基礎(chǔ)設(shè)施欠發(fā)達(dá)的小公司、國(guó)家甚至個(gè)人能夠基于DeepSeek訓(xùn)練自己的“主權(quán)AI”,而無(wú)需依賴科技巨頭的產(chǎn)品或?qū)?shù)據(jù)交給這些公司。印度尼西亞和印度已經(jīng)開(kāi)始使用DeepSeek作為基礎(chǔ)構(gòu)建自己的AI基礎(chǔ)設(shè)施[8]。在此之前,只有美國(guó)和中國(guó)有能力訪問(wèn)如此高水平的大型語(yǔ)言模型。
上表展示了在lighteval上OpenR1-Qwen-7B、DeepSeek-Distill-Qwen-7B和OpenThinker-7B的性能對(duì)比,可以看出在數(shù)學(xué)成績(jī)上,OpenR1-Qwen-7B和DeepSeek-Distill-Qwen-7B差距不是非常明顯。36氪
-
本文僅代表作者個(gè)人觀點(diǎn)。
- 責(zé)任編輯: 鄭樂(lè)歡 
-
鋰電池“打一針”就能“重生”!《自然》刊登我國(guó)科研團(tuán)隊(duì)新發(fā)現(xiàn)
2025-02-13 06:42 -
從四個(gè)角度全面駁斥美方對(duì)DeepSeek的質(zhì)疑和污蔑
2025-02-12 07:34 心智觀察所 -
我國(guó)成功發(fā)射衛(wèi)星互聯(lián)網(wǎng)低軌衛(wèi)星
2025-02-11 19:20 航空航天 -
蹭熱度?ai.com重定向至DeepSeek
2025-02-10 14:35 人工智能 -
-
“中國(guó)物理學(xué)研究領(lǐng)先世界,美國(guó)機(jī)構(gòu)被擠出前十”
2025-02-09 09:14 科技前沿 -
撬開(kāi)日本海關(guān)的口:日本半導(dǎo)體設(shè)備對(duì)華依賴度有多高?
2025-02-06 08:06 心智觀察所 -
中國(guó)平臺(tái),集中上線
2025-02-04 21:12 -
“人造太陽(yáng)”再創(chuàng)紀(jì)錄,是中國(guó)式科研方法論又一次勝利
2025-02-04 13:05 心智觀察所 -
“大洋一號(hào)”功勛船舶將升級(jí)改造
2025-02-02 15:35 -
“霸榜全球140個(gè)市場(chǎng)”,拉新最多的是…
2025-02-01 22:06 觀察者頭條 -
突破70多年來(lái)的傳統(tǒng)認(rèn)知!他們發(fā)現(xiàn)距地球16萬(wàn)公里的“太空合聲”
2025-02-01 16:53 天文 -
中國(guó)光子毫米波雷達(dá)技術(shù)取得突破性進(jìn)展
2025-01-31 22:54 科技前沿 -
果然,臺(tái)當(dāng)局又跳了出來(lái)
2025-01-31 22:01 臺(tái)灣 -
英偉達(dá)平臺(tái)上線DeepSeek
2025-01-31 18:18 -
阿斯麥CEO:DeepSeek,好消息
2025-01-30 09:34 -
20光年外,科學(xué)家又發(fā)現(xiàn)“超級(jí)地球”
2025-01-29 19:03 -
-
理解DeepSeek的中國(guó)式創(chuàng)新,要先回顧深度學(xué)習(xí)的歷史
2025-01-27 08:03 心智觀察所 -
探索宇宙線起源之謎再添“觀天”利器
2025-01-21 20:09 天文
相關(guān)推薦 -
習(xí)近平:中方在TikTok問(wèn)題上的立場(chǎng)是清楚的 評(píng)論 7美媒挑事:巴基斯坦與中國(guó)很鐵,你細(xì)品… 評(píng)論 35“訓(xùn)練成本才這么點(diǎn)?美國(guó)同行陷入自我懷疑” 評(píng)論 108中美高層本月頻繁互動(dòng),什么信號(hào)? 評(píng)論 80“為跟中方談,特朗普拒批4億美元對(duì)臺(tái)軍援” 評(píng)論 121最新聞 Hot
-
美媒挑事:巴基斯坦與中國(guó)很鐵,你細(xì)品…
-
“中方最嚴(yán)厲的公開(kāi)回應(yīng)”
-
“挑戰(zhàn)中國(guó)主導(dǎo),美國(guó)把手伸向贊比亞”
-
“訓(xùn)練成本才這么點(diǎn)?美國(guó)同行陷入自我懷疑”
-
普京罕見(jiàn)透露前線俄軍人數(shù)
-
加拿大饞哭了:中國(guó)又從澳方買了,一買就是9船…
-
以防長(zhǎng)威脅:胡塞,你的死期到了
-
主謀已落網(wǎng)
-
簽了!“中國(guó)發(fā)動(dòng)機(jī)替代德國(guó)產(chǎn)品”
-
“對(duì)農(nóng)民來(lái)說(shuō),無(wú)異于千刀萬(wàn)剮!好好和中國(guó)談吧”
-
印媒越吹越離譜:陣風(fēng)領(lǐng)先殲-35A...
-
白宮AI顧問(wèn)急了:這正中華為下懷,居心何在?
-
“為跟中方談,特朗普拒批4億美元對(duì)臺(tái)軍援”
-
針對(duì)個(gè)別“反華”集會(huì),韓總理緊急指令
-
日本空自一架搜救機(jī)降落時(shí)沖出跑道,暫無(wú)人員傷亡
-
獨(dú)山縣委書記李景寬任上被查
-