-
熊節(jié)|大模型語料的“認知投毒”,一場正在發(fā)生的數(shù)字主權(quán)攻防戰(zhàn)
最后更新: 2025-08-05 12:23:50三、實時知識增強:從被污染的“信息井”中取水
當模型完成訓練,進入實際應(yīng)用階段,它還需要通過搜索引擎等工具接入實時信息,即“知識增強”。然而,如果模型取水的這口“井”本身就是被污染的,那么無論取水工具(模型推理能力)多么先進,打上來的也只能是“污水”。
筆者最近的親身經(jīng)歷便是一個絕佳的例證。
當筆者向騰訊元寶(使用DeepSeek大模型)詢問“縣域AI應(yīng)用的挑戰(zhàn)”時,它給出了一個看似結(jié)構(gòu)清晰、數(shù)據(jù)詳實的回答。其中提到“約60%縣域?qū)W校設(shè)備不滿足AI基礎(chǔ)需求”,以及“某縣醫(yī)院AI忽略甲亢誤推心臟檢查概率達68%”等精準數(shù)據(jù)。面對這樣“專業(yè)”的回答,我們不禁要問:其信源究竟來自何處?是嚴謹?shù)纳鐣{(diào)查,還是某些自媒體為博眼球而杜撰的“數(shù)據(jù)空殼”?
點開信源鏈接,答案令人啼笑皆非——這些數(shù)據(jù)大多來自今日頭條、微信公眾號等平臺上的文章,而這些文章本身就缺乏可信的來源佐證。這暴露了當前中文互聯(lián)網(wǎng)生態(tài)的一個致命弱點:高質(zhì)量、可溯源的中文信息源極度稀缺。在搜索引擎普遍將商業(yè)利益(推廣自家產(chǎn)品)置于信息質(zhì)量之上的大環(huán)境下,大模型應(yīng)用被迫在微信、頭條、百家號這類“內(nèi)容工廠”炮制的“信息流沙”中淘金。
更具諷刺意味的是,一種“模型近親繁殖(Model Inbreeding)”導致的“自我增強幻覺循環(huán)”正在形成。即由AI生成的、充滿事實錯誤的垃圾文章被發(fā)布到互聯(lián)網(wǎng)上,隨后又被其他AI應(yīng)用當作“知識”抓取和引用,循環(huán)往復,導致錯誤信息被不斷放大和固化。例如這個例子中出現(xiàn)的“某縣醫(yī)院AI忽略甲亢誤推心臟檢查概率達68%”的數(shù)據(jù)就源于一條看著很像是AI生成的公眾號文章,筆者未能在任何其他地方找到這項數(shù)據(jù)。
7月初,“DeepSeek對王一博道歉”沖上微博熱搜,引發(fā)對“內(nèi)容農(nóng)場”利用AI批量生產(chǎn)虛假信息污染網(wǎng)絡(luò)環(huán)境的反思 圖自:社交媒體
此外,一種針對大模型的新型攻擊手法——對大模型應(yīng)用的“搜索引擎優(yōu)化”(LLM SEO)也已出現(xiàn)。一些商業(yè)機構(gòu)正通過“螞蟻雄兵”戰(zhàn)術(shù),在全網(wǎng)鋪設(shè)大量同質(zhì)化內(nèi)容,污染大模型的搜索結(jié)果,以達到營銷引流的目的。這種行為,無異于向整個中文互聯(lián)網(wǎng)的“信息井”中系統(tǒng)性地傾倒垃圾,對信息質(zhì)量造成了毀滅性的損害。原本為了減少大模型幻覺而給它加上的在線搜索功能,反而成了全網(wǎng)幻覺生產(chǎn)的一個環(huán)節(jié),多少是有些諷刺的。
四、應(yīng)用層編排:無力回天的“末端過濾器”
面對從預訓練、微調(diào)到知識增強的全鏈路污染,有人可能會寄望于應(yīng)用層的“最后防線”——通過系統(tǒng)提示詞、內(nèi)容過濾和安全護欄來凈化輸出。
然而,這道防線的作用極其有限。它就像是在一個已經(jīng)被重金屬污染的水龍頭末端安裝一個簡易過濾器。它或許能濾掉一些肉眼可見的“雜質(zhì)”(如明顯的違法言論),但對于已經(jīng)深植于模型認知內(nèi)核的、系統(tǒng)性的意識形態(tài)偏見和源于劣質(zhì)信源的錯誤事實,則完全無能為力。
依靠應(yīng)用層的“打補丁”,永遠無法從根本上解決“認知投毒”問題。這是一種治標不治本的“末端治理”,無法替代從源頭保障語料“純凈度”的戰(zhàn)略價值。
結(jié)論:打贏數(shù)字主權(quán)時代的“語料攻防戰(zhàn)”
大模型語料的“認知投毒”,是一場正在發(fā)生、卻又不見硝煙的戰(zhàn)爭。它發(fā)生在數(shù)字空間,攻擊的卻是我們的大腦,爭奪的是未來的認知主導權(quán)。在這場關(guān)乎國家數(shù)字主權(quán)的攻防戰(zhàn)中,我們必須放棄幻想,建立起全鏈路的防御體系。
首先,必須從戰(zhàn)略高度,建立自主可控的“國家級清潔語料庫”。令人欣慰的是,國家已經(jīng)開始行動。教育部、國家語委等部門提出的“2027年初步建成國家關(guān)鍵語料庫”的目標,正是邁向勝利的第一步。這相當于在被污染的全球信息環(huán)境中,為我們自己挖掘一口“戰(zhàn)略儲備井”,確保我們的AI擁有“干凈”的成長水源。
其次,必須倒逼國內(nèi)的互聯(lián)網(wǎng)平臺和搜索引擎服務(wù)商承擔起信息治理的主體責任。當下的“流量為王”模式,實質(zhì)上是在鼓勵“劣幣驅(qū)逐良幣”,是對整個社會信息環(huán)境的巨大破壞。未來,信息服務(wù)的質(zhì)量,而非單純的流量,必須成為衡量平臺價值的核心標準。
最后,全社會都應(yīng)提升對“認知投毒”的警惕性。這不僅是一場技術(shù)之爭、產(chǎn)業(yè)之爭,更是一場圍繞未來信息基礎(chǔ)設(shè)施的“標準之爭”和“認知之爭”。能否在這場“看不見的戰(zhàn)爭”中占據(jù)主動,將直接決定我們在未來智能時代的國際地位和話語權(quán)。
本文系觀察者網(wǎng)獨家稿件,文章內(nèi)容純屬作者個人觀點,不代表平臺觀點,未經(jīng)授權(quán),不得轉(zhuǎn)載,否則將追究法律責任。關(guān)注觀察者網(wǎng)微信guanchacn,每日閱讀趣味文章。
-
本文僅代表作者個人觀點。
- 責任編輯: 郭涵 
-
美國啟動337調(diào)查,一加、聯(lián)想、TCL等成被告
2025-08-05 11:13 觀網(wǎng)財經(jīng)-科創(chuàng) -
竊密華為被重判,中國芯沒有捷徑
2025-08-05 09:25 觀網(wǎng)財經(jīng)-科創(chuàng) -
騰訊混元開源多個小尺寸模型;小米推出168雨傘;京東震虎價不正當競爭
2025-08-05 09:06 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
“巨無霸”來了!中國船舶、中國重工最新公告
2025-08-04 20:15 金融觀察 -
阿里 “掃地僧” 時隔三個月又跳槽,通義AI人才頻頻被挖
2025-08-04 20:13 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
手機端也能流暢運行,騰訊混元宣布開源四款小尺寸模型
2025-08-04 19:12 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
【W(wǎng)AIC對話美的】3-5年內(nèi),家電的“主動服務(wù)”將成為主流
2025-08-04 19:12 觀網(wǎng)財經(jīng)-科創(chuàng) -
喜茶開到蘋果總部,海外門店一年增6倍
2025-08-04 19:02 觀網(wǎng)財經(jīng)-消費 -
或?qū)⒔颖P“沒落貴族”銳步?安踏回應(yīng)
2025-08-04 18:13 觀網(wǎng)財經(jīng)-消費 -
宜家宣布開設(shè)京東旗艦店
2025-08-04 15:12 觀網(wǎng)財經(jīng)-消費 -
-
中國汽研發(fā)聲:隨機購買了二手卡車
2025-08-04 07:30 大公司 -
鴻蒙世界,正上演“寒武紀大爆發(fā)”
2025-08-03 14:45 觀網(wǎng)財經(jīng)-科創(chuàng) -
大疆、影石相互“偷家”!天空與全景的邊界瓦解
2025-08-03 13:43 觀網(wǎng)財經(jīng)-消費 -
AI大潮下的具身和人形,中國在跟跑還是并跑?
2025-08-03 13:22 2025世界人工智能大會 -
華夏人壽被吊銷業(yè)務(wù)許可證,原董事長、董秘被終身禁業(yè)
2025-08-02 19:42 -
李寧還能回到過去嗎?
2025-08-02 10:27 觀網(wǎng)財經(jīng)-消費 -
AI+中國,能否帶來東方文藝的復興?
2025-08-02 10:06 2025世界人工智能大會 -
蘋果在華營收兩年來首次恢復增長,庫克:感謝“國補”
2025-08-02 07:25 觀網(wǎng)財經(jīng)-科創(chuàng) -
普惠AI照進現(xiàn)實:云知聲如何讓技術(shù)“越山?!?/a>
2025-08-01 23:31 觀網(wǎng)財經(jīng)-科創(chuàng)
相關(guān)推薦 -
詳訊來了!習近平同特朗普通電話 評論 0美媒挑事:巴基斯坦與中國很鐵,你細品… 評論 15“訓練成本才這么點?美國同行陷入自我懷疑” 評論 99中美高層本月頻繁互動,什么信號? 評論 75“為跟中方談,特朗普拒批4億美元對臺軍援” 評論 117最新聞 Hot
-
美媒挑事:巴基斯坦與中國很鐵,你細品…
-
“中方最嚴厲的公開回應(yīng)”
-
“挑戰(zhàn)中國主導,美國把手伸向贊比亞”
-
“訓練成本才這么點?美國同行陷入自我懷疑”
-
普京罕見透露前線俄軍人數(shù)
-
加拿大饞哭了:中國又從澳方買了,一買就是9船…
-
以防長威脅:胡塞,你的死期到了
-
主謀已落網(wǎng)
-
簽了!“中國發(fā)動機替代德國產(chǎn)品”
-
“對農(nóng)民來說,無異于千刀萬剮!好好和中國談吧”
-
印媒越吹越離譜:陣風領(lǐng)先殲-35A...
-
白宮AI顧問急了:這正中華為下懷,居心何在?
-
“為跟中方談,特朗普拒批4億美元對臺軍援”
-
針對個別“反華”集會,韓總理緊急指令
-
日本空自一架搜救機降落時沖出跑道,暫無人員傷亡
-
獨山縣委書記李景寬任上被查
-