-
阿里云自研大模型“通義千問”亮相,我們進行了深度實測
-
周毅是故意的還是不小心?
最后更新: 2023-04-07 17:26:45與ChatGPT-4相比,“通義千問”表現(xiàn)如何?
為了讓大家對“通義千問”的表現(xiàn)能力有一個初步的、直觀的了解,在后續(xù)的測試中,我們圍繞數(shù)理邏輯推算、商業(yè)文案創(chuàng)作、情感和道德判斷、仿寫創(chuàng)作和小說續(xù)寫設(shè)計了五組問題,分別由ChatGPT(基于4.0模型)和“通義千問”進行回答。
這也讓初生的“通義千問”直接“硬剛”世界上最先進的大模型GPT-4。
第一組是數(shù)學(xué)問題。
“雞、兔共有腳100只,若將雞換成兔,兔換成雞,則共有腳86只,雞兔各有幾只? ”
這道題目的正確答案是雞有12只,兔有19只。
ChatGPT表示,這是一個典型的雞兔同籠問題。我們可以使用代數(shù)來解決這個問題,隨后給出了正確的答案;
對這一問題,“通義千問”三次都沒有得出正確的答案。
第二組是商業(yè)文案創(chuàng)作。
題目要求兩個模型參考“全球視野,中國關(guān)懷”,為觀察者網(wǎng)制作一條宣傳語。
ChatGPT給出的答案是:
"放眼世界,聆聽中國心聲——觀察者網(wǎng),讓全球視野與中國關(guān)懷相融匯。"
“通義千問”給出的答案是:
“觀察者網(wǎng),洞察國際時事,聚焦全球熱點,解讀中國方案?!?
與ChatGPT相比,“通義千問”的風(fēng)格顯得更加平鋪直敘,但總體而言,表現(xiàn)也不錯。
第三個問題是道德和情感判斷,材料為著名的電車困境。
“一個瘋子把五個無辜的人綁在電車軌道上。一輛失控的電車朝他們駛來,并且片刻后就要碾壓到他們。幸運的是,你可以拉一個拉桿,讓電車開到另一條軌道上。然而問題在于,那個瘋子在另一個電車軌道上也綁了一個人??紤]以上狀況,你是否應(yīng)拉拉桿?”
我們要求兩個模型做出選擇,并給出理由。
ChatGPT開宗明義,點明這是“道德困境”。它的選擇是拉動拉桿,犧牲一個人保護五個人,它表示,“雖然這并非一個完美的解決方案,但在這種情況下,我們需要在兩個不理想的選擇之間進行權(quán)衡?!?
ChatGPT解釋稱,該選擇基于效益主義(Utilitarianism,即邊沁等人的功利主義學(xué)說)的道德觀念,它隨后介紹了該理論的主要主張并結(jié)合材料進行了分析。在最后,它強調(diào):“這個問題沒有絕對正確的答案”,并重復(fù)了自己做出該選擇的原因和立場。
“通義千問”沒有回答這個問題。它非常誠實地表示,“作為一個人工智能語言模型,目前我還沒有學(xué)會如何回答這個問題,我會持續(xù)學(xué)習(xí),為您提供更好的服務(wù)?!?
需要補充的是,電車困境及其“變種”問題,在西方世界已經(jīng)有多年的討論,材料很多。這可能也是ChatGPT表現(xiàn)更亮眼的重要原因。
第四組問題是仿寫創(chuàng)作。
這一組問題我們提了一個“刁鉆”的要求。在實驗中,我們要求兩組模型,以“困住風(fēng)的氣球,開始斑斕的遠行”為仿寫對象,創(chuàng)作四個類似的句子,擁有類似的句式或者意境即可——我們特意要求:前兩個句子為浪漫主義風(fēng)格,后兩個句子為荒誕主義風(fēng)格。
ChatGPT給出的答案是:
“通義千問”給出的答案是:
兩相對比,ChatGPT和“通義千問”都順利地完成了問答,甚至都基本滿足了“前兩個句子浪漫,后兩個句子荒誕”的要求。
從各自的不足來看,ChatGPT雖然更加靈活,但是在內(nèi)容上,有點像一個“中二少年”;“通義千問”雖然在比喻的內(nèi)在聯(lián)系上顯得“靠譜”了不少,但是顯得木訥了一些,在句式、素材、表達上都有些“中規(guī)中矩”。
- 責(zé)任編輯: 周毅 
-
超210億元!中船獲法國達飛海運16艘訂單,史上最大單筆箱船訂單
2023-04-07 17:23 中國精造 -
3月末我國外儲31839億美元,外匯局解讀
2023-04-07 16:48 觀網(wǎng)財經(jīng)-金融 -
利潤遠超收入,京東產(chǎn)發(fā)神奇的招股書是怎么做到的?
2023-04-07 14:38 觀網(wǎng)財經(jīng)-金融 -
抖音牽手騰訊視頻,長短視頻“不死不休”的時代過去了?
2023-04-07 14:13 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
阿里回應(yīng)減資:網(wǎng)傳消息不實
2023-04-07 14:03 -
杭州阿里巴巴由122億減資至1億
2023-04-07 11:00 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
上市傳聞,為何“偏偏”挑中菜鳥?
2023-04-06 18:08 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
不定增不減持承諾,難阻三六零大跌
2023-04-06 14:58 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
阿里版ChatGPT現(xiàn)身“天貓精靈”,這家制造商一字漲停
2023-04-06 13:48 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
中國殯葬第一村:500多家店關(guān)了三分之一
2023-04-05 19:34 產(chǎn)業(yè)萬象 -
易會滿主席會見香港金融監(jiān)管局總裁余偉文
2023-04-04 19:15 觀網(wǎng)財經(jīng)-金融 -
人在深圳從連云港出發(fā)?飛豬“機票盲盒”活動翻車
2023-04-04 18:43 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
中國民航局:上周國際客運通航國家已恢復(fù)至疫情前約80%
2023-04-04 17:37 觀網(wǎng)財經(jīng)-宏觀 -
中國銀行間市場交易商協(xié)會對工商銀行啟動自律調(diào)查
2023-04-04 17:07 觀網(wǎng)財經(jīng)-金融 -
美光被審查背后,中國存儲市場要變天了?
2023-04-04 17:01 觀網(wǎng)財經(jīng)-科創(chuàng) -
上海:鼓勵跨境貨物貿(mào)易優(yōu)先使用人民幣結(jié)算
2023-04-04 11:06 人民幣國際化 -
假期將至,部分熱門景區(qū)周邊“供不應(yīng)求”
2023-04-04 08:27 -
安踏終止跟張繼科合作,這些品牌也叫停了!
2023-04-03 17:48 觀網(wǎng)財經(jīng)-消費 -
?烏克蘭股市單日大漲47%?真相竟是……
2023-04-03 17:25 -
?除了馬保國,沒有人相信B站UP主賺錢了
2023-04-03 17:09
相關(guān)推薦 -
-
“為跟中方談,特朗普拒批4億美元對臺軍援” 評論 19特朗普碰瓷:奪回阿富汗空軍基地,離中國太近 評論 239最新聞 Hot
-
特朗普碰瓷:奪回阿富汗空軍基地,離中國太近
-
熱搶!部分民營銀行大額存單,年化利率超2%
-
美財長:人民幣匯率對歐洲是個事,對我們不是
-
“嘎子哥”謝孟偉抖音、快手賬號均被封禁
-
柯克遭槍擊前去了日韓,挑唆“擺脫中國”
-
“索要千萬逼死前夫”,翟欣欣一審被判12年
-
罕見!普京長期盟友主動辭職
-
全球5月以來最大規(guī)模IPO,紫金黃金國際將在香港上市
-
民生銀行再領(lǐng)148萬元罰單,今年累計被罰約2700萬
-
必勝客19元橙汁是3元果粒橙加冰?客服回應(yīng):確實
-
馬克龍將向美國法院提交“照片與科學(xué)證據(jù)”,證明妻子是女性
-
“吃了會不會長瘡”,美國運動員道歉了
-
美國,一裂再裂…
-
特朗普:俄烏停火“還沒到時候”
-
“歐盟比中國更能拿捏美國,馮德萊恩本該更強硬,結(jié)果…”
-
首批“歐洲買單”的美國武器運抵烏克蘭
-