原標(biāo)題:猜猜誰(shuí)是AI辯手
大屏幕上,長(zhǎng)相、穿戴一模一樣的兩位辯手,對(duì)涉及情感、倫理、心理學(xué)、哲學(xué)的辯題“如果能一鍵消除所有痛苦回憶,要不要按”展開激烈辯論。其中,一方辯手是真人陳銘——武漢大學(xué)教師,另一方“辯手”則是AI陳銘——上海稀宇科技(MiniMax)提供的大模型。
在7月26日舉辦的“2025中國(guó)·AI盛典”辯論賽賽后投票中,42%的觀眾把大模型認(rèn)作人類,這表示該款大模型已通過(guò)了人機(jī)辯論的圖靈測(cè)試。
圖靈測(cè)試是衡量機(jī)器是否具備人類智能水平的經(jīng)典標(biāo)準(zhǔn),由被譽(yù)為“人工智能之父”的圖靈在1950年提出:如果一臺(tái)機(jī)器在自然語(yǔ)言對(duì)話中能“騙過(guò)”超過(guò)30%的人類參與者,那就可以被視作具有智能。
該大模型圖靈測(cè)試的成功,不僅標(biāo)志著我國(guó)在AI自然語(yǔ)言理解和邏輯思維方面取得重大進(jìn)展,也展現(xiàn)出上海作為全球AI高地的創(chuàng)新實(shí)力。科技日?qǐng)?bào)記者了解到,這位“辯手”的文本大模型學(xué)習(xí)了萬(wàn)億條人類數(shù)據(jù),而其語(yǔ)音大模型僅需6秒聲音片段即能模擬真實(shí)人聲。辯論影像則由節(jié)目組運(yùn)用AI技術(shù)統(tǒng)一處理,100位觀眾僅憑辯論內(nèi)容、語(yǔ)言風(fēng)格和思維邏輯判斷誰(shuí)是人類。
在辯論中,AI陳銘的表現(xiàn)亮點(diǎn)眾多。例如在論點(diǎn)構(gòu)建中,針對(duì)“人工智能是否應(yīng)擁有法律人格”等辯題,其能快速檢索法律條文、倫理案例,構(gòu)建多層次論證框架;在臨場(chǎng)應(yīng)變時(shí),面對(duì)人類辯手的即興詰問(wèn),其可在半秒內(nèi)生成反駁話術(shù),比如在“技術(shù)失業(yè)”議題中能結(jié)合制造業(yè)自動(dòng)化數(shù)據(jù)提出“崗位結(jié)構(gòu)轉(zhuǎn)型”新視角;在情感渲染方面,其通過(guò)語(yǔ)音合成技術(shù)模擬語(yǔ)氣變化,在“教育公平”辯論中以富有感染力的敘述引發(fā)觀眾共鳴。
賽后,曾多次獲得國(guó)際辯論賽冠軍的陳銘在社交媒體上稱:“對(duì)于推理能力的成熟程度,辯論幾乎是最佳試金石。以我這次的親身體驗(yàn)來(lái)看,經(jīng)過(guò)針對(duì)性訓(xùn)練的推理大模型,辯論能力恐已超過(guò)90%的人類辯手。觀點(diǎn)、邏輯、金句,再加上極富感染力的輸出,AI流暢無(wú)比,信手拈來(lái),在語(yǔ)言技術(shù)上人類幾乎已經(jīng)沒有什么自留地了?!蓖瑫r(shí),他也認(rèn)為AI尚未完美,“最后的榮耀,還是那些在‘大’問(wèn)題的深度思考。對(duì)于根本性哲學(xué)思考的觀點(diǎn)突圍,AI仍力有不逮?!?/p>
上海交通大學(xué)人工智能學(xué)院院長(zhǎng)李頡認(rèn)為,該模型在辯論場(chǎng)景的突破為AI在政務(wù)咨詢、金融談判等強(qiáng)交互領(lǐng)域的應(yīng)用提供了新范式。目前,MiniMax已與復(fù)旦大學(xué)合作,將相關(guān)技術(shù)應(yīng)用于科技倫理審查智能體系統(tǒng)“一鑒”,實(shí)現(xiàn)倫理風(fēng)險(xiǎn)自動(dòng)標(biāo)注與合規(guī)性分析。
這場(chǎng)圖靈測(cè)試的意義,早已超越了簡(jiǎn)單的“辨別人機(jī)”。中國(guó)工程院院士、之江實(shí)驗(yàn)室主任王堅(jiān)告訴記者:“當(dāng)年的圖靈測(cè)試為人工智能定了一個(gè)極具挑戰(zhàn)的目標(biāo)。今天我們看到,通過(guò)圖靈測(cè)試只是人工智能下一個(gè)新的開始?!?/p>