近日,一場別開生面的人機辯論“圖靈測試”引發全網熱議——國產AI大模型MiniMax以42%的“人類認同率”通過圖靈測試,遠超75年前“人工智能之父”圖靈設定的30%基準線,標志著國內首個通過人機辯論“圖靈測試”的大模型誕生。
在由中央廣播電視總臺(以下簡稱總臺)打造的《2025中國·AI盛典》舞臺上,這場特別的思想實驗不僅讓觀眾驚嘆于AI的辯論能力,更引發廣泛好奇:這場顛覆傳統的測試究竟如何誕生?
“說到人工智能,相信大家腦海中都會立刻浮現出圖靈測試這個概念。”8月19日,節目組回憶道。75年前,圖靈提出了著名的設想:如果一臺機器在自然語言對話中能“騙過”超過30%的人類參與者,那就可以被視作具有智能。于是,在《2025中國·AI盛典》進行一場圖靈測試的想法應運而生。
與傳統的對話測試不同,節目組最終決定采用“人機辯論”這一形式。這一決策基于雙重考量:從技術層面看,辯論是對智能水平一次“更高維度的檢驗”。傳統圖靈測試更注重對話的流暢性,而辯論則要求參與者具備深度理解、即時反應、知識整合和策略博弈等全方位能力。在節目組看來,辯論像一場思維的全方位壓力測試,能更深刻地揭示AI是否真正理解了議題的本質,而不僅僅是檢索或復述信息。從傳播效果看,辯論天然具有對抗性和戲劇張力,正反雙方你來我往,更易碰撞出思維的火花,也能讓抽象的智能測試變得可視、可感、可評。
經過數輪思想碰撞,團隊最終聚焦于兩個頗具哲學張力的命題:“按下一個按鈕可以刪除痛苦的回憶,該不該按”和“AI會不會真的愛上人類”。前者因其直指人類敏感的情感神經,更能展現人機思維的互補性與差異性,最終被選定為測試的核心議題。
“騙過”42%觀眾,AI辯手的“首次突破”并非偶然。作為以線性注意力混合架構(文本模型)為骨、實時語音生成(多模態模型)為翼的智能體,MiniMax多模態大模型學習了萬億條人類數據,擁有4560億參數,單次激活459億參數生成智能響應。它在多個基準測試中取得出色成績,具備強大的數學推理、復雜的問題求解,以及長文本處理能力。
盡管擁有出色的“出廠設置”,這位AI辯手也經歷了漫長而艱辛的“備賽”之路。首先,AI辯手需要構建廣博的知識體系。它的“學習”過程分為兩步:第一步是預訓練,讓大模型掌握海量知識,理解人類語言規律;第二步是對齊,即讓模型學會如何與人類進行有效對話,理解人類意圖,并以類人的思維方式回應。其次,AI辯手需要經歷“千錘百煉”的模擬演練。研發團隊先以人類辯手的大量實戰數據為藍本,對模型的每一次回應進行多維度打分:答案是否準確?與議題是否緊密?邏輯鏈是否嚴密?在一次次測試、反饋中,讓AI少“打馬虎眼”、少“跑題”,說話越來越靠譜。
在中國工程院院士、之江實驗室主任王堅看來,這場“圖靈測試”的意義,已超越了簡單的“辨別人機”。他表示:“我們看到,通過了圖靈測試只是人工智能的下一個新的開始,遠不是終結,而這是圖靈本人也沒有預想到的,下面70年會是人工智能更令人激動的時代!”
“測試中AI展現出的辯證思維能力和即時反應速度,證明我國在自然語言處理和認知智能領域已經達到國際領先水平。”復旦大學特聘教授、上海科學智能研究院院長漆遠補充道,“這場測試既驗證了技術突破,又引發了公眾對智能本質的思考。這正是科研與科普的完美結合,為人工智能的健康發展提供了示范。”
MiniMax技術團隊表示,大模型的“首次突破”驗證了自研技術的有效性和先進性。未來,團隊希望推動技術在更廣泛的生產力場景中發揮作用。
據介紹,《2025中國·AI盛典》是總臺持續深化“5G+4K/8K+AI”發展戰略,積極推動新質生產力轉化為媒體傳播力的又一重要實踐和創新探索。總臺還將繼續探索人機協作的無限可能,讓科技更有溫度,讓傳播更具智慧,持續書寫“相AI相生”的時代新篇。
友情鏈接: 政府 高新園區合作媒體
Copyright 1999-2025 中國高新網chinahightech.com All Rights Reserved.京ICP備14033264號-5
電信與信息服務業務經營許可證060344號主辦單位:《中國高新技術產業導報》社有限責任公司