“在一元二階邏輯測試中,主流大模型得分接近0分,離通用人工智能的要求還有巨大差距。”10月23日,在哈爾濱開幕的第22屆中國計算機大會(CNCC2025)上,華為公司戰略研究院院長周紅拋出的問題,直指當前人工智能發展的核心痛點。這場以“數智賦能、無限可能”為主題的行業盛會,吸引12011人注冊參會、900余名講者齊聚,不僅呈現計算技術前沿成果,更圍繞大模型、智能超算等領域的瓶頸與破局路徑展開深度研討,為數字經濟時代計算技術發展錨定方向。
當前,計算技術已進入多領域滲透、多學科融合的爆發期。會上多位專家為我們展現了人工智能的多場景應用,工業領域中,AI助力煉鋼高爐溫度精準調控,可降低千萬級成本;醫療領域,虛擬手術模擬器可替代動物實驗、優化手術方案;科研領域,人工智能實現流體計算效率提升1000倍。計算技術正以“數智賦能”重塑生產、生活、科研范式。
然而,技術快速迭代背后,瓶頸問題同樣突出。周紅指出,當前大模型存在三大核心挑戰:認知偏差導致泛化能力弱,“比如僅獲取多面體兩面信息,幾乎無法預測第三面,甚至在學習加法時,未訓練過的數值區間就容易出現預測失誤”;數據與能源效率極低,人類高質量文本數據或將在2028年用完,而大模型對文本數據的需求比人類實際情況高10萬倍甚至更多,能源消耗更是遠超人類大腦;在組合爆炸與長程推理上的能力是明顯短板,當前大模型擅長局部數據的統計與抽象,卻難以處理周期性,以及更加復雜的規律與方法。
針對這些問題,他提出構建“世界模型”的解決方案:當前深度學習依賴數據驅動形成的“經驗引擎”存在明顯局限,難以支撐復雜場景下的智能需求,因此“世界模型”的核心思路是打破單一技術路徑依賴,構建“經驗引擎+行動引擎+理念引擎”三引擎協同體系。其中,“經驗引擎”延續現有優勢,負責處理基于數據的統計與抽象;“行動引擎”基于目標驅動,綜合規劃、搜索、推理、優化、記憶工具等環節;“理念引擎”則是創新關鍵,需嵌入數理化知識、知識圖譜等科學認知體系,具備假設驗證、抽象求解等能力,彌補經驗驅動在長程推理、復雜模式分析上的短板,構建更強理解、適應與行動能力的世界模型。
智能超算領域的發展困境也成為大會焦點。“大模型的性能和效果會隨著模型的參數量、數據量和計算量擴展,大算力是大模型發展的前置條件。”中科曙光高級副總裁李斌表示。據統計,全球人工智能計算機,每年保持2.5倍的增速,這個速度超過摩爾定律失效以前,超算發展黃金時期的最高增速。
但系統層面的挑戰日益凸顯,他指出:多場景適配難度大,“智能超算既要支撐大模型訓練的大算力需求,又要適配科學計算的全精度要求,現有系統架構難以兼顧”;數據傳輸與計算性能失衡,“體系結構復雜化導致數據傳輸效率滯后于計算能力提升,現在大模型團隊不得不深度參與系統工程化設計,才能保障訓練效率”;能耗與可靠性壓力劇增,“隨著算力規模擴大,傳統風冷已無法滿足散熱需求,萬卡集群要實現數天無故障運行,對系統穩定性的挑戰極大”。
對此,李斌提出技術演進路徑:推動算力系統向多元融合方向發展,通過硅光傳輸、高壓直供、液冷等技術突破硬件瓶頸,同時強化軟硬件協同與產業鏈協作,“未來智能超算需實現從‘算力堆砌’到‘系統創新’的范式轉變,才能支撐更多前沿應用落地”。
友情鏈接: 政府 高新園區合作媒體
Copyright 1999-2025 中國高新網chinahightech.com All Rights Reserved.京ICP備14033264號-5
電信與信息服務業務經營許可證060344號主辦單位:《中國高新技術產業導報》社有限責任公司