伴隨著人工智能的快速發(fā)展,各種大模型技術(shù)也持續(xù)飛躍,尤其是自國產(chǎn)大模型DeepSeek的推出,低成本、高效能的AI產(chǎn)品以席卷之勢融入我們生活和工作的方方面面。然而,在這個過程中,就業(yè)替代、信息虛假傳播等倫理與社會問題也逐漸浮現(xiàn)并引發(fā)關(guān)注和思考。
如何看待大模型目前發(fā)展的階段?各行各業(yè)紛紛與DeepSeek等大模型深度融合,這是機遇還是挑戰(zhàn)?大模型發(fā)展背后,如何平衡其成本、效率和創(chuàng)新的問題?新京報圍繞相關(guān)話題采訪了經(jīng)濟學家、橫琴數(shù)鏈數(shù)字金融研究院學術(shù)與技術(shù)委員會主席朱嘉明。
經(jīng)濟學家、橫琴數(shù)鏈數(shù)字金融研究院學術(shù)與技術(shù)委員會主席朱嘉明。
新京報貝殼財經(jīng):自DeepSeek火爆之后,各種大模型蜂擁而來,怎么看待當前大模型推出的速度和質(zhì)量?
朱嘉明:整體來看,大模型正在呈現(xiàn)數(shù)量和質(zhì)量兩個方面的演進。第一,在大模型的數(shù)量方面,加速增長,根據(jù)人工智能研究機構(gòu)Epoch AI的統(tǒng)計數(shù)據(jù),在ChatGPT推出的2022年,訓練算力超過1023次浮點運算的模型有22個,在2024年,這樣的模型已經(jīng)有99個。第二,在大模型的質(zhì)量方面,從2025年開始,大模型研發(fā)已經(jīng)完成了從粗放到集約的歷史轉(zhuǎn)型,即從主要通過不斷增大參數(shù)量和數(shù)據(jù)規(guī)模來提升模型性能,轉(zhuǎn)變?yōu)閺娬{(diào)算法架構(gòu)創(chuàng)新、數(shù)據(jù)預(yù)處理與微調(diào)策略,以及硬件與能效的協(xié)同提升,乃至關(guān)注大模型的實際落地收益與相應(yīng)的組織結(jié)構(gòu)調(diào)整。
需要澄清的是,大模型領(lǐng)域雖然不存在權(quán)力的直接干擾,但并非無政府主義狀態(tài),而是有嚴格且多元的標準體系與規(guī)范網(wǎng)絡(luò)共同構(gòu)建的有序生態(tài)。只有滿足這些技術(shù)、倫理、平臺和法律的要求,大模型才能獲得廣泛認可與應(yīng)用。全世界全面滿足技術(shù)標準、社區(qū)準則和法律法規(guī)要求的大模型極為有限。大多數(shù)的人工智能生成式模型,其實是在開源大模型基礎(chǔ)上,針對應(yīng)用目標的垂直領(lǐng)域進行參數(shù)優(yōu)化的產(chǎn)物。
2025年的大模型研發(fā)還有一個更為重要的特征:大模型正在展現(xiàn)前所未有的多模態(tài)的推理能力。大模型從語言中心向“內(nèi)在多模態(tài)”架構(gòu)轉(zhuǎn)變,強調(diào)跨模態(tài)主動推理和交互式反饋,以提升模型在復(fù)雜場景下的適應(yīng)能力。新一代模型能夠同時處理文本、圖像、音頻、視頻等多種格式,將各模態(tài)輸入映射到統(tǒng)一的嵌入空間,實現(xiàn)跨模態(tài)理解與推理。例如,OpenAI的o3模型支持對場景圖像進行空間變換(如縮放、旋轉(zhuǎn))、圖文問答及工具調(diào)用,顯著增強了視覺+文本推理的深度和廣度。
大模型的發(fā)展方向變得越來越明朗。未來兩到三年里,隨著腦科學不斷揭示大腦運作的奧秘,量子技術(shù)也在加速成熟,兩者都有望與現(xiàn)有的AI大模型產(chǎn)生深度融合和交叉創(chuàng)新。這種新一輪的“碰撞”不僅會提高模型的計算效率和推理能力,還可能催生出更接近人類思維模式的智能體系,標志著“大模型2.0時代”的來臨。與此同時,以大模型為核心的AI技術(shù)正在迅速走向市場。研發(fā)與部署成本持續(xù)降低,使得企業(yè)和個人都能更輕松地使用這些先進系統(tǒng)。無論是在智能家居、醫(yī)療診斷還是教育輔助中,這些模型正以前所未有的速度融入日常生活,悄然改變?nèi)藗兊墓ぷ髋c娛樂方式。
新京報貝殼財經(jīng):如何理解該標準?
朱嘉明:大模型研發(fā)是存在標準的。大模型的發(fā)展離不開一套由業(yè)界、學術(shù)界和標準組織共同制定并不斷更新的評估與認證標準。這些標準在形成過程中依賴多方參與與共識,并隨著模型能力的提升不斷推進,體現(xiàn)了“標準-挑戰(zhàn)-突破-再標準”的動態(tài)循環(huán)。首先,領(lǐng)先團隊或企業(yè)發(fā)布具有顯著創(chuàng)新的大模型,確立行業(yè)新基準;之后,其他團隊圍繞該基準發(fā)起攻關(guān),改進模型架構(gòu)、訓練方法或多模態(tài)融合技術(shù);然后,關(guān)鍵技術(shù)或應(yīng)用場景取得新的性能躍遷,推動模型達到更高水平;最后,突破成果成為新的行業(yè)標桿,開啟下一輪競爭與共創(chuàng)循環(huán)。
這一循環(huán)模式使得大模型生態(tài)不但在性能上不斷升級,也在標準體系、數(shù)據(jù)集構(gòu)建與測試方法等方面同步演進,形成良性、共贏的技術(shù)創(chuàng)新環(huán)境。
新京報貝殼財經(jīng):目前國內(nèi)的大模型處于什么階段?
朱嘉明:國內(nèi)大模型已進入普及化和大眾化階段,使用人數(shù)持續(xù)快速增長,應(yīng)用正從通用場景向金融、工業(yè)、政務(wù)、司法、民生等行業(yè)縱深滲透。但嚴格來說,這只是起步,真正的產(chǎn)業(yè)深度結(jié)合仍需更多落地探索,預(yù)計在下半年以后隨著政策供給和資金投入的進一步加碼,產(chǎn)業(yè)化部署和規(guī)?;瘧?yīng)用將顯著提速。
國內(nèi)大模型呈現(xiàn)互補功能格局,沒有單一模型能在所有指標上全能表現(xiàn)。不同類型的人工智能模型協(xié)同并進的體系正在形成,以滿足不同場景的多元需求。
在物理形態(tài)領(lǐng)域,中國已實現(xiàn)關(guān)鍵技術(shù)突破并大規(guī)模部署工業(yè)機器人。2023年中國安裝了逾27萬臺工業(yè)機器人,是日本的6倍、美國的7倍,占全球安裝量的51%。
新京報貝殼財經(jīng):大模型1.0和2.0的根本區(qū)別是什么?
朱嘉明:大模型的1.0時代主要基于深度學習中的Transformer架構(gòu),不斷在規(guī)模和微調(diào)技術(shù)上迭代;而2.0時代則有望突破Transformer本身的限制,通過引入類腦計算和量子計算等全新范式實現(xiàn)性能和效率的跨越。
自從OpenAI的GPT系列模型問世,以Transformer為核心的大模型進入1.0時代。該階段主要依靠不斷擴大參數(shù)規(guī)模、豐富訓練數(shù)據(jù),以及引入人類反饋強化學習、稀疏注意力和混合專家等技術(shù)提升生成質(zhì)量與效率。DeepSeek憑借多步預(yù)測和計算稀疏化手段,將推理性能追平Llama 3.1,而最新“o3”版本通過激進剪枝與并行化策略,進一步降低了延遲與成本。
然而,隨著算力投入回報遞減,大模型研發(fā)人員已將目光投向2.0時代。下一代模型將突破Transformer固有的二次方復(fù)雜度限制,采用線性化或稀疏化注意力,實現(xiàn)更長上下文的高效管理;并有望在類腦神經(jīng)形態(tài)芯片上通過異步、事件驅(qū)動的架構(gòu)顯著提升能效。同時,量子-經(jīng)典混合計算模式正逐步成熟,通過可參數(shù)化量子電路完成部分推理,在文本分類和語言建模任務(wù)中展現(xiàn)出與傳統(tǒng)模型相當卻更低能耗的潛力。
新京報貝殼財經(jīng):DeepSeek在成本控制上展現(xiàn)出巨大優(yōu)勢,怎么看待大模型推出背后成本和效率、創(chuàng)新的關(guān)系?
朱嘉明:DeepSeek在控制AI模型成本方面展現(xiàn)出顯著優(yōu)勢,但對其創(chuàng)新成本的簡單比較忽略了代際演進和不同發(fā)展階段的成本結(jié)構(gòu)差異。第一代創(chuàng)新往往伴隨著高昂的資源投入,而后續(xù)迭代則能借助先行經(jīng)驗和技術(shù)優(yōu)化實現(xiàn)“后進優(yōu)勢”。在“0到1”階段,大量基礎(chǔ)設(shè)施建設(shè)和未知風險必然推高成本;進入“1到10”階段后,通過流程標準化和效率優(yōu)化則有可能降低單位成本。盡管成本是衡量AI競爭力的重要指標之一,但并非唯一標準。為了持續(xù)保持領(lǐng)先,DeepSeek在下一步模型研發(fā)中仍需投入更高性能的芯片和基礎(chǔ)設(shè)施,這意味著其成本將呈上升趨勢。綜合來看,DeepSeek的成本控制策略在當下確立了競爭優(yōu)勢,但其長期成本曲線依然受創(chuàng)新代際、更高性能需求以及基礎(chǔ)設(shè)施投入的推動而上揚。成本雖是重要指標,但需與性能、可持續(xù)性和技術(shù)迭代等多重因素并重評估。
新京報貝殼財經(jīng):AI 和大模型的發(fā)展如何重塑全球產(chǎn)業(yè)結(jié)構(gòu)和經(jīng)濟格局?
朱嘉明: AI作為一種全新工具,不僅催生出全新的產(chǎn)業(yè)形態(tài),還將傳統(tǒng)行業(yè)置于必須適應(yīng)其運作邏輯和基礎(chǔ)設(shè)施的境地,從而實現(xiàn)對傳統(tǒng)行業(yè)的重塑,而不是簡單地在既有框架下進行升級或改造。
需要注意到,智能體經(jīng)濟與人機協(xié)同網(wǎng)絡(luò)正在興起。第一,AI 智能體正在脫離“應(yīng)答者”身份,成為可以主動調(diào)度、決策與協(xié)作的經(jīng)濟參與者,構(gòu)建出以“智能體總線”為入口的分布式運行環(huán)境。第二,垂直領(lǐng)域智能體憑借對行業(yè)語言和需求的深度理解,率先掌握了資源配置與入口控制權(quán)。第三,不同智能體之間的價值交換與協(xié)作,正在孕育一種全新的“組織結(jié)構(gòu)”,即人-機智能體共生的經(jīng)濟網(wǎng)絡(luò)。
新京報貝殼財經(jīng):AI 和大模型廣泛應(yīng)用的同時,也帶來了算法偏見、就業(yè)替代、信息虛假傳播等倫理與社會問題,怎么看待這些問題的出現(xiàn)?
朱嘉明:AI在實現(xiàn)大規(guī)模數(shù)據(jù)處理和決策優(yōu)化方面展現(xiàn)出顯著優(yōu)勢,但也伴隨算法偏見和虛假信息傳播等風險。這些問題雖真實存在,卻并非AI應(yīng)用的主流,而通過技術(shù)改進與制度治理可望在可預(yù)見的時間內(nèi)得到有效緩解。各國正加速推進法規(guī)框架,以規(guī)范AI基礎(chǔ)設(shè)施建設(shè)與運行;與此同時,隨著業(yè)界經(jīng)驗積累和公眾認知提升,對AI的誤解與夸大也將逐步消退。
AI本質(zhì)上是一套處理海量、多源、高速數(shù)據(jù)的方法論,能夠彌補傳統(tǒng)手段在規(guī)模與復(fù)雜度上的不足。但是,公眾與決策者對AI的理解尚不均衡,部分“想象中的”風險被過度放大。
總體來看,AI正處于技術(shù)落地與社會認知的“雙重夾擊”中,隨著標準化制度的建立與技術(shù)自身演進,算法偏見和虛假信息等問題將逐步得到控制,AI處理大數(shù)據(jù)的核心優(yōu)勢將更為凸顯。
新京報貝殼財經(jīng)記者 胡萌 編輯 陳莉 校對 盧茜