開源集團軍超越DeepSeek 中國正重塑全球AI生態
出版日期: Tuesday, April 29, 2025
文本大小:
據觀察者網「好評」報導,中國「開源」正在形成「集團化作戰」的優勢。DeepSeek和阿里Qwen等基礎模型撐起了中國開源的上限,而更多的中小企業正在它們的基礎上,不斷推出體量更小卻能力更強的垂直模型,讓今年以來中國AI大模型更新的速度不斷加快,不斷帶來新的驚喜。而在美國仍以閉源為主的背景下,中國企業擁抱開源的做法充分展現了中國的技術自信,也開闢出一條技術普惠與全球共生的新路徑,持續開拓海外市場,代表著全球AI技術從「單極霸權」轉向「多極共生」。
一、中國開源 正形成合力
2月初,當中國開源大模型DeepSeek在全球140個國家和地區的應用市場下載排行榜同時登頂,OpenAI卻公然在媒體上指責,DeepSeek未經許可使用了ChatGPT的蒸餾數據。
這樣的指責非但沒能為OpenAI「挽尊」,卻招來全球科研從業者的「群嘲」。
如今,又一個把蒸餾buff疊滿的選手出現了。
4月13日,崑崙萬維推出Skywork-OR1(Open Reasoner 1)系列模型,同規模下性能超越阿里QwQ-32B,對齊DeepSeek-R1。
資金實力並不雄厚的崑崙萬維,為什麼也可以做出SOTA級別的大模型?其實官方並不諱言,他們的模型是基於DeepSeek-R1-Distill-Qwen-7B和DeepSeek-R1-Distill-Qwen-32B這兩款模型訓練而來。
而正如名字裡體現的那樣,DeepSeek的這兩款模型,又蒸餾了阿里的Qwen系列模型。
在借力優秀開源模型的同時,崑崙萬維也在為開源社區做出自己的貢獻。相比於只開源模型權重的DeepSeek,崑崙萬維還開放了自己使用的數據集和訓練代碼,更加接近於「真開源」的概念。這意味著,任何用戶都可以去嘗試復刻他們的模型訓練過程。
崑崙萬維這份成果,充分展示了開源最重要的意義——不僅僅是讓給用戶提供一個免費可用的產品,更能夠讓更多開發者站在前人的肩膀上,快速、低成本地推動技術繼續前進。
事實上,就在去年業界還在討論大模型預訓練遭遇瓶頸的背景下,今年以來,中國大模型的迭代速度卻仍在加快,並且越來越多的企業投入開源。
阿里雲通義千問從除夕夜開源全新的視覺模型Qwen2.5-VL,再到3月初發佈並開源了全新推理模型QwQ-32B,在開源當日就登頂全球主流AI開源社區HuggingFace的趨勢榜。
階躍星辰則在一個月左右時間開源三款多模態大模型,其最新開源的是圖生視頻模型Step-Video-TI2V,支持生成的視頻具備運動幅度可控和鏡頭運動可控兩大核心特點,同時自帶一定的特效生成能力。
智譜則在4月宣佈開源32B/9B 系列GLM模型,涵蓋基座、推理、沈思模型,均遵循MIT許可協議。
甚至一度閉源的百度,也宣佈將於6月30日完全開源文心大模型。
相比於大陸國內開源生態的日益繁榮,美國大模型公司至今仍以閉源為主,這也讓中國大模型的出海迎來難得機遇——DeepSeek讓印尼教育公司Ruangguru借此低成本優化了教學模型;新加坡B2B旅遊技術公司Atlas將Qwen集成至智能客服系統,實現7×24小時多語言支持……
二、為何美國閉源 中國開源?
美國AI傾向閉源而中國AI愈發開放,實際上是兩國AI發展環境的必然結果。
美國的AI產業主要由科技大廠和VC(風險投資人)主導,由於資方對於AI有著巨大的資本回報預期。因此美國的AI模型企業普遍具有強烈的技術信仰,即追求技術領先後實現一定程度的市場壟斷後創造巨額利潤,其生態也天然的傾向於閉源。
以OpenAI發展歷程為例,其在創立期間作為非盈利實體,此後卻不斷走向封閉——GPT-1時完全開源,GPT-2部分開源遭遇反對後才全面開源,GPT-3正式走向閉源,隨後GPT-4時閉源策略進一步強化,模型架構、訓練數據完全保密,甚至限制企業用戶的API調用頻率。
儘管OpenAI表示閉源是基於合規和管控技術濫用的出發點,但市場普遍認為OpenAI轉向閉源的標誌性事件是其與微軟達成百億美元級合作,將GPT-3嵌入Azure雲服務,形成「技術-資本」閉環。
在去年10月微軟首次在財報披露其對OpenAI投資時就表示:「我們對OpenAIGlobal,LLC進行了投資,總投資承諾為130億美元,投資按權益法核算。」
所謂的權益法也可以理解為微軟對於OpenAI的投資的目的是獲得回報而不是單純的慈善科研,顯然OpenAI通過閉源生態賣高價API就是其目前最大的收入來源,也成了OpenAI不願開源的最大阻力。
而從OpenAI「分家」成立的Anthropic,更是在一開始就堅定了閉源路線,其大模型產品Claude則全面採取了閉源模式。
而即便是美國開源唯一扛把子的META旗下的Llama,開源時也加入了兩條防友商條款:
1、開源模型在META批准前不能用於超過7億月活的產品和服務;
2、不能利用Llama模型的輸出內容來訓練和改進其他的大語言模型。
可以看到,即便是開源模型,Meta的核心目的依然是打造自己的AI生態而非技術普惠。
美國在資本層面選擇了閉源為主,開源為輔的AI戰略,可以說是純商業考量。相比之下,中國自上而下的頂層設計從一開始就重視開源,體現了自主可控思維下的產業優先路徑。
早在2017年,中國政府就發佈了《新一代人工智能發展規劃》,明確提出要加快AI與經濟、社會深度融合的目標,部署構築AI發展的先發優勢。2021年,開源相關內容更是明確列入中國「十四五」規劃中,引發各地積極推動技術革新進程。
中國科學院院士梅宏就曾表示,語言模型未來的發展必須依賴於開源平台,只有在一個開放的環境中,才能確保各行業用戶對數據上傳和業務整合的安全性與信任度。
去年12月大陸工信部等四部門發佈的《中小企業數字化賦能專項行動方案(2025—2027年)》中,明確支持開放原子開源基金會設立「中小企業AI開源專項」,提供可複製,易推廣的訓練框架、測試工具等資源,降低企業技術門檻。
一個更現實的問題是,由於美國的潛在技術封鎖,中國在AI領域並不能單純的做追隨者,而必須打造能夠獨立自主的國產生態,在美國已經建設了一套閉源為主的生態下,再建設一套閉源生態無異於閉門造車,唯有開源生態才能快速助力AI產業的發展。
除了頂層支持外,各地對開源生態上也付出了真金白銀的支持。
智譜聯合北京國資成立的專注於大模型生態投資的Z基金宣佈,出資3億元支持全球範圍內的AI開源社區發展,任何基於開源模型(不局限於智譜開源模型)的創業項目均可申請。
中美AI產業在開源與閉源策略上的分野,本質是發展邏輯的根本差異——美國受資本驅動,科技大廠與VC的盈利訴求催生了「技術壟斷-高價變現」的閉源生態,即便如Meta嘗試開源,也難逃商業壁壘的桎梏;中國則依託頂層設計,以「技術平權+產業協同」為核心理念,通過政策賦能構建開放生態,讓開源成為降低技術門檻、推動實體經濟融合的基礎設施。這種戰略選擇,既塑造了兩國AI產業的不同路徑,也預示著全球AI生態正從「壟斷競爭」向「開放共贏」加速演進。
三、夠用就是夠好
中國的AI開源生態,不僅正在加速中國及全世界的AI產業化發展,還讓美國技術優先的信仰陷入了一個尷尬的陷阱。
面對DeepSeek效應帶來的步步緊逼,4月5日,Meta發布自稱有史以來最強多模態大模型Llama4。
然而實測下來,這是一款讓人大失所望的模型,號稱10m tokens的上下文長度頻頻出錯、初代小球測試難以完成、9.11>9.9的比大小失誤……模型上線幾天內,高管離職、測試作弊等醜聞也被內部員工爆料證實。
更多消息證明,Llama4可謂是祖克柏趕鴨子上架的產物。那麼問題來了,為什麼祖克柏一定要趕在4月上線呢?
正如前文所述,美國AI產業界對於技術有一種迷之信仰,認為自己的產品必須最強、最先進,因此紛紛開啓軍備競賽。而訓練AI所需的邊際效應遞減,使得大廠們在消耗了天量成本後,技術門檻不僅沒有建成,反而陷入了算力瓶頸的泥沼。
OpenAI剛發佈GPT-4o的圖像生成功能,幾天後Altman就發推說他們的GPU「快燒了」。Gemini2.5發佈不到一周,GoogleAIStudio負責人就說他們仍受「速率限制」困擾,開發者每分鐘只能發20個請求。似乎沒有一家公司能應對超大模型的推理需求。
實際上,美國正在陷入誤區。智源研究院的負責人表示:「如果一個新模型用100倍成本跑出了10分基準測試分的提升,那麼這個新模型對於80%以上的應用場景就毫無意義,因為沒有任何性價比。」
而中國大模型企業加速開源生態,看似不再去爭奪這個第一,反而憑借著「夠用就好」贏得了更多的客戶,尤其是工業界客戶的認可。
相比於政企客戶動不動千萬的預算,很多企業和機構既有迫切的AI需求,但是又沒有那麼多預算現成解決方案,利用開源模型自行開發幾乎成為了他們不二之選:
寶鋼用冶金工程關鍵工序「大模型+小模型」進行生產設備智能預警;
中煤科工的「煤科衛士大模型ChinamjGPT」,使煤機裝備設備故障停機時間、維修成本分別降低30%和20%;
上海孟伯智能物聯網科技有限公司基於輕量大模型打造了邊剪檢測、連退爐工藝優化應用平台;
彌費科技基於大模型技術實現了半導體晶圓廠自動物料搬運系統智能預測維護與管理。
這些都是開源模型在工業場景落地的代表案例。
而除了工業用途外,開源生態也能幫助更多的公益事業。
山水自然保護中心致力於雪豹及高原生態系統的保護,布設的紅外相機每個季度會拍攝大量照片或視頻,靠人工識別雪豹蹤跡效率極低,耗費大量時間和人力。華為昇騰與山水自然保護中心合作進行雪豹蹤跡識別華為把三江源紅外影像物種識別的相關模型和工具開源,降低了參與AI開發的門檻,讓更多使用該模型的研究保護機構受益,可舉眾人之力在數據集、數據處理和數據清洗多方面優化模型。
四、開源的「集市」效應
開源軟體運動的旗手、美國人埃里克·雷蒙德在1999年的《大教堂與集市》一書中提出一個比喻:傳統的、封閉的軟體開發模式如同建造一座大教堂,軟體由少數專家(建築師)在與世隔絕的環境中精心設計和構建,只有在最終完成後才發布給用戶;而開放源代碼的開發模式。如同一個熙熙攘攘、看似混亂但充滿活力的集市,軟體開發是公開的、去中心化的、演進式的。
書中認為,對於許多類型的軟體項目,尤其是複雜的系統級軟體(如操作系統內核),開放、協作、去中心化的「集市」開發模式,儘管看起來可能混亂,但實際上比傳統、封閉、集中式的「大教堂」模式更有效率、更能產生高質量、更健壯的軟體。 它通過「早發佈、常發佈」和利用大規模同行評審(「足夠多的眼睛」)等機制,能夠更快地發現和修復錯誤,並更好地吸納用戶反饋和社區貢獻,從而推動軟體的快速迭代和創新。
Linux等開源項目的巨大成功,驗證了雷蒙德的觀點。
開源運動曾經為美國和世界帶來遠超投入本身的巨大價值。哈佛大學2024年的一份研究報告表示:「開源投入41.5億美元,為企業創造了8.8兆美元價值(即每投入1美元,創造2000美元價值)。如果沒有開源,企業在軟體上的支出將是現在的3.5倍。」
如今,中國公司學到了這一點。美國AI企業似乎卻忘了。
事實上,對於中國的大模型企業們,即使不考慮社會效益,選擇擁抱開源生態對於企業本身也並非無利可圖。
多家大模型企業均告訴觀察者網,開源並不是放棄商業化,開源依然有開源的盈利邏輯,比起開不開源,如何技術上更加服務好客戶才是關鍵的問題。
以智譜AI為例,其宣稱為大陸國內唯一全面對標OpenAI的企業,但相比於OpenAI的閉源戰略,其反而是行業內開源戰略最堅定的踐行者之一。
智譜於2023年率先開源大陸國內第一個Chat大模型ChatGLM-6B,成立近六年來,智譜已開源55餘款模型,在國際開源社區累計下載量近4000萬次。
智譜告訴觀察者網,智譜希望自己的開源戰略為北京打造人工智能「全球開源之都」貢獻自己的力量。
而具體到商業層面,智譜則選擇了開源吸引開發者生態,向B端和G端提供付費的定制解決方案。
而除了賣解決方案,賣API也是一個重要的盈利環節。
以DeepSeek為例,開源模型的第一筆生意是高性能API的銷售。基礎服務雖免費,但企業可提供高性能API服務,按調用量收費。DeepSeek-R1的API定價為每百萬輸入Token1元,每百萬輸出tokens16元。免費token額度用完了或者基礎API滿足不了需求,用戶就傾向於使用付費版保持業務流程的穩定性。
相比於只有模型服務的企業,阿里則選擇另一種開源變現模式——生態捆綁。
阿里的Qwen系列作為開源急先鋒,通過全模態開源吸引開發者使用雲計算等基礎設施,形成場景閉環。他們的模型在前期只是一個引子,明碼標價的商品實則是雲服務。
中國開源大模型的全球化應用已從「技術跟隨」轉向「生態主導」。當美國陷入「閉源壟斷」與「開源失控」的兩難時,中國通過「協議創新+場景深耕」,正在重構全球AI開源生態的底層邏輯。這場博弈的終極戰場,不在參數規模的競賽,而在AI技術與實體經濟深度融合的萬億級市場。