大模型浪潮的席卷速度,超越了歷史上任何一場技術革命。

年初,OpenAI發(fā)布Sora,馬斯克、周鴻祎不惜溢美之詞,狂熱蔓延全世界。正當大家還在驚嘆“未來已來”,Anthropic公司宣布Claude-3正式發(fā)布,并宣布在AI邏輯基準測試中超過了ChatGPT-4。與此同時,Google和馬斯克同時跳入開源大戰(zhàn),分別推出Gemma和Grok。

全球大模型的競爭熱潮,從小眾圈層向外擴散,像漣漪一樣,播散向全世界。一場大模型的無限競爭就此打響。全球科技巨頭攜帶著大筆充沛的資金、漂亮履歷的技術人才將戰(zhàn)場燒的更加火熱。

但冷靜一看,目前世界上公認的大模型領軍者,大多卻是年輕的AI企業(yè):估值高達290億美元的OpenAI,成立于2015年;被稱為OpenAI“最強競爭對手”的大模型公司Anthropic成立于2021年;“歐洲新秀”Mistra創(chuàng)立至今,剛到一年。三家閃耀的AI明星公司的員工加起來卻可能不到一千人,只是科技大廠的一個部門的人數(shù)。

為什么這場對大模型王冠的追逐戰(zhàn),不在巨頭的射程范圍內?

01 為什么榮光屬于AI企業(yè)?

首先,打破一個認知誤區(qū):大模型并不是一場單單依靠資源的軍備競賽。

在ChatGPT橫空出世后,一個廣為流傳的說法是,OpenAI成功的關鍵在于背靠微軟Azure云上的數(shù)萬張A100卡,成本高達數(shù)億美元。更有甚者認為大模型的勝率取決于資源的充沛程度。

然而,今年3月,美國初創(chuàng)公司 Databricks 突然公布旗下開源大語言模型 DBRX,號稱是全球最強開源大模型,參數(shù)規(guī)模達到 1320 億,表現(xiàn)更是超越 Meta 的 Llama2、Mistral AI 的 Mixtral,以及馬斯克旗下 xAI 公司剛剛開源的 Grok-1。

更重要的是,他們只花了 2 個月和 1000 萬美元,在性能全面超越 GPT-3.5 的同時,訓練時間和成本都只有 GPT-3.5 的一小部分。

事實上,資源對于任何領域的競爭都很重要,但資源在大模型領域卻不是萬能的、更不是唯一因素。而AI企業(yè)相比科技巨頭,有一個得天獨厚的優(yōu)勢,就在于技術探索上的靈活性。

Google曾是人工智能深度學習領域里當之無愧的王者。2016年,擊敗人類圍棋冠軍李世石的阿爾法go就是出自谷歌Deepmind,而在自然語言模型領域,谷歌也曾遙遙領先。

然而,2022年ChatGPT橫空出世。實際上拉開身位差距的是技術路線上的分歧。谷歌追逐的自然語言模型應該是一系列的垂類,參數(shù)相對較小、適用場景面相對較窄的模型,而OpenAI認為應該做一個通用的海量參數(shù),海量數(shù)據(jù)訓練的超級大模型。

OpenAI當年的夢想看來是天方夜譚。但即便在與谷歌的較量中長期落于下風,OpenAI也沒有放棄將GPT作為唯一路線。阿爾特曼的一句話給出了答案——“創(chuàng)業(yè)公司做什么都很難,那不如抓住大機會。”(Startups are very hard no matter what you do , you may as well go after a big opportunity.)

相比于AI企業(yè)的靈活性,科技巨頭在押注技術路線上卻很難如此孤注一擲,這也一定程度上造成了動作的遲緩。這也注定了,AI的最新方向大概率要靠AI企業(yè)去探索。

海外AI明星公司鱗次櫛比、星光璀璨。那么問題來了,中國領域的AI明星公司在哪?

02 “ 中國大模型五虎”浮出水面

一張SuperCLUE評測榜單揭開了中國大模型五虎的秘密。

刨除BAT,榜單上展現(xiàn)著中國最強AI企業(yè)的身影,分別是百川智能、智譜AI、月之暗面、MiniMax、云從科技。

百川智能成立于 2023 年 4 月,創(chuàng)始人為前搜狗公司 CEO 王小川。成立后短短數(shù)月,百川智能便躋身科技獨角獸行列,成立至今更是連續(xù)發(fā)布了11款基礎大模型。

智譜AI成立于2019年,今年初已完成新一輪融資。創(chuàng)始人張鵬,畢業(yè)于清華大學計算機科學與技術系。幾年來,公司連續(xù)發(fā)布了GLM系列大模型、ChatGLM、CodeGeeX代碼大模型等,已成為國內最早也是最有大模型研發(fā)經(jīng)驗的企業(yè)之一。

MiniMax成立于2021年,背后的掌舵者閆俊杰畢業(yè)于中科院自動化所,在商湯科技擔任副總裁期間,負責搭建深度學習的工具鏈和底層算法,以及通用智能的技術發(fā)展。聯(lián)合創(chuàng)始人楊斌,則是閆俊杰在中科院的校友。

同樣來勢洶洶的還有月之暗面(Moonshot AI)——2023年,月之暗面接連完成兩輪共計近20億人民幣的融資,估值超25億美金。月之暗面成立于2023年3月由三位清華校友創(chuàng)辦,帶頭人則是90后學霸楊植麟。

至此,加上云從科技,中國AI大模型五虎呼之欲出。

云從科技曾是“AI四小龍”中A股第一股,也是國內AI三駕馬車中,唯一一家具備全內資背景的企業(yè)。在業(yè)內,云從科技與商湯科技、曠視科技、依圖科技并稱“AI四小龍”,但論起光環(huán)與熱度,最年輕的云從科技,卻是最“頂流”的存在。

“AI國家隊選手”、“中國科學院孵化企業(yè)”、“中國AI第一梯隊企業(yè)”、“首個同時承擔國家發(fā)展和改革委人工智能基礎平臺、應用平臺,科技部開放平臺等重大項目建設任務、并參與國家及行業(yè)標準制定的人工智能企業(yè)”等稱號,讓云從科技自2015年誕生以來,始終處于行業(yè)聚光燈下。

如今,云從科技又在大模型時代昂首闊步。

03 被時代眷顧的優(yōu)等生

去年五月,位列國內人工智能第一梯隊的云從科技,正式發(fā)布了AI智能體(AI-agent)領域的戰(zhàn)略級產(chǎn)品——“從容多模態(tài)大模型”。

云從科技研究院產(chǎn)品總監(jiān)孫進在接受媒體采訪時表示:從容大模型在內部已經(jīng)歷了多輪迭代。1.5版本時,平衡上下文長度、模型性能與推理成本是迭代重點。從容大模型 2.0 版本已經(jīng)完成,3.0版本重點是多模態(tài)能力--跳過文本直接處理不同模態(tài)的數(shù)據(jù)。

不只是對話體驗,從容大模型還可以編程、寫作、解題等。云從還對“從容”與ChatGPT進行橫向對比演示,在對同一真題的解答過程中,從容大模型的答題速度相較更快,但推理能力、語義理解能力已超過GPT 3.5,略低于GPT4.0。

經(jīng)第三方機構SuperClue、C-Eval等綜合評測,從容大模型綜合性能位列全球前五。同時,從容大模型具備多模態(tài)能力,在視覺、跨模態(tài)領域10次刷新世界紀錄。

據(jù)云從科技介紹,公司已布局了數(shù)十個行業(yè)大模型,并研發(fā)了DataGPT、智能客服、AI鼠標等多個泛AI智能應用,成為云從科技布局AI智能體(AI-agent)的重要抓手。

同時,云從科技與華為昇騰聯(lián)合提出應對智算基礎設施挑戰(zhàn)的解決之道,開啟“國產(chǎn)化算力+智算”的新布局。目前,雙方已合作推出大模型應用底座——從容大模型訓推一體機,并與天津港集團、首鏈科技、今世緣、國網(wǎng)山東、中國電信等合作伙伴一起,成功幫助港口、醫(yī)藥、制造、電力、銀行等行業(yè)客戶落地生成式AI應用場景。

云從科技連續(xù)踏中兩波AI浪潮,離不開其深厚的科研背景。

云從科技的創(chuàng)始人周曦,曾以中科院“百人計劃”專家身份引進回國,擔任中國科學院重慶綠色智能技術研究院信息所副所長等職位。用了半年時間,他在全國范圍內組建起一支擁有20多位專業(yè)人才的團隊,并入選中國科學院A類戰(zhàn)略性先導科技專項,成為其中唯一的人臉識別團隊。

在日后,這只團隊成為了計算機視覺領域的國家隊,其技術成果先后被用在多個省份,在alpha go尚未大戰(zhàn)李世石讓AI一夜爆火之前,就悄然將這一技術帶到了普通人的生活之中。

一直到2015年4月,33歲的周曦,卻放棄別人艷羨的“鐵飯碗”,選擇內部創(chuàng)業(yè),牽頭成立云從科技,專攻人臉識別領域。

“很驚訝,因為在這個領域很少見到愿意放棄現(xiàn)有職位全力投入創(chuàng)業(yè)的科學家。”海通證券某人士在接受媒體采訪時表示,“海通作為云從的第一個項目,在應用實現(xiàn)上有特別多困難,周曦當時把整個研發(fā)弄到上海來攻堅了一周,系統(tǒng)上線后到現(xiàn)在再也沒出過問題。”

從2015年開始,人臉識別作為計算機視覺領域最易落地的賽道,開始逐漸形成風口。在篳路藍縷七年之后,云從交上了他的答卷:作為唯一一家全內資AI企業(yè),順利登陸科創(chuàng)板,被稱為“AI國家隊”。

翻開云從科技的招股書,我們可以看到,云從科技的創(chuàng)始團隊大多來自中科院、中科大。公司擁有近600名科研人員,研發(fā)人員占比超過50%,核心團隊曾先后10次獲得國內外人工智能領域桂冠。

如今全球大模型競爭風起云涌,新的科技浪潮席卷各行各業(yè),中國人工智能領域在焦慮和追趕中又一次走到了十字路口。

如何書寫這一次新的篇章,既是云從科技新的課題,同樣也是所有中國AI企業(yè)迫切的使命。