新年伊始,訊飛旋即召開最新的模型發(fā)布會,距離上次重大更新僅過去不到一個季度,這次發(fā)布會上,訊飛帶來三個大招:1)推出深度推理模型訊飛星火X1,作為全國產算力平臺上唯一的深度推理大模型,該模型中文數學能力國內第一,并率先應用于教育、醫(yī)療等剛需場景;2)升級星火4.0Turbo 底座能力升級,進一步拓展多模態(tài)的邊界;3)發(fā)布同傳大模型,最快語音同傳時延小于5秒。
訊飛速度,讓我們看到全國產化AI大模型的能力擢升的希望之路。當下脫鉤斷鏈的時空背景下,自主可控有了更深刻的現(xiàn)實意義,中國AI產業(yè)也有了真正意義的壓艙石,未來不管形勢如何變化,我們都已有從容自主應對的底氣:中國大模型技術未來發(fā)展安全可控,商業(yè)化落地路徑也愈發(fā)清晰可見。
01從“星火發(fā)布會窗口”看全棧國產AI的成色
大部分人都非常關心基于全國產的芯片、算子、算法的大模型之路,究竟是否能夠走得通。一直以來,訊飛星火堅持走全國產化路線,因此其發(fā)布會也成為業(yè)內人士觀察全棧國產AI進展的關鍵窗口。在此之前,2023 年 10 月首個國產萬卡算力集群“飛星一號”平臺上線,后升級為國產超大規(guī)模智算平臺“飛星二號”,2024年1月,訊飛通過國產算力平臺訓練出的千億參數模型訊飛星火V3.5正式發(fā)布,性能指標處于國內領先水平,初步驗證了這條路能行得通。而這次發(fā)布會,是觀察這條路能否走得好的關鍵切面。
【1】迭代速度保持領先
從23年首發(fā)至最新的發(fā)布會,我們觀察到星火模型的迭代速度非???,完全不用擔心國產底座成為技術發(fā)展的掣肘。從近2年來關鍵的時間節(jié)點來看:
-
- 2023年5月6日,在AI全球爆火后不到2個月,訊飛星火大模型正式發(fā)布,且具備文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模態(tài)能力等七大核心能力。
2023年10月24日,為實現(xiàn)完全的國產化,訊飛與華為攜手自研算力底座,并于聯(lián)合發(fā)布了國內首個全國產算力平臺“飛星一號”,常態(tài)化支持萬億參數的大模型訓練。
2024年1月30日,首個基于全國產算例訓練的訊飛星火V3.5發(fā)布,同時發(fā)布的還有星火語音大模型,首批支持37個主流語種。
2024年6月27日,科大訊飛發(fā)布訊飛星火V4.0,七大核心能力全面升級,在8個國際主流測試集中排名第一。
2024年10月24日,基于“飛星一號”平臺,星火大模型已升級為4.0 Turbo版本,根據真實數據的測試,其七項核心能力在中文領域全面超過GPT-4 Turbo,數學和代碼能力超越GPT-4o。
2025年1月15日,科大訊飛持續(xù)深入大模型國產化“無人區(qū)”,正式發(fā)布星火深度推理模型X1,同時首發(fā)星火語音同傳大模型;此外,訊飛星火4.0Turbo底座能力+行業(yè)能力再次升級。
訊飛大模型的迭代速度和頻率,均與全球第一梯隊廠商保持一致,直接證明了基于國產算力和算法的大模型之路深度可靠。
【2】能力上比肩全球第一梯隊
在過去兩年的百模大戰(zhàn)之后,AI從2025年開始進入推理時代,所以這次訊飛發(fā)布會,最引起我們關注的,自然是當前業(yè)界全國產算力平臺上唯一的深度推理模型——星火深度推理模型X1。發(fā)布會上,科大訊飛研究院依次展示了訊飛星火X1解答高考題、AIME競賽題以及高中奧賽題的表現(xiàn),X1不僅準確給出了這些題目的答案,還對解題思路和步驟進行了詳細拆解。
通過解題的案例,也首次揭秘星火X1的三大特點:化繁為簡,能將復雜問題分步拆解簡化;進行自我探索反思驗證;依據答案正確與否進行強化訓練。這種能力相對通用大模型,是一種更為接近人類的“慢思考”方式。這種方式是X1能力突出的關鍵。星火深度推理模型X1近期還參加了小初高(含競賽)、大學(含競賽)、AIME、MATH 500等多項考試,交出了一份非常亮眼的“考試成績單”:用更少的算力,達到業(yè)界一流效果,多項指標位居國內第一。
另外值得一提的是,推理階段相對訓練而言,是更加追求成本效用的,便宜好用是商業(yè)化落地的最大前提。水滴石穿非一日之功。這次發(fā)布會上推理模型X1的驚艷表現(xiàn),離不開科大訊飛從成立之初就保持對AI的專注,以及近些年持續(xù)大手筆加大對研發(fā)的投入。
除此之外,訊飛的底座星火4.0 Turbo能力也迎來全新升級,此前的七大核心能力得到全面提升,對標或者超越OpenAI 最新版的GPT-4o。更引起我們重視的是,此次升級最重要的特點,是針對行業(yè)、企業(yè)的痛點問題,在數學能力、行業(yè)知識、圖文識別、長文本能力等能力上實現(xiàn)提升。比如數學能力上,星火X1的高質量合成數據,讓訊飛星火4.0 Turbo的數學能力變得更強,可以在數學教學、金融分析和科研推演等發(fā)揮更大的作用。
整體來說,星火4.0 Turbo成為更懂行業(yè)的通用大模型,為賦能千行百業(yè)提供有力支持。
在地緣沖突不斷加劇的當下,掌握科技革命的底層資產是應對未知的重中之重。AI大模型的底層資產,就是算力和算法。訊飛星火,成為了奇點爆發(fā)后,現(xiàn)階段唯一掌握底層資產的大模型。由于采用全國產算力,科大訊飛逐漸成長為中國人工智能“國家隊”。“全棧中國算力”的意義并不僅僅僅是為應對偶發(fā)性的地緣沖突,更是證明技術不會被卡脖子,安全可控,開發(fā)者可以繼續(xù)沿著這條路奮力耕耘。另外發(fā)布會的一條暗線是,星火大模型正在朝著應用落地方向快速成熟,意味著應用者未來可以在國產生態(tài)中繁榮。
02掌握自主“know how”,是國產模型的新內核
【1】成為大模型國家隊的前提是know-how
我們沒有發(fā)明計算機,但是我們依托摩爾定律成為全世界最大的計算機制造商,我們沒有發(fā)明互聯(lián)網,但是我們依托高帶寬成為全球領先的移動應用市場。但過往的榮光根植于漸行漸遠的全球化時代,那時我們只要完成產業(yè)鏈分工的一個環(huán)節(jié)即可。
當時當下,不管是脫鉤斷鏈、小院高墻,都力證全棧自主化的緊迫性和必要性。在AI大模型的競爭中,英偉達向全球AI參與者輸出了工程能力,依托CUDA和英偉達的解決方案,市面上所有的玩家只要有錢,都可以構建百卡、千卡乃至萬卡的計算集群。我們可以依托英偉達做出更強的模型,更強的應用,只不過底層的Know-how和產業(yè)運行邏輯還是掌握在英偉達、OpenAI們手里。另外,現(xiàn)階段AI的發(fā)展,越來越受限于數據安全。畢竟大模型的訓練依托的就是優(yōu)秀的數據、語料,而對于企業(yè)而言,數據是最核心的生產要素之一。對于國家安全、產業(yè)自主來說,擁有一套屬于自主可控的模型,也越發(fā)重要。
算力即國力的后半句應該是,模型安全即國家安全。隨著美國對大模型出口也開始嚴格限制,這層窗戶紙已經被捅破。因此,現(xiàn)階段我國真正需要的是,掌握AI大模型最底層的Know-how,掌握AI從基礎算力層到應用層全部的運行邏輯,包含每一顆芯片、每一行代碼、每一個數據。
【2】如此,才能成為產業(yè)放心的基座
對國計民生的重要行業(yè)、尤其是中國國企陣營而言,我們需要一支具備中國科技發(fā)展結晶的國家隊來為企業(yè)AI轉型護航。在大模型之前,科大訊飛就承擔了國家發(fā)改委、工信部、科技部和中科院的多項國家戰(zhàn)略任務。而近兩年來,全棧國產化的“訊飛星火”大模型,速度和能力都持續(xù)領跑業(yè)界,因此自然成為央國企轉型AI時的首選。
2024年10月14日,中國海油攜手科大訊飛、中國電信打造的“海能”人工智能模型正式發(fā)布,為解決央企在垂直領域核心痛點問題,共推出具有海油特色的5個專業(yè)場景模型和6個通用場景模型.專業(yè)場景模型針對海上油田穩(wěn)產增產、安全鉆井、海工制造、設備維護、LNG(液化天然氣)貿易、油氣銷售等場景,構建數據驅動、業(yè)務協(xié)同的新模式,進一步提升產業(yè)數智化水平。通用場景模型針對招標采辦、員工健康、輔助辦公等需求推出智能應用,助力業(yè)務管理和辦公效率提升。
其實不僅僅是中海油,中國移動、交通銀行等等行業(yè)標桿性的央國企都選擇與科大訊飛合作共建大模型。截至目前,訊飛已經與央國企及20多個行業(yè)的頭部企業(yè)一起發(fā)布行業(yè)大模型,覆蓋300多個應用場景。在積累百余個行業(yè)應用經驗之后,訊飛星火4.0Turbo的行業(yè)能力也將再次升級,懂得了更多的行業(yè)know-how,成為“最懂行業(yè)”的大模型。
第三方數據顯示:在2024年大模型的招投標中,科大訊飛的中標數量(91個中標項目)和中標金額(8.5億元)均位居第一,成為2024年度大模型中標項目的“標王”,涵蓋了通信、金融、能源、教科、政務、醫(yī)療等多個行業(yè),且主要以央國企客戶為主。
03星火X1帶動中國率先進入深度推理時代
過去,科大訊飛一直堅持“技術頂天,應用立地”的發(fā)展戰(zhàn)略,引領大模型規(guī)?;瘧寐涞?,以期早日達成AI生態(tài)的閉環(huán)。早在公司2023年的年報中,公司就用一張“業(yè)務全景示意圖”,描繪了訊飛對于其AI生態(tài)的愿景規(guī)劃:基于全棧自主化的核心AI技術,賦能C端、B端、G端,最終實現(xiàn)共贏。
從時間維度上應用落地的緊迫性正在與日俱增。2025年隨著AI正式進入推理紀年,全行業(yè)都需要回答該如何收回天量的投資,答案是唯有應用。而星火X1的重磅推出,正在將訊飛在一年前擘畫的愿景,描繪成清晰的應用落地商業(yè)化路線。比如在訊飛傳統(tǒng)優(yōu)勢的教育、醫(yī)療行業(yè),星火X1起到了點睛的作用。去年,訊飛就聯(lián)合中國教育科學研究院,發(fā)布了基于“問題鏈”的高中數學智能教師助手,同時也正面向全國百個試點區(qū)域、聯(lián)合千名優(yōu)秀教研員和老師打造上萬個優(yōu)秀案例。
目前,星火X1已經部署上述試點區(qū)域,X1在一題多解、教學知識關聯(lián)、拓展學生高階思維等方面表現(xiàn)出色,得到一線老師的高度認可。我們也不難推斷,在訊飛的拳頭產品AI學習機上,具備“慢思考能力與深度推理能力”的星火X1,馬上將成為學生和家長的得力助手,AI學習機學習推薦和診斷將變得更加精準,解題思路和知識鏈條將更加清晰。
醫(yī)療領域,訊飛星火X1的模型策略已取得初步驗證成效,專科輔助診斷和復雜病歷內涵質控的準確率均達90%,發(fā)布會上,訊飛還宣布將在今年上半年正式發(fā)布基于訊飛星火X1的醫(yī)療大模型升級版,在更大范圍為醫(yī)生提供更專業(yè)更高水平的輔助。不僅僅是教育和醫(yī)療,X1大幅提升了訊飛的AI引力,加速AI生態(tài)的成形:
B端,X1能夠加速在教育、醫(yī)療、汽車等已有場景的的商業(yè)價值閉環(huán),此外還能提升其他垂直行業(yè)的用戶體驗和產品滲透率,去展望更大的想象空間;
C端,學習機、文檔、翻譯等標準化產品更貼近使用習慣,將惠及更多的消費者。
G端和央國企側,X1還能幫助訊飛做深做透,實現(xiàn)更好的降本增效。
技術迭代,產品落地,并實現(xiàn)了多端共振的正反饋,商業(yè)化路徑自然會逐漸清晰。
04中國AI國家隊的星火征程
AI是歷史級的科技革新,沒有人能夠躲過時代的浪潮,我們能做的只是順勢而為、踏浪前行。從2023年爆發(fā)至今AI的突飛猛進滿打滿算不到2年,未來精彩只會更多,當然風浪也會越大。歷史總是在風雨飄搖中前行,有幸的是,這一次我們抓住了船舵,掌握自己的命運,同時也有了競爭的底氣。星火燎原的征程,我們已經和訊飛一起開拔。