首頁 > 科技要聞 > 科技> 正文

訊飛星火X1單挑滿血版DeepSeek-R1,全國產(chǎn)算力單機部署!中國AI再下一城

新智元 整合編輯:太平洋科技 發(fā)布于:2025-03-05 14:41

業(yè)界唯一全國產(chǎn)算力訓出的深度推理模型,再次迎來全面升級!

時隔一個半月,星火X1在數(shù)學能力上大幅躍升,僅以70B參數(shù)規(guī)模,便追平了o1和DeepSeek-R1。

尤其是,在競賽級難題上再攀高峰。就中小學實用任務(wù),新模型更是全面領(lǐng)先DeepSeek-R1。

針對小初高中文測試集(來自2023/2024各學段考試真題/模擬題/競賽題),星火X1拿下SOTA

令人振奮的是,這一切全是在全國產(chǎn)算力平臺上實現(xiàn)的。

不用依賴昂貴的英偉達卡,星火X1用更小的規(guī)模、更少的算力,就能對標671B滿血版R1和o1,充分證明了算法創(chuàng)新在國產(chǎn)算力上的巨大潛力。

在自主可控的前提下,科大訊飛再下一城,這是中國AI的硬核自信。

從醫(yī)療到教育,從政務(wù)到司法,70B的星火X1正以更低成本、更高效率,加速釋放出行業(yè)的無限潛力。

星火X1再升級,數(shù)學登頂對標DeepSeek-R1

1月15日,星火X1首次亮相,便在多項指標媲美國際領(lǐng)先水平。此次,升級后的星火X1不僅「會算」,而且「會想」。

網(wǎng)頁端展示的解題過程,更加直觀完整,每一步的思考細節(jié)、反思邏輯、結(jié)論整合都一覽無余。

同時,星火X1在中小學數(shù)學作業(yè)的批改、輔導以及題目推薦等任務(wù)上,已經(jīng)展現(xiàn)出明顯的優(yōu)勢。

還有新增的「識圖答題」功能讓體驗再升級,只需截圖上傳題目,即可快速獲取解答。

而現(xiàn)在,打開訊飛星火網(wǎng)頁端/APP,進入深度推理X1即可體驗。

一手實測

先上手一道簡單的——2024北京中考第4題,根據(jù)所給的一元二次方程,求解實數(shù)C。

通過左下角「識圖解題」入口,選擇題目4圖片,AI直接開啟學霸做題模式。

星火X1先是精準分析、理解了題目的條件、要求,然后用時50秒,給出了詳細的思路歷程。

首先,先從概念上拿出一元二次方程的一般形式,以及判別式Δ=b²-4ac,而且只有Δ=0,方程才有2個相等的實數(shù)跟。

它通過對照后發(fā)現(xiàn),原題目中給出的就是一個標準的方程式,由此得出了a=1,b=-4,需要求解c值。

接下來,它通過將已知的數(shù)值代入方程Δ=(−4)²−4⋅1⋅c=16−4c,最后得出了c=4,也就是選項C。

注意看,其實思維鏈截止到這里,已經(jīng)得出了正確答案。

那么,下面的思考過程又是怎么回事呢?

就像考場中的學生一樣,作為深度推理模型,星火X1也有自己的反思、驗證、自我糾正的過程。

更驚喜的是,它給出了另一種驗證方法:根據(jù)方程有兩個相等的實數(shù)根的條件,可以寫成完全平方形式,即(x - r)²=0(r是重根),展開方程式得到x² -2rx +r²=0。

然后再和題目中原方程比較,便可以得到r=2,常數(shù)c=r²=4。

最終,通過兩種方法得出了一致的結(jié)果,讓答案更加可靠。

在給出解答中,星火X1用了中學知識點中更為常見的方法,即思維鏈第一種,給出了翔實、讓人易懂的求解過程。

再拿一道高中的概率統(tǒng)計題考考它:

已知隨機變量X服從指數(shù)分布,其參數(shù)λ=0.3,求P(X>2)

收到題目后,星火X1很快就看出「這個題目看起來應(yīng)該是概率論里的關(guān)于指數(shù)分布的問題!谷缓,它開始使用概率論的知識進行推導。

首先,列出指數(shù)分布的概率密度函數(shù),并注意到了λ=0.3這個已知條件。

接著,意識到了求P(X>2)實際上就是這個概率密度函數(shù)從2到∞的積分。更聰明的是,它想到這里面可能有現(xiàn)成的公式,從而不用從頭推導!

然后,它將λ=0.3代入到公式中去,很快就得出了正確結(jié)果e^-0.6。

值得一提的是,為了算出e^-0.6大概等于多少,星火X1非常聰明的先算了e^0.6的值,然后再求倒數(shù)就得到了近似值0.5488。

而在檢查過程中,星火X1則使用了多種不同的方法。比如為了驗證e^-0.6的值,它選擇了泰勒級數(shù)展開來算,直到達到一定的精度后才罷手!相當認真。

最后的答案完美的渲染出了思考及解答過程。

接著我們給它上難度,找一道關(guān)于二元一次不等式的多選題給它試試。

看完題目后,星火X1開始了詳細的思考過程,并在177秒后,給出了正確的選項。

接下來,是一道常見,但略有難度的極限題。

經(jīng)過302秒的長推理后,星火X1給出了正確答案。這么長的CoT竟然沒被截斷,屬實厲害。

甚至,就連2024年AIME2競賽級難題,也可完美拿捏。

上傳第4題,星火X1用時2分多,通過拆解問題、詳細求解、反復驗證,最終得出了33。

沒錯,最終的正確答案就是33。

這份亮眼成績單背后,離不開科大訊飛的兩大技術(shù)創(chuàng)新。

首先,通過高效領(lǐng)域數(shù)據(jù)自動化挖掘,以及多類型數(shù)據(jù)合成算法,構(gòu)建出了海量數(shù)學領(lǐng)域的預(yù)訓練數(shù)據(jù)。

其次,基于評語模型與RL算法,激發(fā)了大模型長思維鏈的能力,以及在推理過程中的反思驗證,進一步提升了推理結(jié)果的準確性。

在訊飛星火X1具備了強大的能力之后,接下來的落地階段,便要考驗?zāi)P偷男袠I(yè)適配性了。

單機部署,成本驟降

600B的超大模型效果確實很好,但部署成本高昂,讓許多機構(gòu)望而卻步。相比之下,星火X1的70B模型,則有著顛覆性的優(yōu)勢。

它不僅能夠單機運行,訓練更高效,最重要的是定制門檻低。更小的模型規(guī)模,可以讓科研單位、央國企、醫(yī)院等基于國產(chǎn)算力用上高性能AI。

具體來看,70B模型擁有700億參數(shù),若每個參數(shù)以8位浮點數(shù)(1字節(jié))存儲,則參數(shù)內(nèi)存需求為70GB。而671B模型(如DeepSeek-R1)擁有6710億參數(shù),其參數(shù)內(nèi)存需求為671GB。

單機若配備8張H800 GPU(每張80GB,總640GB),一臺不僅能容納70B模型,還能實現(xiàn)出色的并發(fā)性能。而671B的模型則需要至少2臺機器才能跑。

正如我們所見,70B含金量,不僅在于性能,更在于用更低的成本撬動更大的行業(yè)價值。

醫(yī)療、教育加速兌現(xiàn),五大場景全面開花

現(xiàn)在,全新升級后星火X1,正為各行各業(yè)的應(yīng)用,注入新動能。

星火醫(yī)療大模型X1重磅上線,AI醫(yī)療邁進「深度思考」時代

在醫(yī)療領(lǐng)域,科大訊飛首發(fā)深度推理星火醫(yī)療大模型X1,并將其正式落地旗下AI健康助手應(yīng)用「訊飛曉醫(yī)」。

這一次升級,不僅讓曉醫(yī)從「知識查詢」工具進化成「決策輔助」專家,更標志著AI醫(yī)療邁入了「深度思考」的新時代。

憑借個性化、專業(yè)化、實用化,星火醫(yī)療大模型X1以醫(yī)學專家級的推理能力取得了重大突破。

如下所示,在診斷推薦、健康咨詢、檢查檢驗報告解讀等推理任務(wù)匯中,星火醫(yī)療大模型X1一舉超越了GPT-4o和DeepSeek。

數(shù)據(jù)來源:曉醫(yī)、智醫(yī)助理、安貞心內(nèi)科等真實場景測試集

過去,AI健康咨詢往往千篇一律,難以滿足患者的個性化需求。而升級后的訊飛曉醫(yī),首次實現(xiàn)了健康檔案與AI模型的深度融合。

不論是既往病史、檢查報告,還是用藥記錄,星火醫(yī)療大模型X1都能逐一分析,深入洞察患者的健康狀況和潛在風險。

這種從千人一面,到量身定制的體驗,才能讓AI醫(yī)療真正進入每個人的生活。

比如,針對「沙庫巴曲纈沙坦能否降壓」問題,訊飛曉醫(yī)不僅明確給出回答,還會詳細說明適用人群、禁忌癥和劑量的調(diào)整建議,堪稱教科書級解答。

而像DeepSeek這樣的通用大模型,回答卻可能遺漏關(guān)鍵信息。

此外,星火醫(yī)療大模型X1還解決了「建議答案寬泛不實用」的痛點,能夠給出更加個性化、實用的建議。

隨著星火醫(yī)療大模型X1在醫(yī)療場景的持續(xù)落地,無論是患者,還是醫(yī)生,都將得到AI助手更高效、更精準的智能支持。

教師助手更會「思考」,盤活課堂教學

那么,教育又該如何擁抱AI?

科大訊飛再次給出了創(chuàng)新性答案,讓AI不僅會教,還能會想。

基于星火X1的星火教師助手,也迎來了升級,通過教學思維可視化,為老師打造從備課到課堂的全流程智能助手。

在備課時,在教學設(shè)計過程中,星火教師助手能夠結(jié)合教師意圖,明確教學重難點、要達成的目標。并且,它還做出了分步說明,幫助老師理解前后邏輯,激發(fā)靈感創(chuàng)新。

在授課過程中,它還能夠?qū)ⅰ杆季S可視化」,不論是學生對基礎(chǔ)問題提問,還是對復雜問題進階研究,都可以做到有跡可循。

比如,在合肥望湖中學的一堂歷史課上,老師拋出了一個經(jīng)典問題——如何評價武則天?

正是星火教師助手,讓這堂課變得與眾不同。

系統(tǒng)迅速調(diào)用了多模態(tài)知識圖譜,呈現(xiàn)出武周革命、《資治通鑒》等多元史料,通過語義理解和因果推理,拆解出評價的多個維度,最終生成清晰的三段論引導框架。

對此,在座的學生們驚嘆道,「原來評價歷史人物需要多維坐標系」!

智慧黑板上,AI生成的思維導圖動態(tài)展示了「統(tǒng)治功績與道德爭議的平衡考量」,ML算法構(gòu)建的認知模型讓抽象概念變得直觀可感。

這種教學方式,不僅讓歷史課從傳統(tǒng)的「背書」轉(zhuǎn)向「思辨」,更讓學生在研究中培養(yǎng)了批判性思維。

通過人機協(xié)同教學,教育生態(tài)正被悄然重塑。

星火+DeepSeek雙引擎,AI老師來了

課堂之外,家庭學習場景也迎來了革新。

科大訊飛還推出了首款「訊飛星火+DeepSeek」雙引擎學習機——T30系列。

兩個聰明大腦強強聯(lián)合,打造出一位診斷超快、推薦超準、輔導超細的「AI老師」。

基于星火的教育CoT和DeepSeek可視化CoT優(yōu)勢,這款學習機能根據(jù)孩子個性化學情數(shù)據(jù),深入剖析學習弱項,并給出清晰的推理過程。

假設(shè)孩子在一個數(shù)學題上卡殼,AI老師會用「蘇格拉底啟發(fā)式」輔導,通過語音、圖像、文字互動,引導孩子一步步找到答案,培養(yǎng)期自主思考能力。

相比原生DeepSeek,它能夠彌補教研理解不足、知識幻覺等問題,真正做到1+1>2。

在家長端,「訊飛AI學」親子助手中補充接入了DeepSeek,幫助家長與孩子有效溝通出謀劃策。

而且,訊飛AI學習機還實現(xiàn)了三大功能升級——AI 1對1精準學、AI 1對1英語口語陪練、家長端「訊飛AI學」,不僅讓孩子學習更高效。讓家長輔導更省心。

全新星火一體機,行業(yè)效率飆升

值得一提的是,科大訊飛還與華為強強聯(lián)手,發(fā)布了全新升級的「星火一體機」——4U訓推一體機和2U推理一體機。

從算力、模型、訓練、推理到應(yīng)用,一體機通過全國產(chǎn)化架構(gòu),為政企提供安全高效的AI底座。

此次升級,還深度融合了訊飛星火與DeepSeek的雙引擎能力,讓行業(yè)知識能力提升30%,模型幻覺率下降10%。

具體來說,星火一體機具備了多項核心優(yōu)勢:

面向昇騰硬件的大模型推流性能極致優(yōu)化

內(nèi)置知識蒸餾、模型微調(diào)等成套工具鏈

內(nèi)置「一站式」星火智能體平臺,三款精品智能體到手即用

面向醫(yī)療、高教、政務(wù)、警務(wù)、法律等垂類場景,訊飛還專門定制了行業(yè)一體機。

星火醫(yī)療一體機:內(nèi)置基于千億級token權(quán)威醫(yī)學知識庫訓練醫(yī)療LLM,外加20個醫(yī)療專業(yè)智能體、工具鏈,可高效學習專業(yè)數(shù)據(jù)。

星火高教一體機:內(nèi)置星火科研大模型,讓科研成果調(diào)研效率暴增10倍以上;內(nèi)置工具鏈和特色語料庫,倒灶學科大模型;內(nèi)置科研助手、智能編程等智能體應(yīng)用。

星火政務(wù)一體機:內(nèi)置各類政務(wù)服務(wù)智能體,辦件登記效率平均提升5倍以上。

星火警務(wù)一體機:內(nèi)置警務(wù)報告輔助生成系統(tǒng),生成效率飆升10倍多。

星火法律一體機:部署深度推理訊飛法律大模型,內(nèi)置法律專業(yè)智能體,支持部署法律專業(yè)工具鏈,高效學習私域數(shù)據(jù)。

自主可控,中國AI再下一城!

星火X1超進化的意義,遠不止一場技術(shù)競賽的勝利。

70B對標o1、R1的技術(shù)高度,證明了中國AI在業(yè)界唯一全國產(chǎn)化底層算力和算法創(chuàng)新上的硬實力。

頂天立地,勇攀高峰,是科大訊飛成立以來一直堅守的初心,不僅要在源頭技術(shù)上創(chuàng)新,更要在應(yīng)用落地中開花結(jié)果。

不難看出,星火X1已經(jīng)跑通了許多垂類應(yīng)用,從醫(yī)療、教育,到法律、政務(wù)等,實現(xiàn)了深度賦能。

這種「底座進步+場景兌現(xiàn)」的雙輪驅(qū)動,成為科大訊飛走向國民級市場的有力注腳。

回看DeepSeek-R1,它是國產(chǎn)大模型的一次高光亮相;而星火X1,則是中國AI的一次全面進階。

它不止于與R1比拼數(shù)學能力,更在應(yīng)用廣度和深度上,樹立了全新標桿。

從一臺國產(chǎn)機就能服務(wù)千行百業(yè),再到醫(yī)療教育的智能化躍遷,星火X1讓大模型的紅利真正惠及科研機構(gòu)、企業(yè),甚至是普通用戶。

這種普惠性和實用性的結(jié)合,正是中國AI「再下一城」的核心價值。

未來,隨著大模型迭代和應(yīng)用場景不斷擴展,星火X1的潛力還將進一步釋放。

從70B驚艷亮相,到自主可控的產(chǎn)業(yè)落地,科大訊飛用實際行動告訴世界:中國AI不僅能站得更高,還能走得更遠。

本文來源:新智元

網(wǎng)友評論

聚超值•精選

推薦 手機 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部