DeepSeek 的熱度,終究還是被車圈蹭上了。
當(dāng)我們還在跟 DeepSeek 互噴服務(wù)器繁忙的時(shí)候, N 個(gè)國(guó)內(nèi)的車企就跟商量好了似的,先是嵐圖,后是極氪,緊接著就是智己、寶駿和比亞迪。
之后甚至人傳人到了斑馬智行和億咖通這些做車機(jī)的企業(yè),都一個(gè)接一個(gè)的表示,自家的產(chǎn)品已經(jīng)和 DeepSeek 最新的 R1 模型合體了。
而就在脖子哥寫稿的時(shí)候,這個(gè)名單還在變長(zhǎng)。
不知道大伙咋想啊,反正我在看到這些消息的時(shí)候,腦子里就是一連串的問號(hào):
把 DeepSeek 用在車上有啥意義?他們說的深度融合到底是個(gè)啥形式?車載版本的 DeepSeek 和網(wǎng)頁(yè)版又有啥區(qū)別?
當(dāng)然最重要的靈魂拷問是,這些車企們,到底是不是只是為了營(yíng)銷的熱度在硬蹭 DeepSeek ?
你別說,在狠狠研究了一番以后哥們已經(jīng)有結(jié)論了。說人話就是, DeepSeek 的成功對(duì)汽車行業(yè)確實(shí)有用,但壓根不是上頭這些車企這么用的。
至于為啥,我們慢慢來看。
首先第一個(gè)問題,車企們是怎么把 DeepSeek 放到車上的?
可以肯定的是,大家都沒有選擇在車機(jī)里裝 app 這種最直給的方式。因?yàn)閺母髀沸侣劯謇锟梢钥吹剑蠹叶继岬搅?DeepSeek-R1 模型和自有模型在底層算法上的融合,部份品牌還提到了模型蒸餾的技術(shù)。
再加上一家名叫思必馳的云端大模型服務(wù)公司,前一陣也官宣了自己在云端模型里融合了 DeepSeek 模型,給像是長(zhǎng)城、比亞迪這樣的車企提供云端 AI 助手的支持。
基本可以確定目前上車的 DeepSeek-R1 ,大概率會(huì)是以下兩種形式之一:
一是通過 DeepSeek 的 MIT 開源協(xié)議,在自家的服務(wù)器上布置滿血版或是蒸餾后的 R1 模型,然后通過微調(diào)融合,和自家原有的模型變成一整個(gè)大模型。車主呢,則是通過車機(jī)聯(lián)網(wǎng)來使用這個(gè)大模型的交流功能。
第二種則是通過蒸餾的方式,把 R1 壓縮成一個(gè)體積非常小的小模型然后更新到車端,讓車主就算不聯(lián)網(wǎng),也能用上 DeepSeek 的一部分功能。
這兩種方式說到底,就是給這些車上原本的 AI 模型上了一個(gè) DeepSeek 的 buff ,讓它擁有一部分 R1 的能力。
那這些模型是用來干啥的呢?其實(shí)。。。就是能讓語(yǔ)音助手說起話來更有人味而已。
是不是覺得有點(diǎn)無聊,是的,因?yàn)轭愃频墓δ芤呀?jīng)在很多新勢(shì)力車型上實(shí)現(xiàn)了。
比如之前很火理想 MindGPT 和蔚來的 NomiGPT ,對(duì)話溝通啥的不僅比傳統(tǒng)的語(yǔ)音助手更流暢,一些比較抽象的問題,比如 “ 鑿壁偷光需要判幾年 ” 這種弱智吧問題,能答上來的概率也能相對(duì)高點(diǎn)。
但要我說啊,這種用法壓根就沒發(fā)揮出 DeepSeek-R1 模型的能力,改善用車體驗(yàn)啥的就更別指望了。
你問為啥?
要知道, DeepSeek 的 R1 模型之所以產(chǎn)生了這么大的轟動(dòng),開源是一方面,最重要的還是它在訓(xùn)練的時(shí)候,很 big 膽的使用了強(qiáng)化學(xué)習(xí) + 獎(jiǎng)勵(lì)模型的方式,最終涌現(xiàn)出了超強(qiáng)的推理能力,非常適合解決困難的邏輯問題。
打個(gè)比方啊,高中班里有倆同學(xué) A 和 B ,面對(duì)同一道數(shù)學(xué)題, A 的做法是循規(guī)蹈矩的用各種公式,一步步按部就班的解題。而 B 則是管你公式這那的,自己靠著之前做過的超多題目,自己摸索出一個(gè)解法。
而這個(gè)解法,很有可能就會(huì)比硬套公式來的高效的多。就跟咱們學(xué)了高等數(shù)學(xué)再回去做高中的題似的,直接就秒了。
久而久之,相比死記公式的 A , B 同學(xué)就更能理解問題和答案之間的邏輯關(guān)系,在面對(duì)沒見過的復(fù)雜問題,比如巨難的數(shù)學(xué)和編程問題的時(shí)候,也能更快、更準(zhǔn)確的推理出正確的答案。
而這個(gè) B 對(duì)應(yīng)的,其實(shí)就是 DeepSeek-R1 的純強(qiáng)化學(xué)習(xí)的訓(xùn)練模式。
不需要像以往的監(jiān)管學(xué)習(xí)一樣一直用規(guī)則來微調(diào)和修正,只靠著做對(duì)了就獎(jiǎng)勵(lì),讓 AI 自己領(lǐng)悟推導(dǎo)過程。
這時(shí)候再回到車上的語(yǔ)音助手,問題就來了,因?yàn)樵蹅儔焊粫?huì)問它什么太復(fù)雜的問題,頂多就是問問天氣放放歌啥的。
這些功能就算不是 DeepSeek 這種級(jí)別的大語(yǔ)言模型,其實(shí)也都能解決的七七八八。只要你不是開車開一半突然就問語(yǔ)音助手:
那在體驗(yàn)上大概率就不會(huì)和現(xiàn)有的車載大模型有太大的差別。
再加上經(jīng)過蒸餾和融合之后的小模型,能力對(duì)比滿血版有著不小的閹割,對(duì)于自己本來就有自己的大模型的車企來說,再加一個(gè) DeepSeek 著實(shí)沒啥必要。
所以啊,那些著急喊出 DeepSeek 口號(hào)的車企們,我的評(píng)價(jià)是熱點(diǎn)么肯定是想蹭的, DeepSeek 上車的實(shí)際效果,肯定也遠(yuǎn)沒有宣傳里那么邪乎,大伙可以坐下了。
當(dāng)然,如果車企本來在座艙 AI 上有短板,能靠著開源的 DeepSeek-R1 做做查缺補(bǔ)漏,讓自家的模型追上一線新勢(shì)力的水平,確實(shí)也不是什么壞事。
可就像我開頭說的, DeepSeek 如果只是拿來做語(yǔ)音助手的話,那屬實(shí)是有點(diǎn)浪費(fèi)了。畢竟它更大的潛力,其實(shí)是在智能駕駛上。
就這么說吧,甭管是很火的端到端還是規(guī)則算法,如果能更多的用上 DeepSeek 的強(qiáng)化學(xué)習(xí)模式,或許就能讓能力往上提高一大截。
真不是我吹啊,大伙還記得前頭做題的同學(xué) A 和 B 么,其實(shí)類似的道理在智能駕駛上也同樣成立。
現(xiàn)在幾乎所有的主流智能駕駛其實(shí)就是那個(gè)循規(guī)蹈矩的同學(xué) A ,在訓(xùn)練模型的時(shí)候都是模仿學(xué)習(xí)為主。模仿嘛,顧名思義就是讓智駕算法能跟專家的行為示范對(duì)應(yīng),也就是模仿人類開車。
比如特斯拉、比亞迪和華為,就都會(huì)從駕駛評(píng)分比較高的車主那收集駕駛數(shù)據(jù),比如攝像頭拍的視頻喂給算法,研究車主們?cè)趺磸?A 點(diǎn)開到 B 點(diǎn),再進(jìn)行一個(gè)模仿。
很明顯,這種思路到頭來訓(xùn)練出的就是跟人類開車水平持平的智駕。但強(qiáng)化學(xué)習(xí)則完全不同,因?yàn)樗鼘W(xué)習(xí)的不是駕駛的過程,而是通過不斷的試錯(cuò),領(lǐng)悟出從 A 點(diǎn)開到 B 點(diǎn)最高效的路線。
而這個(gè)領(lǐng)悟的上限,可不就只是能讓智駕開得像人了。
要知道智駕系統(tǒng)對(duì)于環(huán)境的感知能力,其實(shí)比我們?nèi)祟愃緳C(jī)強(qiáng)很多。當(dāng)我們過路口的時(shí)候還在東張西望看前后左右有沒有障礙物的時(shí)候,智駕通過車上各種的攝像頭和雷達(dá)只要一瞬間就能看個(gè)大概。
當(dāng)我們只能單線程的先觀察、后打燈、再變道的時(shí)候,智駕也能在同一時(shí)間用一個(gè)操作搞定。
理論上,只要學(xué)習(xí)和領(lǐng)悟到位,智駕就能推理、總結(jié)出許多比人類司機(jī)效率更高、更能利用好各種車輛性能的駕駛方式。很多咱們覺得很難、用模仿學(xué)習(xí)咋學(xué)都學(xué)不會(huì)的小眾場(chǎng)景,強(qiáng)化學(xué)習(xí)可能分分鐘就能搞定。
都說現(xiàn)在的智駕是剛拿駕照司機(jī)的水平,用上強(qiáng)化學(xué)習(xí)之后,指不定真就會(huì)變成有了十幾年駕齡的超絕老司機(jī)。
當(dāng)然了,理論終究是理論,想要在智駕訓(xùn)練里大規(guī)模的用上強(qiáng)化學(xué)習(xí),依舊有不少難點(diǎn)和瓶頸。
就比如,強(qiáng)化學(xué)習(xí)的試錯(cuò)過程需要巨大的算力資源,對(duì)于國(guó)內(nèi)很多需要租算力做智駕的企業(yè)來說其實(shí)不太能搞得定。
再比如強(qiáng)化學(xué)習(xí)很容易出現(xiàn)的幻覺問題,咱們有時(shí)候在用滿血 DeepSeek 的時(shí)候會(huì)經(jīng)常發(fā)現(xiàn)它擱那胡言亂語(yǔ),本質(zhì)上就是因?yàn)閺?qiáng)化學(xué)習(xí)學(xué)的有些魔怔了,開始涌現(xiàn)出一些不符合事實(shí)的內(nèi)容。
智駕算法也是如此,如果獎(jiǎng)勵(lì)和微調(diào)的機(jī)制沒有設(shè)計(jì)到位,就很有可能幻想出 “ 需要開到天上 ” 的開法。
就算不出現(xiàn)幻覺,也可能出現(xiàn)急加速、猛剎車這種賽道開法。效率是高了,但誰的脖子和腰頂?shù)米“?這就需要車企花費(fèi)很多精力設(shè)計(jì)獎(jiǎng)勵(lì)模型,并且通過一些微調(diào)措施來限制 AI 的發(fā)揮,這就非常考驗(yàn)主機(jī)廠的算法能力了。
即使是賊早開始做智駕的特斯拉,也只有在非常少的公開資料里表示自己有在部分模塊里有限的使用了強(qiáng)化學(xué)習(xí)。
可見難度是實(shí)打?qū)嵉,而且還不小。
但我覺得啊,想要真正讓智駕的能力再上一層樓,多用強(qiáng)化學(xué)習(xí)肯定是各家未來的大方向。把強(qiáng)化學(xué)習(xí)的成果做到大規(guī)模的落地,未來可能也是繼把智駕做到白菜價(jià)之外,各家車企和供應(yīng)商們 battle 的下一個(gè)戰(zhàn)場(chǎng)。
這不比做語(yǔ)音助手啥的有意思多了嘛。
本文來源:差評(píng)
精選推薦
熱門出行排行榜
原創(chuàng)IP推薦
換一換網(wǎng)友評(píng)論
聚超值•精選
最新內(nèi)容
馬自達(dá)6和福特福克斯宣布停產(chǎn),標(biāo)志著家用轎車黃金時(shí)代的結(jié)束。隨著電動(dòng)化、智能化的推進(jìn),傳統(tǒng)燃油車企的經(jīng)典車型將逐漸退出歷史舞臺(tái)。馬自達(dá)6曾是馬自達(dá)旗艦車型,以其“Zoom-Zoom”駕駛理念和個(gè)性張揚(yáng)設(shè)計(jì)而備受贊譽(yù)。然而,由于堅(jiān)持使用自吸發(fā)動(dòng)機(jī)等原因,在技術(shù)競(jìng)爭(zhēng)中落后于渦輪增壓發(fā)動(dòng)機(jī),導(dǎo)致銷量下滑。
馬自達(dá)6 | 福克斯馬斯克在中國(guó)建立了第二座工廠,這次是生產(chǎn)儲(chǔ)能超級(jí)工廠。新型產(chǎn)品Megapack將為企業(yè)、園區(qū)等用電大戶提供穩(wěn)定的儲(chǔ)能解決方案,并參與削峰填谷來套利。特斯拉的儲(chǔ)能業(yè)務(wù)營(yíng)收同比增長(zhǎng)99.7%,并預(yù)計(jì)到2030年可賺到39.5億美元稅后凈利潤(rùn)。
馬斯克 | 特斯拉東風(fēng)本田S7純電SUV正式上市,售價(jià)25.99萬-30.99萬。價(jià)格引發(fā)爭(zhēng)議,與廣汽豐田鉑智3X相比明顯不占優(yōu)勢(shì)。S7配置強(qiáng)大,但競(jìng)品更便宜且功能更全面。銷量下滑的本田能否靠這個(gè)價(jià)格吸引消費(fèi)者?
本田S7 | 價(jià)格競(jìng)爭(zhēng)2025年鳳凰車研所發(fā)布極氪x電耗測(cè)試報(bào)告,該車型續(xù)航里程達(dá)600km,高速行駛里程387.2km。充電性能突出,從0%到100%僅需48分鐘,在極充站更快。此數(shù)據(jù)可作第三方技術(shù)參考。
鳳凰車研所 | 電耗測(cè)試特斯拉股價(jià)持續(xù)下跌,一夜蒸發(fā)2900億市值。馬斯克權(quán)力增大,但銷量表現(xiàn)差。2月份中國(guó)銷量?jī)H30688輛,同比下降49.2%。在歐洲多個(gè)關(guān)鍵市場(chǎng)的銷量也大幅度下滑,總體較去年同期暴跌46.2%。核心高管拋售股票加劇了股價(jià)下跌,特斯拉董事長(zhǎng)羅賓·丹霍姆再次拋售約3300萬至3370萬美元的股票。
特斯拉 | 馬斯克未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制或建立鏡像,如有違反,追究法律責(zé)任。
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:粵B2-20040647
網(wǎng)站備案號(hào):粵B2-20040647號(hào)-11
舉報(bào)郵箱:shenhezhiban@pconline.com.cn