極越汽車,搞了一個車圈科技圈大新聞:純視覺NOA國內(nèi)首發(fā)上路! 一段陸家嘴點到點領航輔助駕駛的實拍視頻剛剛被公開 : 視頻中極越01一鏡到底、全程不接管、帶領航輔助,而且ODD包含高速、城市以及泊車場景,全程解放用戶不用自己開。 這樣的Demo在自動駕駛行業(yè)其實不稀奇,Robotaxi早就實現(xiàn)。但令人吃驚的是,極越01的這種私家車智駕系統(tǒng),在國內(nèi)首個布局、跑通純視覺方案,不再把激光雷達作為唯一的智能駕解決方案——通常行業(yè)認為這是現(xiàn)階段高階智駕的必須條件。 中國首個,且在全球范圍內(nèi)和北美地區(qū)的特斯拉FSD處于同一梯隊。 這也是李彥宏剛剛在百度世界大會上所說“大模型重構自動駕駛”的成果和體現(xiàn)之一。 同樣是今年智能駕駛所有玩家內(nèi)卷的一個方向:視覺為主落地NOA,實現(xiàn)輕傳感器高功能落地。 只不過極越汽車和背后關系緊密的百度Apollo,也許在其他玩家還在驗證研發(fā)的階段,就要率先落地了。 最終的智駕量產(chǎn)版本留有懸念,10月27日舉辦的極越01上市發(fā)布會上,這款主打開箱即用的高階智駕產(chǎn)品即將交卷。 不過用戶疑問也隨之而來,再次引發(fā)了行業(yè)對于智駕技術路線的討論:擺脫激光雷達,靠譜嗎?極越01演示的這套智駕方案有哪些技術亮點? 純視覺高階智駕,體驗如何? 點到點領航輔助駕駛,是指在目前的人機共駕階段,絕大部分的駕駛由系統(tǒng)輔助完成,司機位的職責對車輛的行駛狀態(tài)保持時刻關注。 極越01的測試全程,包含了城市高頻使用場景,比如上海浦東區(qū)CBD,這屬于城區(qū)內(nèi)的NOA功能;還包括上下高速匝道、隧道內(nèi)的連續(xù)領航輔助,以及復雜路口的人車混行等等。 其中的基礎能力,包括自動避讓、基礎的跟車、車道保持、定速巡航等等。 更高階的能力,包括綜合考慮安全因素和通勤效率,自行變道(不用提前撥桿)、識別紅綠燈、根據(jù)導航自主規(guī)劃路線… 我們先看其中最值得關注的亮點,實測一鏡到底視頻長度約9分鐘,放在最后。 首先是隧道內(nèi)的長距離智能駕駛,在隧道內(nèi)因為GPS信號弱或離線,需要系統(tǒng)較為精準的定位能力,同時還要面對隧道內(nèi)光照條件差、周圍障礙物密集的挑戰(zhàn): 除了正常行駛之外,極越01還能自主識別進入隧道內(nèi)的分流岔路: 城市道路內(nèi),極越01除了能按照導航信息,自主規(guī)劃轉(zhuǎn)彎,還能在匯入、駛出主路的過程中,主動繞行路邊故障車輛: 以及主動避讓占道的行人、兩輪車: 高速場景下,自主進出匝道、匯入?yún)R出車流,并且主動避讓加塞車輛: 當然,極越01在路上為了保證安全,對于行人、加塞的處理方式是主動避讓,但在安全的情況下也會通行效率優(yōu)先,主動選擇更快的車道: 如果這樣的表現(xiàn)是一輛Robotaxi,那沒什么值得驚奇的。畢竟Robotaxi上傳感器類型、數(shù)量豐富,而且也擁有相對固定的線路。 但這是一輛需要考慮量產(chǎn)、交付給用戶的私家車,而且是隨機在上海核心城區(qū)挑戰(zhàn)。 是國內(nèi)第一個,很難有直接對比的參考,畢竟其他的“遙遙領先”都是在重傳感器的加持下實現(xiàn)的類似功能。 在極越01之前,全球范圍內(nèi),只有特斯拉的FSD展現(xiàn)過類似的能力。 極越CEO夏一平在這件事上是很不“謙虛”的: 行業(yè)標桿,而且一定比特斯拉FSD強。 百度Apollo自動駕駛能力賦能了這套系統(tǒng),百度智能駕駛事業(yè)群(IDG)技術委員會主席王亮進一步解釋了一下: 考慮到特斯拉FSD的數(shù)據(jù)手機幾乎全部基于北美路況,所以它真正落地中國的時候,還要面臨復雜的的泛化性挑戰(zhàn)。 擺脫激光雷達,技術上靠譜嗎? 目前,具備城市領航輔助能力的智能車,普遍常見1-2個激光雷達的配置,也有的是3個,都宣稱自己是最可靠最領先的。 但擺脫了激光雷達的智能駕駛系統(tǒng),對于不了解細節(jié)的用戶,不免產(chǎn)生疑問:多個硬件多份保障,沒有激光雷達的智駕,能靠譜嗎? 回答這個問題,首先要弄明白激光雷達在車上有啥用。 量產(chǎn)智能駕駛系統(tǒng),你可以把它看成一個AI司機,它開車的方式和人類相同,也是用眼睛去感知一切信息。這是計算機視覺學科自然而然衍生出的一個應用方向。 這個AI司機的“眼睛”,就是車端的攝像頭。而讓AI司機分辨出看到的目標、物體的“大腦”就是背后的感知識別算法。 算法的本質(zhì)是AI,而不是“if else”的判斷指令,因為你不可能窮舉世界上每一種交通參與者或場景狀況。既然是AI,它就需要大量的數(shù)據(jù)學習,作為感知識別的基礎。 但是這里有一個問題,人類看到的世界,是3維立體的,你可以憑直覺判斷一個目標的形狀、大小,距離遠近。但攝像頭捕捉到的圖像信息,卻是2維平面,同時AI又不具備和人類一樣的“直覺”。 所以從2維數(shù)據(jù)復現(xiàn)構建出3維實時場景,是純視覺智能駕駛系統(tǒng)的最大挑戰(zhàn)。當然還有另一個難題是路上的異形物、異型車層出不窮,在有限數(shù)據(jù)集上學習訓練的AI,難以完全識別覆蓋。 在算法還不發(fā)達、車端芯片算力支持還不夠的早期,給“眼神”不好的純視覺系統(tǒng)增加一種感官,就成了最好的辦法——激光雷達登場。 激光雷達發(fā)射紅外光,碰到障礙物一定會產(chǎn)生相應的回波信號,這其中自然包含了目標的形狀、大小,而通過回波時間,還能計算出距離信息。 相當于激光雷達通過“觸覺”,構建場景的3維數(shù)據(jù),給系統(tǒng)作為圖像數(shù)據(jù)外的參考補充:視覺錯檢漏檢的,激光雷達告訴你那還有一個XX目標。 但激光雷達成本高昂,目前在高檔豪華車以外,難以隨車標配。并且紅外光回波信號的噪音抑制、信號處理等等,需要占用大量系統(tǒng)資源。而且激光雷達也不是萬無一失,對于回波信號的識別,同樣由算法完成,自然也有針對它的對抗攻擊手段。 不依賴激光雷達的純視覺方案要解決的關鍵問題,就是找出能夠替代3維數(shù)據(jù)實時還原構建的視覺方法。 極越所展示的方式是OCC,Occupancy Networks,占用網(wǎng)絡。 這項技術去年在特斯拉AI Day上被首次公開應用,后來特斯拉又在CVPR 2023的workshop上做了進一步闡述。 系統(tǒng)的主要感知識別數(shù)據(jù)仍然是視覺圖像,攝像頭采集的數(shù)據(jù)通過基于Transformer的BEV網(wǎng)絡,應用自注意力機制進行特征提取,獲得當前場景各個目標的語義分割信息,并加入時序特征。 OCC的作用,是在傳統(tǒng)3D目標識別能力之上,通過體素(Voxel)化的方式理解和處理空間信息。 可以簡單理解為將場景空間分割成單位化的“方塊”,感知系統(tǒng)可以對3D空間的可通行區(qū)域進行高保真度還原。不需要考慮物體是什么,只考慮當下這個“方塊”是否被占用: OCC從根本上避免傳統(tǒng)視覺對非訓練集內(nèi)物體的漏檢問題,使模型的泛化能力大幅提升,能更好適應不同場景和環(huán)境。 而且對比激光雷達產(chǎn)生的稀疏且不連續(xù)的點云,攝像頭采集的信息內(nèi)容更豐富,更好地將3D幾何信息與語義信息融合,更準確還原3D場景。 OCC的作用,同樣提供了空間尺度下的物體大小、形狀、距離等等信息,而且不需要額外傳感器,依然使用攝像頭采集的圖像信息。 這也是極越01基于此前“純視覺為主+激光雷達”的技術路線,又開發(fā)了“無激光雷達”智駕方案的關鍵,看似沒了一項重要冗余,卻依然能夠?qū)崿F(xiàn)點到點智能駕駛可靠性的關鍵技術。 重新審視激光雷達,高階智駕新路線? 極越CEO夏一平透露,從2021年末就和王亮博士探討純視覺智能駕駛技術方案的可行性。 從用戶端來看,這樣的方案目前似乎有些激進,因為這兩年激光雷達有成為高階智駕標配之勢。 但技術端、供應鏈一側(cè)的震動,早已經(jīng)醞釀、產(chǎn)生并傳導:高階智駕普及,傳感器越來越輕,成本越來越經(jīng)濟。 之前耕耘自動駕駛、AI技術多年的玩家,比如大疆、商湯、曠視等等,今年紛紛公布智能駕駛量產(chǎn)產(chǎn)品路線,瞄準的是從2024以及后3年的新車型。 無一例外將高階智駕的普及門檻越降越低,有鮮明且統(tǒng)一的標志:入門級方案成本不過千元級,功能至少是高速NOA起步。 激光雷達在這些方案中,逐漸成為選配或非必須,“領土”退守售價更貴、規(guī)模更小的車型上。 而且其退守有加劇之勢:行業(yè)頭部玩家公布的最新方案中,純視覺系統(tǒng)實現(xiàn)的功能已經(jīng)覆蓋到城市通勤NOA。 王亮博士解釋了核心原因: “實際上,任何自動駕駛、智能汽車行業(yè)從業(yè)者都清楚,激光雷達不是自動駕駛的終局”。 這并不涉及什么“路線之爭”,只是技術發(fā)展不同階段的呈現(xiàn)。 他透露,2019年之前的嘗試證明,純視覺的方法要達到高可靠且體驗良好的自動駕駛功能,“太難了”。所以激光雷達成了系統(tǒng)必不可少的傳感器,相當于給當時“眼神不好”的AI司機,配了一根可以“觸摸”環(huán)境的拐杖。 但激光雷達也有不盡完美的地方。其一是成本高昂(目前仍在數(shù)千元級別),是量產(chǎn)智駕普及、L4落地規(guī)模上量的主要障礙;其二是激光雷達讓系統(tǒng)數(shù)據(jù)類型繁雜,數(shù)據(jù)量劇增,增添算法、算力資源負擔。 所以“擺脫掉激光雷達依賴”實際上成了所有量產(chǎn)智能駕駛玩家的主動選擇,也成了車企作為甲方的客觀需求。 這同樣也是老百姓的需求。因為1個激光雷達=至少數(shù)千元BOM成本,對于大眾消費的20萬元級或更加經(jīng)濟的車型,這樣的智駕系統(tǒng)只能是嘗鮮選配,沒法普及。這也是目前行業(yè)的普遍狀況。 智能化作為核心競爭力和產(chǎn)品價值,獲得用戶認可重視,極越和百度Apollo聯(lián)合研發(fā)純視覺方案的邏輯是: 用戶不會認為多了幾個硬件就是高級的,反而車端輕傳感器減成本方案,背后的算力、數(shù)據(jù)、算法研發(fā)投入更大,這才是更高級更昂貴的智駕方案。 但這些軟件端的研發(fā)成本不同于硬件,不是由用戶直接買單,而是攤銷進了規(guī)模化量產(chǎn)。 預售價25.99萬的極越01,想做中國智能車的一個大膽嘗試:點到點高階智駕普及到大眾消費車型,而且智能硬件標配,不選裝不加價。 并且前端方案配置清晰、后端技術體系透明。 于是這一階段比拼性價比的智能駕駛量產(chǎn)競爭幾乎已宣告結(jié)束,下一階段卷的方向更加清晰:更高的通行效率、更絲滑的乘坐體驗,和更可靠的功能安全——細節(jié)處見功夫。 不再依賴激光雷達的高階智駕,不是主觀上的激進,而是技術和行業(yè)發(fā)展到一定階段的必然和客觀體現(xiàn)。 只不過令人吃驚的是,極越展示的技術實力,讓這個標志性里程碑的到來大大加速了。 本文來源:量子位 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選