作者 | 張祥威

(資料圖片)

編輯 | 德新

落地城市NOA的第一關

落地城市NOA，是今年最重磅的自動駕駛大戰。而BEV感知，目前看來是通往城市NOA的必經之路。

年內落地BEV，已經是國內自動駕駛頭部玩家的共識。

其實，BEV是很早就提出的算法，又稱鳥瞰圖或上帝視角。直到近幾年，特斯拉將其用于自動駕駛領域，國內車企隨之布局，才受到更多關注。

國內涉足BEV的，造車新勢力有小鵬、蔚來、理想等，科技公司有百度、華為、毫末智行等。

尤其今年4月，國內新能源汽車龍頭比亞迪宣布年內落地BEV，將大戲推向高潮。

為何要落地BEV？主要是自動駕駛場景發生了變化。

高速場景相對簡單，城市場景更為復雜，感知任務規模大幅增加，需要更多地利用深度學習。

感知層面，傳統的2D檢測已經力不從心，只有BEV能更好地完成城市場景感知任務，并為下一環節的規劃、控制打好基礎。

落地BEV，最直觀的檢驗就是城市NOA功能能否在多個城市大規模推送。這場感知算法的重大轉變，考驗的是車企的算法自研功底。

一、進入城市，BEV感知算法興起

故事從特斯拉重寫Autopilot軟件代碼開始。

2019年，特斯拉推出高速場景下的NOA（Navigate on Autopilot），小鵬、蔚來等造車新勢力緊隨，興起了一小股高速NOA技術潮。

直到2020年8月，馬斯克透露，團隊正在重寫Autopilot的底層代碼。

又過了兩個月，特斯拉推出 FSD Beta ，可以支持在城市道路場景下的NOA。支撐城市NO功能的，便是全新的BEV感知算法。

為什么會出現這一變化？

毫末智行技術副總裁艾銳告訴HiEV，“在特斯拉推出BEV之前，大家使用的是前視相機，周視用的很少。高速上，車密度不大，側后方用一些雷達也夠了。進入城市后，車流量開始密集，僅看正前方也不夠了。BEV的出現， 核心在于需要做360度的感知。

” 特斯拉重寫代碼的同年，蔚來和小鵬也開始轉向。

蔚來引入原Momenta研發總監任少卿，任的背景是計算機視覺研發，加入蔚來后負責算法團隊，開始在Mobileye方案外啟動自動駕駛自研。

小鵬也開始研發基于XNet的BEV感知架構。2021年的1024科技日上，吳新宙透露，在過去6個月里，每一個預測和規劃代碼全是重寫的。

對于兩家重寫代碼這件事，均勝電子副總裁郭繼舜向HiEV表示，“周期性重寫代碼是對產品和系統認知提升后的必然階段。在工程化方面，該踩的坑基本都要踩一遍，大家都需要階段性更新代碼和架構。

” 從已有信息看，基于BEV研發全新算法，小鵬們的做法相似。大家均是從靜態BEV網絡算法、動態BEV網絡算法部署算法。

靜態BEV解決的是道路結構還原，感知對象是車道線、道路邊界、停止線，可以解決部分攝像頭被遮擋、車道線模糊等問題。

動態BEV解決的是交通參與者的還原和預測，感知對象車輛位置、姿態、尺寸、速度，可以在車輛同時出現在多顆攝像頭視野內，可以穩定地追蹤和感知出物體的距離和速度。

在BEV出現前，傳統2D檢測的好處是整個計算非常直觀，但整個投影過程都是使用軟件的方式，沒辦法形成端到端，會出現信息丟失、誤差等問題。

BEV的到來，將讓小鵬們獲得更強的360度感知能力。不過，這里面的難度并不小。

二、復雜的代碼，以及昂貴的數據標注

BEV，全稱Bird’s eye view，本質上多個目標前融合感知方案。

簡單理解，它是將攝像頭等傳感器采集的2D為主的圖像數據，轉化為3D坐標空間下的數據，從而實現對物理世界的真實還原。

特斯拉的做法大致是：

基于純視覺，利用8個攝像頭采集數據，通過深度學習的主干網絡Backbone對各個攝像頭進行特征提取，再通過Transformer將2D圖像轉化為3D空間。

應用的技術并不新潮。

Backbone的本意是人的脊梁骨，在深度學習中被引申為主干網絡的意思，其主要作用是就是提取圖像的特征。

Transformer最早在2017年由谷歌提出，是利用注意力機制（Attention）來提升模型訓練速度的模型。將Transformer發揚光大的是GPT，也就是Generative Pre-trained Transformer。

通過BEV和Transformer，特斯拉開始獲得全新的“上帝視角”下的數據。并在此基礎上為數據加上了時間戳，形成了4D空間。

以用于對目標物測速，乃至對目標物的運動軌跡進行預測。

可以說，BEV改進了自動駕駛看物理世界的視角，可以更高效、準確地獲取感知數據，這為后面的規劃和控制提供了基石。

國內的自動駕駛玩家已經認可了這種方式，并且紛紛布局。

與特斯拉不同的是，國內玩家之前的方案中，在攝像頭之外增加了更多的傳感器和定位系統，比如超聲波雷達、激光雷達、高精度地圖等。

方法論相似，挑戰在于融合困難，以及更多的代碼量、數據標注工作。寫代碼是一項繁重的任務。

小鵬汽車自動駕駛副總裁吳新宙披露，城市NGP的代碼量是高速NGP的6倍、感知模型數量是4倍、預測、規劃、控制相關代碼量是88倍。

為BEV的數據進行標注，同樣需要大量的工作。

舉個例子，要構建實時語義地圖，需要對數據進行結構性訓練，基于BEV模型做數據的標注、分割、分類。僅標注一項，根據毫末智行CEO顧維灝預測，BEV的模型大概需要標注1億公里的數據。

據了解，數據標注行業單人單月的綜合成本約為四千元，千人規模的標注團隊一年成本要達到1億元。

一位從事數據標注的業內人士向HiEV表示， “要標注1億公里的數據，實際上會有失效率，按照50%的失效率計算，假定都是簡單場景，每人每天標注2km，需要一萬人的團隊標注至少四年的時間。

” 好在，特斯拉已經探了路。

早前，特斯拉有一支千人規模的人工標注團隊，后來開始增加自動標注和虛擬仿真等工具。

對此，上述數據標注從業人士表示，“特斯拉的自動標注是行業風向標，其預標注技術目前行業最優。加入自動化標注模型后，假定可以提效80%，可以將1萬人團隊的標注時間縮減到一年。

” 小鵬、毫末智行等已經感受過人工標注的成本之昂貴，開始探索自動標注。其他各家，也可以進行借鑒。

三、BEV帶來的變化：方案“減配”，芯片合作更緊密

BEV帶來的第一個變化，是讓自動駕駛配置開始縮減。

在沒有布局BEV之前，國內車企是最早通過高精地圖來實現自身定位。車規級激光雷達成熟后，車企又加入了激光雷達。

布局BEV算法后，一些車企們開始由原來的堆砌配置，轉為縮減配置。

大家發現，BEV可以實時生成語義地圖，進而替代高精度地圖，甚至還可以去掉超聲波雷達。

事實上，小鵬早期并不打算去高精度地圖。

吳新宙曾提到，對于城市場景，高精地圖的鮮度非常關鍵，小鵬汽車正在和高德地圖一起努力，希望發布的時候能夠做到天級更新高精度地圖的能力。

不過，耗資幾千萬可以買下高速道路的高精度地圖，但要買下城市場景下的高精度地圖，費用又是另一個級別。

更何況，獲取地圖審批資質的效率，也會耽誤自動駕駛向多個城市推送的進程。最終，車企們不得不進入自動駕駛的縱深地帶，利用技術甩掉高精度地圖的拐杖。

這里面也有一定挑戰。

“BEV去高精度地圖，很多公司不一定能搞定，需要做大規模的云端場景重建、自動化的元素提取。另外，純拓撲的任務還是很難，很多時候會因為遮擋、車道線不清晰而難以實現。”宏景智駕高級工程經理柴可寧告訴HiEV。

至于BEV是否會去掉激光雷達？

特斯拉的答案是， 利用Occupancy占用網絡，以及4D毫米波雷達的點云信息，就能替代激光雷達。

國內是另一重景象。

國內目前尚未興起去激光雷達的苗頭。艾銳認為，激光雷達不會由于BEV算法的出現而被替代。

“在夜間，攝像頭根本看不見。激光雷達是一個物理傳感器，可以主動發射信號。對高端車型來說，可以讓車輛多一重安全性。對于中低端產品來說，成本相對較高，只有追求極致性價比，才會去傳感器。”他解釋道。

其實，基于純視覺還是多模態，本質上不是技術問題，而是一個商業成本問題。從技術角度，多模態的效果肯定更好，但從成本角度，多模態的上車搭載量會少。

BEV帶來的第二個變化，是需要芯片廠商更好地適配，與車企形成深度合作。

因為，BEV方案比較考驗芯片對于算子的支持能力。

除了特斯拉采用自研FSD芯片外，頭部自動駕駛玩家更多地 基于英偉達Orin X落地BEV方案，且以雙Orin X為主，算力高達508TOPS。

對此，艾銳表示，“英偉達的芯片基礎計算單元是CUDA，非常小，也非常靈活，對算子的支持能力非常強。”

而如果算力小了，要實現同樣的幀率，就需要做特別的算子優化。

事實上，一套標準的BEV算法，現在的很多芯片都不支持，大家在用各種各樣的算子去替換它們，這就需要芯片廠商和主機廠深度配合。

今年4月，比亞迪在上海車展宣布基于地平線征程5的自研BEV方案將在年內量產。目前，地平線可以向車企提供BEV參考算法，且正在布局Occupancy占用網絡。雙方的合作，將是基于征程5落地BEV的首個案例。

最后，BEV技術的強大感知能力，不僅吸引了乘用車競相布局，也在商用車里面開始應用。

比如，摯途科技的BEV方案，便針對商用車型車身長、檢測盲區較大的特點，向車企提供攝像頭選型和安裝位置方案，可以實現前方300米范圍的檢測，且增加了車身和近距離的感知冗余。

頭部車企闖關BEV感知時，其他傳統車企會面臨更大的壓力。

四、后來者，自研還是外包？

對于BEV方案，發力較晚的車企其實有著更多選擇。

一種是自研。

要做BEV方案，方向大致已定。需要選一套傳感器方案，基于大算力芯片進行開發。另外，還需要自動標注閉環系統，以及用于數據訓練的智算中心等等。

時間上，做BEV的周期相對造車更短。

“主機廠從傳統2D檢測轉到BEV感知，如果要把數據準備都算上，快的話需要一年時間。”艾銳說。

投入事項明確，周期相對較短，這決定了車企可以進行自研。

我們也注意到，除上述幾家布局BEV的車企外，其他玩家也在準備入局。

今年1月，長安汽車智算中心GPU算力擴容集成項目開始招標。2月，吉利星睿智算中心在湖州長興揭牌。

另一種是與供應商合作。

如果看整個國內汽車市場，會發現自動駕駛方案供應商也有其存在價值。

除了造車新勢力覆蓋的30萬以上的高端市場外，中低端市場十幾萬以上30萬以下的車，仍然是主流。

據HiEV了解，毫末智行將基于十幾TOPS的芯片運行BEV算法，“硬件成本上，幾千塊錢就可以做到城市NOA，類似的產品很快也會出現。

” 一些之前布局L4的科技公司，比如小馬智行、元戎啟行、商湯絕影等，也在推出BEV的方案。這些公司做BEV，優勢在于之前的算法更易于遷移。

理論上，這些公司不會面臨華為向車企提供解決方案時的“奪走靈魂”的質疑。

“華為太大了，它有能力做任何事，包括造車。我們很小，而且非常開放，車企不需要擔心失去靈魂。”一位自動駕駛解決方案供應商的高管表示。

“在BEV上，我們愿意賦能車廠，是服務者的心態。很多時候，車廠對我們感興趣的就是真值系統，它一年有幾千萬的標注預算，搭載真值系統后，可以降到幾百萬，肯定會感興趣。整體上，車企對我們的感知算法很感興趣。”柴可寧說。

“從技術演進趨勢看，不是零和博弈。作為一個解決方案供應商，我們的算法、云端中心還是有一定的領先性。”商湯絕影量產行車智能駕駛研發負責人蔣沁宏表示。

如果車企不想重復造輪子，至少在可見的一段時間，與解決方案供應商合作，盡早進入自動駕駛的賽道是一個好的選擇。

五、基于BEV的城市NOA，年內將落地百城

還記得2020年下半年，蔚來推出基于Mobileye的高速NOP功能，小鵬則基于英偉達Xavier推出了高速NGP。

如今，三年時間不到，大家又開始比拼基于BEV感知架構落地城市NOA的效率。

一個例子可以看出各家競爭的激烈。

最近，小鵬發布了一項名為“通勤模式”的功能，又被稱為微縮版城市NGP，可以在無圖方案的四五線城市使用。

“聽說我司預告城市通勤模式之后，有兩家友商已經快速決策分別從宣傳和實際行動上致敬一下子。”小鵬汽車自動駕駛產品高級總監劉毅林在社交平臺上發文表示。

今年以來，各家陸續公布基于BEV的城市NOA落地計劃。

小鵬計劃今年下半年，將在大部分無圖城市開放變道、超車、左右轉能力；蔚來已經推送的Banyan2.0.0版本，切換為了BEV架構，下半年將推出帶有城區能力的NAD Beta版本；理想的城市NOA將在第二季度內開啟推送，并于年底前完成100個城市的落地推送；其他玩家，毫末智行、華為、比亞迪，也將在今年落地BEV方案。中國有600多個城市，按照各家計劃，年內將有接近六分之一也就是近百家城市可以使用城市NOA功能。

對于這些大力投入的玩家來說，有的需要維護一早立起的自動駕駛一哥的江湖地位，有的蓄勢通過城市NOA規模落地打一個后來居上的漂亮翻身仗，也有的要證明自己在自動駕駛領域也是遙遙領先，也有的要借助車企，為更大的市場立一個標桿產品，一切都將在下半年出現定論。

各家競逐城市NOA落地時，還有一家真正的巨頭正在候場。目前，特斯拉FSD Beta已經在海外城市范圍內推送，進入國內只是時間問題。

如王傳福所說，新能源汽車的上半場是電動化，下半場是智能化。

在電動化競爭階段，大家還有傳統造車工藝可供依仗，智能化的競爭階段，將是包括BEV感知、規劃、控制，以及智能座艙等在內的各個點位的全方位競賽，更加考驗車企的軟件研發能力。經歷BEV算法落地大戰后，車企的核心技術將再次重塑。

年內BEV落地之戰：華為遙遙領先，還是蔚小理登上王座？ 環球熱推薦

一、進入城市，BEV感知算法興起

二、復雜的代碼，以及昂貴的數據標注

三、BEV帶來的變化：方案“減配”，芯片合作更緊密

四、后來者，自研還是外包？

五、基于BEV的城市NOA，年內將落地百城

相關閱讀

搜索

年內BEV落地之戰：華為遙遙領先，還是蔚小理登上王座？環球熱推薦