GPT能為自動駕駛帶來什么?毫末給出了答案|鈦媒體焦點_熱訊
“在 AI 技術生態(tài)上,生成式大模型已成為自動駕駛系統(tǒng)進化的關鍵,基于 Transformer 大模型訓練的感知、認知算法,將逐步在車端進行落地部署?!?
在最新的毫末 AI DAY 上,毫末智行董事長張凱給出了這一判斷,并基于這一判斷發(fā)布業(yè)內首個自動駕駛生成式大模型 DriveGPT,中文名“雪湖·海若”。
自去年年末以來, GPT 的熱度一直高漲不下,尤其是 ChatGPT 的大火更是引發(fā)全行業(yè)關注。此前,GPT 多應用于文本生成、代碼生成或是搜索領域,但由于缺乏數據支撐,GPT 在自動駕駛行業(yè)這一垂類的應用并不高。
(相關資料圖)
截至目前,業(yè)內也僅有毫末一家率先將 GPT 應用到自動駕駛領域,即 DriveGPT 雪湖·海若。
DriveGPT 能為智能駕駛做什么?
GPT 的全稱是生成式預訓練 Transformer 模型,本質上是在求解下一個詞出現的概率。即根據輸入的前序文本,模型會輸出可能出現的下一個字的幾率分布,再從中取樣出幾率較高的字。如此循環(huán)往復,直到完整地寫完下文。
據官方介紹,DriveGPT 雪湖·海若的底層模型采用 GPT(Generative Pre-trained Transformer)生成式預訓練大模型,與 ChatGPT 使用自然語言進行輸入與輸出不同,DriveGPT 輸入是感知融合后的文本序列,輸出是自動駕駛場景文本序列,即將自動駕駛場景 Token 化,形成“Drive Language”。
Drive Language 基于毫末的 CSS 場景庫理論,將駕駛空間進行離散化處理,每一個 Token 都表征場景的一小部分,相當于許多個可能在未來出現的平行宇宙,最終完成自車的決策規(guī)控、障礙物預測以及決策邏輯鏈的輸出等任務。截至目前,毫末從真實駕駛場景庫中提取的token序列,規(guī)模達到 50 萬個。
有了 Drive Language,毫末就可以用人類駕駛的數據對模型進行預訓練。
首先,在預訓練階段通過引入量產駕駛數據,訓練初始模型,再通過引入駕駛接管 Clips 數據完成反饋模型(Reward Model)的訓練,然后再通過強化學習的方式,使用反饋模型去不斷優(yōu)化迭代初始模型,形成對自動駕駛認知決策模型的持續(xù)優(yōu)化。
同時,DriveGPT 雪湖·海若會根據輸入端的提示語以及毫末 CSS 自動駕駛場景庫的決策樣本去訓練模型,讓模型學習推理關系,從而將完整駕駛策略拆分為自動駕駛場景的動態(tài)識別過程,完成可理解、可解釋的推理邏輯鏈生成。
毫末智行 CEO 顧維灝表示,毫末 DriveGPT 雪湖·海若通過引入駕駛數據建立 RLHF(人類反饋強化學習)技術,對自動駕駛認知決策模型進行持續(xù)優(yōu)化。據毫末方面的說法,在 RLHF 的加持下,Hard Case 通過率提升了 48%。
目前,毫末 DriveGPT 雪湖·海若實現了模型架構與參數規(guī)模的升級,參數規(guī)模達 1200 億,預訓練階段引入 4000 萬公里量產車駕駛數據,RLHF 階段引入 5 萬段人工精選的困難場景接管 Clips。
毫末方面表示,DriveGPT雪湖·海若現階段主要用于解決自動駕駛的認知決策問題。“在感知到了周圍的世界之后,怎么樣把車開得更安全,把車開得更順滑,怎么樣跟周圍的交通參與者互相博弈?!鳖櫨S灝說道。
毫末判斷,DriveGPT雪湖·海若還將在城市 NOH、智能陪練、駕駛捷徑推薦、脫困場景中得到應用,最終目標是要實現端到端自動駕駛
毫末在 AI DAY 上宣布,DriveGPT雪湖·海若將在即將量產上市的新摩卡DHT-PHEV首發(fā)。
毫末基于GPT技術的探索,毫末衍生出服務于業(yè)界的能力和新的商業(yè)模式,即向業(yè)界開放DriveGPT的能力,4月11日開放單幀自動標注服務,可降低標注成本,之后還將陸續(xù)開放駕駛行為驗證、困難場景脫困等功能。
DriveGPT 背后的支持
事實上,DriveGPT 雪湖·海若的訓練和落地,離不開算力的支持。
今年 1 月,毫末和火山引擎共同發(fā)布了其自建智算中心“毫末雪湖·綠洲 MANA OASIS”。毫末表示,OASIS 的算力高達 67 億億次/秒,存儲帶寬 2T /秒,通信帶寬達到 800G /秒。
不過,只有算力還不夠,還需要訓練和推理框架的支持,由此毫末進行了三方面升級——
一是訓練穩(wěn)定性優(yōu)化。毫末在大模型訓練框架的基礎上,與火山引擎共同建立了全套訓練保障框架,可以通過集群調度器實時獲取服務器異常,將異常節(jié)點從訓練 Task group 中刪除,再結合CheckPoint 功能,利用 VePFS 高性能存儲和 RDMA 網絡高效分發(fā),以保障 DriveGPT雪湖·海若大模型訓練的穩(wěn)定性。
二是彈性調度資源的升級。毫末構建了一個大模型持續(xù)學習系統(tǒng),數據以動態(tài)數據流的形式結合增量學習,持續(xù)不斷地將量產回傳和篩選的存量數據,傳入認知和感知 Pretrain 大模型。
三是吞吐效率的升級。在 Transformer 的大矩陣計算上,毫末通過對內外循環(huán)的數據拆分,盡量保持數據在 SRAM 中提升計算的效率;在傳統(tǒng)的訓練框架中,通過引入火山引擎提供的 Logo核心算子庫實現融合,端到端吞吐提升 84%。
另外,毫末表示,自動駕駛數據智能體系MANA架構已迎來全線升級。截至2023年4月, MANA 學習時長超 56 萬小時,相當于人類司機 6.8 萬年。
在 MANA 發(fā)布迭代一年后,在本次 AI DAY 也迎來升級,具體包括:
- 首先,MANA 感知和認知相關大模型能力統(tǒng)一整合到 DriveGPT 雪湖·海若中;
- 其次,MANA計算基礎服務針對大模型訓練在參數規(guī)模、穩(wěn)定性和效率方面做了專項優(yōu)化,并集成到 OASIS 中;
- 第三,增加了使用NeRF技術的數據合成服務,降低 Corner Case 數據的獲取成本;
- 最后,針對多種芯片和多種車型的快速交付難題優(yōu)化了異構部署工具和車型適配工具。
在視覺感知能力上,毫末對視覺自監(jiān)督大模型做了一次架構升級,將預測環(huán)境的三維結構,速度場和紋理分布融合到一個訓練目標里面,強迫模型練好內功,使其能從容應對各種具體任務。目前毫末視覺自監(jiān)督大模型的數據集超過 400 萬 Clips,感知性能提升 20%。
顧維灝舉例稱,在泊車場景下,毫末將魚眼相機也引入到視覺 BEV 的感知框架當中,魚眼圖像通過 2D backbone 提取出視覺特征,經過空間轉換映射至 BEV 空間,并在該空間下對于障礙物的輪廓邊界進行識別和測量,目前可做到在 15 米范圍內達測量精度 30cm,2 米內精度高于 10cm。
除了用自監(jiān)督大模型練內功,毫末還公開了在純視覺三維重建方面的一些進展。
毫末對 NeRF 做了升級,將視覺感知結果轉化為可用于 BEV 模型訓練的帶 3D 標注的真值數據,目前可以做到重建誤差小于 10cm。
單趟重建有時會受到遮擋的影響,不能完整地還原三維空間,因此毫末嘗試了多趟重建的方式——即將同一地點不同車輛在不同時間經過的數據合并做多趟重建,由此提升場景還原度,重建效率可提升 5 倍。
重建之后,MANA 可以編輯場景合成難以收集的 Corner Case。毫末表示,近期訓練了一個可以在靜態(tài)場景做虛擬動態(tài)物體編輯的模型,可以控制虛擬物體在場景中按照設定的軌跡運動,由此合成各種 hardcase,例如近距離回車,行人、電動車交互行為等。
2023年將是智駕產品大考之年
“2023 年智駕產品進入全線爆發(fā)期?!焙聊┲切卸麻L張凱在活動上表示。
張凱判斷,城市導航輔助駕駛產將在 2023 年將圍繞量產上車發(fā)力,主要玩家的城市導航輔助駕駛產品進入到真實用戶覆蓋和多城市落地的比拼。
其次,行泊一體和末端物流自動配送產業(yè)商業(yè)化將成為自動駕駛公司深耕的重點。在乘用車領域,搭載行泊一體功能的智駕產品將迎來前裝量產潮;在末端物流自動配送領域,末端物流自動配送車在商超、快遞等場景迎來爆發(fā),2023 年將在這些場景實現可持續(xù)商業(yè)化閉環(huán)。
在 AI DAY 上,毫末表示其城市 NOH 已在北京、保定、上海等城市開啟泛化測試,即將量產上車。張凱表示,到2024 年,毫末城市 NOH 將有序落地 100 城。
一年之內,從三座城市擴張至百城,毫末給出的目標可以說十分激進。
截至目前,毫末三代乘用車產品搭載車型近 20 款,毫末輔助駕駛用戶行駛里程突破4000萬公里,HPilot2.0 日均里程使用率 12.6%。
毫末智行透露,目前已與 3 家主機廠(包括長城)簽署定點合同,相關項目正在交付中。
結合毫末往屆 AI DAY 的動態(tài)來看,從發(fā)布中國首個數據智能體系 MANA,到建設智算中心雪湖·綠洲,再在其基礎上訓練出參數規(guī)模達 1200 億作為 DriveGPT 雪湖·海若模型,毫末的閉環(huán)思維始終貫徹其技術始末,并逐漸形成數據驅動的閉環(huán)。
正如毫末所言,2023 年將是智能駕駛沖刺之年、大考之年。這對毫末來說,這也是長久技術布局走向落地應用的關鍵時期;畢竟,毫末要在 2025 年實現城市 NOH 落地 100 城,這并不是一個簡單的事情。
(本文首發(fā)鈦媒體App,作者|肖漫,編輯|張敏)
標簽:
- GPT能為自動駕駛帶來什么?毫末給出了答案|鈦媒體焦點_熱訊
- 藏在年輕人小眾愛好里的“大生意”
- 視點!小米大師86"MiniLED電視定檔4月18日:搭載全新自研
- 多孩家庭購房新政,能否一舉解決“催生”“解困樓市”兩大難題?
- 送完禮物后應該說什么 全球信息
- 海南省4月16日舉行“5城14校”聯動招聘
- 卡住了怎么結束程序_卡住
- 新款特斯拉Model 3實車現身!顏值大漲,增全液晶儀表+旋轉屏幕?
- 環(huán)球快報:教研工作的作用_教研工作的本身意義在哪里
- 【焦點熱聞】嫂子過生日送什么禮物
- 零成本搭建一個線上24小時可直播平臺
- 活動招募|學齡前邏輯思維課程體驗活動第二波招募開始!
- 大霧黃色預警!湖南這些地方要注意_每日看點
- 光遇/Skycpdd 每日快看
- 下周最高30℃,夏之初體驗上線-今日聚焦
- 第八個全民國家安全教育日丨各地多形式宣傳普及總體國家安全觀
- 全球快資訊:英國有哪些汽車試驗場
- 【文體市場面面觀】以發(fā)展眼光看待露營經濟
- 全球熱推薦:視點|體重48公斤被約談?高校柔性關懷值得“挨夸”
- 我國防范和處置非法集資取得重要階段性成果
- 安卓地下城與勇士單機破解版_安卓地下城與勇士
- 蓮湖區(qū)民營企業(yè)服務月系列招聘活動火熱來襲!
- 智光電氣: 關于股東減持計劃期限屆滿暨后續(xù)減持計劃預披露的公告
- 中國金茂(00817)附屬完成發(fā)行2023年度第一期中期票據|環(huán)球滾動
- 每日報道:農村婚戀困局:男青年無人問津,體制內女孩難尋對象
- 今日看點:“真甜!不愧是天然氧吧,真的不錯!”
- 世界快資訊丨奧克斯空調外機嗡嗡響怎么回事?
- 廣州浪奇:廣氏菠蘿味啤酒是國內果味啤酒的首創(chuàng)品牌,先后獲得“廣州十大手信”“中華老字號”等數項殊榮|今日熱搜
- 國軒高科:光伏電站項目正在建設中
- 紫砂壺可以泡紅茶嗎 紫砂壺可不可以沖泡紅茶呢
- 韓國電信公布未來五年非基礎設施投資預算撥出12萬億韓元
- 冰墩墩設計者給北京四中學生回信:祝??蓯蹔^進的中國少
- 江蘇南通發(fā)現1人檢測結果呈陽性 系外地返通人員
- 湖南郴州報告2例香港返湘人員新冠肺炎確診病例
- 廣西百色疫情社區(qū)傳播鏈基本阻斷
- 廣西新增1例本土確診病例 本輪本土疫情累計報告確診病例
- 葫蘆島市兩醫(yī)院不再收治非綏中地區(qū)患者 就醫(yī)患者閉環(huán)管理
- 蘇州14日新增本土確診1例,無癥狀感染者3例 詳情及軌跡公布
- 2021年北京空氣質量創(chuàng)歷史最優(yōu) 首次全面達標
- 化屋村火起來了
- 國家藥監(jiān)局:“小金盾”不是質量認證標志
- 大霧!湖南18條高速通行受影響 157個收費站臨時交通管制