首頁(yè) > 智能 > 正文

    毫末智行發(fā)布生成式大模型“雪湖·海若”,自動(dòng)駕駛也需要GPT嗎?|今日熱議

    2023-04-14 14:04:58來(lái)源:智嗨網(wǎng)  

    撰文 | 小不董

    編輯 | 李信馬

    題圖 | 毫末智行


    (資料圖片)

    自動(dòng)駕駛也安排上“GPT”了。

    4月11日,毫末智行正式官宣首個(gè)應(yīng)用GPT模型和技術(shù)邏輯的自動(dòng)駕駛算法模型,中文名“雪湖·海若”。

    微軟CEO納德拉曾說(shuō):“深度學(xué)習(xí)在過(guò)去20年或10年取得了巨大進(jìn)展,大模型將是下一個(gè)大事件。”當(dāng)下國(guó)內(nèi)外人工智能技術(shù)大爆發(fā),大模型正在迅速向我們的生活中拓展延伸,相對(duì)來(lái)說(shuō),國(guó)外科技巨頭的步伐更快一步,但在自動(dòng)駕駛領(lǐng)域,毫末智行所發(fā)布的DriveGPT,卻是全球首個(gè)自動(dòng)駕駛生成式大模型,這在讓人欣喜的同時(shí),也不禁產(chǎn)生疑問(wèn):自動(dòng)駕駛也需要GPT嗎?DriveGPT是真的“為天下先”,還是噱頭居多?

    I、何為“雪湖·海若”?

    海若,出自《莊子·秋水》,河伯請(qǐng)教北海若,何謂大小之分,北海若教導(dǎo),不因天地而覺大,不因毫末而覺小。因此,毫末把DriveGPT中文名命名為“雪湖·海若”,寓意智慧包容、海納百川。

    要回答上面兩個(gè)問(wèn)題,首先要回答,雪湖·海若是不是“GPT”?

    GPT,全稱Generative Pre-trained Transformer,即生成式預(yù)訓(xùn)練大模型,本質(zhì)上是在求解下一個(gè)詞出現(xiàn)的概率,這是它的數(shù)學(xué)原理,每一次調(diào)用都是從概率分布中抽樣并生成一個(gè)詞,這樣不斷地循環(huán),就能生成一連串的字符,用于各種下游任務(wù)。

    其實(shí)在ChatGPT大火之前,GPT就已經(jīng)用在了其他領(lǐng)域,比如2021年7月的CodeX,也就是CodeGPT,可以用于代碼生成,提升寫代碼的效率,還有2021年12月發(fā)布的WebGPT,可以讓GPT利用搜索引擎,主動(dòng)搜索結(jié)果并匯總整理出答案,也就是近期微軟發(fā)布的New Bing搜索。所以,GPT本身是一種非常通用的建模范式,能應(yīng)用的領(lǐng)域非常之多。

    DriveGPT整體的訓(xùn)練邏輯和使用的算法,與ChatGPT大體相似,不過(guò)由于領(lǐng)域不同,所以只在自己的特定條件下實(shí)行,性質(zhì)不完全相同,但仍是“GPT”。

    自動(dòng)駕駛也需要GPT嗎?

    這個(gè)問(wèn)題其實(shí)在數(shù)年前就有企業(yè)進(jìn)行了探索。當(dāng)前,全球范圍內(nèi)有機(jī)會(huì)沖擊1億公里級(jí)運(yùn)營(yíng)里程俱樂(lè)部的有兩家企業(yè):一個(gè)是特斯拉,基于百萬(wàn)級(jí)車主的參與,其FSD累積行駛里程將沖向1億英里;另一個(gè)就是毫末智行。

    2019年,時(shí)任特斯拉AI總負(fù)責(zé)人安德魯·卡帕西(Andrej Karpathy)提出,特斯拉自動(dòng)駕駛要像人一樣開車,要在2021年取消激光雷達(dá),并引入“大模型”對(duì)特斯拉的自動(dòng)駕駛系統(tǒng)進(jìn)行訓(xùn)練,同年發(fā)布了Dojo超級(jí)計(jì)算系統(tǒng)(Dojo是特斯拉自研的超級(jí)計(jì)算機(jī)系統(tǒng),能夠利用海量視頻數(shù)據(jù),完成“無(wú)人監(jiān)管”的標(biāo)注和訓(xùn)練)。

    2020年,特斯拉宣布將基于深度神經(jīng)網(wǎng)絡(luò)的大模型引入其自動(dòng)駕駛之中,到現(xiàn)在已實(shí)現(xiàn)了純視覺FSD Beta的大規(guī)模公測(cè)。特斯拉FSD系統(tǒng)即全自動(dòng)駕駛系統(tǒng),包括了自動(dòng)駕駛導(dǎo)航、自動(dòng)變道、自動(dòng)泊車、召喚和交通燈以及停車標(biāo)志控制等功能。截止到2022AI DAY,特斯拉已在超過(guò)16萬(wàn)輛車上進(jìn)行了FSD Beta版系統(tǒng)測(cè)試,僅一年內(nèi)就訓(xùn)練了7.5萬(wàn)個(gè)神經(jīng)網(wǎng)絡(luò)模型。

    在國(guó)內(nèi),毫末智行率先引入了Transformer的技術(shù),之后也是最早建立自己超算中心的自動(dòng)駕駛企業(yè)。2021年,毫末智行在推出數(shù)據(jù)智能體系MANA的同時(shí),也宣布要借助大模型提升數(shù)據(jù)處理能力,從而加速HPilot智能輔助駕駛產(chǎn)品的進(jìn)化。

    今年1月5日,毫末智行舉辦AI DAY,在自動(dòng)駕駛數(shù)據(jù)智能體系MANA(雪湖)的基礎(chǔ)上,推出了新的智算中心MANA OASIS(雪湖·綠洲)。毫末智行董事長(zhǎng)張凱在現(xiàn)場(chǎng)說(shuō)到:“隨著自動(dòng)駕駛企業(yè)向3.0時(shí)代邁進(jìn),大模型+大數(shù)據(jù)的數(shù)據(jù)驅(qū)動(dòng)模式,成為自動(dòng)駕駛技術(shù)進(jìn)化的關(guān)鍵,而驅(qū)動(dòng)大模型和海量數(shù)據(jù)訓(xùn)練的超算中心將成為自動(dòng)駕駛企業(yè)的入門配置。”

    2、加速進(jìn)入自動(dòng)駕駛3.0時(shí)代

    如果將自動(dòng)駕駛的發(fā)展分為三個(gè)階段,那么在自動(dòng)駕駛3.0時(shí)代,DriveGPT可以說(shuō)是應(yīng)運(yùn)而生。

    1.0時(shí)代是硬件驅(qū)動(dòng)的,從谷歌等科技巨頭的初代無(wú)人車開始的自動(dòng)駕駛1.0時(shí)代,這一階段硬件就是自動(dòng)駕駛的能力上限,特別是雷達(dá)傳感器,其數(shù)量越多、性能越強(qiáng),對(duì)應(yīng)的自動(dòng)駕駛智能化程度就越高。其明顯問(wèn)題就是,整車成本居高不下,改造成本動(dòng)輒上百萬(wàn);以及智能化程度較低,行駛里程較短,在100萬(wàn)公里內(nèi)。

    2.0時(shí)代是軟件驅(qū)動(dòng)的,自2016年AlphaGo戰(zhàn)勝李世石后,掀起了一陣以深度學(xué)習(xí)為基礎(chǔ)的AI技術(shù)潮,大幅降低了單車成本的同時(shí),自動(dòng)駕駛里程逐漸增加至上千萬(wàn)公里。

    圖片來(lái)源:IC Photo

    而3.0時(shí)代是數(shù)據(jù)驅(qū)動(dòng)的,AI依然是核心技術(shù),不同就在于AI對(duì)數(shù)據(jù)的要求發(fā)生了質(zhì)變,“大模型”成為新的技術(shù)基石。

    工信部數(shù)據(jù)顯示,2022上半年L2 級(jí)輔助駕駛乘用車新車市場(chǎng)滲透率達(dá)到 30%,同比增加 12.7%。中國(guó)自動(dòng)駕駛在多方也取得了突破,來(lái)自2022世界智能網(wǎng)聯(lián)汽車大會(huì)的消息顯示,全國(guó)開放各級(jí)測(cè)試公路超過(guò)7000公里,實(shí)際道路測(cè)試?yán)锍坛^(guò)1500萬(wàn)公里,自動(dòng)駕駛出租車、無(wú)人巴士、自主代客泊車、干線物流以及無(wú)人配送等多場(chǎng)景示范應(yīng)用有序開展。

    技術(shù)方面呈現(xiàn)了一個(gè)新的趨勢(shì):不再是硬件或者軟件驅(qū)動(dòng),不再是測(cè)試道路下的數(shù)據(jù)驅(qū)動(dòng),而是以真實(shí)道路行駛場(chǎng)景為核心的數(shù)據(jù)驅(qū)動(dòng),這便是自動(dòng)駕駛3.0。

    隨著用戶更高頻地開啟輔助駕駛功能,智駕行駛的行駛里程和使用頻率呈現(xiàn)指數(shù)級(jí)提升,足夠規(guī)模和多樣化的數(shù)據(jù)帶來(lái)數(shù)據(jù)積累的優(yōu)勢(shì),可以更好驅(qū)動(dòng)自動(dòng)駕駛技術(shù)的快速迭代升級(jí)。生成式大模型已成為自動(dòng)駕駛系統(tǒng)進(jìn)化的關(guān)鍵,基于Transformer大模型訓(xùn)練的感知、認(rèn)知算法,將逐步在車端進(jìn)行落地部署。基于自動(dòng)駕駛數(shù)據(jù)的大規(guī)模增長(zhǎng),以及大模型的深入應(yīng)用,也讓智算中心成為自動(dòng)駕駛行業(yè)的“新基建”。

    3、DriveGPT是怎樣煉成的?

    DriveGPT自動(dòng)駕駛認(rèn)知大模型也采用了RLHF(人類反饋強(qiáng)化技術(shù))算法,通過(guò)不斷輸入真實(shí)人駕接管數(shù)據(jù),持續(xù)優(yōu)化自動(dòng)駕駛決策模型,簡(jiǎn)單來(lái)說(shuō)就是它會(huì)借鑒海量真實(shí)駕駛數(shù)據(jù),從而做出自己的最優(yōu)解。

    不同路況、天氣和變量下,自動(dòng)駕駛?cè)绾螒?yīng)變?這就需要一個(gè)強(qiáng)大的模擬人類思維的模型,GPT相關(guān)的AI軟件就是為此而生。

    首先,把感知和認(rèn)知相關(guān)大模型能力統(tǒng)一整合到DriveGPT——也就是自動(dòng)駕駛生成式大模型中;其次,計(jì)算基礎(chǔ)服務(wù)針對(duì)大模型訓(xùn)練在參數(shù)規(guī)模、穩(wěn)定性和效率方面做了專項(xiàng)優(yōu)化,并集成到OASIS當(dāng)中。增加了使用NeRF技術(shù)的數(shù)據(jù)合成服務(wù),降低Corner Case數(shù)據(jù)的獲取成本;另外,毫末智行還針對(duì)多種芯片和多種車型的快速交付難題,優(yōu)化了異構(gòu)部署工具和車型適配工具。

    自動(dòng)駕駛中不可或缺的視覺感知上,其核心目的就是恢復(fù)真實(shí)世界的動(dòng)靜態(tài)信息和紋理分布,毫末智行對(duì)視覺自監(jiān)督大模型做了一次架構(gòu)升級(jí),將預(yù)測(cè)環(huán)境的三維結(jié)構(gòu),速度場(chǎng)和紋理分布融合到一個(gè)訓(xùn)練目標(biāo)里面,強(qiáng)迫模型練好內(nèi)功,之后面對(duì)各種具體任務(wù)都能“胸有成竹”。

    據(jù)現(xiàn)場(chǎng)演講介紹,DriveGPT雪湖·海若具有三個(gè)能力:

    可以按概率生成多個(gè)場(chǎng)景序列,每個(gè)場(chǎng)景都是一個(gè)全局的場(chǎng)景,都是未來(lái)有可能發(fā)生的一種實(shí)際情況。能把場(chǎng)景中用戶最關(guān)注的自車行為軌跡量化,也就是生成場(chǎng)景的同時(shí),便會(huì)產(chǎn)生自車未來(lái)的軌跡信息。DriveGPT雪湖·海若也很好地繼承了這種特性,在生成場(chǎng)景序列、軌跡的同時(shí),也會(huì)把整個(gè)決策邏輯鏈給輸出。

    DriveGPT雪湖·海若的一個(gè)關(guān)鍵設(shè)計(jì),就是場(chǎng)景的Token化表達(dá),毫末智行把這種方式叫做Drive Language。

    目前毫末智行Token的詞表空間是50萬(wàn)個(gè)左右,DriveGPT雪湖·海若就像一部推理機(jī)器,你告訴它過(guò)去發(fā)生了什么,它按概率推理出未來(lái)多個(gè)可能。通過(guò)對(duì)于不同場(chǎng)景“優(yōu)勝劣汰”,DriveGPT最后把參數(shù)更新到一個(gè)備份模型(Active Model)中,通過(guò)強(qiáng)化學(xué)習(xí)的方式,生成的效果就會(huì)有一個(gè)明顯地提升。

    圖片來(lái)源:毫末智行

    相比特斯拉FSD的百萬(wàn)+量產(chǎn)車下線,中國(guó)企業(yè)與之的距離相去甚遠(yuǎn)。要突破自動(dòng)駕駛的長(zhǎng)尾效應(yīng),就要不斷擴(kuò)大道路行駛場(chǎng)景。毫末智行CEO顧維灝在現(xiàn)場(chǎng)說(shuō)到:“DriveGPT雪湖·海若可以逐步應(yīng)用到城市NOH、捷徑推薦、智能陪練以及脫困場(chǎng)景中。有了DriveGPT的加持,車輛行駛會(huì)更安全;動(dòng)作更人性、更絲滑,并有合理的邏輯告訴駕駛者,車輛為何選擇這樣的決策動(dòng)作。對(duì)于普通用戶來(lái)說(shuō),車輛越來(lái)越像老司機(jī)。”

    4、大考之年,枕戈待旦

    2022年,中國(guó)市場(chǎng)乘用車高級(jí)別輔助駕駛前裝搭載率升至29.40%,前裝標(biāo)配交付585.99萬(wàn)輛。毫末智行曾在去年預(yù)估,到2025年高級(jí)別輔助駕駛搭載率超過(guò)70%。這意味著從今年開始,智駕產(chǎn)品進(jìn)入一個(gè)快速增長(zhǎng)的全線爆發(fā)期。

    這也說(shuō)明,城市導(dǎo)航輔助駕駛產(chǎn)品在2023年將圍繞量產(chǎn)交付發(fā)力,幾個(gè)主要玩家的城市導(dǎo)航輔助駕駛產(chǎn)品將會(huì)進(jìn)入到真實(shí)用戶交付和多城市并行落地的比拼中。其次,行泊一體和無(wú)人車的商業(yè)化將成為自動(dòng)駕駛公司深耕的重點(diǎn)。搭載低成本行泊一體功能的智駕產(chǎn)品將迎來(lái)一個(gè)前裝量產(chǎn)的高潮,高速導(dǎo)航輔助駕駛、自主泊車等產(chǎn)品的體驗(yàn)也會(huì)迎來(lái)全面升級(jí),車主的使用頻率和滿意度將成為產(chǎn)品競(jìng)爭(zhēng)力的主要衡量標(biāo)準(zhǔn)。

    在這些趨勢(shì)之下,毫末智行迎來(lái)了它的沖刺大考之年。

    圖片來(lái)源:毫末智行

    據(jù)了解,毫末智行DriveGPT雪湖·海若大模型的成果將首發(fā)落地在搭載毫末智行HPilot3.0的新摩卡DHT-PHEV上,此款車型上市后,我們就能看到,DriveGPT是否真的能提供優(yōu)秀的駕駛體驗(yàn)。

    圖片來(lái)源:毫末智行

    “很多人問(wèn)我,為什么毫末智行要探討雪湖·海若?背后是毫末智行踏踏實(shí)實(shí)的在做技術(shù),踏踏實(shí)實(shí)的實(shí)現(xiàn)未來(lái)。毫末智行成立到現(xiàn)在接近三年半時(shí)間。這三年多時(shí)間,很多事物都發(fā)生了變化,但是毫末智行對(duì)技術(shù)的堅(jiān)定投入始終未變。我們始終熱愛技術(shù),枕戈待旦,全力沖刺。再難,我們都不會(huì)放棄。”顧維灝總結(jié)道。

    標(biāo)簽:

    相關(guān)閱讀

    相關(guān)詞

    推薦閱讀

    精品亚洲成a人片在线观看少妇| 亚洲精品国产第一综合99久久| 亚洲av无码片区一区二区三区| 亚洲成AV人片在线观看ww| 亚洲精品成人在线| 亚洲国产精品一区二区九九 | 国精无码欧精品亚洲一区| 亚洲中文字幕无码爆乳av中文| 国产亚洲精品美女| 久久久久久久久无码精品亚洲日韩| 亚洲综合色一区二区三区| 亚洲综合无码无在线观看| 亚洲人成人网站18禁| 亚洲精品成a人在线观看夫| 亚洲国产美女精品久久久| 久久精品国产亚洲AV电影网| 亚洲av片在线观看| 夜色阁亚洲一区二区三区| 亚洲XX00视频| 亚洲日本一区二区一本一道| 久久精品夜色噜噜亚洲A∨| 亚洲中文字幕无码中文字在线| 亚洲深深色噜噜狠狠爱网站| 亚洲精品无码专区久久久| 亚洲av午夜福利精品一区| 亚洲影院在线观看| 亚洲宅男天堂a在线| 2019亚洲午夜无码天堂| 亚洲色成人网站WWW永久四虎| 亚洲国产aⅴ成人精品无吗| 日本中文一区二区三区亚洲| 国产啪亚洲国产精品无码| 九月丁香婷婷亚洲综合色| 亚洲福利视频一区| 亚洲欧洲日产专区| 亚洲一本一道一区二区三区| 日韩成人精品日本亚洲| 国产亚洲色视频在线| 久久精品国产亚洲av四虎| 亚洲自偷自拍另类图片二区| 国产亚洲sss在线播放|