轉(zhuǎn)眼間,百度的 Apollo 平臺已經(jīng)公布了一年多了。這項(xiàng)聲勢浩大的自動駕駛開源計(jì)劃到現(xiàn)在為止已經(jīng)更新到了 Apollo2.5 版本。Apollo 平臺陸續(xù)開放了高精度地圖、參考硬件、云計(jì)算、視覺感知等眾多模塊。在最新的 2.5 版本中,Apollo 的方案已經(jīng)開放了高速公路上的自動駕駛能力,并開始開放車輛控制相關(guān)的模塊。
對于汽車行業(yè)來說,這個(gè)迭代速度可以說是非??炝?。
百度 Apollo 的數(shù)據(jù)開放計(jì)劃
其實(shí)除了迭代速度之外,百度 Apollo 計(jì)劃還有一個(gè)需要重視的舉措——開放數(shù)據(jù)。
自動駕駛的核心在于需要深度的 AI 算法,這又依靠海量大數(shù)據(jù)和高性能計(jì)算。數(shù)據(jù)分成原始數(shù)據(jù)、標(biāo)注數(shù)據(jù)、邏輯數(shù)據(jù)和仿真數(shù)據(jù)四個(gè)層次。原始數(shù)據(jù)由 Lidar、攝象頭、雷達(dá)、GNSS、IMU、CAN 總線等數(shù)據(jù)構(gòu)成。光有原始數(shù)據(jù)還不夠,為了做深度學(xué)習(xí)養(yǎng)料,要教會機(jī)器數(shù)據(jù)表達(dá)的是什么,這就需要標(biāo)注。進(jìn)而需要對邏輯的理解和各種模型的刻畫。要呈現(xiàn)一個(gè)完整的自動駕駛要解決相當(dāng)多的問題,還需要構(gòu)建更廣泛的場景,重組出無窮的場景,成為仿真數(shù)據(jù)。
熟悉自動駕駛的人都知道,數(shù)據(jù)是驅(qū)動整個(gè)技術(shù)優(yōu)化的核心資源。很多汽車廠商對數(shù)據(jù)十分珍視,輕易絕不愿意拿出來。
而作為一個(gè)開放平臺,百度 Apollo 數(shù)據(jù)作為重要組成部分也開放了出來。在 Apollo1.0 版本發(fā)布時(shí),就率先將百度積累多年的數(shù)據(jù)資源對外開放,包括 2D 紅綠燈檢測、2D 紅綠燈檢測及 Road Hackers 等。此后的 Apollo1.5、2.0 及 2.5 版本中,Apollo 的數(shù)據(jù)開放類型及數(shù)據(jù)量也都持續(xù)擴(kuò)大。
在今年的 3 月份,百度又公布了一個(gè)全新的模塊:ApolloScape。你可以把它看作是 Apollo 平臺下一個(gè)相對獨(dú)立的「子品牌」。它的本質(zhì)是一個(gè)公開的數(shù)據(jù)集,包含自動駕駛數(shù)據(jù)和仿真技術(shù)兩個(gè)部分。
自動駕駛數(shù)據(jù)將包括具有高分辨率圖像和像素級別標(biāo)注的 RGB 視頻,具有場景級語義分割的密集三維點(diǎn)云、基于雙目立體視覺的視頻和全景圖像。數(shù)據(jù)集中提供的圖像為通過采集系統(tǒng)每米采集一幀的方式采集,分辨率為 3384 x 2710。
百度數(shù)據(jù)采集車是配備了高分辨率相機(jī)和 Riegl 采集系統(tǒng)的中型 SUV。采集場景包括不同城市的不同交通狀況的道路行駛數(shù)據(jù),平均每張圖中移動障礙物的數(shù)量從幾十到上百不等。(例如,單張圖像中多達(dá) 162 輛交通工具或 80 名行人)
除了采集數(shù)據(jù)之外,百度還會用自己的視覺感知算法給每一幀畫面中的像素做相應(yīng)的語義分割。當(dāng)前支持的語義分割種類已經(jīng)達(dá)到了 25 項(xiàng),包括車輛、行人、自行車、摩托車、道路、交通標(biāo)識等等。這樣的分割有助于開發(fā)者可以在這個(gè)數(shù)據(jù)集中直接訓(xùn)練以及驗(yàn)證自己的自動駕駛算法。換言之這套數(shù)據(jù)集是可以讓開發(fā)者直接拿來就用的,而不用再做初始的數(shù)據(jù)解析。
截止到今年 3 月 8 日,百度共發(fā)布了包含 74555 幀視頻圖像序列及對應(yīng)的逐像素標(biāo)注和姿態(tài)文件。從今年到 2019 年底,百度計(jì)劃在數(shù)據(jù)集中陸續(xù)加入更改多傳感器支持以及更廣泛的數(shù)據(jù)覆蓋面。同時(shí),百度還計(jì)劃在今年年底引入「眾包」的數(shù)據(jù)采集模式,用于收集更多的罕見交通場景。
而在仿真技術(shù)上,百度也將逐漸開放行駛軌跡制定,駕駛決策模塊,以及感知融合和導(dǎo)航等模塊。這也是為了能夠更方便的讓開發(fā)者驗(yàn)證和訓(xùn)練自己的算法。
ApolloScape 的定位
可以明顯的感受到,百度希望通過 ApolloScape 這個(gè)數(shù)據(jù)集吸引到更多的開發(fā)者來參與到 Apollo 計(jì)劃中。但是為何要建立一個(gè)獨(dú)立的子品牌?這里有什么特殊的定位嗎?
在 4 月 24 日 ApolloScape 舉辦的一場學(xué)術(shù)峰會中,小編找到了答案:來參加會議的分享者全部是來自中、美、德、澳等國內(nèi)外的自動駕駛/機(jī)器視覺研究專家。ApolloScape 正在嘗試打通自動駕駛產(chǎn)業(yè)界和學(xué)術(shù)界,搭建自動駕駛產(chǎn)學(xué)研結(jié)合的交流平臺。
在自動駕駛領(lǐng)域一直有兩個(gè)研究方向:落地應(yīng)用和前沿學(xué)術(shù)。
落地應(yīng)用: 主要指的是汽車廠商和零部件供應(yīng)商,他們更加關(guān)注自動駕駛技術(shù)如何在現(xiàn)有產(chǎn)品上落地,以及自動駕駛會對汽車行業(yè)的商業(yè)模式產(chǎn)生怎樣的影響。
前沿學(xué)術(shù): 主要指的是一些知名高校、研究機(jī)構(gòu)或者是創(chuàng)新科技公司。他們主要關(guān)注的是機(jī)器視覺、人工智能等技術(shù)在自動駕駛推動下的技術(shù)革新。
由于落地應(yīng)用上直接關(guān)系到商業(yè)利益,因此一般情況下,汽車廠商對于數(shù)據(jù)的態(tài)度都是比較封閉的。
反倒是以高校為主的前沿學(xué)術(shù)領(lǐng)域,由于大家的目標(biāo)都是推動技術(shù)創(chuàng)新,且相互之間利益關(guān)系相對簡單。因此對數(shù)據(jù)開放的接受度很高。
其實(shí)在前沿學(xué)術(shù)領(lǐng)域,已經(jīng)出現(xiàn)過幾個(gè)自動駕駛的開放數(shù)據(jù)集了,最著名的應(yīng)該就是由德國卡爾斯魯厄理工學(xué)院和豐田美國技術(shù)研究院聯(lián)合創(chuàng)辦 KITTI。很多研究機(jī)構(gòu)都會在 KITTI 數(shù)據(jù)集內(nèi)驗(yàn)證、評估自己的視覺算法。甚至還將 KITTI 作為一個(gè)評判標(biāo)準(zhǔn)來做算法排名。
百度這次的 ApolloScape 其實(shí)與 KITTI 的定位是一致的,只不過將數(shù)據(jù)的核心采集點(diǎn)設(shè)定在了中國。由于中國在政策以及駕駛環(huán)境上的特殊性,一般的研究機(jī)構(gòu)(尤其是海外的)要是想要靠自己在中國獲得駕駛數(shù)據(jù)是非常困難的。而百度這次的數(shù)據(jù)集就是為這些研究機(jī)構(gòu)提供了便利。
Kitti,CityScapes 和 ApolloScape 關(guān)于數(shù)據(jù)實(shí)例的對比
據(jù)了解,Apollo 開放平臺還與加州大學(xué)伯克利分校在 CVPR 2018(IEEE 國際計(jì)算機(jī)視覺與模式識別會議)期間聯(lián)合舉辦自動駕駛研討會(Workshop on Autonomous Driving),基于 ApolloScape 的大規(guī)模數(shù)據(jù)集定義了多項(xiàng)任務(wù)挑戰(zhàn)。WAD 已正式于國外知名機(jī)器學(xué)習(xí)競賽平臺 Kaggle 上線 Video Segmentation Challenge(視頻場景解析挑戰(zhàn)賽),比賽中所提供的數(shù)據(jù)集中將包含大量的分段原始駕駛圖像,包含有 20+種場景標(biāo)注信息。賽事將持續(xù)到 6 月 12 日。目前已有來自全球的三十多只隊(duì)伍正式報(bào)名參加。
其實(shí)在自動駕駛領(lǐng)域,應(yīng)用和學(xué)術(shù)一直是兩個(gè)相輔相成的方向。比如在應(yīng)用領(lǐng)域的標(biāo)桿企業(yè) Mobileye,其靈魂人物 Shashua 教授同樣也擁有著很高的學(xué)術(shù)地位,從學(xué)術(shù)領(lǐng)域跳槽到應(yīng)用企業(yè)就職的人也屢見不鮮。
畢竟前沿學(xué)術(shù)的成果,最終也會落地到實(shí)際應(yīng)用領(lǐng)域,只不過是時(shí)間早晚的問題。百度這次的 ApolloScape 計(jì)劃估計(jì)也是在默默地為自己的底層技術(shù)創(chuàng)新以及人才聚集做儲備。