【中國智能制造網(wǎng) 行業(yè)動態(tài)】據(jù)麥姆斯咨詢報道,激光雷達(LiDAR)新銳廠商Ouster近日與Playment和Scale.AI一起宣布了一項激光雷達數(shù)據(jù)標記合作伙伴計劃,以為Ouster快速增長的客戶群(目前已超過300家,并且還在不斷增長中!)簡化并提高激光雷達數(shù)據(jù)標記的效率。Ouster希望其開發(fā)的數(shù)據(jù)標記技術不僅可以服務于Ouster的客戶,還能惠及廣闊的機器學習行業(yè)。
激光雷達也需要軟硬兼顧:結(jié)構化激光雷達數(shù)據(jù)及其標記
幾個月來,Ouster與Playment和Scale.AI合作開發(fā)了一種新的數(shù)據(jù)標記工具,利用Ouster激光雷達數(shù)據(jù)自身的2D-3D特性,將數(shù)據(jù)標記成本降低了50%,并能提供更高精度、更快速的標記以及更多的標記選項,還能大大簡化從數(shù)據(jù)捕獲到開始模型訓練的過程。
此外,Ouster還為激光雷達數(shù)據(jù)開發(fā)了一種開放格式,使客戶的數(shù)據(jù)記錄、存儲、傳輸、加載和標記變得更加簡單。Ouster開放了這種數(shù)據(jù)格式,希望產(chǎn)業(yè)其它廠商能夠圍繞Ouster已經(jīng)開始的工作進行標準化(盡管它只支持結(jié)構化激光雷達數(shù)據(jù))。這種激光雷達格式將包含在Ouster開源驅(qū)動的更新中,使客戶的OS-1傳感器數(shù)據(jù)能夠直接以這種格式記錄,以便將其轉(zhuǎn)移到Playment、Scale.AI或其他廠商進行數(shù)據(jù)標記。
結(jié)構化激光雷達數(shù)據(jù)的優(yōu)勢
傳統(tǒng)激光雷達通常采用機械旋轉(zhuǎn)單元或者是光束掃描單元。典型的機械旋轉(zhuǎn)激光雷達傾向于以非恒定的速度旋轉(zhuǎn),導致每幀的點間隔不均勻。同時,MEMS或掃描激光雷達傾向于有部分光束以非線性S形曲線掃描。這些都不利于將激光雷達數(shù)據(jù)存儲在固定網(wǎng)格中,用于2D深度學習、壓縮數(shù)據(jù)格式和易于標記。
得益于Ouster的多光束flash激光雷達設計,Ouster的OS-1傳感器能夠輸出結(jié)構化激光雷達數(shù)據(jù),其中水平和垂直角度間距就像相機一樣,始終保持不變。這就能使激光雷達輸出2048 x 64像素尺寸固定的深度圖以及每幀上的強度和環(huán)境光圖像,從而可以使用卷積神經(jīng)網(wǎng)絡,并大規(guī)模簡化圖像存儲和標記。
雖然RGB-D相機和傳統(tǒng)flash激光雷達也能夠輸出結(jié)構化深度數(shù)據(jù),但與Ouster OS-1相比,這兩類傳感器在室外環(huán)境中的探測距離、深度分辨率、視場或穩(wěn)定性都不如OS-1。不過,這些短距離結(jié)構化3D相機仍然可以從Ouster正在開發(fā)的工作中受益,Ouster鼓勵這些產(chǎn)品的制造商考慮應用Ouster的方案。
結(jié)構化激光雷達數(shù)據(jù)的標記工作流
Ouster通過與標記合作伙伴合作,在其標記工具中利用Ouster的結(jié)構化數(shù)據(jù)優(yōu)勢,大限度地降低了標記成本,提高其功能性,并顯著提高了注釋精度。例如:
- 為注釋器提供同步的2D和3D視圖,作為當前任務的直觀視覺確認;
- 在2D激光雷達圖像中注釋像素級掩碼,并使用3D點云檢查掩碼精度,通過添加或移除單個點或選擇點簇并更新2D掩碼,來優(yōu)化3D點云內(nèi)的掩碼;
- 使用3D邊界框自動生成100%準確的2D掩碼(語義或?qū)嵗指?、長方體或2D圖像中的邊界框。
一旦親身了解過這種標記流程的運行,就會清楚它有多和準確。另一種方法是為2D和3D數(shù)據(jù)復制這項工作:
從3D邊界框自動生成的2D像素級掩碼,以及2D掩碼用于優(yōu)化3D邊界框的精度。
這種方案盡可能用少的工作量和高的精度,提供了大的標記族,從2D邊界框、語義和實例掩碼到3D邊界框(2D或3D)、點云語義和實例分割。
這些意味著什么?
10~50%的成本降低和更快地標記
無需單獨標記2D和3D數(shù)據(jù)集,Ouster將所需的注釋量減少了2倍,終降低了客戶的成本。
更小的文件尺寸
Ouster的開源結(jié)構化數(shù)據(jù)格式,可將文件尺寸及其相關的傳輸成本降低97%。目前,隨著激光雷達數(shù)據(jù)量的不斷增高,以至于一些客戶需要將硬盤驅(qū)動器運送給他們的標記合作伙伴。是時候改變這一現(xiàn)狀了!
更高的標記精度
通過2D和3D格式之間標記的可轉(zhuǎn)換性,提高了2D和3D標記精度,為注釋提供了更多的視覺輔助,實現(xiàn)了100%準確的2D語義掩碼。語義分割中不再有邊界問題。
即使是商店和展廳內(nèi)的行人和汽車也能輕松準確地進行標記!更準確的標記還意味著Ouster可以在測試算法時生成更準確、可測量和有意義的指標。
動態(tài)遮罩(Rotoscoping)和綠屏摳像
這些詞匯是不是看起來有點眼熟,因為它們確實很流行。在另一個大眾產(chǎn)業(yè),幾十年來一直在投資在大型2D圖像集中生成像素掩碼的技術和工具,那就是:電影產(chǎn)業(yè)。
動態(tài)遮罩和綠屏摳像技術已經(jīng)有很長的歷史,通常是高度手動的(對綠屏摳像來說略少),是一種從相機的場景中分割演員和其它感興趣的對象以進行合成的方法。像自動駕駛和機器人產(chǎn)業(yè)一樣,它們近一直在開發(fā)利用3D相機和深度學習的自動化動態(tài)遮罩技術。
(原標題:激光雷達也需要軟硬兼顧:結(jié)構化激光雷達數(shù)據(jù)及其標記)