什么是人類視覺能做到而計算機(jī)視覺所不能的?人類從三個維度感知世界,而深度傳感器是實現(xiàn)更高級別機(jī)器視覺并釋放自動駕駛功能的關(guān)鍵。
在傳感技術(shù)最新發(fā)展的助力之下,越來越多的機(jī)器被賦予了感知、行動及與環(huán)境交互的能力。EE Times Europe團(tuán)隊對當(dāng)前3D視覺格局進(jìn)行了研究,以期更清晰地了解其市場驅(qū)動因素、元器件供應(yīng)商面臨的機(jī)遇和挑戰(zhàn),以及實現(xiàn)更高級別深度敏感度的新興技術(shù)。
往縱深發(fā)展
根據(jù) Yole Développement 的數(shù)據(jù),在模塊層面,3D 傳感市場目前市值為 68億美元,將以 15% 的復(fù)合年增長率增長,到 2026 年預(yù)計達(dá)到 150 億美元。
由于華為被禁,而且安卓陣營事實上放棄了3D傳感技術(shù),因此在移動和消費(fèi)這類主要驅(qū)動市場的增長將有暫時的中斷,Yole Développement 光學(xué)和傳感部門首席分析師Pierre Cambou告訴EE Times Europe。但另一方面,他又補(bǔ)充道,蘋果通過在 iPad 和 iPhone 中添加LiDAR 傳感器又加速了這一趨勢。
3D在汽車領(lǐng)域的應(yīng)用也在加速。LiDAR 傳感器和座艙內(nèi) 3D 攝像頭越來越多地被采用,我們對汽車市場的 3D 傳感發(fā)展非常樂觀,未來五年其市值應(yīng)該會翻四倍。(如圖1)
圖1:Yole預(yù)計汽車市場的3D傳感市值將在未來五年內(nèi)翻四倍
截至目前,較為流行的3D成像技術(shù)包括立體視覺、結(jié)構(gòu)光和飛行時間(ToF)。
Cambou指出,立體視覺在10米以外的遠(yuǎn)程傳感應(yīng)用中表現(xiàn)極佳,例如大疆等公司提供的消費(fèi)級無人機(jī)和梅賽德斯、捷豹和斯巴魯?shù)溶囆椭械那耙旳DAS 攝像頭。
結(jié)構(gòu)光技術(shù)一直是1米以內(nèi)短距離傳感的首選方案。典型應(yīng)用案例如蘋果iPhone將其用于前置面部識別。該技術(shù)也用于某些工業(yè)應(yīng)用中,如被Photoneo等公司采用。
Cambou還提到,TOF系統(tǒng)主要用于中程測距,目前主要有兩種方法。一種是間接 ToF,2019 年和 2020 年,間接 ToF 被應(yīng)用于來自華為、三星和 LG 等廠商的Android 手機(jī)的背面,主要用于拍照。另一種是直接ToF,蘋果在其最先進(jìn)的智能手機(jī)中采用了直接ToF方法。
Cambou 指出,直接ToF是LiDAR 中已經(jīng)采用的技術(shù)(如Velodyne、Innoviz、Ibeo、Hesai 和 RoboSense等公司的產(chǎn)品),但最終可能會在接收側(cè)使用矩陣形傳感器。這類傳感器由于來自自動駕駛市場的激勵,正在取得進(jìn)展。
EELs 還是 VCSELs?
LiDAR 技術(shù)捕捉整個場景的能力使其在機(jī)器視覺應(yīng)用中極具價值。獲取三維點云最常用的兩種系統(tǒng)為閃光LiDAR和掃描LiDAR。Ams-Osram全球營銷經(jīng)理 Matthias Hoenig 表示,在掃描 LiDAR 系統(tǒng)中,聚焦脈沖激光束通過機(jī)械旋轉(zhuǎn)鏡或微機(jī)電系統(tǒng) (MEMS) 鏡定向到某個小的立體角。
由于高功率激光束可以被控制發(fā)射到很小的立體角,因此與使用 3D 閃光系統(tǒng)可達(dá)到的距離相比,使用光學(xué)功率器件可達(dá)到的距離要遠(yuǎn)得多。邊緣發(fā)射激光器 [EEL] 是這種系統(tǒng)架構(gòu)的理想產(chǎn)品,它通過一個很小的發(fā)射區(qū)域在極小空間內(nèi)提供大量的光,因此在功率和射程方面均表現(xiàn)出色。Hoenig指出。
現(xiàn)在已成為Ams子公司的歐司朗宣布,隨著封裝溫度在應(yīng)用過程中上升,其激光器在波導(dǎo)穩(wěn)定性方面最近取得了不少進(jìn)展,該公司目前正在探索面向LiDAR 應(yīng)用的具有更多波長的產(chǎn)品。
Yole 預(yù)測,就激光二極管而言,EEL是目前最大的市場機(jī)會,但垂直腔面發(fā)射激光器 (VCSEL) 將會在未來迅速趕上。VCSEL可以將紅外 LED 的高功率密度和簡單封裝優(yōu)點與激光器的光譜寬度和速度結(jié)合起來。
這項技術(shù)的優(yōu)勢包括出色的光束質(zhì)量、簡單的設(shè)計和小尺寸,這也解釋了 VCSEL市場增長的原因,Hoenig說。雖然它們比 EEL 發(fā)射器需要更多的板載空間,但在某些應(yīng)用領(lǐng)域又具有優(yōu)勢。他解釋到,例如,VCSEL所具有的輻射特性使其尤其適用于閃光 LiDAR 系統(tǒng)以及工業(yè)應(yīng)用(如機(jī)器人和物流車輛等)中的主動立體視覺。
至于VCSEL相關(guān)的技術(shù)挑戰(zhàn),Hoenig 表示,Ams-Osram 正在研究更高的光輸出。繼2018 年收購 Vixar 之后,歐司朗相繼展示了比單結(jié) VCSEL 效率更高、速度更快的雙結(jié)和三結(jié)VCSEL技術(shù)。在今年的美國西部光電展(Photonics West)上,又推出了基于多結(jié)技術(shù)的 PowerBoost VCSEL 產(chǎn)品組合。該公司表示,他們還在探索改善散熱的各種方法,例如,從頂部發(fā)射組件改為底部發(fā)射組件。
Ams-Osram高級營銷經(jīng)理 Lei Tu 表示,所有常見的 3D 傳感方法都依賴于各種系統(tǒng)構(gòu)建模塊之間的順暢交互。通常,這些系統(tǒng)由光源、特殊光學(xué)器件、檢測器和相應(yīng)處理檢測信號的下游軟件組成。她還說,未來,對Ams-Osram這樣的元件制造商來說,重點將在以最佳方式滿足客戶的要求。
這包括組件的小型化、光學(xué)性能和使用壽命的優(yōu)化,當(dāng)然還有易用性。 Tu補(bǔ)充道,有些客戶喜歡現(xiàn)成的即插即用解決方案,而另一些客戶則更傾向于自己組裝單個元件,或借助第三方將它們組裝成完整的解決方案。
用于盲點檢測的深度和側(cè)面感應(yīng)
深度感知是指從三個維度看物體并測量物體距離的能力。LiDAR無疑充當(dāng)了自動駕駛汽車的眼睛,許多汽車制造商都利用它來構(gòu)建車輛周圍環(huán)境的 3D 地圖。不過,開發(fā)工作主要還是集中在具有較長檢測范圍(超過 200 米)但視野相對狹窄(約 20°至30°)的前置 LiDAR 系統(tǒng)。
2019年從德國Fraunhofer硅技術(shù)研究所 (ISIT) 獨(dú)立出來的OQmented 公司正在努力改變這種狀況。該公司表示,他們已開發(fā)出一種 MEMS 鏡技術(shù),可以使側(cè)面 LiDAR 具有 180°視野。
OQmented 創(chuàng)始人兼董事總經(jīng)理 Ulrich Hofmann 表示,側(cè)視 LiDAR 系統(tǒng)主要針對短距離盲點檢測。盲點檢測是一項重要的安全功能,它使短距離側(cè)掃系統(tǒng)比遠(yuǎn)視系統(tǒng)更有意義。
例如,在進(jìn)入一個十字路口時,您需要這些LiDAR觀察系統(tǒng)在短距離范圍進(jìn)行觀察,因為這種環(huán)境中的行人、騎自行車的人和汽車都很多,很容易混亂并發(fā)生意外。出于這個原因,不僅在廣角上有清晰的視角很重要,較高的橫向分辨率也很重要,它可以區(qū)分不同的物體,包括靜態(tài)和移動的物體。
與平面玻璃蓋不同,OQmented 在其 MEMS 鏡器件頂部放置了一個曲面玻璃蓋,用來實現(xiàn)激光束出入的封裝,并實現(xiàn) 180°激光掃描。(見圖2)Hofmann稱,這種Bubble MEMS專利技術(shù)不僅提供了密封真空封裝和保護(hù),可以免受環(huán)境污染物的影響,而且還確保了激光束成功地傳入和傳出封裝,因為激光束與玻璃的角度始終垂直。
而使用平面玻璃蓋時,情況就并非總是理想了。當(dāng)掃描角度較大時,部分光線會在蓋子處反射回封裝中。Hofmann指出,這對于任何類型的LiDAR 解決方案都是不可接受的。
圖2:Bubble MEME 技術(shù)的命名來源于OQmented MEMS 鏡器件上方的曲面玻璃蓋
更接近數(shù)據(jù)源
圖像傳感器會生成大量的數(shù)據(jù)。盡管目前大部分處理都在云端或中央處理單元完成,但其發(fā)展趨勢是使計算更接近數(shù)據(jù)源,并將智能因素嵌入傳感器內(nèi)部或附近。
Yole 公司的 Cambou 表示,通常情況下,數(shù)據(jù)采用H264技術(shù)壓縮,這意味著它可以通過 100 Mbps 的帶寬傳輸。但在傳感領(lǐng)域,數(shù)據(jù)流通常要大 10 到 100 倍——典型機(jī)器視覺數(shù)據(jù)流可達(dá)到1 Gbps ——而且,如果同時使用 10 個攝像頭,則很快會達(dá)到 10 Gbps 甚至更高。
由于CPU 不堪重負(fù),靠近傳感器進(jìn)行數(shù)據(jù)處理的必要性越來越大。如果需要,所有預(yù)處理、清理和 AI 增強(qiáng)都必須在更靠近傳感器的位置進(jìn)行,以減輕 CPU 的負(fù)擔(dān)。
但是,目前還幾乎沒有計算能夠在傳感器本身進(jìn)行,因為這會產(chǎn)生熱量,Cambou指出。
前景展望
圖像傳感器是推動自動駕駛的一個關(guān)鍵因素,但卻不能無限制地添加;因為它所需要的計算能力也會激增。Yole的分析師表示,有一種解決方案是提高數(shù)據(jù)質(zhì)量。但如果真的想解決自動駕駛問題,我們很快就會需要更多樣化的解決方案。
新技術(shù)不斷涌現(xiàn),用以提高靈敏度并構(gòu)建可以看得更清楚的機(jī)器。Cambou 指出了兩個方向:神經(jīng)擬態(tài)感知,即每個像素都充當(dāng)神經(jīng)元并嵌入一定程度的智能;以及量子成像,即單獨(dú)檢測每個光子。
總部位于法國的神經(jīng)擬態(tài)初創(chuàng)公司 Prophesee 推出了基于事件的工業(yè)級視覺傳感器:第三代 Metavision 傳感器。Prophesee 產(chǎn)品營銷和創(chuàng)新總監(jiān) Simone Lavizzari 表示:如果將Metavision 傳感器與 VCSEL 投影儀或其它可以投射合適圖案的投影儀結(jié)合使用,就可以實現(xiàn)基于事件的結(jié)構(gòu)光傳感器。 也就是說,當(dāng)今最先進(jìn)的深度傳感技術(shù)在曝光時間、精確度和穩(wěn)健性之間取得了平衡。
Lavizzari 說,將 IR 投影儀與 Prophesee 的 Metavision 傳感器相結(jié)合,可為每個獨(dú)立像素提供快速響應(yīng)時間,進(jìn)而允許直接在傳感器內(nèi)部進(jìn)行時間模式識別和提取。
如果采用基于事件的傳感器來做結(jié)構(gòu)光,響應(yīng)會非???。我們可以將掃描時間提高 50 倍,只需1 毫秒就能獲得完整的 3D 掃描,而傳統(tǒng)基于幀的方法則需要10 到 33 毫秒。其精確度也是最高標(biāo)準(zhǔn)的,但軟件復(fù)雜度已降至最低,因為不需要在后處理中做匹配工作。
匹配不是在事件發(fā)生后在幀上完成,而是在傳感器級逐個像素完成。Lavizzari說,其中一個優(yōu)勢是,它沒有運(yùn)動模糊,因為可以非??焖俚夭东@點云,而且與戶外應(yīng)用兼容。 超快脈沖檢測不僅可以提高功率,同時還能保持該技術(shù)的人眼安全等級。
在量子成像方面,Cambou 提到了 Gigajot Technology 的 Quanta Image Sensors (QIS),這是一款具有光子計數(shù)能力的單光子圖像傳感器。Gigajot是一家總部位于美國加州的初創(chuàng)公司,他們聲稱可以每幀每像素 1個光子的光子級別從一系列幀中重建動態(tài)場景。
文章來源: 電子工程專輯,傳感器專家網(wǎng)