一種新的仿生傳感器可以從視頻中在一幀內(nèi)識別移動物體,并成功預(yù)測它們將移動到哪里。《自然通訊》的一篇論文中描述了這種智能傳感器,它將在一系列領(lǐng)域成為一種有價值的工具,包括動態(tài)視覺傳感、自動檢測、工業(yè)過程控制、機(jī)器人制導(dǎo)和自動駕駛技術(shù)。
當(dāng)前的運(yùn)動檢測系統(tǒng)需要許多組件和復(fù)雜的算法來進(jìn)行逐幀分析,這使得它們效率低下且耗能高。受人類視覺系統(tǒng)的啟發(fā),阿爾托大學(xué)的研究人員開發(fā)了一種新的神經(jīng)形態(tài)視覺技術(shù),該技術(shù)將傳感、記憶和處理集成在一個可以檢測運(yùn)動和預(yù)測軌跡的設(shè)備中。
他們技術(shù)的核心是一系列光調(diào)制器,這是一種響應(yīng)光產(chǎn)生電流的電氣設(shè)備。當(dāng)光線關(guān)閉時,電流不會立即停止。相反,它會逐漸衰減,這意味著光調(diào)制器可以有效地“記住”它們最近是否暴露在光線下。因此,由光調(diào)制器陣列制成的傳感器不僅像相機(jī)那樣記錄場景的即時信息,而且還包括先前瞬間的動態(tài)存儲器。
領(lǐng)導(dǎo)這項研究的研究員譚宏偉解釋道:“我們技術(shù)的獨特之處在于它能夠?qū)⒁幌盗泄鈱W(xué)圖像集成在一幀中?!泵總€圖像的信息作為隱藏信息嵌入到以下圖像中。換句話說,視頻中的最后一幀也具有關(guān)于所有先前幀的信息。這讓我們可以通過簡單的人工神經(jīng)網(wǎng)絡(luò)只分析最后一幀來更早地檢測視頻中的運(yùn)動。其結(jié)果是一個緊湊而高效的傳感單元。
為了演示這項技術(shù),研究人員使用視頻一次顯示一個單詞的字母。因為所有單詞都以字母“E”結(jié)尾,所以所有視頻的最后一幀看起來都很相似。傳統(tǒng)的視覺傳感器無法判斷屏幕上的“E”是否出現(xiàn)在“APPLE”或“GRAPE”中的其他字母之后。但光調(diào)制器陣列可以在最后一幀中使用隱藏的信息來推斷之前的字母,并以接近100%的準(zhǔn)確率預(yù)測單詞是什么。
在另一項測試中,該團(tuán)隊展示了一個模擬人以三種不同速度移動的傳感器視頻。該系統(tǒng)不僅能夠通過分析單個幀來識別運(yùn)動,而且還能正確預(yù)測下一幀。
準(zhǔn)確檢測運(yùn)動和預(yù)測物體的位置對自動駕駛技術(shù)和智能交通至關(guān)重要。自動駕駛汽車需要準(zhǔn)確預(yù)測汽車、自行車、行人和其他物體的移動方式,以指導(dǎo)其決策。通過在光調(diào)制器陣列中添加機(jī)器學(xué)習(xí)系統(tǒng),研究人員表明,他們的集成系統(tǒng)可以基于全信息幀的傳感器內(nèi)處理來預(yù)測未來的運(yùn)動。
Sebastiaan van Dijken教授說:“我們緊湊的傳感器內(nèi)存和計算解決方案為自主機(jī)器人和人機(jī)交互提供了新的機(jī)會。我們在使用光調(diào)制器的系統(tǒng)中獲得的幀內(nèi)信息避免了冗余的數(shù)據(jù)流,從而實現(xiàn)了實時的節(jié)能決策?!?