【別藏了,姿態也能“暴露”你[並不簡單]】破解三重物理旋轉密碼鎖和指紋鎖後,阿湯哥的搭檔又得經受步態識別鎖的考驗……這一場景出現在2015年上映的《碟中諜5》中,至今仍令人印象深刻。在影片中,多個攝像頭對他的身體輪廓和步態進行360度無死角掃描,進而判斷和識別進入者的身份。

心理學研究表明,步態具有唯一性,可用於身份識別。“人體輪廓加上步態是人類進行身份識別時優先級最高的方式,即在遠距離就可以實現對人的身份識別。”複旦大學計算機科學技術學院教授張軍平告訴《中國科學報》,它的好處之一是,在預防潛在恐怖襲擊或犯罪時,與其它生物認證方式相比,步態能提供最早的預警和最長的反應時間。

相關論文訊息:
http://t.cn/A6IAhnfS
https://doi.10.11834/jig.210078

然而,如果生物體被遮擋了,是否還能做到精准的步態識別?

近日,一項最新研究顯示,研究人員創新人體姿態估計方法,可在真實場景中解決多人遮擋的問題。研究人員先進行人體關鍵點的估計,進而得到人體骨架,形成人體關鍵點序列,用於步態識別。研究成果發表在2021年國際計算機視覺與模式識別會議上。

最具前景的應用方向之一

像《碟中諜5》中的場景一樣,安防領域是步態識別的應用方向之一。

“你們猜猜,哪張圖像是抑郁症患者的步伐?”在2021世界人工智能大會上,複旦大學類腦智能科學與技術研究院教授馮建峰給出兩張動態圖像,問場下的觀眾。當觀眾猜錯時,他開玩笑地說:“看來今天來的醫生比較少。”

張軍平在接受《中國科學報》採訪時表示,步態是人的行為外在表現方式之一,在一定程度上能夠反映人的健康狀況。“通過步態識別抑郁症患者,是一個值得研究的方向。”

所謂步態,就是人在行走過程中姿態的變化。“步態識別,俗稱‘走姿’識身份。不同人的走姿是不一樣的,所以走姿是人的另一種身份。”杭州電子科技大學博士生鄭錦凱在接受《中國科學報》採訪時解釋道。

從解剖學的視角出發解釋步態具有唯一性。據介紹,這種唯一性的物理基礎是每個人生理結構的差異性,不一樣的腿骨長度、不一樣的肌肉強度、不一樣的重心高度、不一樣的運動神經靈敏度等,共同決定步態的唯一性。

近年來,隨著視頻監控設備在機場、車站、商場等公眾場所的普及,步態識別在社會安全、市場營銷、生物認證、法律援助等領域逐漸發揮重要的作用。

“步態識別是生物認證中最具前景的應用方向之一。”張軍平向《中國科學報》解釋道,人臉識別技術盡管已全面應用,但其可識別距離最遠僅有7至8米,且易被遮擋、易受光照等影響,也存在被3D偽人臉模型攻擊的風險;虹膜識別則易受美瞳等隱形眼鏡產品的影響;指紋和掌紋識別存在依賴設備和距離受限的問題。

人工智能技術帶來無限可能

盡管步態識別具有各種優勢,但同樣存在很多挑戰,包括不同攝像頭造成的巨大視角偏差、行人著裝與攜帶物改變、遮擋以及分割誤差等。近些年來,隨著機器學習的快速發展,步態識別在實際應用中逐漸發揮出巨大的優勢。

要識別步態,常用的生物認證策略有兩種。一是基於步態走路周期性形成的視頻序列,通過逐幀比較來識別步態。該方法雖然性能高,但識別效率低。另一種是將步態的視頻序列進行平均,形成一幅步態能量圖模板,並基於此模板來識別。該方法雖然有實時的效率,但識別性能不如視頻序列方法。

“在實際環境中,攝像頭采集到的步態往往來自多個角度。如果算法只能處於單個角度,則很難將其推廣至實際應用中。”張軍平說。

自2006年以來,張軍平團隊先後在低解析度步態識別、時間保持不變模板等方面獲得一系列研究成果。其中,時間保持不變模板方法的文章在2012年發表在計算機視覺與模式識別頂級期刊IEEE TPAMI上,並通過第三方在步態公用數據集OU-ISIR進行測試,被列為當時六個state-of-the-art算法之一,並獲得排名第三的成績。

基於以上成果,為了獲得最佳性能和潛在的實用性,張軍平研究小組進一步跳出以往步態識別的思路,將傳統步態識別中一直依賴的步態周期摒棄,而將步態序列看成是一個集合,創新性地提出了步態集合算法(GaiSet)。

“直觀地說,就是把步態序列看成是一個集合,不需要步態視頻序列中的每一幀,只需要一些有代表性的幀用來訓練即可。”張軍平表示。

他進一步介紹,GaiSet另一個優點是,在極少量步態圖像用於訓練的前提下,能夠達到很好的性能,因此比較穩定。相關研究成果發表在2019年的AAAI和2021年的IEEE TPAMI上,被同行認為是步態識別領域近年來的標杆性成果。

相互融合是方向

不可否認,步態識別不像指紋識別、人臉識別已發展得很成熟,仍處於探索階段,許多方面的理論和方法還有很大完善空間。

步態識別有兩個傳統的研究方向,分別是基於模型與基於非模型的方法。前者對人體的基礎結構建模,而後者直接從圖像或視頻中基於輪廓提取步態特徵。鄭錦凱進一步解釋道,人體關鍵點組成的人體骨架序列屬於人體的基礎結構建模,為基於模型的方法;由人體輪廓圖組成的人體輪廓序列或步態能量圖,為基於非模型的方法。而張軍平團隊的研究成果則屬於後者。

就在前不久,鄭錦凱等人針對人在不同場域的步態不同,提出可遷移鄰域發現算法。“在超市里購物步伐偏慢,而趕車時步伐急促,所以跨域步態識別為‘走姿’識身份增加了難度。”鄭錦凱說。利用這一方法,可有效提升跨域場景下的步態識別精度。

所謂可遷移鄰域發現算法,鄭錦凱比喻道:“就像小孩識別動物種類,最開始借助一些圖片和對應的動物名字,學習認識許多動物。如果讓小孩對更多的圖片進行分類,一開始可能很容易將見過的長得類似的動物圖片分在一組。但當小孩發現還剩余許多沒見過的圖片,他就可能從中尋找沒見過的相似圖片,並猜測它們屬於一個新物種。接下來,小孩可能同時發現好幾個新物種,進而把它們分在一組,接著繼續尋找和這些新物種長得很像的圖片,直到所有圖片都找完為止。”

據悉,不同於傳統聚類賦偽標簽識別,新算法有望在步態識別領域拓展新的應用。

近日,由中國科學院自動化研究所、計算技術研究所及清華大學等7家單位共同撰寫的《生物特徵識別學科發展報告》(以下簡稱《報告》)發表在《中國圖像圖形學報》上。

《報告》指出,自非模型深度學習方法提出後,由步態剪影圖序列中直接提取特徵的非模型步態識別方法得到極大發展,步態識別精准度大大超越基於模型的識別算法。但隨著人體關節點提取方法的出現,基於模型的步態識別算法再次得到關注。

在最新由新加坡國立大學、騰訊人工智能實驗室等機構聯合完成人體姿態估計的研究中,研究人員將現有的三維人體姿態估計方法分為自上向下和自下向上兩種。前者在很大程度上依賴於人的檢測來定位每個人,然後再估計關節。但當多人相互遮擋時,這種檢測變得不可靠。後者雖然不使用人的檢測,但會受限於尺度變化,姿態估計的准確性同樣受到影響。

於是,研究人員將自上向下和自下向上的方法結合起來,從只使用一個傳感器拍攝的視頻中實現更准確、更穩健的三維多人姿態估計。

在張軍平看來,這一方法有可能為步態識別貢獻更高精度的姿態估計,從而進一步提高跨角度步態識別的性能。他同時指出,步態骨架的精確構造也是值得關注的方向。

“由於兩者所利用的訊息不同,所以相互融合也成為了步態識別發展的重要研究方向。”《報告》強調。http://t.cn/A6IAhnfX

更多學習動態

全站最新消息

d