
卡內(nèi)基·梅隆大學(xué)的研究員研發(fā)出一種系統(tǒng),可以分析出視頻中的物體動作。這個系統(tǒng)來自研究論文《視頻監(jiān)控下的自動動作識別》,其主要內(nèi)容就是:通過技術(shù)把視頻分割成一定的塊,然后電腦確定物體的運(yùn)動過程并對每塊視頻中的動作加上某個提前設(shè)定好的含義,比如“撿起”、“埋”等。
這樣當(dāng)攝像頭中出現(xiàn)變化時,電腦首先鑒別出視頻中是什么物體,比如“人”、“四肢爬行動物”、“袋狀物體”等,然后分析動作變化來與研究人員提前定義好的動作名字相匹配,比如“拖動”、“跑”、“扔”等。最后計算機(jī)會把這些信息以語言的形式輸出給監(jiān)控者,比如:視頻中“一個人在拖動袋子,然后挖了一個坑,然后把袋子埋了起來。”
在論文中,研究人員稱該系統(tǒng)是為本周早些時候和情報、防御、安全議題相關(guān)的 International Conference on Semantic Technologies (國際語義分析技術(shù)大會)準(zhǔn)備的,這還只是整個項目中的一小部分。和美國軍方的Mind’s Eye戰(zhàn)場分析機(jī)器人一樣,該項目也是由DARPA(國防部高級研究計劃局)出資贊助的。他們的最終目標(biāo),是讓機(jī)器也能像人一樣偵查周圍的動作,如果將這套系統(tǒng)安裝在Mind’s Eye上的話,未來機(jī)器人便可以通過攝像頭觀察周圍的環(huán)境,然后像人一樣報告現(xiàn)場在發(fā)生了哪些事。再加上遠(yuǎn)程控制、夜視、望遠(yuǎn)鏡等功能的輔助,機(jī)器人就要比人類強(qiáng)大多了。
既然是軍方的技術(shù),自然離我們還很遠(yuǎn)。但不妨假象一下,如果這些動作識別系統(tǒng)投入商用或民用,未來你在大街上的每一個動作都有可能被別人知道。這樣縱然能夠監(jiān)控街頭犯罪的發(fā)生,比如人們有肢體沖突、搶奪、或舉槍的姿勢等。但更可怕的是,你亂扔個垃圾或者吐口痰,都有可能被記錄在案。如果社會真的變成那樣的話,那可就不太好辦了。
至于還有哪些應(yīng)用場景,大家可在文章下留言討論。



