美國普渡大學的研究人員開發(fā)出一種基于熱映像的計算機圖像分割算法,可使計算機迅速識別出物體的外形,即便其發(fā)生扭曲或輕度變形也不會受到影響。該技術將使機器視覺與人類視覺更加接近,可廣泛應用于圖像搜索、醫(yī)療影像以及無人機制造等多個領域。詳細研究結果將分為兩篇論文,在6月21日至23日舉行的IEEE(美國電氣及電子工程師學會)計算機視覺和模式識別大會上予以公布。
人類能夠很容易把一個三維物體從背景中識別出來,也能輕松地識別出它的部分和整體。但這對計算機來說就比較復雜:按照目前的計算機視覺識別技術,必須事先告訴計算機目標物體外形的初始信息以及可以將其分割成多少片段,而后通過一定的算法將已知圖像與未知圖像進行對比,最終通過篩選識別出目標。新算法更接近于人類,是一種無監(jiān)督機器學習(計算機或是機器人在無需任何事前訓練的情況下就能具有感知和學習能力)技術,計算機可自行估計可分割的段數(shù)而無需預先提供。
負責該項研究的美國普渡大學機械工程學教授卡西克?拉馬尼說,新算法采用了兩種新技術,分別被稱為熱圖和熱分布。由于熱量會沿物體表面進行擴散,并準確地顯示出物體的外形,通過這種“智能熱力”,該算法就能模擬出熱量沿物體表面從一點到另一點的流動,從而描述出物體的形狀。其工作原理是,為了便于描述和識別,首先將圖像分割成眾多三角形狀的網(wǎng)格,再通過計算網(wǎng)格間流動的熱量來識別出物體的外形。該方法不但可用于對實際熱量的跟蹤,還能按照相應的原理對熱量的流動進行模擬。拉馬尼說,該技術是站在巨人的肩膀上才得以產生的。愛因斯坦對熱擴散理論的貢獻和法國物理學家傅立葉對熱在固體中傳播的研究都為該算法提供了巨大的幫助。
實驗中,研究人員利用該算法對包括手、人形模型和半人馬模型等多種復雜形狀的物體進行了測試。結果發(fā)現(xiàn),計算機能夠準確識別出這些物體,即便其發(fā)生扭曲或輕度變形也不會受到影響。此外,該算法還能忽略由激光掃描不完整或其他錯誤數(shù)據(jù)所產生的“噪音”.
研究人員稱,該技術潛力巨大,可廣泛應用于圖像搜索、機器人視覺和導航、3D醫(yī)學影像、無人機制造、多媒體游戲機、動畫電影人物創(chuàng)作等多個領域。
轉載請注明出處。