揭開一點動態影像辨識的神秘面紗 - 鄉下老師 - udn部落格
Contents ...
udn網路城邦
揭開一點動態影像辨識的神秘面紗
2022/03/16 03:52
瀏覽1,410
迴響0
推薦4
引用0

在一張靜態影像中找東西的技術叫作影像辨識,這個大家都知道。但是在連續動態(或稱串流)的影像中辨識你需要的目標資訊,那是甚麼樣的技術內容?我想多數人就會覺得有點神祕?業界廠商的廣告中會刻意語焉不詳故作神秘,連多數的SCI論文中,對此也多半交代不清。

其實不管是結果看起來多神奇的「動態」影像辨識,一定,也鐵定,都還是奠基於單張靜態的影像處理!所有辨識需要使用的原始資訊,當然都還是來自一張張靜態的單一影像!但是如何使用這些原始資訊的學問差異就大了!一種是直接在單一影像上辨識出目標資訊,譬如車牌,然後用簡單的,非影像處理的關聯邏輯,把這些資訊連貫組合。

譬如所謂的天網區間測速系統,就是在各路口架設車牌辨識系統,他們辨識車牌時其實只是連續取像,辨識所有在單一影像中「看得到」的車牌,記下車牌出現的時間與地點。為何可以據此追蹤車輛的路徑?還知道它們的車速呢?其實只是車牌出現時間與位置資料的整合計算,跟影像辨識技術是毫無關係的!學過國中物理的人就會做了!

所以當我這個內行人看到那些浮誇廣告,說他們的系統可以全面追蹤所有車輛的行經路線時,是毫無驚訝或神奇感受的!因為系統能否成功的技術門檻關鍵,在於他們是不是可以在單一車牌辨識測站,真的抓到快速大量通過的車牌?這一關做不好,就是沒有食材的廚師,絕對無法上菜的!

反之,如果車牌真的都能抓到,任何會寫程式的人都可以完成「神奇」的天網!那其實是非常簡單普通的技術。我的公司推出的多數車牌辨識軟體都是號稱動態的!也就是辨識對像是連續影像不是單張照片檔案,但這些軟體主攻的技術目標絕對不是如何「串接整合車牌位置時間」的資訊!那些事情太簡單了,留給我的學生們開的公司去賺錢討生活吧!

我的車牌辨識技術成功的關鍵是:我真的可以在單站的連續影像中辨識出最多最正確的車牌!譬如在車速四五十公里的車上,用攝影機掃描路邊停車的車牌,辨識成功率超過八成!或是在路邊定點裝設攝影機,辨識路過的所有車輛,成功率超過九成!

這才是我這五六年來研發的重點!如果連優質的稻米都種不出來,你大打廣告說可以做出精緻的壽司飯糰?那是甚麼意思?根本就是詐騙嘛!但很不幸的,這就是高階車牌辨識市場的現狀!除了我之外,每個廠商在對外宣傳時,都是這樣迴避關鍵技術的!他們當然知道,也會私下積極研發,但絕對不會自曝其短告訴你

正本清源!那些號稱神奇的天網,真正關鍵的技術就是我這些年致力研發的重點:盡量正確辨識出單張影像中變形扭曲模糊的車牌!只要有了這個基礎能力,其他車牌辨識的相關應用有了足夠數量與正確率的車牌辨識原始資料,其實每一家軟體公司,甚至個人工作室,都可以做出天網的!

我其實也不是想變成製作大型天網系統的大公司,他們不是我的競爭對手或敵人,我只是知道關鍵事實,也有能力完成關鍵研發的小公司,提醒大家如果你需要,來買我的辨識核心元件軟體去作天網賺大錢就好了!我呢?就只是想做一個賣晶片的台積電而已!不會賣手機跟iPhone搶生意的!

以影像辨識技術的觀點來看,即使是我目前的「動態」辨識,其實也只是「假的動態辨識」!因為我並沒有真的使用跨時間軸的多格影像的「影像資訊」做統合處理,譬如前後影格的同一位置畫素的影像亮度顏色變化等等!這就是我想為我的公司建立的未來技術基礎!

業界公司都是比較短視近利的!為了生存我也一樣!我用不太道地的假動態辨識技術研發獲得了一些商機活到現在,但是展望未來,我就是要向著真的跨影格影像處理的「真動態影像辨識」技術邁進!所以我「逼著」我的RD去讀碩士班,正是希望她跟我知道專攻這種技術的南台科大資工系的林泓宏教授學習!

其實本文一開始是想談動態辨識軟體的取像方式的,一聊開就講偏了,但是也闡述了一些很重要的動態影像辨識的事實與迷思,原來想談的議題就另行撰文討論了。

有誰推薦more
全站分類:心情隨筆 工作職場
自訂分類:不分類

限會員,要發表迴響,請先登入