什麽是計算機視(shì)覺?

2020-02-11

AI人工智能知識理(lǐ)解篇—計算機視(shì)覺技術

data-ai.jpg


  1.計算機視(shì)覺技術(ComputerVision),什麽是計算機視(shì)覺?

  “人的(de)大腦皮層的(de)活動,大約70%是在處理(lǐ)視(shì)覺相關信息。視(shì)覺就相當于人腦的(de)大門,其它如(rú)聽覺、觸覺、味覺那都是帶寬較窄的(de)通道(dào)。視(shì)覺相當于八車道(dào)的(de)高(gāo)速,其它感覺是兩旁的(de)人行道(dào)。如(rú)果不能處理(lǐ)視(shì)覺信息的(de)話,整個人工智能系統是個空架子(zǐ),隻能做(zuò)符号推理(lǐ),比如(rú)下棋、定理(lǐ)證明,沒法進入現實世界。計算機視(shì)覺之于人工智能,它相當于說芝麻開門。大門就在這裏面,這個門打不開,就沒法研究真實世界的(de)人工智能。”——朱松純,加州大學(xué)洛杉矶分校UCLA統計學(xué)和(hé)計算機科學(xué)教授根據科普中國(guó)撰寫的(de)對計算機視(shì)覺的(de)定義,這是一(yī)門研究如(rú)何讓機器“看”的(de)科學(xué),更進一(yī)步的(de)說,是指用計算機代替人眼對目标進行識别、跟蹤和(hé)測量的(de)機器視(shì)覺,并進一(yī)步做(zuò)圖形處理(lǐ),使計算機處理(lǐ)成為(wèi)更适合人眼觀察或傳送給儀器檢測的(de)圖像。

  2.計算機視(shì)覺VS機器視(shì)覺

  計算機視(shì)覺更關注圖像信号本身以及圖像相關交叉領域(地(dì)圖、醫療影像)的(de)研究;機器視(shì)覺則偏重計算機視(shì)覺技術工程化,更關注廣義上的(de)圖像信号(激光和(hé)攝像頭)和(hé)自(zì)動化控制(生産線)方面的(de)應用。

  3.計算機視(shì)覺識别技術的(de)分類

  物體識别分為(wèi)“1VSN”對不同物體進行歸類,以及“1VS1”對同類型的(de)物體進行區分和(hé)鑒别;物體屬性識别,結合地(dì)圖模型讓物體在視(shì)覺的(de)三維空間裏得到記憶的(de)重建,進而進行場景的(de)分析和(hé)判斷;物體行為(wèi)識别分為(wèi)3個進階的(de)步驟,移動識别判斷物體是否做(zuò)了位移,動作識别判斷物體做(zuò)的(de)是什麽動作,行為(wèi)識别是結合視(shì)覺主體和(hé)場景的(de)交互做(zuò)出行為(wèi)的(de)分析和(hé)判斷。

  4.計算機視(shì)覺的(de)識别流程

  訓練模型:樣本數據包括正樣本(包含待檢目标的(de)樣本)和(hé)負樣本(不包含目标的(de)樣本),視(shì)覺系統利用算法對原始樣本進行特征的(de)選擇和(hé)提取訓練出分類器(模型);此外因為(wèi)樣本數據成千上萬、提取出來的(de)特征更是翻番,所以一(yī)般為(wèi)了縮短(duǎn)訓練的(de)過程,會人為(wèi)加入知識庫(提前告訴計算機一(yī)些規則),或者引入限制條件來縮小搜索空間。

  識别圖像:會先對圖像進行信号變換、降噪等預處理(lǐ),再來利用分類器對輸入圖像進行目标檢測。一(yī)般檢測過程為(wèi)用一(yī)個掃描子(zǐ)窗口在待檢測的(de)圖像中不斷的(de)移位滑動,子(zǐ)窗口每到一(yī)個位置就會計算出該區域的(de)特征,然後用訓練好的(de)分類器對該特征進行篩選,判斷該區域是否為(wèi)目标。

  5.計算機視(shì)覺技術模式圖和(hé)對應企業圖

  目前世界上圖像識别最大的(de)數據庫,是斯坦福大學(xué)人工智能實驗室提供的(de)ImageNet,針對諸如(rú)醫療等細分領域也需要收集相應的(de)訓練數據;Google、Microsoft此類科技巨頭會面向市場提供開源算法框架,為(wèi)初創視(shì)覺識别公司提供初級算法。

責任編輯:中山網站建設
 【網訊網絡】國(guó)家高(gāo)新技術企業》十一(yī)年(nián)專注軟件開發,網站建設,網頁設計,APP開發,小程序,微信公衆号開發,定制各類企業管理(lǐ)軟件(OA、CRM、ERP、OMS訂單管理(lǐ)系統、WMS進銷存管理(lǐ)軟件等)!服務熱線:0760-88610046、13924923903,http://www.wansion.net

您的(de)項目需求咨詢熱線:0760-88610046(國(guó)家高(gāo)新技術企業)

*請認真填寫需求,我們會在24小時內(nèi)與您取得聯系。