計算機視覺是指用攝像機和電腦及其他相關設備,對生物視覺的一種模擬。它的主要任務是讓計算機理解圖片或者視頻中的內容,就像人類和許多其他生物每天所做的那樣。
我們可以將其任務目標拆分為:
讓計算機理解圖片中的場景(辦公室,客廳,咖啡廳等)
讓計算機識別場景中包含的物體(寵物,交通工具,人等)
讓計算機定位物體在圖像中的位置(物體的大小,邊界等)
讓計算機理解物體之間的關系或行為(是在對話,比賽或吵架等),以及圖像表達的意義(喜慶的,悲傷的等)
那我們在OpenCV階段,主要學習圖像處理,而圖像處理主要目的是對圖像的處理,比如平滑,縮放等,想、從而為其他任務(比如“計算機視覺”)做好前期工作。
根據對計算機視覺目標任務的分解,可將其分為三大經典任務:圖像分類、目標檢測、圖像分割。
圖像分類(Classification):即是將圖像結構化為某一類別的信息,用事先確定好的類別(category)來描述圖片。
目標檢測(Detection):分類任務關心整體,給出的是整張圖片的內容描述,而檢測則關注特定的物體目標,要求同時獲得這一目標的類別信息和位置信息(classification + localization)。
圖像分割(Segmentation):分割是對圖像的像素級描述,它賦予每個像素類別(實例)意義,適用于理解要求較高的場景,如無人駕駛中對道路和非道路的分割。
接下來的課程中我們將圍繞這三個任務對計算機視覺進行介紹。
計算機視覺涉及的領域復雜,具有廣泛的實際應用范圍。總體而言,依賴于人工智能和機器學習,尤其是計算機視覺的創新的好處是,從電子商務行業到更經典的各種類型和規模的公司都可以利用其強大的功能,下圖展示了相關的應用場景及相關的企業:
人臉識別技術目前已經廣泛應用于金融、司法、軍隊、公安、邊檢、政府、航天、電力、工廠、教育、醫療等行業。據業內人士分析,我國的人臉識別產業的需求旺盛,需求推動導致企業敢于投入資金。
代表企業:Face++曠視科技、依圖科技、商湯科技、深醒科技、云從科技等。
人工智能技術可以對結構化的人、車、物等視頻內容信息進行快速檢索、查詢。這項應用使得讓公安系統在繁雜的監控視頻中搜尋到罪犯的有了可能。在大量人群流動的交通樞紐,該技術也被廣泛用于人群分析、防控預警等。
代表企業:SenseTime 商湯科技、DeepGlint 格靈深瞳、依圖科技、云天勵飛、深網視界等。
代表企業:Face++曠視科技、圖普科技、碼隆科技、酒咔嚓、YI+陌上花科技等。
隨著汽車的普及,汽車已經成為人工智能技術非常大的應用投放方向,但就目前來說,想要完全實現自動駕駛/無人駕駛,距離技術成熟還有一段路要走。不過利用人工智能技術,汽車的駕駛輔助的功能及應用越來越多,這些應用多半是基于計算機視覺和圖像處理技術來實現。
代表企業:縱目科技、TuSimple 圖森科技、馭勢科技、MINIEYE 佑駕創新、中天安馳等。
?
除了上述這些,計算機視覺在三維視覺,三維重建,工業仿真,地理信息系統,工業視覺,醫療影像診斷,文字識別(OCR),圖像及視頻編輯等領域也有廣泛的應用。云和數據大數據課程旨在培養適應國家高速發展的大數據人才,有意者可以訪問云和數據官網。
Copyright ? 2013-2021 河南云和數據信息技術有限公司 豫ICP備14003305號 ISP經營許可證:豫B-20160281