每天,我們睜開(kāi)眼都會(huì)看見(jiàn)這個(gè)多彩的世界,五彩斑斕的花朵、湛藍(lán)的天空、還有親人熟悉的笑容,對(duì)于每一個(gè)健康人一出生便享有上天賜予的美好特權(quán),我們可以通過(guò)眼鏡感知這個(gè)世界。然而,小伙伴們知道視覺(jué)對(duì)于機(jī)器人是多么難能可貴嗎?我們平時(shí)所說(shuō)的計(jì)算機(jī)視覺(jué)和機(jī)器視覺(jué)又有什么區(qū)別呢?今天小編就為大家講一講什么是計(jì)算機(jī)視覺(jué)、什么又是機(jī)器視覺(jué)。
首先在很多文獻(xiàn)中,計(jì)算機(jī)視覺(jué)與機(jī)器視覺(jué)是不加區(qū)分的,但其實(shí)這兩個(gè)術(shù)語(yǔ)既有區(qū)別又有聯(lián)系的。計(jì)算機(jī)視覺(jué)是采用圖像處理、模式識(shí)別、人工智能技術(shù)相結(jié)合的手段,著重于一幅或多幅圖像的計(jì)算機(jī)分析。機(jī)器視覺(jué)則偏重于計(jì)算機(jī)視覺(jué)技術(shù)工程化,能夠自動(dòng)獲取和分析特定圖像,以控制相應(yīng)的行為。
計(jì)算機(jī)視覺(jué)
計(jì)算機(jī)視覺(jué)是指用攝像機(jī)和電腦及其他相關(guān)設(shè)備,對(duì)生物視覺(jué)的一種模擬。它的主要任務(wù)是通過(guò)對(duì)采集的圖片或視頻進(jìn)行處理以獲得相應(yīng)場(chǎng)景的三維信息,就像人類和許多其他類生物每天所做的那樣。
計(jì)算機(jī)視覺(jué)的最終目標(biāo)是使計(jì)算機(jī)能像人那樣通過(guò)視覺(jué)觀察和理解世界,具有自主適應(yīng)環(huán)境的能力。但能真正實(shí)現(xiàn)計(jì)算機(jī)能夠通過(guò)攝像機(jī)感知這個(gè)世界卻是非常之難,因?yàn)殡m然攝像機(jī)拍攝的圖像我們平時(shí)所見(jiàn)一樣,但對(duì)于計(jì)算機(jī)來(lái)說(shuō),任何圖像都只是如上圖右半邊所示的像素值排列,是一堆死板的數(shù)字。如何讓計(jì)算機(jī)從這些死板的數(shù)字里面讀取到有意義的視覺(jué)線索,是計(jì)算機(jī)視覺(jué)應(yīng)該解決的問(wèn)題。
然而,計(jì)算機(jī)視覺(jué)發(fā)展多年,卻依然存在著一系列難以解決的難題。目前人們掌握的具體計(jì)算機(jī)視覺(jué)任務(wù)的方法,也僅僅適用于狹隘的人臉識(shí)別、指紋識(shí)別等簡(jiǎn)單任務(wù),無(wú)法廣泛的應(yīng)用于不同場(chǎng)合。不過(guò),也有學(xué)者認(rèn)為,隨著機(jī)器學(xué)習(xí)方法的日漸普及以及大數(shù)據(jù)科技的應(yīng)用,計(jì)算機(jī)視覺(jué)實(shí)現(xiàn)質(zhì)的突破也是指日可待的。
機(jī)器視覺(jué)是人工智能正在快速發(fā)展的一個(gè)分支。簡(jiǎn)單說(shuō)來(lái),機(jī)器視覺(jué)就是用機(jī)器代替人眼來(lái)做測(cè)量和判斷。機(jī)器視覺(jué)系統(tǒng)是通過(guò)機(jī)器視覺(jué)產(chǎn)品將被攝取目標(biāo)轉(zhuǎn)換成圖像信號(hào),傳送給專用的圖像處理系統(tǒng),得到被攝目標(biāo)的形態(tài)信息,根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號(hào);圖像系統(tǒng)對(duì)這些信號(hào)進(jìn)行各種運(yùn)算來(lái)抽取目標(biāo)的特征,進(jìn)而根據(jù)判別的結(jié)果來(lái)控制現(xiàn)場(chǎng)的設(shè)備動(dòng)作。
機(jī)器視覺(jué)是一項(xiàng)綜合技術(shù),包括圖像處理、機(jī)械工程技術(shù)、控制、電光源照明、光學(xué)成像、傳感器、模擬與數(shù)字視頻技術(shù)、計(jì)算機(jī)軟硬件技術(shù)(圖像增強(qiáng)和分析算法、圖像卡、 I/O卡等)。一個(gè)典型的機(jī)器視覺(jué)應(yīng)用系統(tǒng)包括圖像捕捉、光源系統(tǒng)、圖像數(shù)字化模塊、數(shù)字圖像處理模塊、智能判斷決策模塊和機(jī)械控制執(zhí)行模塊。
機(jī)器視覺(jué)系統(tǒng)的特點(diǎn)是提高生產(chǎn)的柔性和自動(dòng)化程度。在一些不適合于人工作業(yè)的危險(xiǎn)工作環(huán)境或人工視覺(jué)難以滿足要求的場(chǎng)合,常用機(jī)器視覺(jué)來(lái)替代人工視覺(jué);同時(shí)在大批量工業(yè)生產(chǎn)過(guò)程中,用人工視覺(jué)檢查產(chǎn)品質(zhì)量效率低且精度不高,用機(jī)器視覺(jué)檢測(cè)方法可以大大提高生產(chǎn)效率和生產(chǎn)的自動(dòng)化程度。而且機(jī)器視覺(jué)易于實(shí)現(xiàn)信息集成,是實(shí)現(xiàn)計(jì)算機(jī)集成制造的基礎(chǔ)技術(shù)。上圖便是機(jī)器視覺(jué)的一個(gè)典型應(yīng)用。
毋庸置疑,計(jì)算機(jī)視覺(jué)與機(jī)器視覺(jué)在技術(shù)和應(yīng)用領(lǐng)域上都有相當(dāng)大的重疊,這表明這兩個(gè)學(xué)科的基礎(chǔ)理論大致是相同的,但細(xì)究其機(jī)理,確實(shí)也有一些不同之處:
計(jì)算機(jī)視覺(jué)的研究對(duì)象主要是映射到單幅多幅圖像上的三維場(chǎng)景。計(jì)算機(jī)視覺(jué)的研究很大程度上是針對(duì)圖像的內(nèi)容。如下圖所示,如何讓計(jì)算機(jī)判斷出圖片中都是貓,才是計(jì)算機(jī)視覺(jué)研究的內(nèi)容。
機(jī)器視覺(jué)主要是指工業(yè)領(lǐng)域的視覺(jué)研究,例如自主機(jī)器人的視覺(jué),用于檢測(cè)和測(cè)量的視覺(jué)。這表明在這一領(lǐng)域通過(guò)軟件硬件,圖像感知與控制理論往往與圖像處理得到緊密結(jié)合來(lái)實(shí)現(xiàn)高效的機(jī)器人控制或各種實(shí)時(shí)操作。舉個(gè)不恰當(dāng)?shù)睦?,還是上圖中的貓,機(jī)器視覺(jué)是觀察上圖中成百上千個(gè)某一特定形態(tài)的貓,發(fā)現(xiàn)哪只貓缺只耳朵,然后把它剔除出去。