計(jì)算機(jī)視覺的理論框架探索論文
計(jì)算機(jī)視覺理論框架的新發(fā)展,可以以計(jì)算視覺理論為主,將基于知識(shí)的視覺理論和主動(dòng)視覺理論結(jié)合到一起,從而使計(jì)算機(jī)視覺系統(tǒng)框架變得更加完善。今天學(xué)習(xí)啦小編要與大家分享的是 :計(jì)算機(jī)視覺的理論框架探索的論文;具體內(nèi)容如下,希望能幫助到大家!
計(jì)算機(jī)視覺的理論框架探索
引言
在計(jì)算機(jī)系統(tǒng)中,計(jì)算機(jī)視覺是通過模擬人類視覺,從而對(duì)不同事物進(jìn)行相關(guān)描述,以獲得更全面的信息。隨著計(jì)算機(jī)視覺在文字識(shí)別、漫步機(jī)器人和導(dǎo)航中的成功應(yīng)用,計(jì)算機(jī)視覺的理論框架研究顯得越來(lái)越重要,對(duì)于促進(jìn)我國(guó)計(jì)算機(jī)應(yīng)用技術(shù)水平不斷提升具有重要意義。
1 計(jì)算機(jī)視覺的理論框架
隨著計(jì)算機(jī)視覺的不斷研究和總結(jié),從二維景物圖像發(fā)展到三維景物圖像,計(jì)算機(jī)視覺的理論框架主要有如下三個(gè):
1.1 計(jì)算視覺理論框架 在七十年代中期,有關(guān)研究人員提出了第一個(gè)計(jì)算機(jī)視覺理論框架,即計(jì)算視覺理論,將視覺過程看作是信息處理過程,并將信息處理過程分為三個(gè)不同的層次,它們分別是計(jì)算理論層次、數(shù)據(jù)結(jié)構(gòu)層次和硬件實(shí)現(xiàn)層次,從而對(duì)計(jì)算機(jī)視覺進(jìn)行全面分析。根據(jù)相關(guān)數(shù)據(jù)和資料顯示,視覺是對(duì)圖像的位置、形狀和特征等進(jìn)行描述,因此,計(jì)算理論層成為了研究的重點(diǎn),進(jìn)而將視覺過程看作是從二維圖像信息中對(duì)圖像進(jìn)行重塑,從而將三維物體的形狀、位置和空間等反映出來(lái),最終形成三維圖像。
由此可見,早期的視覺處理是從輸入的二維圖像中獲得二維要素圖,即圖像中強(qiáng)度變化較強(qiáng)時(shí)的位置和幾何分布情況、結(jié)構(gòu)等;中期的視覺處理是從二維要素圖中獲得二點(diǎn)五維圖,即以觀察者為中心,對(duì)表面的法向、深度和不連續(xù)的輪廓等進(jìn)行觀測(cè)。雖然二點(diǎn)五維包含的深度信息比二維要多,但還不是真正意義上的三維表示,而僅僅是有多個(gè)相對(duì)獨(dú)立的視覺模塊組成的,在相關(guān)研究中被稱作是“shape from X”模型,將運(yùn)動(dòng)視覺、立體視覺等融入到其中;后期視覺處理是指從二點(diǎn)五維圖中獲取物體的三維描述,從而將場(chǎng)景中的物體識(shí)別處理,確定物體的確切位置和姿態(tài)。
1.2 基于知識(shí)的視覺理論框架 在計(jì)算機(jī)視覺理論中,基于知識(shí)的視覺理論框架,是圍繞感知特征群集來(lái)進(jìn)行相關(guān)研究的,從而通過人類感知的經(jīng)驗(yàn)來(lái)描述目標(biāo),最終確定物體在場(chǎng)景中的真正位置、形態(tài)等。相關(guān)研究人員認(rèn)為,基于知識(shí)的視覺理論可以通過知識(shí)的引導(dǎo)來(lái)直接完成三維重建,以將相對(duì)應(yīng)觀察方向保持不變動(dòng)二維特征稱作是非偶然性聚類,而人體中視覺識(shí)別發(fā)揮重要作用的一種感知組織,通過對(duì)非偶然性聚類的檢測(cè),可以有效辨別出目標(biāo)。
因此,首先是利用感知組織來(lái)提取圖像中相對(duì)于觀察方向大范圍變化,并且保持不變的分組和結(jié)構(gòu)等;然后,利用概率排隊(duì)的方法來(lái)進(jìn)行模型匹配,從而縮小檢測(cè)空間;最后,通過對(duì)觀察點(diǎn)的未知求解和尋找模型參數(shù)對(duì)應(yīng)關(guān)系,使三維模型的投影和圖像得到最合適的匹配,最終完成三維重建。
1.3 主動(dòng)視覺理論框架 第三種計(jì)算機(jī)視覺理論框架是中東視覺理論礦坑,是根據(jù)人類視覺的主動(dòng)性特征提出的。由于人類視覺會(huì)根據(jù)自己的意識(shí)選擇視野范圍內(nèi)所看見的事物的主次,從而移動(dòng)身體、轉(zhuǎn)向或者改變視角,因此,人們的視覺過程是與所在環(huán)境交互感知和動(dòng)作的過程。在計(jì)算機(jī)視覺理論框架的主動(dòng)視覺框架中,視覺行為不需要三維物體的相關(guān)精確信息,就可以完成物體重建。主動(dòng)視覺系統(tǒng)根據(jù)所需的物體對(duì)象特征、分析結(jié)果和當(dāng)前要求等,通過控制攝像機(jī)的相關(guān)操作,如取向、位置、焦距等,就可以完成相關(guān)處理任務(wù)和信息交換。與此同時(shí),主動(dòng)視覺還可以用改變攝像機(jī)的參數(shù)和處理攝像后的數(shù)據(jù)等,使圖像的時(shí)間、空間和分辨率等發(fā)生變化,從而增強(qiáng)圖像的感知效果。
2 計(jì)算機(jī)視覺理論框架存在的問題
現(xiàn)代發(fā)展中,計(jì)算機(jī)視覺理論框架的提出,是計(jì)算機(jī)視覺領(lǐng)域研究的重要突破,而在這個(gè)發(fā)展過程中,存在著如下一些問題,影響計(jì)算機(jī)視覺理論框架的更完善構(gòu)建。由于視覺過程是成像過程的逆過程,存在著混合、投影、噪音和畸變等干擾因素,使圖像三維重建存在不穩(wěn)定性和不確定性,因此,從一幅景象到多幅景象的重建存在很多困難,使三維圖像的準(zhǔn)確性和通用性大大降低。并且,計(jì)算視覺理論認(rèn)為輸入是被動(dòng)的,整個(gè)視覺過程自下而上不存在反饋,處理目的沒有發(fā)生任何改變,因此,對(duì)物體的確切位置和形狀有一定要求。
另外,有關(guān)學(xué)者提出計(jì)算機(jī)視覺理論框架沒有充分運(yùn)用知識(shí),對(duì)知識(shí)表達(dá)沒有給以高度重視,從而忽略知識(shí)推理和知識(shí)庫(kù)的構(gòu)建,沒有對(duì)空間約束和場(chǎng)景假設(shè)進(jìn)行充分考慮,從而使場(chǎng)景假設(shè)受到局限。并且,沒有進(jìn)行多次的分析和試驗(yàn),致使計(jì)算機(jī)視覺理論框架構(gòu)建存在很多問題。
基于知識(shí)的理論框架忽略了計(jì)算視覺理論的重要性,認(rèn)為人類視覺和重建無(wú)關(guān),然而,在進(jìn)行物體尺寸判斷、物體距離估算等情況時(shí),光靠識(shí)別是不夠的,必須要依靠三維重建,才能將物體的確切位置、形狀等準(zhǔn)確地描述出來(lái)。
主動(dòng)視覺理論沒有排除三維重建,通過改變攝像機(jī)的參數(shù)和角度等,來(lái)改變物體空間、時(shí)間和分辨率的感知效果,從而對(duì)圖像出來(lái)過程進(jìn)行相關(guān)約束,使很多不穩(wěn)定和不合適的問題得到有效解決,最終完成三維重建。運(yùn)用主動(dòng)視覺理論框架,可以大大降低問題的難度,但主動(dòng)視覺理論框架仍存在缺乏高層知識(shí)指導(dǎo)的問題,導(dǎo)致主動(dòng)視覺框架還不夠完整,使計(jì)算機(jī)視覺理論框架構(gòu)建受到一定影響。
3 計(jì)算機(jī)視覺理論框架構(gòu)建的新發(fā)展
在計(jì)算機(jī)視覺理論框架的構(gòu)建過程中,計(jì)算視覺理論比較系統(tǒng)地解釋了從二維圖中獲取三維物體形態(tài)的方法和可能性,而基于知識(shí)的實(shí)際理論和主動(dòng)視覺理論則對(duì)計(jì)算視覺理論進(jìn)行了補(bǔ)充和進(jìn)一步提升。因此,計(jì)算機(jī)視覺理論框架的新發(fā)展,可以以計(jì)算視覺理論為主,將基于知識(shí)的視覺理論和主動(dòng)視覺理論結(jié)合到一起,從而使計(jì)算機(jī)視覺系統(tǒng)框架變得更加完善。
在實(shí)際應(yīng)用過程中,將早期視覺處理分為圖像分割、圖像預(yù)處理和二維模式識(shí)別等,以對(duì)二維圖像進(jìn)行濾波降噪和圖像增強(qiáng)等,因此,不需要知識(shí)引導(dǎo)和控制視覺目的。在圖像分割、二維圖像模式識(shí)別、中期處理、后期處理和三維模式識(shí)別的過程中,沒有知識(shí)引導(dǎo)和模型匹配,最終得出的圖像效果會(huì)更好、更完整。在早期視覺處理和后期視覺處理中,二維模式和三維模式的識(shí)別,需要根據(jù)物體的實(shí)際情況來(lái)確定,由于特征、模型等各不一樣,所以,二維物體和三維物體的描述方式也各不相同。
由于二維信息的質(zhì)量會(huì)影響三維信息的效果,因此,在計(jì)算機(jī)視覺中,二維信息應(yīng)當(dāng)給以高度重視。而模型庫(kù)和視覺目的的應(yīng)用,為計(jì)算機(jī)視覺理論框架構(gòu)建提供了更多的信息。由此可見,在計(jì)算機(jī)視覺系統(tǒng)中,通過視覺目的來(lái)進(jìn)行物體形象、位置等的輸出判斷,同時(shí),運(yùn)用視覺目的可以對(duì)圖像分割和二維模式識(shí)別、中期視覺處理、后期視覺處理和三維模式識(shí)別等進(jìn)行有效控制,最終使三維重建的圖像信息更加完整。
4 結(jié)束語(yǔ)
隨著高科技信息技術(shù)的不斷推廣,計(jì)算機(jī)視覺理論框架的研究已經(jīng)成為目前重點(diǎn)關(guān)注對(duì)象之一,雖然取得了一定的成績(jī),但計(jì)算機(jī)視覺理論框架構(gòu)建還不夠完善。因此,計(jì)算機(jī)視覺理論框架未來(lái)的發(fā)展,需要對(duì)計(jì)算實(shí)際理論、基于知識(shí)的視覺理論和主動(dòng)視覺理論進(jìn)行更深層次的研究,將理論和實(shí)踐應(yīng)用緊密結(jié)合在一起,從而使計(jì)算機(jī)視覺理論框架研究的成果可以更加輝煌。