機(jī)器視覺(jué)ocr識(shí)別

本文目錄一覽:
- 1、OCR 概述
- 2、機(jī)器視覺(jué)字符檢測(cè),缺陷檢測(cè),尺寸測(cè)量哪個(gè)方向的研究容易
- 3、機(jī)器視覺(jué)識(shí)別技術(shù)有些什么種類(lèi)
- 4、什么是機(jī)器視覺(jué)?有人能解釋一下嗎?
- 5、機(jī)器視覺(jué)的四大應(yīng)用
OCR 概述
OCR技術(shù)作為機(jī)器視覺(jué)領(lǐng)域一個(gè)非常重要的研究反向,涉及的應(yīng)用領(lǐng)域多種多樣。現(xiàn)今,各應(yīng)用領(lǐng)域已經(jīng)出現(xiàn)了非常多的產(chǎn)品,包括卡片證件類(lèi)識(shí)別、票據(jù)類(lèi)識(shí)別、文字信息結(jié)構(gòu)化視頻類(lèi)識(shí)別、自然場(chǎng)景下的文字識(shí)別等。本文主要從數(shù)據(jù)、算法兩個(gè)方面概述目前OCR較為成熟的解決方案。
深度學(xué)習(xí)算法是非常依賴(lài)于數(shù)據(jù)數(shù)量與質(zhì)量的,OCR也不例外。一般OCR任務(wù)中不僅需要識(shí)別具體的文字內(nèi)容,還要識(shí)別文字具體所在位置,甚至結(jié)構(gòu)化組織識(shí)別信息,所以圖像數(shù)據(jù)中的監(jiān)督信息就包括文字位置坐標(biāo)和相應(yīng)文本內(nèi)容。標(biāo)注數(shù)據(jù)的來(lái)源一般分為兩類(lèi):人工標(biāo)注和程序(模型)自動(dòng)生成。
一般人工標(biāo)注的成本比較大,首先需要搭建合適的標(biāo)注平臺(tái),好在github上有幾個(gè)開(kāi)源的關(guān)于目標(biāo)檢測(cè)任務(wù)的標(biāo)注平臺(tái)供選擇(參見(jiàn) 十個(gè)最常用深度學(xué)習(xí)圖像/視頻數(shù)據(jù)標(biāo)注工具 或者 深度學(xué)習(xí)圖像標(biāo)注工具匯總 )。其次,構(gòu)建專(zhuān)業(yè)的標(biāo)注團(tuán)隊(duì),尤其是涉及垂直領(lǐng)域的任務(wù)。另外還要設(shè)計(jì)數(shù)據(jù)質(zhì)量監(jiān)控機(jī)制,如標(biāo)注數(shù)據(jù)交叉驗(yàn)證等。
數(shù)據(jù)自動(dòng)生成的數(shù)據(jù)量大,成本小,唯一需要擔(dān)心的就是生成的數(shù)據(jù)分布與真實(shí)數(shù)據(jù)分布有顯著差異。針對(duì)文本檢測(cè)和文本識(shí)別,目前的數(shù)據(jù)生成方案基本都是模擬真實(shí)背景,同時(shí)平滑地嵌入文本內(nèi)容。
那么標(biāo)注或生成多少數(shù)據(jù)量合適呢?當(dāng)然,高質(zhì)量數(shù)據(jù)肯定是越多越好的,如果非要給一個(gè)下限,一般文本檢測(cè)任務(wù)圖片數(shù)據(jù)量在萬(wàn)張級(jí)別,文本識(shí)別任務(wù)在百萬(wàn)張級(jí)別。
整體OCR識(shí)別算法一般是分為兩個(gè)部分:文本檢測(cè)和文本識(shí)別。
文本檢測(cè)與目標(biāo)檢測(cè)算法的發(fā)展是息息相關(guān)的。目前主流的目標(biāo)檢測(cè)算法分為兩類(lèi):
通用的目標(biāo)檢測(cè)算法對(duì)文本一般檢測(cè)都不精準(zhǔn),原因主要包括大多數(shù)文本沒(méi)有閉合邊緣、文本行方向任意、文本排列不規(guī)則等,需要結(jié)合文本的結(jié)構(gòu)與分布特點(diǎn)優(yōu)化檢測(cè)模塊,其中包括 CTPN 、 SegLink 、 Rotation RPN 、 Textboxes 等。
文本識(shí)別模型一般分為特征提取器(編碼器)和解碼器。
目前針對(duì)不同識(shí)別場(chǎng)景的都有相應(yīng)的算法調(diào)優(yōu)方案,模型擬合能力方面已經(jīng)有了長(zhǎng)足進(jìn)步。相較于算法,如何獲取高質(zhì)量數(shù)據(jù)很大程度上影響著整個(gè)OCR項(xiàng)目成敗,打通整個(gè)數(shù)據(jù)鏈路會(huì)是深度學(xué)習(xí)項(xiàng)目的關(guān)鍵,也會(huì)成為企業(yè)的核心競(jìng)爭(zhēng)力。
機(jī)器視覺(jué)字符檢測(cè),缺陷檢測(cè),尺寸測(cè)量哪個(gè)方向的研究容易
機(jī)器視覺(jué)字符檢測(cè)的缺陷檢測(cè)更容易研究。
以下是字符檢測(cè)的相關(guān)介紹:
光學(xué)字符驗(yàn)證,簡(jiǎn)稱(chēng)OCV,是一種用于檢查光學(xué)字符識(shí)別(OCR)字符串的打印或標(biāo)記質(zhì)量并確認(rèn)其易辨識(shí)性的機(jī)器視覺(jué)軟件工具 。該技術(shù)除了可以檢查所呈現(xiàn)的字符串內(nèi)容是否正確,還可以檢查字符串的質(zhì)量、對(duì)比度和清晰度,并對(duì)品質(zhì)不合格的樣品進(jìn)行標(biāo)記或剔除。
字符檢測(cè),又叫OCR或OCV檢測(cè),是專(zhuān)門(mén)對(duì)各種電子元器件、手機(jī)鍵盤(pán)、電腦鍵盤(pán)等物品表面上印刷或雕刻的字符進(jìn)行識(shí)別和檢測(cè),常見(jiàn)的字符包括數(shù)字、英文字母、符號(hào)、漢字等。
目前國(guó)內(nèi)外不少研究機(jī)器視覺(jué)的企業(yè)開(kāi)發(fā)了相應(yīng)的檢測(cè)軟件,進(jìn)行簡(jiǎn)單設(shè)定后,即可對(duì)被檢測(cè)字符自動(dòng)識(shí)別、檢測(cè),如有異常發(fā)生,可提示報(bào)警或者控制機(jī)器停機(jī)。對(duì)不符合要求的工件檢測(cè)后可輸出控制信號(hào),剔除不合格品,自能化程度相當(dāng)高。
以上資料參考百度百科——字符檢測(cè)
機(jī)器視覺(jué)識(shí)別技術(shù)有些什么種類(lèi)
機(jī)器視覺(jué)識(shí)別技術(shù)包括以下幾種常見(jiàn)的類(lèi)型:
形狀匹配:通過(guò)比較目標(biāo)物體的形狀和已知形狀的樣本,識(shí)別出目標(biāo)物體的種類(lèi)。
顏色識(shí)別:通過(guò)對(duì)目標(biāo)物體的顏色進(jìn)行分析和比較,識(shí)別出目標(biāo)物體的種類(lèi)或狀態(tài)。
紋理分析:通過(guò)對(duì)目標(biāo)物體表面的紋理進(jìn)行分析和比較,識(shí)別出目標(biāo)物體的種類(lèi)或狀態(tài)。
物體跟蹤:通過(guò)對(duì)目標(biāo)物體的運(yùn)動(dòng)軌跡進(jìn)行分析和比較,識(shí)別出目標(biāo)物體的位置和狀態(tài)。
二維碼識(shí)別:通過(guò)對(duì)二維碼圖像進(jìn)行分析和解碼,識(shí)別出二維碼中的信息。
OCR識(shí)別:通過(guò)對(duì)文字圖像進(jìn)行分析和識(shí)別,識(shí)別出文字信息。
人臉識(shí)別:通過(guò)對(duì)人臉圖像進(jìn)行分析和比較,識(shí)別出人臉的身份信息。
目標(biāo)檢測(cè):通過(guò)對(duì)圖像中的物體進(jìn)行檢測(cè)和識(shí)別,確定物體的位置和種類(lèi)。
姿態(tài)估計(jì):通過(guò)對(duì)物體的姿態(tài)進(jìn)行分析和計(jì)算,識(shí)別出物體的位置、方向和姿態(tài)。
深度學(xué)習(xí)識(shí)別:通過(guò)深度學(xué)習(xí)算法進(jìn)行圖像特征提取和分類(lèi),實(shí)現(xiàn)對(duì)物體的自動(dòng)識(shí)別和分類(lèi)。
綜上所述,機(jī)器視覺(jué)識(shí)別技術(shù)種類(lèi)較多,不同的技術(shù)可以應(yīng)用于不同的場(chǎng)景和應(yīng)用領(lǐng)域。
什么是機(jī)器視覺(jué)?有人能解釋一下嗎?
機(jī)器視覺(jué),就是用機(jī)器代替人眼來(lái)做測(cè)量和判斷。機(jī)器視覺(jué)系統(tǒng)是指通過(guò)機(jī)器視覺(jué)產(chǎn)品(即圖像攝取裝置,分 CMOS 和CCD
兩種)將被攝取目標(biāo)轉(zhuǎn)換成圖像信號(hào),傳送給專(zhuān)用的圖像處理系統(tǒng),根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號(hào);圖像系統(tǒng)對(duì)這些信號(hào)進(jìn)行各種運(yùn)算來(lái)抽取目標(biāo)的特征,進(jìn)而根據(jù)判別的結(jié)果來(lái)控制現(xiàn)場(chǎng)的設(shè)備動(dòng)作。
日弘智能視覺(jué)系統(tǒng)組成部分:
1.照明光源2.鏡頭3.工業(yè)攝像機(jī)4.圖像采集/處理卡5.圖像處理系統(tǒng)6.其它外部設(shè)備
一、相機(jī)篇
工業(yè)相機(jī)又俗稱(chēng)攝像機(jī),相比于傳統(tǒng)的民用相機(jī)(攝像機(jī))而言,它具有高的圖像穩(wěn)定性、高傳輸能力和高抗干擾能力等,目前市面上工業(yè)相機(jī)大多是基于CCD(Charge
Coupled Device)或CMOS(Complementary Metal Oxide Semiconductor)芯片的相機(jī)。
其中,CCD是目前機(jī)器視覺(jué)最為常用的圖像傳感器。它集光電轉(zhuǎn)換及電荷存貯、電荷轉(zhuǎn)移、信號(hào)讀取于一體,是典型的固體成像器件。
CCD的突出特點(diǎn)是以電荷作為信號(hào),而不同于其它器件是以電流或者電壓為信號(hào)。這類(lèi)成像器件通過(guò)光電轉(zhuǎn)換形成電荷包,而后在驅(qū)動(dòng)脈沖的作用下轉(zhuǎn)移、放大輸出圖像信號(hào)。
典型的CCD相機(jī)由光學(xué)鏡頭、時(shí)序及同步信號(hào)發(fā)生器、垂直驅(qū)動(dòng)器、模擬/數(shù)字信號(hào)處理電路組成。CCD作為一種功能器件,與真空管相比,具有無(wú)灼傷、無(wú)滯后、低電壓工作、低功耗等優(yōu)點(diǎn)。
CMOS圖像傳感器的開(kāi)發(fā)則最早出現(xiàn)在20世紀(jì)70 年代初,90 年代初期,隨著超大規(guī)模集成電路 (VLSI)
制造工藝技術(shù)的發(fā)展,CMOS圖像傳感器得到迅速發(fā)展。
CMOS圖像傳感器將光敏元陣列、圖像信號(hào)放大器、信號(hào)讀取電路、模數(shù)轉(zhuǎn)換電路、圖像信號(hào)處理器及控制器集成在一塊芯片上,還具有局部像素的編程隨機(jī)訪問(wèn)的優(yōu)點(diǎn)。
目前,CMOS圖像傳感器以其良好的集成性、低功耗、高速傳輸和寬動(dòng)態(tài)范圍等特點(diǎn)在高分辨率和高速場(chǎng)合得到了廣泛的應(yīng)用。
分類(lèi):
任何東西一定有它自己的分類(lèi)標(biāo)準(zhǔn),工業(yè)相機(jī)也不例外。
按照芯片類(lèi)型可以分為CCD相機(jī)、CMOS相機(jī);
按照傳感器的結(jié)構(gòu)特性可以分為線陣相機(jī)、面陣相機(jī);
按照掃描方式可以分為隔行掃描相機(jī)、逐行掃描相機(jī);
按照分辨率大小可以分為普通分辨率相機(jī)、高分辨率相機(jī);
按照輸出信號(hào)方式可以分為模擬相機(jī)、數(shù)字相機(jī);
按照輸出色彩可以分為單色(黑白)相機(jī)、彩色相機(jī);
按照輸出信號(hào)速度可以分為普通速度相機(jī)、高速相機(jī);
按照響應(yīng)頻率范圍可以分為可見(jiàn)光(普通)相機(jī)、紅外相機(jī)、紫外相機(jī)等。
區(qū)別:
1、性能穩(wěn)定可靠易于安裝,相機(jī)結(jié)構(gòu)緊湊結(jié)實(shí)不易損壞,連續(xù)工作時(shí)間長(zhǎng),可在較差的環(huán)境下使用,一般的數(shù)碼相機(jī)是做不到這些的。例如:讓民用數(shù)碼相機(jī)一天工作24小時(shí)或連續(xù)工作幾天肯定會(huì)受不了的。
2、快門(mén)時(shí)間非常短,可以抓拍高速運(yùn)動(dòng)的物體。例如,把名片貼在電風(fēng)扇扇葉上,以最大速度旋轉(zhuǎn),設(shè)置合適的快門(mén)時(shí)間,用工業(yè)相機(jī)抓拍一張圖像,仍能夠清晰辨別名片上的字體。用普通的相機(jī)來(lái)抓拍,是不可能達(dá)到同樣效果的。
3、圖像傳感器是逐行掃描的,而普通的相機(jī)的圖像傳感器是隔行掃描的,
逐行掃描的圖像傳感器生產(chǎn)工藝比較復(fù)雜,成品率低,出貨量少,世界上只有少數(shù)公司能夠提供這類(lèi)產(chǎn)品,例如Dalsa、Sony,而且價(jià)格昂貴。
4、幀率遠(yuǎn)遠(yuǎn)高于普通相機(jī)。工業(yè)相機(jī)每秒可以拍攝十幅到幾百幅圖片,而普通相機(jī)只能拍攝2-3幅圖像,相差較大。
5、輸出是裸數(shù)據(jù)(raw data),其光譜范圍也往往比較寬,比較適合進(jìn)行高質(zhì)量的圖像處理算法,例如機(jī)器視覺(jué)(Machine
Vision)應(yīng)用。而普通相機(jī)拍攝的圖片,其光譜范圍只適合人眼視覺(jué),并且經(jīng)過(guò)了mjpeg壓縮,圖像質(zhì)量較差,不利于分析處理。
6、相對(duì)普通相機(jī)(DSC)來(lái)說(shuō)價(jià)格較貴。
如何選擇:
1、根據(jù)應(yīng)用的不同分別選用CCD或CMOS相機(jī)CCD工業(yè)相機(jī)主要應(yīng)用在運(yùn)動(dòng)物體的圖像提取,如貼片機(jī)機(jī)器視覺(jué),當(dāng)然隨著CMOS技術(shù)的發(fā)展,許多貼片機(jī)也在選用CMOS工業(yè)相機(jī)。用在視覺(jué)自動(dòng)檢查的方案或行業(yè)中一般用CCD工業(yè)相機(jī)比較多。CMOS工業(yè)相機(jī)由成本低,功耗低也應(yīng)用越來(lái)越廣泛。
2、分辨率的選擇首先考慮待觀察或待測(cè)量物體的精度,根據(jù)精度選擇分辨率。相機(jī)像素精度=單方向視野范圍大小/相機(jī)單方向分辨率。則相機(jī)單方向分辨率=單方向視野范圍大小/理論精度。若單視野為5mm長(zhǎng),理論精度為0.02mm,則單方向分辨率=5/0.02=250。然而為增加系統(tǒng)穩(wěn)定性,不會(huì)只用一個(gè)像素單位對(duì)應(yīng)一個(gè)測(cè)量/觀察精度值,一般可以選擇倍數(shù)4或更高。這樣該相機(jī)需求單方向分辨率為1000,選用130萬(wàn)像素已經(jīng)足夠。
其次看工業(yè)相機(jī)的輸出,若是體式觀察或機(jī)器軟件分析識(shí)別
,分辨率高是有幫助的;若是VGA輸出或USB輸出,在顯示器上觀察,則還依賴(lài)于顯示器的分辨率,工業(yè)相機(jī)的分辨率再高,顯示器分辨率不夠,也是沒(méi)有意義的;利用存儲(chǔ)卡或拍照功能,工業(yè)相機(jī)的分辨率高也是有幫助的。
3、與鏡頭的匹配傳感器芯片尺寸需要小于或等于鏡頭尺寸,C或CS安裝座也要匹配(或者增加轉(zhuǎn)接口)。
4、相機(jī)幀數(shù)選擇當(dāng)被測(cè)物體有運(yùn)動(dòng)要求時(shí),要選擇幀數(shù)高的工業(yè)相機(jī)。但一般來(lái)說(shuō)分辨率越高,幀數(shù)越低。
二、鏡頭篇
鏡頭的基本功能就是實(shí)現(xiàn)光束變換(調(diào)制),在機(jī)器視覺(jué)系統(tǒng)中,鏡頭的主要作用是將成像目標(biāo)在圖像傳感器的光敏面上。鏡頭的質(zhì)量直影響到機(jī)器視覺(jué)系統(tǒng)的整體性能,合理地選擇和安裝鏡頭,是機(jī)器視覺(jué)系統(tǒng)設(shè)計(jì)的重要環(huán)節(jié)。
基礎(chǔ)知識(shí):
1、鏡頭匹配
大家如何選擇合適鏡頭,鏡頭選配時(shí)需要選擇與攝像機(jī)接口和CCD的尺寸相匹配的鏡頭。鏡頭C和CS的接口方式占主流。小型的安防用的CS接口攝像機(jī)得到普及、FA行業(yè)則大部分是C接口的攝像機(jī)與鏡頭的組合。對(duì)應(yīng)的CCD尺寸、市場(chǎng)上一般根據(jù)用途使用2/3寸到1/3寸的產(chǎn)品。
2、互換性
C接口鏡頭可以與C接口攝像機(jī)、CS接口攝像機(jī)互用;CS接口鏡頭不可以應(yīng)用在C接口攝像機(jī),只可以應(yīng)用在CS接口攝像機(jī)。
3、KERARE
攝像機(jī)如果使用配備小CCD尺寸的鏡頭,那么周邊沒(méi)有攝取到圖像的部分呈現(xiàn)出黑色,我們稱(chēng)其為KERARE。
4、鏡頭的作用:
將折射率不同的各種硝材通過(guò)研磨,加工成高精度的曲面、把這些鏡頭進(jìn)行組合,就是設(shè)計(jì)鏡頭。從伽利略時(shí)代開(kāi)始使用的普遍技術(shù)是其基本原理。為得到更清晰的圖像,一直在研究開(kāi)發(fā)試制新的硝材和非球面鏡片。
三、光源篇
LED光源、鹵素?zé)?光纖光源)、高頻熒光燈。目前LED光源最常用,主要有如下幾個(gè)特點(diǎn):
可制成各種形狀、尺寸及各種照射角度;
可根據(jù)需要制成各種顏色,并可以隨時(shí)調(diào)節(jié)亮度;
通過(guò)散熱裝置,散熱效果更好,光亮度更穩(wěn)定;
使用壽命長(zhǎng);
反應(yīng)快捷,可在10微秒或更短的時(shí)間內(nèi)達(dá)到最大亮度;
電源帶有外觸發(fā),可以通過(guò)計(jì)算機(jī)控制,起動(dòng)速度快,可以用作頻閃燈;
運(yùn)行成本低、壽命長(zhǎng)的LED,會(huì)在綜合成本和性能方面體現(xiàn)出更大的優(yōu)勢(shì);
可根據(jù)客戶(hù)的需要,進(jìn)行特殊設(shè)計(jì)。
LED光源按形狀通常可分為以下幾類(lèi):
1、環(huán)形光源環(huán)形光源提供不同照射角度、不同顏色組合,更能突出物體的三維信息;高密度LED陣列,高亮度;多種緊湊設(shè)計(jì),節(jié)省安裝空間;解決對(duì)角照射陰影問(wèn)題;可選配漫射板導(dǎo)光,光線均勻擴(kuò)散。應(yīng)用領(lǐng)域:PCB基板檢測(cè),IC元件檢測(cè),顯微鏡照明,液晶校正,塑膠容器檢測(cè),集成電路印字檢查。
2、背光源用高密度LED陣列面提供高強(qiáng)度背光照明,能突出物體。的外形輪廓特征,尤其適合作為顯微鏡的載物臺(tái)。紅白兩用背光源、紅藍(lán)多用背光源,能調(diào)配出不同顏色,滿(mǎn)足不同被測(cè)物多色要求。應(yīng)用領(lǐng)域:機(jī)械零件尺寸的測(cè)量,電子元件、IC的外型檢測(cè),膠片污點(diǎn)檢測(cè),透明物體劃痕檢測(cè)等。
3、條形光源條形光源是較大方形結(jié)構(gòu)被測(cè)物的首選光源;顏色可根據(jù)需求搭配,自由組合;照射角度與安裝隨意可調(diào)。應(yīng)用領(lǐng)域:金屬表面檢查,圖像掃描,表面裂縫檢測(cè),LCD面板檢測(cè)等。
4、同軸光源同軸光源可以消除物體表面不平整引起的陰影,從而減少干擾;部分采用分光鏡設(shè)計(jì),減少光損失,提高成像清晰度,均勻照射物體表面。應(yīng)用領(lǐng)域:系列光源最適宜用于反射度極高的物體,如金屬、玻璃、膠片、晶片等表面的劃傷檢測(cè),芯片和硅晶片的破損檢測(cè),Mark點(diǎn)定位,包裝條碼識(shí)別。
5、AOI專(zhuān)用光源不同角度的三色光照明,照射凸顯焊錫三維信息;外加漫射板導(dǎo)光,減少反光;不同角度組合;應(yīng)用領(lǐng)域:用于電路板焊錫檢測(cè)。
6、球積分光源具有積分效果的半球面內(nèi)壁,均勻反射從底部360度發(fā)射出的光線,使整個(gè)圖像的照度十分均勻。應(yīng)用領(lǐng)域:合于曲面,表面凹凸,弧形表面檢測(cè),或金屬、玻璃表面反光較強(qiáng)的物體表面檢測(cè)。
7、線形光源超高亮度,采用柱面透鏡聚光,適用于各種流水線連續(xù)檢測(cè)場(chǎng)合。應(yīng)用領(lǐng)域:陣相機(jī)照明專(zhuān)用,AOI專(zhuān)用。
8、點(diǎn)光源大功率LED,體積小,發(fā)光強(qiáng)度高;光纖鹵素?zé)舻奶娲?,尤其適合作為鏡頭的同軸光源等;高效散熱裝置,大大提高光源的使用壽命。應(yīng)用領(lǐng)域:適合遠(yuǎn)心鏡頭使用,用于芯片檢測(cè),Mark點(diǎn)定位,晶片及液晶玻璃底基校正。
9、組合條形光源四邊配置條形光,每邊照明獨(dú)立可控;可根據(jù)被測(cè)物要求調(diào)整所需照明角度,適用性廣。應(yīng)用案例:CB基板檢測(cè),IC元件檢測(cè),焊錫檢查,Mark點(diǎn)定位,顯微鏡照明,包裝條碼照明,球形物體照明等。
10、對(duì)位光源對(duì)位速度快;視場(chǎng)大;精度高;體積小,便于檢測(cè)集成;亮度高,可選配輔助環(huán)形光源。應(yīng)用領(lǐng)域:VA系列光源是全自動(dòng)電路板印刷機(jī)對(duì)位的專(zhuān)用光源。
四、光源的選型
1、前提信息
(1)檢測(cè)內(nèi)容外觀檢查、OCR、尺寸測(cè)定、定位
(2)對(duì)象物
想看什么?(異物、傷痕、缺損、標(biāo)識(shí)、形狀等)
表面狀態(tài)(鏡面、糙面、曲面、平面)
立體?平面?
材質(zhì)、表面顏色
視野范圍?
動(dòng)態(tài)還是靜態(tài)(相機(jī)快門(mén)速度)
(3)限制條件
工作距離(鏡頭下端到被測(cè)物表面距離)
設(shè)置條件(照明的大小、照明下端到被測(cè)物表面的距離、反射型or透射型)
周?chē)h(huán)境(溫度、外亂光)
相機(jī)的種類(lèi),面陣or線陣
2、簡(jiǎn)單的預(yù)備知識(shí):
(1).因材質(zhì)和厚度不同、對(duì)光的透過(guò)特性(透明度)各異。(2).光根拠其波長(zhǎng)之長(zhǎng)短、對(duì)物質(zhì)的穿透能力(穿透率)各異。(3).光的波長(zhǎng)越長(zhǎng)、對(duì)物質(zhì)的透過(guò)力越強(qiáng),光的波長(zhǎng)越短、在物質(zhì)表面的拡散率越大。(4).透射照明、即是使光線透射對(duì)象物、并觀察其透過(guò)光之照明手法。
3、光源:
穩(wěn)定均勻的光源極其重要
目的:將被測(cè)物與背景盡量明顕區(qū)分
攝取圖像時(shí)、最重要之處是如何鮮明地獲得:被測(cè)物與背景的濃淡差
目前、在圖像處理領(lǐng)域中最廣范的技術(shù)手法是:二值化(白黒)處理為了能夠突出特征點(diǎn),將特征圖像突出出來(lái),在打光手法上,常用的包括有明視野與暗視野。
明視野:用直射光來(lái)觀察對(duì)象物整體(散亂光呈黒色)
暗視野:用散亂光來(lái)觀察對(duì)象物整體(直射光呈白色)具體的光源選取方法還在于試驗(yàn)的實(shí)踐經(jīng)驗(yàn)。
機(jī)器視覺(jué)的四大應(yīng)用
機(jī)器視覺(jué)的四大應(yīng)用如下:
機(jī)器視覺(jué)可說(shuō)是工業(yè)自動(dòng)化系統(tǒng)的靈魂之窗,從物件/條碼辨識(shí),產(chǎn)品檢測(cè)、外觀尺寸量測(cè)導(dǎo)機(jī)械手臂/傳動(dòng)設(shè)備定位,都是機(jī)器視覺(jué)技術(shù)可以發(fā)揮的舞臺(tái)。因此它的應(yīng)用范圍十分廣泛,行業(yè)應(yīng)用領(lǐng)域更是多到令人眼花繚亂。
用來(lái)檢測(cè)的,包括尺寸檢測(cè)、顏色檢測(cè),表面外觀檢測(cè)等等。檢測(cè)是機(jī)器視覺(jué)工業(yè)領(lǐng)域最重要的應(yīng)用之一,光學(xué)篩選機(jī),幾乎所有產(chǎn)品都是需要檢測(cè),而人工檢測(cè)存在較多的毛病,人工檢測(cè)準(zhǔn)確性低,工作效率低,準(zhǔn)確性沒(méi)辦法保證,檢測(cè)速度慢。
用它來(lái)定位的。視覺(jué)定位要求機(jī)器視覺(jué)系統(tǒng)能夠快速準(zhǔn)確的找到被測(cè)零件并確認(rèn)其位置。在半導(dǎo)體封裝領(lǐng)域,設(shè)備需要按照機(jī)器視覺(jué)取得芯片位置調(diào)整拾取頭,這就是視覺(jué)定位在機(jī)器視覺(jué)工業(yè)領(lǐng)域的最基本的應(yīng)用。
用來(lái)物體測(cè)量的。視覺(jué)定位要求機(jī)器視覺(jué)系統(tǒng)能夠快速準(zhǔn)確地找到被測(cè)零件并確認(rèn)其位置,設(shè)備需要按照機(jī)器視覺(jué)取得芯片位置信息調(diào)整拾取,這就是視覺(jué)定位在機(jī)器視覺(jué)工業(yè)領(lǐng)域最基本地應(yīng)用。
物體分揀應(yīng)用。物體分揀應(yīng)用是建立在識(shí)別、檢測(cè)之后地一個(gè)環(huán)節(jié),通過(guò)機(jī)器視覺(jué)系統(tǒng)將圖像進(jìn)行處理,實(shí)現(xiàn)分揀,在機(jī)器視覺(jué)工業(yè)應(yīng)用種常英語(yǔ)食品分揀,零件瑕疵自動(dòng)分揀等。
測(cè)試君
回復(fù)的成本比較大,首先需要搭建合適的標(biāo)注平臺(tái),好在github上有幾個(gè)開(kāi)源的關(guān)于目標(biāo)檢測(cè)任務(wù)的標(biāo)注平臺(tái)供選擇(參見(jiàn) 十個(gè)最常用深度學(xué)習(xí)圖像/視頻數(shù)據(jù)標(biāo)注工具 或者 深度學(xué)習(xí)圖像標(biāo)注工具匯總 )。其次,構(gòu)建專(zhuān)業(yè)的標(biāo)注團(tuán)隊(duì),尤其是涉及垂直領(lǐng)
f型光源
回復(fù)貴。4、幀率遠(yuǎn)遠(yuǎn)高于普通相機(jī)。工業(yè)相機(jī)每秒可以拍攝十幅到幾百幅圖片,而普通相機(jī)只能拍攝2-3幅圖像,相差較大。5、輸出是裸數(shù)據(jù)(raw data),其光譜范圍也往往比較寬,比較適合進(jìn)行高質(zhì)量的圖像處理算法,例如機(jī)器視覺(jué)(Machine
日光源視覺(jué)
回復(fù)圖像傳感器的開(kāi)發(fā)則最早出現(xiàn)在20世紀(jì)70 年代初,90 年代初期,隨著超大規(guī)模集成電路 (VLSI) 制造工藝技術(shù)的發(fā)展,CMOS圖像傳感器得到迅速發(fā)展。CMOS圖像傳感器將光敏元陣列、圖像信號(hào)放
f光源
回復(fù)厚度不同、對(duì)光的透過(guò)特性(透明度)各異。(2).光根拠其波長(zhǎng)之長(zhǎng)短、對(duì)物質(zhì)的穿透能力(穿透率)各異。(3).光的波長(zhǎng)越長(zhǎng)、對(duì)物質(zhì)的透過(guò)力越強(qiáng),光的波長(zhǎng)越短、在物質(zhì)表面的拡散率越大。(4).透射照明、即是使光線透
特種光源
回復(fù)其位置。在半導(dǎo)體封裝領(lǐng)域,設(shè)備需要按照機(jī)器視覺(jué)取得芯片位置調(diào)整拾取頭,這就是視覺(jué)定位在機(jī)器視覺(jué)工業(yè)領(lǐng)域的最基本的應(yīng)用。用來(lái)物體測(cè)量的。視覺(jué)定位要求機(jī)器視覺(jué)系統(tǒng)能夠快速準(zhǔn)確地找到被測(cè)零件并確認(rèn)其位置,設(shè)備需要按照機(jī)器視覺(jué)取得芯片位置信息調(diào)整拾取,這就是視覺(jué)定位在機(jī)器