Mašininis matymas. Įvadas. Kas yra kas Rusijos kompiuterinės vizijos rinkoje. Vaizdo apdorojimas ir analizė

Magistrantūros studentas. Mukhamediarov R.M.

Kazachstano nacionalinis technikos universitetas K.I.Satpajeva, Almata, Kazachstanas

Mašininė vizija: koncepcijos, užduotys ir programos

1. Pagrindiniai kompiuterinio matymo apibrėžimai ir sąvokos

Mašininis matymas – tai mokslinė kryptis dirbtinio intelekto, ypač robotikos, ir susijusių technologijų srityje, skirta realaus pasaulio objektų vaizdams gauti, juos apdoroti ir gautus duomenis panaudoti įvairioms taikomoms problemoms spręsti be (viso ar dalinio) žmogaus. dalyvavimas.

Mašininis matymas glaudžiai sąveikauja su tokiomis sritimis kaip Kompiuterinis matymas, Vaizdo apdorojimas , Vaizdo analizė , Rašto atpažinimas ir kt.Taip pat nėra standartinės formuluotės, kaip ir kaip turėtų būti sprendžiama šios srities problemaDažnai vienai iš šių sričių sunku vienareikšmiškai priskirti kylančias problemas ir taikomus sprendimo būdus.Jei apžvelgsime šiose srityse naudojamus ir plėtojamus metodus, algoritmus ir vaizdo apdorojimo metodus, pamatytume, kad jie yra daugiau ar mažiau identiški.

Mašininis matymas daugiausia dėmesio skiriama pramoninėms reikmėms, pvz., autonominiams robotams ir vizualinio tikrinimo bei matavimo sistemoms. Tai reiškia, kad vaizdo jutiklių technologija ir valdymo teorija yra susijusios su vaizdo duomenų apdorojimu robotui valdyti, o gaunamų duomenų apdorojimas realiu laiku vykdomas programinėje arba techninėje įrangoje.

Vaizdo apdorojimas Ir Vaizdo analizė daugiausia orientuota į darbą su 2D vaizdais, t.y. kaip konvertuoti vieną vaizdą į kitą. Pavyzdžiui, operacijos po pikselis kontrastui padidinti, kraštų paryškinimas, triukšmo pašalinimas arba geometrinės transformacijos, pvz., vaizdo pasukimas. Šios operacijos daro prielaidą, kad vaizdo apdorojimas / analizė veikia nepriklausomai nuo pačių vaizdų turinio.

Kompiuterinis matymas dėmesys sutelkiamas į trimačių scenų, projektuojamų ant vieno ar kelių vaizdų, apdorojimą. Pavyzdžiui, atkuriant struktūrą ar kitą informaciją apie 3 D scena iš vieno ar kelių vaizdų. Kompiuterinis matymas dažnai priklauso nuo daugiau ar mažiau sudėtingų prielaidų apie tai, kas pavaizduota vaizduose.

Taip pat yra sritis, vadinama Vizualizacija , kuris iš pradžių buvo susijęs su vaizdų kūrimo procesu, bet kartais buvo susijęs su apdorojimu ir analize. Pavyzdžiui, rentgenografija veikia su vaizdo duomenų analize medicinos reikmėms.

Pagaliau, Rašto atpažinimas yra sritis, kuri naudoja įvairius metodus informacijai iš vaizdo duomenų išgauti, daugiausia remiantis statistiniu požiūriu. Didžioji šios srities dalis skirta praktinis pritaikymasšiuos metodus.

Taigi galime daryti išvadą, kad „kompiuterinio matymo“ sąvoka šiandien apima: kompiuterinį matymą, vizualinio modelio atpažinimą, vaizdo analizę ir apdorojimą ir kt.

Pagrindiniai elementai modernios sistemos Kompiuteriniu regėjimu galima vadinti kamerą, su kuria gaunamas vaizdas, įvesties plokštę, kuri skaitmenizuoja vaizdą, ir judesio valdymo plokštę. Mašininio matymo technologija turi kelis sistemos veikimo etapus. Pirmas žingsnis yra gauti valdomo objekto vaizdą. Toliau gautas vaizdas turi būti įvestas į pramoninį valdiklį ar kitą kompiuterį, kuriame vyksta kompiuterinis apdorojimas, gautų duomenų analizė ir sprendimų priėmimas pagal įdėtą valdymo programą. Paskutinis etapas yra valdymo veiksmų išvestis į pavaras.

Apskritai mašininio matymo sistemų užduotys apima gavimą skaitmeninis vaizdas, vaizdo apdorojimas, siekiant išryškinti reikšmingą informaciją vaizde ir matematinė gautų duomenų analizė sprendžiant priskirtas problemas.

Literatūra:

1. „Computer Vision: A Modern Approach“, D. A. Forsyth ir J. Ponce, Prentice Hall, Upper Saddle River, N. J., 2002 m.

2. Kompiuterinė vizija. L. Shapiro ir G. Stockman, Prentice-Hall, Upper Saddle River, N. J., 2000 m.

3. K. Ach . Struktūriniai modelių atpažinimo metodai. Leidykla „Mir“. Maskva, 1977 m.

4. Edvardas A. Patrikas. Pagrindinė teorija modelio atpažinimas. Maskvos „Tarybinis radijas“, 1980 m.

5. Dirbtinis intelektas. Šiuolaikinis požiūris. Stuartas Russellas, Peteris Norvigas. Maskva / Sankt Peterburgas / Kijevas, 2006 m.

Kompiuterinio matymo technologijų rinkos apžvalga

Šiuolaikinis kompiuterinių sistemų pasaulis sunkiai įsivaizduojamas be mašininio ar kompiuterinio matymo technologijų. Straipsnyje „Kodėl kompiuteriui reikalingas regėjimas? (ComputerPress Nr. 5’2002) buvo apžvelgta šios technologijos formavimosi istorija ir apžvelgta daugybė jos pritaikymų. Žinoma, straipsnyje aprašoma tik nedidelė programų dalis Platus pasirinkimas taikomosios kompiuterinės regos sistemos, o būsimuose numeriuose grįšime panagrinėti šią labai įdomią ir sparčiai besivystančią žinių sritį. Taip, ji sparčiai vystosi. Juk šiai technologijai tik apie 50 metų, o tai pagal daugelio tiksliųjų mokslų standartus neperžengia savo kūdikystės ribų. Didindama savo mokslinį ir praktinį potencialą kartu su skaičiavimo ir įrašymo technologijų tobulėjimu, kompiuterinė vizija palaipsniui užkariauja naujas technologines ribas. Naujausios kartos didelio našumo kompiuteriai (įskaitant šiuolaikinius asmeninius kompiuterius) jau leidžia išspręsti daugybę skaitmeninės vaizdo informacijos srautų apdorojimo ir sprendimų priėmimo realiuoju laiku problemų. Ir šiandien, daugeliui iš mūsų kartais nepastebėtas, kompiuterinis matymas gana tvirtai įsitvirtina daugelyje žmogaus gyvenimo sričių, jam padeda, o kartais pakeičia, atleidžia nuo monotoniško, rutininio ar dažnai gyvybei pavojingo darbo.

Ne paslaptis, kad kompiuterinė vizija kaip technologija gavo plačiausiai paplitusią, išsamiausią ir visapusiška plėtra Vakaruose, ypač JAV, in Pietų Korėja ir Japonijoje. Tai visų pirma dėl stiprios finansinės paramos šiai sričiai iš vyriausybės ir investuotojų, kurie prognozuoja jai puikią ateitį. Be to, vyriausybė daugiausia remia technologijų plėtrą švietimo centruose, o investuotojai teikia paramą privačioms, perspektyvioms įmonėms. Dauguma ryškūs pavyzdžiai Tokie gerai finansuojami tyrimų centrai gali būti Masačusetso technologijos instituto (MIT) Dirbtinio intelekto laboratorija. Dirbtinis intelektas Laboratorija), UC Berkeley Computer Vision Group, Regėjimo ir autonominių sistemų centras Cornegie Mellon universitete, Stanfordo vizijos laboratorija ir keletas kitų. Palaikomų privačių įmonių pavyzdžiai yra tokios įmonės kaip „Visionics“, „Eyematic“ ir kt. Iš viso interneto svetainė, vienijanti kūrėjus kompiuterinio matymo srityje, yra „Computer Vision“ pagrindinis puslapis (http://www.2.cs.cmu.edu/afs). /cs/project/cil/ftp/html/txtvision.html) – užregistruota apie 200 grupių ir mokslinių laboratorijų, dirbančių šiuo klausimu. Reikėtų pažymėti, kad tai neišsemia su kompiuterine vizija susijusių organizacijų, nes tokių yra didelis skaičius komercinės įmonės, kurios specializuojasi kompiuterinio vaizdo ir vaizdo apdorojimo srityje. Informacijos apie juos galima rasti specializuotose teminėse interneto svetainėse, skirtose atskiroms šios technologijos sritims. Kitaip tariant, įvairių technologijų kūrėjai pačioje kompiuterinio matymo technologijoje tarsi jungiasi į interesų klubus. Pavyzdžiui, tie, kurie domisi gestų atpažinimo pažanga, gali rasti daug Detali informacija apie tyrimus, tyrimų grupes, komercines programas, patentus atitinkamoje specializuotoje interneto svetainėje – gestų atpažinimo pagrindiniame puslapyje (http://www.cybernet.com/~ccohen/gesture.html). Čia taip pat galite atsisiųsti kai kurias demonstracines programas ir peržiūrėti naujausius mokslinius leidinius. Jei skaitytojas nori užsiimti technologijomis, susijusiomis su veido atpažinimu, tada jis turi tiesioginį kelią į virtualų klubą kitoje interneto svetainėje - Veido aptikimo ir atpažinimo pagrindiniame puslapyje (http://home.t-online.de/home/Robert). .Frischholz/ face.htm).

Reikėtų pažymėti, kad visa tai, kas išdėstyta pirmiau, lemia staigus augimas ir tobulinti kompiuterinio matymo technologijas. Šiuo metu užsienio mokslo ir komercijos centrai pritraukia daug mokslininkų ir aukštos kvalifikacijos programuotojų, atlieka lygiagrečius tyrimus įvairiose kompiuterinio matymo srityse, pasiekdami gana reikšmingų rezultatų.

Rusija, kaip visavertė pasaulio ekonominės bendruomenės narė, neliko nuošalyje nuo šio proceso. Jau kelerius metus Rusijos technologijų rinkoje taip pat pastebima tendencija, kad kompiuterinio regėjimo problemomis didėja tiek daugelio IT įmonių ir saugumo rinkoje veikiančių įmonių vadovai, tiek vartotojai (vartotojai) ir norintys studentai. specializuotis šiose srityse. Reaguojant į šį susidomėjimą, atsirado laboratorijos, grupės ir komercinės struktūros, kurios išsikėlė uždavinį kurti įvairių tipų technologijas ir programas kompiuterinio regėjimo problemoms spręsti. Ir jei prieš dešimtmetį buvome pasivyti, tai šiandien daugelis įmonių - pažangių technologijų lyderių siekia patekti į Rusijos rinką, kad įsigytų atitinkamų kompiuterinio matymo technologijų arba pateiktų užsakymus pažangiems tyrimams ir plėtrai šioje srityje. plotas.

Šis straipsnis skirtas šiai temai, kurio tikslas yra ne tik parodyti Rusijos ir užsienio prekių gamintojų susidomėjimą šia tema, bet ir pakalbėti apie daugybę besivystančių Rusijos įmonių. programinė įrangaįvairioms vaizdo apdorojimo ir analizės sistemoms.

Kas yra kas Rusijos kompiuterinės vizijos rinkoje

Rusijos rinkos kompiuterinio matymo technologijų kūrėjams tyrimas rodo, kad įmonių, užsiimančių kompiuteriniu regėjimu, skaičius yra palyginti mažas. Pažvelkime į žymiausias iš šių įmonių ir trumpai apibūdinkime keletą įdomių kompiuterinio matymo technologijų, kurias jos tiekia vidaus ir pasaulio rinkoms.

SPIRIT kompanija

Garsiausios pasaulyje fotogrammetrinės sistemos apima tokias techninės ir programinės įrangos sistemas kaip Leica ir Intergraph, tiekiamos su galingomis darbo stotimis. Tai labai brangios sistemos ir tik nedaugelis įmonių gali jas sau leisti. Tobulėjant kompiuterinėms technologijoms, vis populiaresnės tampa pigesnės sistemos, leidžiančios apdoroti vaizdą asmeniniuose kompiuteriuose. Rusijos skaitmeninės fotogrammetrinės sistemos "Talka" (http://www.talka-tdv.ru/), Photomod (įmonė "Rakurs" (http://www.racurs.ru/)), Z-Space (GosNIIAS), TsFS TsNIIGAIK (Roskartografija) arba „Fotoplanas“ (Krašto apsaugos ministerijos 29-asis institutas), ne prastesnis, o kartais ir pranašesnis skaitmeninio vaizdo signalo apdorojimo kokybe. užsienio analogai, o yra dešimtis kartų pigesnis nei panašios užsienio plėtros. Tokių sistemų charakteristikų ir galimybių svarstymas yra atskiro straipsnio tema.

Kita kryptis kompiuterinio matymo srityje – simbolių atpažinimo sistemų konstravimas. Šiame straipsnyje mes tik netiesiogiai paminėjome šią sritį, kurioje kompiuterinio matymo technologijas galima laikyti brandžiomis. Visų pirma, mes atsižvelgėme tik į labai specializuotas užduotis, kurias išsprendė įmonės komerciniai projektai. Jei kalbėsime apie nusistovėjusius komercinius simbolių atpažinimo sistemų produktus ir technologijas, tai negalime nepaminėti didžiausių Rusijos ir pasaulio šios technologijos tiekėjų - ABBYY su FineReader programų serija ir Cognitive Technologies su CuneiForm programų serija. Ne vienas straipsnis ComputerPress puslapiuose skirtas šių įmonių tiekiamų technologijų apžvalgai. Informaciją apie šių įmonių pasiekimus rasite šiame žurnalo numeryje. Todėl, atiduodami pagarbą šioms įmonėms ir jų technologijoms, šiame straipsnyje tik trumpai apie jas užsimename.

Apibendrinant, galime drąsiai teigti, kad Rusijos kompiuterinio matymo technologijos nėra prastesnės ir daugeliu atžvilgių pranašesnės už užsienio analogus. Dažnai šias technologijas kuriančioms įmonėms trūksta visame pasaulyje garsus vardas. Todėl investicijos į juos, kaip taisyklė, nelinkusios. Tačiau tuo nekyla abejonių aukštas lygis technologijos ir aukšta Rusijos specialistų kvalifikacija artimiausiu metu lems Rusijos kompiuterinio matymo technologijų dominavimą pasaulinėje rinkoje.

ComputerPress 7"2002

UDC 004.93"1

Mašininis matymas

Tatjana Vadimovna Petrova, grupė 4241/3

Mašininė vizija – tai kompiuterinės vizijos taikymas pramonėje ir gamyboje. Mašininio matymo sritis – skaitmeniniai įvesties/išvesties įrenginiai ir kompiuteriniai tinklai, skirti gamybos įrangai stebėti. Mašininis regėjimas turi tam tikrų pranašumų, palyginti su žmogaus regėjimu. Todėl svarbu plėtoti šią mokslo sritį. IN šią apžvalgą kalbama apie mašininio matymo raidos istoriją, mašininio matymo sistemos komponentus, mašininio matymo taikymą ir šios mokslo srities ateitį.


Įvadas

kompiuterinių mašinų vizų gamyba

Žmogus didžiąją dalį informacijos apie išorinį pasaulį gauna per vaizdinį kanalą ir tada labai efektyviai apdoroja gautą informaciją naudodamas vaizdinės informacijos analizės ir interpretavimo aparatą. Todėl kyla klausimas dėl šio proceso mašininio įgyvendinimo galimybės.

Dėl vis sudėtingėjančių sprendžiamų mokslinių ir techninių problemų, automatinis vaizdinės informacijos apdorojimas ir analizė tampa vis labiau. aktualiais klausimais. Šios technologijos naudojamos itin paklausiose mokslo ir technologijų srityse, tokiose kaip procesų automatizavimas, našumo didinimas, gaminamų produktų kokybės gerinimas, gamybos įrangos valdymas, išmaniosios robotizuotos sistemos, judančių transporto priemonių valdymo sistemos, biomedicininiai tyrimai ir daugelis kitų. . Be to, galima teigti, kad šiuolaikinio verslo sėkmę daugiausia lemia siūlomų produktų kokybė. O norint tai užtikrinti, jei kalbame apie materialių dalykų gamybą, reikalinga vizualinė kontrolė.

Toliau mes vartosime terminą „mašininė vizija“ kaip sąvoką, kuri labiausiai apima inžinerinių technologijų, metodų ir algoritmų, susijusių su vizualinės informacijos interpretavimo užduotimi, spektrą, taip pat praktinį šios interpretacijos rezultatų panaudojimą.


1. Mašininio regėjimo raidos istorija

Kompiuterinis matymas kaip nepriklausoma disciplina atsirado septintojo dešimtmečio pabaigoje. Ši kryptis atsirado dirbtinio intelekto rėmuose tuo metu, kai vis dar vyko karštos diskusijos apie galimybę sukurti mąstymo mašiną. Tai atsirado dirbant modelio atpažinimo srityje. [Zueva, 2008]

Trumpa mašininio regėjimo raidos istorija pateikta 1 pav.

Ryžiai. 1. Mašininio matymo istorija

Mašininio regėjimo raidos istorijoje galima išskirti šiuos etapus:

· 1955 m. – Masačusetso technologijos instituto (MIT) profesorius Oliveris Selfridžas paskelbė straipsnį „Kompiuterio akys ir ausys“. Jame autorius iškėlė teorinę idėją aprūpinti kompiuterį garso ir vaizdo atpažinimo priemonėmis.

· 1958 m. – psichologas Frankas Rosenblattas iš Kornelio universiteto sukūrė perceptrono (iš suvokimo – suvokimo) kompiuterinį įgyvendinimą – prietaisą, imituojantį modelio atpažinimo grandinę. žmogaus smegenys. Perceptronas pirmą kartą buvo sumodeliuotas 1958 m., o jo mokymui reikėjo maždaug pusvalandžio kompiuterio laiko IBM-704 kompiuteryje. Aparatinė versija – Mark I Perceptron – buvo sukurta 1960 metais ir buvo skirta vizualiniam vaizdo atpažinimui [Computer Vision, 2010] .

Tačiau kompiuterinio regėjimo problemų svarstymas buvo gana spekuliatyvus, nes dar nebuvo nei technologijos, nei matematinės paramos tokioms sudėtingoms problemoms spręsti.

· septintasis dešimtmetis – atsirado pirmosios vaizdo apdorojimo programinės įrangos sistemos (daugiausia triukšmui šalinti iš lėktuvų ir palydovų darytų nuotraukų), pradėjo vystytis taikomieji tyrimai spausdintų simbolių atpažinimo srityje. Tačiau plėtojant šią mokslo sritį vis dar buvo apribojimų, tokių kaip pigių optinių duomenų įvesties sistemų trūkumas, skaičiavimo sistemų apribojimai ir gana siaura specializacija. Spartų kompiuterinio matymo sistemų vystymąsi per 60-uosius galima paaiškinti didėjančiu kompiuterių naudojimu ir akivaizdžiu greitesnio bei efektyvesnio žmogaus ir kompiuterio ryšio poreikiu. Iki šeštojo dešimtmečio pradžios kompiuterinio regėjimo problemos daugiausia apėmė kosmoso tyrimų sritį, kuriai reikėjo apdoroti didelį kiekį skaitmeninės informacijos.

· 1970 m - Lawrence'as Robertsas, MIT magistrantas, pateikė trijų matmenų objektų vaizdų mašininio konstravimo koncepciją, pagrįstą jų dvimačių vaizdų analize. Šiame etape buvo pradėta nuodugnesnė duomenų analizė. Pradėti kurti įvairūs požiūriai, kaip atpažinti objektus vaizde, pavyzdžiui, struktūriniai, bruožai ir tekstūros.

· 1979 m. – profesorius Hansas Helmutas Nagelis iš Hamburgo universiteto padėjo dinaminės scenos analizės teorijos pagrindus, leidžiančias atpažinti judančius objektus vaizdo sraute.

· Devintojo dešimtmečio pabaigoje buvo sukurti robotai, kurie galėjo daugiau ar mažiau patenkinamai įvertinti pasaulis ir savarankiškai atlikti veiksmus natūrali aplinka

· 80-90-ieji pasižymėjo naujos kartos jutiklių, skirtų įvairios fizinės prigimties dvimačiams skaitmeniniams informacijos laukams, atsiradimu. Sukūrus naujas matavimo sistemas ir dvimačių skaitmeninių informacijos laukų registravimo realiuoju laiku metodus, buvo galima gauti analizei skirtus laiko stabilius šių jutiklių generuojamus vaizdus. Tobulinus šių jutiklių gamybos technologijas, buvo galima ženkliai sumažinti jų savikainą, todėl gerokai išplėsti jų taikymo sritį.

· Nuo 90-ųjų pradžios algoritminiu aspektu vaizdo apdorojimo veiksmų seka buvo svarstoma pagal vadinamąją modulinę paradigmą. Ši paradigma, kurią D. Marras pasiūlė remdamasis ilgu žmogaus regėjimo suvokimo mechanizmų tyrimu, teigia, kad vaizdo apdorojimas turėtų būti pagrįstas keliais nuosekliais kylančios informacinės linijos lygiais: nuo „ikoniško“ objektų vaizdavimo (rastrinio) vaizdas, nestruktūrizuota informacija) prie jų simbolinis vaizdavimas(vektoriniai ir atributiniai duomenys struktūrizuota forma, reliacinės struktūros ir kt.). [Visilter ir kt., 2007]

· 90-ųjų viduryje pirmasis komercinės sistemos automatinė automobilio navigacija. 20 amžiaus pabaigoje buvo sukurtos veiksmingos kompiuterinės judesių analizės priemonės.

· 2003 m. – į rinką buvo išleistos pirmosios gana patikimos įmonių veido atpažinimo sistemos.


2. Kompiuterinio matymo problemos ir taikymo sritys

2.1 „Mašininio matymo“ apibrėžimas

Mašininė vizija – tai kompiuterinės vizijos taikymas pramonėje ir gamyboje. Kompiuterinės regos, kaip inžinerijos srities, domėjimosi sritis yra skaitmeniniai įvesties/išvesties įrenginiai ir kompiuterių tinklai, skirti valdyti gamybos įrangą, pavyzdžiui, robotines rankas ar įrenginius, skirtus sugedusiems produktams išgauti.

Mašininis matymas – tai metodų ir technikų, kurias naudojant galima sukurti dirbtinio matymo sistemas ir naudingai panaudoti praktikoje, tyrimas. Kaip tokia, ji apima ir mokslą, ir regėjimo inžineriją .

Jo tyrimas apima ne tik programinę įrangą, bet ir aparatinę aplinką bei vaizdų gavimo būdus, reikalingus jai pritaikyti. Iš esmės jis skiriasi nuo kompiuterinio matymo, kuris iš daugumos knygų šia tema atrodo kaip galima programinės įrangos projektavimas, per daug nekreipiant dėmesio į tai, kas patenka į integruotą regėjimo sistemą (nors šiuolaikinėse knygose apie kompiuterinį regėjimą paprastai daug rašoma apie „bjaurią regėjimo realybę“, pvz., triukšmo pašalinimą ir okliuzijos analizę).

2.2 Mašininis matymas šiandien.

Šiuo metu yra aiški riba tarp vadinamojo monokulinio ir binokulinio kompiuterinio matymo. Pirmoji sritis apima mokslinius tyrimus ir plėtrą kompiuterinio matymo srityje, susijusią su informacija, gaunama iš vienos kameros arba iš kiekvienos kameros atskirai. Antroji sritis apima tyrimus ir plėtrą, susijusią su informacija, vienu metu gaunama iš dviejų ar daugiau kamerų. Tokiose sistemose stebėjimo gyliui matuoti naudojamos kelios kameros. Šios sistemos vadinamos stereosistemomis.

Iki šiol kompiuterinio matymo teorija yra visiškai išplėtota kaip savarankiška kibernetikos šaka, pagrįsta mokslo ir praktinių žinių baze. Kiekvienais metais šia tema išleidžiama šimtai knygų ir monografijų, surengiama dešimtys konferencijų ir simpoziumų, gaminama įvairi programinė ir techninė įranga. Yra keletas mokslinių ir visuomeninių organizacijų, kurios remia ir apima šios srities tyrimus šiuolaikinės technologijos, įskaitant kompiuterinio matymo technologijas.

2.3. Pagrindinės kompiuterinio matymo užduotys

Apskritai kompiuterinio matymo sistemų uždaviniai apima skaitmeninio vaizdo gavimą, vaizdo apdorojimą, siekiant išryškinti reikšmingą informaciją vaizde, bei matematinę gautų duomenų analizę sprendžiant priskirtas problemas.

Tačiau kompiuterinis matymas leidžia išspręsti daugybę problemų, kurias galima suskirstyti į keturias grupes (2 pav.) [Lysenko, 2007] :


2 pav. Kompiuterinio matymo užduotys


· Pozicijos atpažinimas

Kompiuterinio matymo tikslas šioje programoje yra nustatyti erdvinę vietą (objekto vietą, palyginti su išorinė sistema koordinatės) arba statinė objekto padėtis (kokioje padėtyje objektas yra koordinačių sistemos atžvilgiu, o pradžia yra pačiame objekte) ir informacijos apie objekto padėtį ir orientaciją perdavimas valdymo sistemai arba valdikliui.
Tokios programos pavyzdys būtų pakrovimo ir iškrovimo robotas, kuriam pavesta judinti objektus įvairių formų iš bunkerio. Išmanioji mašininio matymo užduotis yra, pavyzdžiui, nustatyti optimalią atskaitos koordinačių sistemą ir jos centrą, kad būtų galima lokalizuoti dalies svorio centrą. Gauta informacija leidžia robotui tinkamai suvokti dalį ir perkelti ją į tinkamą vietą.

Mašininis matymas. Kas tai yra ir kaip juo naudotis? Optinio šaltinio vaizdo apdorojimas

Mašininis matymas yra mokslinė kryptis dirbtinio intelekto, ypač robotikos, ir susijusių technologijų srityje, skirta realaus pasaulio objektų vaizdams gauti, juos apdoroti ir gautus duomenis panaudoti sprendžiant įvairias taikomąsias problemas be (visiško ar dalinio) žmogaus dalyvavimo.

Istoriniai lūžiai mašininio matymo srityje

Vision sistemos komponentai

  • Viena ar daugiau skaitmeninių arba analoginių fotoaparatų (juodai baltų arba spalvotų) su tinkama optika vaizdams užfiksuoti
  • Programinė įranga, skirta apdoroti vaizdus. Analoginėms kameroms tai yra vaizdo skaitmeninimo priemonė
  • Procesorius (šiuolaikinis kompiuteris su kelių branduolių procesoriumi arba įmontuotu procesoriumi, pavyzdžiui, DSP)
  • Kompiuterinės vizijos programinė įranga, teikianti įrankius atskiroms programinės įrangos programoms kurti.
  • Įvesties / išvesties įranga arba ryšio kanalai, skirti pranešti apie rezultatus
  • Išmanioji kamera: vienas įrenginys, kuriame yra visi aukščiau išvardyti taškai.
  • Labai specializuoti šviesos šaltiniai (LED, fluorescenciniai ir halogeninės lempos ir tt)
  • Speciali programinė įranga, skirta vaizdo apdorojimui ir atitinkamų savybių aptikimui.
  • Jutiklis, skirtas sinchronizuoti aptikimo dalis (dažnai optinį arba magnetinį jutiklį), kad būtų galima užfiksuoti ir apdoroti vaizdą.
  • Tam tikros formos pavaros, naudojamos sugedusioms dalims rūšiuoti arba išmesti.
Mašinų matymas daugiausia dėmesio skiria pramoninėms reikmėms, pvz., autonominiams robotams ir vizualinės apžiūros bei matavimo sistemoms. Tai reiškia, kad vaizdo jutiklių technologija ir valdymo teorija yra susijusios su vaizdo duomenų apdorojimu robotui valdyti, o gaunamų duomenų apdorojimas realiu laiku vykdomas programinėje arba techninėje įrangoje.

Vaizdo apdorojimas ir vaizdų analizė daugiausia orientuota į darbą su 2D vaizdais, t.y. kaip konvertuoti vieną vaizdą į kitą. Pavyzdžiui, operacijos po pikselis kontrastui padidinti, kraštų paryškinimas, triukšmo pašalinimas arba geometrinės transformacijos, pvz., vaizdo pasukimas. Šios operacijos daro prielaidą, kad vaizdo apdorojimas / analizė veikia nepriklausomai nuo pačių vaizdų turinio.

Kompiuterinė vizija sutelkia dėmesį į trimačių scenų, projektuojamų ant vieno ar kelių vaizdų, apdorojimą. Pavyzdžiui, atkuriant struktūrą ar kitą informaciją apie 3D sceną iš vieno ar kelių vaizdų. Kompiuterinis matymas dažnai priklauso nuo daugiau ar mažiau sudėtingų prielaidų apie tai, kas pavaizduota vaizduose.

Taip pat yra sritis, vadinama vizualizacija, kuri iš pradžių buvo susijusi su vaizdų kūrimo procesu, bet kartais buvo susijusi su apdorojimu ir analize. Pavyzdžiui, radiografija veikia su vaizdo duomenų analize medicinos reikmėms.

Galiausiai modelio atpažinimas yra sritis, kurioje naudojami įvairūs metodai informacijai iš vaizdo duomenų išgauti, daugiausia remiantis statistiniu požiūriu. Didžioji šios srities dalis skirta praktiniam šių metodų taikymui.

Taigi galime daryti išvadą, kad „kompiuterinio matymo“ sąvoka šiandien apima: kompiuterinį matymą, vizualinio modelio atpažinimą, vaizdo analizę ir apdorojimą ir kt.

Kompiuterinio matymo užduotys

  • Pripažinimas
  • Identifikavimas
  • Aptikimas
  • Teksto atpažinimas
  • 3D formos atkūrimas iš 2D vaizdų
  • Judėjimo įvertinimas
  • Scenos restauravimas
  • Vaizdo atkūrimas
  • Tam tikro tipo struktūrų identifikavimas vaizduose, vaizdo segmentavimas
  • Optinio srauto analizė

Pripažinimas


Klasikinė kompiuterinio matymo, vaizdo apdorojimo ir mašininio matymo problema yra nustatyti, ar vaizdo duomenyse yra koks nors būdingas objektas, funkcija ar veikla.

Šią problemą gali patikimai ir nesunkiai išspręsti žmonės, tačiau ji dar nėra patenkinamai išspręsta kompiuteriniame regėjime bendruoju atveju: atsitiktiniai objektai atsitiktinėse situacijose.

Galima atpažinti vieną ar daugiau iš anksto nustatytų ar išmoktų objektų arba objektų klasių (dažniausiai kartu su jų dvimačia padėtimi vaizde arba trimate padėtimi scenoje).

Identifikavimas


Atpažįstamas atskiras klasei priklausančio objekto egzempliorius.
Pavyzdžiai: konkretaus žmogaus veido, piršto atspaudo ar transporto priemonės identifikavimas.

Aptikimas


Vaizdo įrašo duomenys tikrinami dėl tam tikros būklės.

Santykinai paprastais ir greitais skaičiavimais pagrįstas aptikimas kartais naudojamas norint surasti mažas analizuojamo vaizdo sritis, kurios vėliau analizuojamos naudojant daug išteklių reikalaujančius metodus, kad būtų gauta teisinga interpretacija.

Teksto atpažinimas


Vaizdų paieška pagal turinį: visų vaizdų radimas dideliame vaizdų rinkinyje, turinčiame konkretų įvairiais būdais turinys.

Padėties įvertinimas: konkretaus objekto padėties arba orientacijos nustatymas kameros atžvilgiu.

Optinis simbolių atpažinimas: simbolių atpažinimas spausdinto arba ranka parašyto teksto vaizduose (dažniausiai verčiant į teksto formatą, patogiausią redaguoti ar indeksuoti. Pavyzdžiui, ASCII).

3D formos atkūrimas iš 2D vaizdų atliekamas naudojant stereo rekonstrukciją gylio žemėlapyje, atkuriant normalų lauką ir gylio žemėlapį iš pustonio vaizdo atspalvio, atkuriant gylio žemėlapį iš tekstūros ir nustatant formą iš poslinkio.

3D formos atkūrimo iš 2D vaizdo pavyzdys

Judėjimo įvertinimas

Keletas judesio įvertinimo problemų, kai vaizdų seka (vaizdo įrašo duomenys) apdorojama, siekiant nustatyti kiekvieno vaizdo ar 3D scenos taško greitį. Tokių užduočių pavyzdžiai: trimatės kameros judėjimo nustatymas, sekimas, tai yra objekto (pvz., automobilių ar žmonių) judėjimo sekimas.

Scenos restauravimas

Pateikiami du ar daugiau scenos vaizdų arba vaizdo duomenų. Scenos rekonstrukcijos uždavinys – atkurti trimatį scenos modelį. Paprasčiausiu atveju modelis gali būti taškų rinkinys trimatė erdvė. Sudėtingesni metodai atkuria visą trimatį modelį.

Vaizdo atkūrimas


Vaizdo atkūrimo užduotis – pašalinti triukšmą (jutiklio triukšmą, judančio objekto neryškumą ir kt.).

Paprasčiausias būdas išspręsti šią problemą yra Įvairių tipų filtrai, tokie kaip žemo dažnio arba vidutinio dažnio filtrai.

Didesnis triukšmo pašalinimo lygis pasiekiamas pirmiausia išanalizavus įvairių struktūrų, pvz., linijų ar kraštų, vaizdo duomenis, o tada pagal tais duomenimis valdant filtravimo procesą.

Vaizdo atkūrimas

Optinė srauto analizė (pikselių judėjimo tarp dviejų vaizdų nustatymas).
Keletas judesio įvertinimo problemų, kai vaizdų seka (vaizdo įrašo duomenys) apdorojama, siekiant nustatyti kiekvieno vaizdo ar 3D scenos taško greitį.

Tokių užduočių pavyzdžiai: trimatės kameros judėjimo nustatymas, sekimas, t.y. stebėti objekto (pavyzdžiui, automobilių ar žmonių) judesius.

Vaizdo apdorojimo metodai

Pikselių skaitiklis

Skaičiuoja šviesių arba tamsių pikselių skaičių.
Naudodamas pikselių skaitiklį, vartotojas gali pasirinkti stačiakampę ekrano sritį dominančioje vietoje, pavyzdžiui, ten, kur jis tikisi matyti pro šalį einančių žmonių veidus. Kamera iš karto atsakys pateikdama informaciją apie stačiakampio kraštinėse pavaizduotų pikselių skaičių.

Pikselių skaitiklis leidžia greitai patikrinti, ar sumontuota kamera atitinka norminius arba klientų pikselių skiriamosios gebos reikalavimus, pavyzdžiui, žmonių, įeinančių į kameras stebimas duris, veidus arba valstybinio numerio atpažinimo tikslais.

Binarizacija


Konvertuoja pilkų atspalvių vaizdą į dvejetainį (balti ir juodi pikseliai).
Kiekvieno pikselio reikšmės paprastai koduojamos kaip „0“ ir „1“. Reikšmė „0“ paprastai vadinama fonu arba fonu, o „1“ yra priekinis planas.

Dažnai saugant skaitmeninius dvejetainius vaizdus naudojamas bitmap, kai vienas informacijos bitas naudojamas vienam pikseliui pavaizduoti.

Be to, ypač ankstyvosiose technologijų plėtros stadijose, du galimos spalvos buvo juodos ir baltos spalvos, o tai neprivaloma.

Segmentavimas

Naudojamas dalims ieškoti ir (arba) skaičiuoti.

Segmentavimo tikslas – supaprastinti ir/ar pakeisti vaizdo vaizdavimą, kad jį būtų paprasčiau ir lengviau analizuoti.

Vaizdo segmentavimas dažniausiai naudojamas objektams ir riboms (linijoms, kreivėms ir kt.) paryškinti vaizduose. Tiksliau, vaizdo segmentavimas yra procesas, kai kiekvienam vaizdo pikseliui priskiriamos etiketės taip, kad pikseliai su tomis pačiomis etiketėmis turėtų bendrų vaizdinių savybių.

Vaizdo segmentavimo rezultatas yra segmentų rinkinys, kuris kartu apima visą vaizdą, arba kontūrų rinkinys, išskirtas iš vaizdo. Visi segmento pikseliai yra panašūs tam tikra būdinga arba apskaičiuota savybe, pvz., spalva, ryškumu ar tekstūra. Kaimyniniai segmentai labai skiriasi šia charakteristika.

Brūkšninių kodų skaitymas


Brūkšninis kodas – tai grafinė informacija, uždedama ant gaminių paviršiaus, žymėjimo ar pakuotės, leidžianti ją nuskaityti techninėmis priemonėmis – juodų ir baltų juostelių ar kitų geometrinių formų seka.
Mašininio matymo srityje brūkšniniai kodai naudojami 1D ir 2D kodams, skirtiems nuskaityti arba nuskaityti mašinomis, iššifruoti.

Optinis simbolių atpažinimas

Optinis simbolių atpažinimas: automatizuotas teksto skaitymas, pvz. serijos numeriai.

OCR naudojamas knygoms ir dokumentams konvertuoti į elektroninis vaizdas, verslo apskaitos sistemoms automatizuoti ar teksto publikavimui tinklalapyje.

Optinis teksto atpažinimas leidžia redaguoti tekstą, ieškoti žodžių ar frazių ir saugoti juos daugiau kompaktiška forma, rodyti ar spausdinti medžiagą neprarandant kokybės, analizuoti informaciją ir pritaikyti elektroninį vertimą, formatavimą ar kalbos konvertavimą į tekstą.

Mano programa, parašyta LabView, skirta darbui su vaizdais

Kompiuterinis matymas buvo naudojamas nesuardomai superlaidžių medžiagų kokybės kontrolei.

Įvadas. Sprendžiant kompleksinio saugumo (tiek antiteroristinės, tiek mechaninės objektų saugos, tiek inžinerinių sistemų technologinės saugos) užtikrinimo problemas, šiuo metu reikia sistemingai organizuoti esamos objektų būklės kontrolę. Vienas iš perspektyviausių būdų stebėti esamą objektų būklę yra optiniai ir optoelektroniniai metodai, pagrįsti optinio šaltinio vaizdo vaizdų apdorojimo technologijomis. Tai apima: programas, skirtas dirbti su vaizdais; naujausi būdai vaizdo apdorojimas; vaizdų gavimo, analizės ir apdorojimo įranga, t.y. priemonių ir metodų, susijusių su kompiuterinio ir mašininio matymo sritimi, rinkinys. Kompiuterinis matymas yra bendras metodų rinkinys, leidžiantis kompiuteriams matyti ir atpažinti trimačius ar dvimačius objektus, nesvarbu, ar jie yra inžineriniai, ar ne. Norint dirbti su kompiuterine vizija, reikalingi skaitmeniniai arba analoginiai įvesties/išvesties įrenginiai, taip pat kompiuterių tinklai ir IP vietos analizatoriai, skirti valdyti gamybos procesas ir informacijos parengimas operatyviniams sprendimams priimti per trumpiausią įmanomą laiką.

Problemos formulavimas.Šiandien pagrindinė suprojektuotų kompiuterinio matymo sistemų užduotis išlieka atsitiktinėje vietoje komplekso eksploatacinės atsakomybės zonoje esančių potencialios rizikos objektų aptikimas, atpažinimas, identifikavimas ir kvalifikavimas. Šiuo metu egzistuojantys programinės įrangos produktai, skirti išspręsti išvardytas problemas, turi nemažai reikšmingų trūkumų, būtent: didelis sudėtingumas, susijęs su dideliu optinių vaizdų detalumu; didelis energijos suvartojimas ir gana siauras galimybių diapazonas. Galimos rizikos objektų aptikimo užduočių išplėtimas į atsitiktinių objektų paieškos atsitiktinėse situacijose, esančių atsitiktinėje vietoje, sritį. programinės įrangos produktai neįmanoma, net naudojant superkompiuterį.

Tikslas. Sukurti universalią optinio šaltinio vaizdų apdorojimo programą, turinčią galimybę srautiniu būdu analizuoti duomenis, tai yra, programa turi būti lengva ir greita, kad ją būtų galima įrašyti į mažo dydžio kompiuterio įrenginį.

Užduotys:

  • programos matematinio modelio kūrimas;
  • rašyti programą;
  • programos testavimas laboratoriniame eksperimente, su pilnas pasiruošimas ir atlikti eksperimentą;
  • programos panaudojimo susijusiose veiklos srityse tyrimas.

Programos aktualumą lemia:

Programos kūrimo aktualumo analizė.
  • trūksta vaizdo apdorojimo programų su išėjimu programinės įrangos rinkoje išsamią analizę inžineriniai objektų komponentai;
  • nuolat augantys reikalavimai vaizdinės informacijos gavimo kokybei ir greičiui, smarkiai didėjantys vaizdo apdorojimo programų paklausa;
  • esamas didelio našumo, patikimų ir patogių programų poreikis;
  • Reikalingos didelio našumo programos ir paprastas valdymas, o tai mūsų laikais itin sunku pasiekti. Pavyzdžiui, paėmiau Adobe Photoshop. Šis grafinis redaktorius turi harmoningas derinys funkcionalumas ir naudojimo paprastumas paprastam vartotojui, tačiau šioje programoje neįmanoma dirbti su sudėtingais vaizdo apdorojimo įrankiais (pavyzdžiui, vaizdo analizė konstruojant matematinį ryšį (funkcija) arba integruotas vaizdo apdorojimas);
  • didelė profesionalių vaizdinės informacijos apdorojimo programų kaina. Jei programinė įranga yra kokybiška, tai kaina už ją yra itin didelė, net iki atskirų konkretaus programų rinkinio funkcijų. Žemiau pateiktame grafike parodytas kainos ir kokybės santykis tarp paprastų programos analogų.

Norėdami supaprastinti problemų sprendimą šio tipo, sukūriau matematinį modelį ir parašiau programą kompiuteriniam įrenginiui vaizdų analizei naudojant paprastas šaltinio vaizdų transformacijas.

Programa veikia su tokiomis transformacijomis kaip dvejetainis nustatymas, ryškumas, vaizdo kontrastas ir kt. Programos veikimo principas demonstruojamas superlaidžių medžiagų analizės pavyzdžiu.

Kuriant kompozitinius superlaidininkus Nb3Sn pagrindu, skiriasi bronzos ir niobio tūrio santykis, pluoštų dydis ir skaičius, jų pasiskirstymo per bronzos matricos skerspjūvį vienodumas, difuzijos barjerų ir stabilizavimo medžiagų buvimas. . Tam tikrai niobio tūrio daliai laidininke, padidėjus skaidulų skaičiui, atitinkamai sumažėja jų skersmuo. Dėl to pastebimai padidėja Nb / Cu-Sn sąveikos paviršius, o tai žymiai pagreitina superlaidžios fazės augimo procesą. Toks superlaidumo fazės kiekio padidėjimas, padidėjus skaidulų skaičiui laidininke, užtikrina superlaidininko kritinių charakteristikų padidėjimą. Šiuo atžvilgiu būtina turėti įrankį, leidžiantį kontroliuoti superlaidžios fazės tūrio dalį galutiniame produkte (sudėtiniame superlaidininke).

Kuriant programą buvo atsižvelgta į medžiagų, iš kurių kuriami superlaidūs kabeliai, tyrimų svarbą, nes jei niobio ir bronzos santykis yra neteisingas, galimas laidų sprogimas, o dėl to – žmonių aukų. piniginės išlaidos ir laiko praradimas. Ši programa leidžia nustatyti laidų kokybę remiantis chemine ir fizine objekto analize.

Programos blokinė schema


Tyrimo etapų aprašymas.

1 etapas. Mėginio paruošimas: kompozitinio superlaidininko pjaustymas elektros išlydžio mašinoje; mėginio presavimas į plastikinę matricą; bandinio poliravimas iki veidrodinio paviršiaus; mėginio ėsdinimas, kad išryškintų niobio pluoštus ant bronzos matricos. Gauti presuotų kompozitinių superlaidžių bandinių pavyzdžiai;

2 etapas. Vaizdavimas: metalografinių vaizdų gavimas skenuojančiu elektroniniu mikroskopu.

3 etapas. Vaizdo apdorojimas: superlaidžios fazės tūrinės dalies nustatymo metalografiniame vaizde įrankio sukūrimas; tam tikro tipo imties statistiškai reikšmingų duomenų rinkinys. Sukurti įvairių vaizdo apdorojimo priemonių matematiniai modeliai; sukurta programinė įranga, skirta įvertinti superlaidumo fazės tūrio dalį; programa supaprastinta sujungiant kelias matematines funkcijas į vieną; vidutinė niobio pluoštų tūrinės dalies reikšmė bronzos matricoje buvo 24,7±0,1%. Mažas nuokrypio procentas rodo didelį sudėtinės vielos struktūros pakartojamumą.

Sudėtinių superlaidininkų elektroninės mikroskopijos vaizdai

Vaizdo apdorojimo metodai programoje.

  • Identifikavimas- atpažįstamas atskiras klasei priklausančio objekto egzempliorius.
  • Binarizacija– spalvoto (arba pilkų tonų) vaizdo konvertavimo į dviejų spalvų nespalvotą procesą.
  • Segmentavimas yra skaitmeninio vaizdo padalijimo į kelis segmentus (daug pikselių, dar vadinamų superpikseliais) procesas.
  • Erozijasunkus procesas, kurio metu konstrukcinis elementas pereina per visus vaizdo pikselius. Jei tam tikroje padėtyje kiekvienas atskiras konstrukcinio elemento pikselis sutampa su vienu dvejetainio vaizdo pikseliu, tada atliekamas loginis struktūrinio elemento centrinio pikselio pridėjimas su atitinkamu išvesties vaizdo pikseliu.
  • Išsiplėtimas- vaizdo arba pasirinktos vaizdo srities konvoliucija su tam tikru branduoliu. Šerdis gali būti bet kokios formos ir dydžio. Šiuo atveju branduolyje skiriama viena pirmaujanti pozicija, kuri skaičiuojant konvoliuciją derinama su esamu pikseliu.

Programų formulės

Binarizacijos formulė (Otsu metodas):

Erozijos formulė:

Išsiplėtimo formulė:

Išsiplėtimo ir erozijos modelis

Spalvų slenksčio segmentavimo formulės:

Kiekvieno vaizdo pikselio šviesumo gradiento modulio nustatymas:

Slenksčio apskaičiavimas:

Naudota įranga

Programos sąsaja

Pasaulyje yra daug dalykų, kurie žmogaus akis Aš tiesiog negaliu to suspėti. Pavyzdžiui, konvejerio technologijoje klaidos atsiranda būtent dėl ​​žmogiškojo faktoriaus. Žmogus tiesiog nesugeba blaiviai įvertinti daiktų po kelių valandų darbo. Tam puikiai tinka robotai. Naudojant mašininis matymas jie gali atlikti detalų gaminio patikrinimą, palyginti jį su pavyzdžiu ir akimirksniu apsispręsti dėl tolesnio gaminio apdorojimo.

Kaip veikia kompiuterinis matymas?

Kompiuterinis regėjimas yra kompiuterio gebėjimas „matyti“. Mašininio matymo sistemoje naudojama viena ar daugiau vaizdo kamerų, analoginio į skaitmeninį konvertavimą (ADC) ir skaitmeninio signalo apdorojimo (DSP) įrenginį. Gauti duomenys patenka į kompiuterį arba roboto valdiklį. Kompiuterinis regėjimas yra panašus į balso atpažinimo sudėtingumą.

Du svarbias savybes bet kurioje tokioje sistemoje yra jautrumas ir skiriamoji geba. Jautrumas – tai mašinos gebėjimas matyti silpnoje šviesoje arba atskirti silpnus impulsus nematomų bangų ilgių spektre. Jautrumas ir skiriamoji geba yra tarpusavyje susiję parametrai. Didėjant jautrumui, skiriamoji geba paprastai mažėja ir atvirkščiai, nors visi kiti veiksniai paprastai nesikeičia.

Žmogaus akys gali atskirti elektromagnetines bangas kurių bangos ilgiai svyruoja nuo 390 iki 770 nanometrų. Vaizdo kamerų diapazonas yra daug platesnis. Pavyzdžiui, yra mašininio matymo sistemų, kurios gali matyti infraraudonųjų, ultravioletinių ir rentgeno spindulių bangos ilgio sritis.

Mašininis matymas naudojamas įvairiose pramonės ir medicinos srityse:

    Komponentų analizė

    Parašo identifikavimas

    Optinis simbolių atpažinimas

    Rašysenos atpažinimas

    Objekto atpažinimas

    Rašto atpažinimas

    Medžiagos kontrolė

    Valiutos kontrolė

    Medicinos vaizdo analizė


Mašininė vizija – tai kompiuterinės vizijos taikymas pramonėje ir gamyboje. Nors kompiuterinis matymas yra bendras metodų, leidžiančių kompiuteriams matyti, rinkinys, kompiuterinės regos, kaip inžinerinės disciplinos, interesų sritis yra skaitmeniniai įvesties / išvesties įrenginiai ir kompiuterių tinklai, skirti stebėti gamybos įrangą, pvz., robotų ginklus ar ištraukimo mašinas. nekokybiški gaminiai. Mašinų matymas yra inžinerijos poskyris, susijęs su kompiuterių mokslu, optika, mechanine inžinerija ir pramonės automatika. Vienas iš labiausiai paplitusių mašininio matymo pritaikymų yra pramoninių produktų, tokių kaip puslaidininkių lustai, automobiliai, maistas ir vaistai. Surinkimo linijose dirbę žmonės tikrindavo gaminio dalis, darydami išvadas apie atlikimo kokybę. Mašininio matymo sistemos šiems tikslams naudoja skaitmenines ir išmaniąsias kameras, taip pat vaizdo apdorojimo programinę įrangą panašiems patikrinimams atlikti.

Mašininio matymo sistemos yra užprogramuotos atlikti labai specializuotas užduotis, tokias kaip objektų skaičiavimas surinkimo linijoje, serijos numerių skaitymas arba paviršiaus defektų paieška. Vizualinės apžiūros sistemos pranašumai yra didelis greitis su didėjančia apyvarta, 24 valandų veikimo galimybė ir kartojamas matavimo tikslumas. Taip pat mašinų pranašumas prieš žmones yra nuovargio, ligos ar neatidumo nebuvimas. Tačiau žmonės per trumpą laiką puikiai suvokia ir lanksčiau klasifikuodami bei prisitaikydami prie naujų defektų paieškos.

Kompiuteriai negali „matyti“ taip, kaip žmonės. Fotoaparatai nėra lygiaverčiai žmogaus regėjimo sistemai, ir nors žmonės gali pasikliauti spėlionėmis ir prielaidomis, mašininio matymo sistemos turi „matyti“ nagrinėdamos atskirus vaizdo pikselius, juos apdorodamos ir bandydamos daryti išvadas naudodamiesi žinių baze ir funkcijų rinkiniu. pvz., įrenginio modelio atpažinimas. Nors buvo sukurti kai kurie kompiuterinio matymo algoritmai, imituojantys žmogaus regimąjį suvokimą, buvo sukurta daugybė unikalių metodų vaizdams apdoroti ir atitinkamoms vaizdo savybėms nustatyti.

Mašininio matymo programos

Mašininio matymo taikymas yra įvairus ir apima įvairiose srityse veikla, įskaitant, bet neapsiribojant:

    Didelė pramoninė gamyba

    Pagreitinta gamyba unikalūs produktai

    Saugos sistemos pramoninėje aplinkoje

    Surenkamų objektų kontrolė (pvz., kokybės kontrolė, klaidų tyrimas)

    Vizualinės valdymo ir valdymo sistemos (apskaita, brūkšninio kodo skaitymas)

    Automatizuotas valdymas Transporto priemonė

    Kokybės kontrolė ir maisto tikrinimas

Automobilių pramonėje mašininio matymo sistemos naudojamos pramoniniams robotams valdyti, taip pat transporto priemonių dažų paviršiams, suvirinimo siūlėms, variklių blokams ir daugeliui kitų komponentų patikrinti, ar nėra defektų.