Enllaços

dilluns, 17 de febrer del 2014

La Visió Artificial explicada


La Visió per Computador, també anomenada Visió Artificial, és una  vessant de la Intel·ligència Artificial i es basa en un conjunt de tècniques que  tenen com a finalitat extreure propietats del món a partir d'un conjunt  d'imatges. Així dons, es tracta de programar un ordinador per a obtenir certa informació a partir d'una imatge. 
Un sistema de Visió Artificial actua sobre una representació d'una realitat que li proporciona informació sobre la intensitat, colors, formes, etc. Aquestes representacions acostumen a ser en forma d'imatges estàtiques, escenes tridimensionals o imatges en moviment. 
Interpretació de la imatge 
Quan es parla d'una imatge bidimensional, s'estarà fent en base a una funció f on a cada coordenada (x,y) de la imatge li correspondrà un valor d'alguna propietat com pot ser la intensitat o el color, com per exemple:
Aquesta representació es dóna quan es capta una imatge mitjançant una càmera i es passa a un digitalitzador, el qual duu a terme la digitalització.

 
Etapes d'un sistema de Visió Artificial 
 Un sistema de Visió per Computador està format per un sensor òptic, normalment una càmera més un computador, que emmagatzemarà les imatges i executarà els algorismes sobre elles. 
El procés es pot dividir en cinc etapes: 
1. Adquirir la imatge digital amb algun tipus de sensor. 
Principals parts en la adquisició de imatges:
 • Il·luminació: Propietats dels objectes. Tipus de il·luminació. Fonts de llum.
 • Càmeres CCD: Estructura del dispositiu. Característiques de las cameres CCD matricials. Arquitectures de les CCD matricials.
 • Òptica: Principals paràmetres. Òptiques tipus zoom. Model Pin - Hole. Profunditat de camp i distancies hiperfocals. Aberracions òptiques. Filtres.
 • Targetes de adquisició i processament de imatges. (Frame Grabbers)
2. Fer un preprocessament: es millra la qualitat de la imatge adquirida amb l'ajut de filtres i transformacions geomètriques per facilitar les etapes posteriors. 
3. Segmentació: es tracta d'identificar els objectes de l'escena. 
4. Reconeixement: poder diferenciar els objectes mitjançant l'ús de patrons.
5. Interpretació: segons allò obtingut en el punt 4 es fa una interpretació i es prenen les decisions corresponents. 
6. Anàlisi previ de certes característiques comunes que s'estableixen per diferenciar els objectes. 
 És un procés que pot realimentar-se cap endarrere, és a dir, pot ser que es faci una mala interpretació i per tant, calgui tornar al reconeixement, segmentar la  imatge d'una altra forma o passar-li un filtre diferent en el preprocés
Marcacions Industrials
Pel seu reconeixement cal seguir els seguents pasos:


marcadores industriales 1marcadores industriales 2marcadores industriales 3marcadores industriales 4

 
1- Estudi de Font 
Quan el joc de caràcters emprat no és estàndard o és imprès d'una manera insòlita és possible preparar el lector amb mostres de text, un entrenament complet és una condició necessària per permetre l'emmagatzematge de mostres de referència dels caràcters apuntats i font de fàcil consulta.
2-Segmentació de caràcter 
Els caràcters han de ser aïllats abans del procés de reconeixement. 
Considerant que les posicions dels caràcters no han de ser conegudes per avançat, el canvi de text o l'espaiat de font arbitrari són tractats.
3- Rotació i invariància de mida 
Dos mètodes de reconeixement són utilitzats:
Un fa servir la normalització de mida amb la normalització de nivell de grisos. Això explota totalment la informació del nivell de grisos. 
L'altre confia en la representació de la forma mitjançant els anomenats "Descriptors Fourier" en addició a la mida invariant és rotació invariant també, permetent llegir textos d'orientació arbitrària.
4-Verificació de la Qualitat d'impressió 
Com un complement a la capacitat de lectura cal una comprovació de llegibilitat: per a un caràcter donat, la qualitat pot ser calculada, dient com de properes deuen ser les coincidències amb les mostres introduïdes, d'aquesta manera la verificació òptica de caràcters pot realitzar.
 
ocr-a ocr-b

5- Orientació i posicionament d'objectes 

Disseny i implementació de sistemes de visió artificial per a verificar la posició i orientació d'elements dins de cintes de transports per a la seva manipulació posterior. Disseny de sistemes "pick and place" per manipulació automatitzada de productes en línies de producción.
 

6- Recompte de productes en processos complexos i d'alta velocitat 
Disseny i implementació de sistemes de visió artificial per recompte de productes en transports, estàtics ... per exemple per:
-Empaquetat de productes automatitzat. 
-Control de qualitat en processos de producció 
-Detecció de defectes en productes, aspecte, mida, longitud 
-Disseny i implementació de sistemes de visió artificial per a control dimensional (mida, longitud) i estètic (defectes físics) aplicat al control de qualitat de productes manufacturats en general tant a nivell industrial (peces d'automòbils, taulers de control, llunes de cotxe, maons, rajoles ) com de consum.
7- Inspecció de superfícies 

Disseny i implementació de sistemes de visió artificial a la línia de fabricació de l'empresa per a inspecció de superfícies a la recerca de determinades característiques com defectes superficials, rugositat, textura ... consum.

 
imagen multiespectral
Detecció de cares 

Hi ha infinitat d'aplicacions de detecció de rostres, tant per seguretat com per a altres tipus d'aplicacions, com per exemple en càmeres de fotos, perquè l'enfocament automàtic sàpiga on ha de enfocar. 
Com funciona el reconeixement facial? 
Com hi ha una gran quantitat d'aplicacions, el funcionament varia d'unes a altres, però independentment dels patrons emprats per cada programa hi ha una sèrie de passos comuns. 
Un cop obtinguda una imatge (ja sigui emprant càmeres dedicades a aplicacions de seguretat o webcams domèstiques) el primer pas consisteix en l'extracció de la cara de la imatge. Per a això s'obtenen punts singulars amb què centrar la imatge, els ulls per exemple. D'aquesta imatge centrada es normalitza a una mida i profunditat específics per després extreure trets d'ella (aquests primers passos són comuns a la major part d'aplicacions de visió artificial):

face to features

A continuació es divideix la imatge en blocs menors i s'emmagatzema en una matriu:

face to dct

Finalment es processen les dades de les noves imatges i es generen els seus "Eigenfaces", conjunt de vectors propis, mitjançant un procés matemàtic anomenat ACP. És a dir separem la informació de la cara en una sèrie de autovectors, derivats de l'anàlisi estadística d'un gran nombre de rostres

Cap comentari:

Publica un comentari a l'entrada

Aquest és un blog amb moderador dels comentaris. Per tant, no apareixen immediatament