LOCALIZACION DE PLACAS EN VEHICULOS AUTOMOTORES

Instituto Tecnológico de Chihuahua ELECTRO 2001 LOCALIZACION DE PLACAS EN VEHICULOS AUTOMOTORES Arturo Legarda Sáenz Mario I. Chacón M. Alejandro Zi...
506 downloads 0 Views 1MB Size
Instituto Tecnológico de Chihuahua

ELECTRO 2001

LOCALIZACION DE PLACAS EN VEHICULOS AUTOMOTORES Arturo Legarda Sáenz Mario I. Chacón M. Alejandro Zimmerman Solís Instituto Tecnológico de Chihuahua Ave. Tecnológico 2909 31310, Chihuahua, Chih. Tel. (01) 1413-7474 [email protected] difusos, creados a partir de reglas intuitivas como el área aproximada de localización de la placa, la brillantez del borde, etc. [8]. Ambos métodos mencionados se aplican a placas tipo europeo las que tienen como una característica el largo que es de alrededor de 50 cm. con un alto de 15 cm. aproximadamente. La mayoría de los métodos sin embargo incluyen restricciones para solucionar casos específicos de localización de placas por lo que no representan o no intentan dar una solución más robusta al problema. En este artículo se presenta un método nuevo para la localización de placas de vehículos el cual trata de disminuir al mínimo las restricciones que comúnmente se incluyen en otros métodos y reducir la cantidad de información donde se realiza la búsqueda.

RESUMEN. El presente artículo presenta un nuevo método para la localización de placas en vehículos. En el proceso de localización no se incluyen restricciones que otros sistemas incorporan como pudiera ser el tamaño fijo de la placa y su posición con respecto a la imagen. El método propuesto primero realiza una reducción de información basado en un operador de textura y un operador and lógico con lo cual se disminuye el tiempo de búsqueda del objetivo. La localización de la placa se realiza solo en regiones de interés seleccionadas automáticamente por el método y presenta hasta el momento un 83% de exactitud. 1. INTRODUCCIÓN La finalidad de un sistema ATR (de sus siglas en inglés Automatic Target Recognition, Reconocimiento Automático de Objetivos); es detectar, clasificar, reconocer y/o identificar un objeto sin la ayuda del humano[1]. Este tipo de sistemas tienen una amplia gama de aplicaciones las cuales van desde la identificación de objetivos con fines militares, hasta la interpretación de imágenes de placas de rayos X en medicina[2][3]. Dentro del campo de aplicación de los ATR, se encuentran los LPR (License Plate Recognition, Reconocimiento de placas de Automotores) los cuales localizan e identifican de manera automática las placas de vehículos automotores de imágenes fijas o videos de vehículos. Sobre este tópico ( LPR ) existen varios trabajos de investigación desarrollados así como productos comerciales [4][5][6]. De entre estos trabajos existen una variedad de métodos usados para lograr la localización de la placa, como es el cálculo del gradiente Sobel horizontal en la imagen entera para posteriormente realizar una búsqueda de patrones en zonas rectangulares con valores altos positivos seguidos de valores altos negativos [7]. En otro método usado la imagen del automóvil es particionada en rectángulos de un tamaño aproximado al ocupado por la placa. En estos rectángulos se calcula la "membresía" de conjuntos

2. DESARROLLO 2.1. Descripción del Método Este trabajo presenta la primera parte de un sistema de LPR que es la localización de la placa de un vehículo en una imagen. El proceso implementado consta de: adquisición de imágenes de vehículos, preprocesamiento a las imágenes capturadas, extracción y selección de regiones candidatas a contener la placa del vehículo, y la localización de la placa en las regiones mencionadas anteriormente. 2.2. Adquisición de imágenes Las imágenes usadas fueron obtenidas con un cámara de vídeo marca Sony y capturadas con una tarjeta PCX200 Color Frame Grabber de Imagenation en formato BMP (640x486x16 Millones de colores). Un ejemplo se puede ver en la figura 1. La restricción que se tiene al momento de realizar la captura es que la placa no debe presentar ocultamiento de alguna sección, a excepción de vehículos tipo camioneta que en la defensa tengan una perilla y esta oculte parcialmente la placa. En la captura de las imágenes no se toma en cuenta la

147

Instituto Tecnológico de Chihuahua

ELECTRO 2001

impidiendo la separación de pixeles de regiones de interés.

Figura 1. Imagen original posición de la placa en la escena ni el tipo de iluminación de la misma, lo que agrega grados de complejidad al no buscar evitar problemas en etapas posteriores de segmentación como pudiera ser la iluminación de la placa con tipos de luz especiales [9][4], o considerar a priori la ubicación de la misma en la imagen [8].

Figura 2. Resultado del operador de textura 2.4. Extracción de Regiones Con las imágenes con bordes suavizados se inicia la eliminación de información no necesaria realizando primeramente una binarización dada por la formula 2:

2.3. Preprocesamiento Basados en la teoría de la percepción de la visión humana, la cual usa los conceptos de un procesamiento que va de global a local usando la información de baja resolución, a las imágenes capturadas se les aplica un operador de textura [10] el cual fue desarrollado basándose en la teoría antes mencionada, esto con el fin de localizar regiones en la escena. Este operador se basa en la medición de la energía de la textura presente en las superficies, la ecuación 1 define al operador. Tif: I(m,n) → IT(m,n)

1

si f(x,y) > T

0

si f(x,y) ≤ T

g(x,y) =

(2)

donde T es el nivel de tono de gris seleccionado como umbral y que puede tomar valores de 0 hasta 255, f(x,y) es el nivel de gris del punto (x,y), y g (x,y) es la imagen binarizada resultante. Para determinar el valor del umbral T, se llevaron a cabo experimentos en los que se busco un valor de umbral tal que eliminara la mayor información posible pero sin que se perdieran los bordes de la placa, el valor obtenido experimentalmente fue de 120 en la escala mencionada anteriormente. Con esto se obtiene una imagen binaria con los pixeles de los bordes resaltados. En la imagen resultante se rellenan regiones que estén enmarcadas por los bordes. En algunos casos los bordes no forman una región cerrada quedando líneas delgadas, y en otros, las regiones que se obtienen después de rellenar son tan delgadas que no puedan contener la placa, por lo que es necesario eliminar este tipo de regiones. Para esto se aplica un operador morfológico de apertura, el cual está dado por la formula 3:

(1)

donde : I(m,n) es una imagen e IT(m,n) es la imagen generada por el operador de textura. Tif se define como avg(var( vecindad i)), representando avg la función promedio y var es le varianza alrededor del pixel i de la imagen considerando cuatro direcciones, dentro de un vecindario vertical, horizontal, diagonal derecha y diagonal izquierda en una ventana de 3x3. El operador de textura genera regiones marcadas por bordes fuertes como se ilustra en la figura 2. A estos bordes se les aplica un suavizado con un filtro Gausiano con desviación estándar de 0.8 el cual nos permite, sin llegar a perder la definición de los bordes [11], suavizarlos lo suficiente para ampliar las líneas de pixeles que conectan regiones

Ro = ( RaΘRb) ⊕ Rb

148

(3)

Instituto Tecnológico de Chihuahua

ELECTRO 2001

en donde Ra es la región a la cual se le aplica la apertura, Rb el elemento estructural en que se basa la apertura, en nuestro caso es un rectángulo de 3x3 pixeles, y Ro corresponde a la región resultante después de la apertura que es el resultado de una erosión ( operador Θ ) de un área Ra por un elemento estructural Rb seguido por una dilatación (operador ⊕ ) usando el mismo elemento estructural.

las imágenes de varias placas de automóviles y se muestra en la Figura 4.

Figura 4. Patrón de placa El método para la creación del template consistió en el promediado de varias placas lo cual puede ser expresado por la formula 5:

Realizado lo anterior se seleccionan las regiones que cumplan con los criterios de una área mínima de 2000 pixeles, que se considera como el área mínima para poder contener una placa que sea posible identificar, hasta un limite máximo de 300000 que es casi la totalidad de una imagen. Al tener seleccionadas las regiones que cumplen con el criterio de áreas mínima y máxima, se crea una imagen nueva con los pixeles de la imagen original que pertenecen a las regiones anteriormente mencionadas, ver figura 3.

T (r,c) = avg( Pn(r,c) )

en donde Pn(r,c) corresponde a las imágenes de n placas de las cuales se obtiene un promedio (avg) de los valores de los pixeles, y T(r,c) corresponde al template obtenido. Este método de promediar las imágenes es el mas sencillo para obtener o crear un patrón, aunque lleva una carga en el costo de recursos computacionales utilizados. Para la obtención de las imágenes de placas se procedió a seleccionar y recortar de la imagen del carro la parte correspondiente a la placa. Lo anterior nos deja imágenes de placas las cuales tienen diferentes tamaños, debido a, como se explicó en la sección 2.2, no tenemos en consideración la escala de la placa con respecto a la imagen. Estas diferencias representan un problema al momento de buscar un template que este basado en el dominio espacial. Para igualar el tamaño de estas imágenes, calculamos el promedio del ancho y la altura de las imágenes de placas. Cada una de las imágenes de placas se ajustó al tamaño calculado.

Figura 3. Regiones seleccionadas 2.5. Localización de la Placa Para la localización de la placa se utilizó la función de autocorrelación normalizada la cual presenta la característica de no ser sensible a fondos y está definida por : (4) ϒ (s.t)

(5)

Al realizar la búsqueda de la placa en la imagen del carro con regiones seleccionadas se obtuvo un porcentaje de localización menor al 40% el cual no es en nada aceptable. Al analizar las imágenes que presentaron errores en la localización se encontró que en la mayoría de ellas se debía a áreas con textura suave (zonas uniformes como pueden ser las defensas o ventanas). En la figura 5 se nos presenta un ejemplo de lo anterior. La figura 5-a son las regiones seleccionadas en las cuales se realiza la búsqueda el patrón de la figura 4. El resultado de la máxima correlación está señalado en la figura 5-b con las flechas; las manchas dentro de la región correspondiente a la ventana son los

= ΣmΣn [ I(m,n) - Î (m,n) ][ W(m-s,n-t)- w ] {ΣmΣn [ I(m,n) - Î (m,n)]2 + ΣmΣn [ W(m-s,n-t)- w ] 2 }½

donde: I(m,n) es la imagen, Î (m,n) es el promedio de la imagen, W(m,n) es el patrón y w el promedio de W(m,n). El patrón representa el objeto a identificar, en este caso la placa. El patrón (template), se generó con

149

Instituto Tecnológico de Chihuahua

ELECTRO 2001

pixeles con el valor máximo, no confundir con el fondo de la imagen.

una imagen en la que los bordes aparecen realzados al tener valores de gris altos, mientras que las regiones uniformes, sin bordes, desaparecen, ver figura 6.

Figura 6. Resultado del operador and lógico El operador and lógico se aplicó a la imagen del carro y a sus bordes respectivos en el área correspondiente a las regiones seleccionadas. Como las imágenes con regiones seleccionadas se modifican, también modificamos el patrón de la placa, el cual se procesa de la misma manera que las imágenes de carros. Con las imágenes modificadas tanto de las regiones seleccionadas como la del template o patrón, se usa de nueva cuenta la función de correlación de la ecuación 4. El resultado de aplicar la autocorrelación se muestra en la Figura 7-a. El valor mayor de correlación es entonces marcado con un círculo, lo que se puede apreciar en la figura 7-b indicando la posición de la placa.

Figura 5. a) Regiones seleccionadas, b) resultado de la función de correlación donde se señala la localización del valor máximo La manera de eliminar este tipo de regiones que afectan en gran medida el desempeño del sistema fue tomar la característica del operador de textura (sección 2.3) que consiste en la medición de la energía de la textura con lo que las áreas uniformes se minimizan, quedando los bordes resaltados. Esta imagen de textura se combinó con la imagen original usando un operador and logico lo que estaría definido por la ecuación 6 : Ia(m,n) = IT(m,n) ● I(m,n)

(6)

donde IT(m,n) es la imagen resultante del operador de textura, ecuación 1, I(m,n) la imagen con los valores de pixeles originales, e Ia(m,n) el resultado de un and lógico (representado por el símbolo ●) entre las dos imágenes a nivel de bit obteniéndose

a)

150

Instituto Tecnológico de Chihuahua

ELECTRO 2001

[6] Parisi, R., Di Claudio, E.D., Lucarelli, G., y Orlandi, G.; “Car Plate Recognition By Neural Networks and image processing”, IEEE, pp 195 – 197,1998. [7] X. Fernández Hermida, F. M. Rodríguez, J. L. Fernandez, "A System for the automatic and Real Time Recognition of V.L.P.'s (Vehicle License Plate).", Proceedings of ICIAP-97, Florencia, Italia. Septiembre 1997. [8] Zimic, N., Ficzko, J., Mraz, M., y Virant, J.;”The Fuzzy Logic approach to the Car Number Plate Locating Problem”, IEEE,pp.227-230,1997. [9] Marvall Gomez-Allende, Dario; “Reconocimiento de formas y visión artificial”,Addison-Wesley,1994. [10] Chacon, Mario; “Document Segmentation using Texture Variance and Low Resolution Images”, IEEE Southwest Symposium on Image Analysis and Interpretation, pp 164-166, USA, 1998. [11] Vernon, David; “Machine Visión. Automated Visual Inspection and Robot Visión”, PrenticeHall, 1991. [12] Barroso,J., Rafael, A., Dagless, E.L., y BulasCruz, J.; “Number plate reading using computer visión”, Pagina Web: http://www.utad.pt/~jbarroso/html/isie97.html .

b) Figura 7. a)Valores de correlación, b) localización de la placa 3. RESULTADOS Los resultados obtenidos hasta el momento utilizando la modificación descrita anteriormente tiene un 83% de localización correcta de la placa. Este desempeño aunque no es muy alto para un localizador es relativamente bueno comparado con sistemas que incluyen un conjunto de restricciones los cuales reportan rangos que van del 89% al 100% en la localización de la placa [12]. Con los resultados obtenidos se da fundamento para continuar la investigación de nuevas propiedades que ayuden a mejorar el desempeño del sistema sin tener que incrementar el número de restricciones. 4. REFERENCIAS [1] Ratches, James A, Walters, C.P., Buser, Rudolf G., y Guenther, B.D.;”Aided and Automatic Target Recognition Based Upon Sensory Inputs From Image Forming Systems”, IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 19, no. 9, pp.1004-1019,1997. [2] Wan, Shu-yen, Kiraly, Atilla P., Ritman, Erik L., y Higgins, William E.; “Extraction of Hepatic vasculature in rats using 3-D Micro-CT images”, IEEE Transactions on Medical Imaging, vol. 19, no. 9,pp 964-971,2000 [3] Querk, Francis K.H., y Kirbas, Cemil; ”Vassel extraction in medical images by wave propagation and traceback”, IEEE Transactions on Medical Imaging ,vol. 19, no. 2, pp. 117-131, 2001. [4] Muehlemann, Mike; “Identify license plates of moving vehicles”, Visión System Design, Agosto 2000, pp 24-29. [5] Página Web: http://www.htsol.com/

151

Instituto Tecnológico de Chihuahua

ELECTRO 2001

152