Detection and classification of the periorbital wrinkles in 2D images

Proceedings of XI Workshop de Visão Computacional ‐ October 05th‐07th, 2015 Detection and classification of the periorbital wrinkles in 2D images Dan...
0 downloads 0 Views 1MB Size
Proceedings of XI Workshop de Visão Computacional ‐ October 05th‐07th, 2015

Detection and classification of the periorbital wrinkles in 2D images Daniel A.C.

Deborah S.R.D.

Angelo Amâncio D.

Leizer Schnitman

UFBA Clínica Deborah Duarte UEFS UFBA Salvador, BA, Brazil Feira de Santana BA, Brazil Feira de Santana BA, Brazil Salvador, BA, Brazil [email protected] [email protected] [email protected] [email protected]

Resumo—The use of images to monitor aesthetic treatments is a standard procedure used by dermatologists. However, the subjectivity in the analysis hampers the monitoring of dermatologic treatments, especially when there is no control over the capture of images. To confront this problem, we propose a robust system of detection and classification of periorbital wrinkles with photos of the patient’s face obtained without strict standardization. The algorithm has been tested with a set of photographs of patients with different degrees of wrinkle severity. The results presented by the system were satisfactory and correlated with clinical scores. Index Terms—facial wrinkles; wrinkle detection; wrinkle quantification; automatic detection;

I. I NTRODUÇÃO A busca pela beleza é uma tendência na sociedade atual e, em virtude disso, a procura por tratamentos estéticos vem crescendo com o passar dos anos. Atualmente, tratamentos estéticos são cada vez mais focados em retardar ou remover os efeitos causados pelo tempo sobre a pele, principalmente sobre as partes que ficam mais aparentes, como é o caso do rosto. É de senso comum que as rugas faciais, particularmente as periorbitais, aquelas que se localizam ao redor dos olhos e são vulgarmente conhecidas como "pés de galinha", são as que frequentemente se relacionam com a idade do indivíduo. Dessa forma, o combate às rugas é um tema recorrente nos tratamentos dermatológicos antienvelhecimento. Alguns tratamentos antienvelhecimento mais sofisticados necessitam da coleta de parâmetros precisos de rugosidade, oleosidade e hidratação da pele, com o objetivo de acompanhar com mais rigor sua evolução. Na literatura médica sobre esse assunto, pode-se encontrar trabalhos que envolvem coleta de informações precisas para auxiliar diagnósticos e tratamentos relacionados a rugas na pele. Pode-se destacar, por exemplo, a construção de moldes negativos de silicone da região da pele [1], para estimar com precisão o comprimento, largura e profundidade das rugas. Porém, essa prática é bastante trabalhosa e requer cuidados especiais na construção dos moldes, como a utilização de produtos que não agridam a pele do paciente e que facilitem a construção da máscara. Existem também alguns métodos que utilizam ultrassonografia de alta frequência multiphoton fluorescence e harmonic generation microscopy [2]. Esses sistemas apresentam grande precisão e reduzem a subjetividade das avaliações, porém são caros e necessitam um grande tempo para captura das informações.

Outra prática que se tornou popular entre os dermatologistas, dado ao seu baixo custo e simplicidade, é a comparação de fotografias de rugas de pacientes com fotografias de escalas padronizadas. Algumas delas podem ser encontradas nos trabalhos de [2], [3] e [4]. As escalas são formadas por fotografias de casos clínicos, e a descrição detalhada das características que diferem seus graus de enrugamento. Apesar de ser simples, a comparação com escalas inclui muita subjetividade, pois, dependendo do olhar do especialista, o mesmo paciente pode estar em dois graus de enrugamento diferentes. Outra dificuldade inerente ao método, é que a foto do paciente deve ser obtida sob as mesmas condições da foto da escala, o que muitas vezes é impraticável dentro da rotina de um consultório. A. Abordagens Computacionais Pode-se encontrar na literatura algumas abordagens que detectam e classificam rugas de forma automática a partir de imagens digitais 2D da face, porém, segundo Cula [5], estes métodos têm confiabilidade limitada. No trabalho de Brand [6] é descrita a montagem de uma estrutura metálica que mantém constante a distância e o ângulo da câmera em relação à face do paciente, e também menciona o uso de ambientes com iluminação controlada. O autor compara seus resultados de classificação com os resultados obtidos por especialistas usando a escala de Glogau [4]. Nos trabalhos de Cula [5] e [7] são apresentados sistemas que detectam e classificam (com uma escala própria) rugas periorbitais e rugas de testa, respectivamente. O autor descreve a utilização de um sistema que mantém a câmara e a fonte luminosa, agrupados paralelamente, para tornar melhor a aparência da superfície da pele e destacar as rugas. B. Motivação Apesar dos trabalhos mencionados em [5], [6], [7] apresentarem resultados satisfatórios, a necessidade de controlar o processo de aquisição das imagens torna o procedimento caro, trabalhoso e inadequado ao uso nas clínicas dermatológicas. Na rotina de uma clínica, por causa dos requisitos de redução do tempo entre os atendimentos e também da própria infraestrutura, é comum que médicos fotografarem os pacientes sem um padrão de iluminação, distância, ângulo e qualidade de imagem. Na maioria das vezes o médico compara

259

Proceedings of XI Workshop de Visão Computacional ‐ October 05th‐07th, 2015

e determina a evolução dos pacientes apenas de forma visual, e é comum a um especialista humano fazer tais ponderações. Entretanto, quando existe a necessidade de comparar imagens digitais para confrontar a evolução de um tratamento, ou para que se obtenham opiniões de especialistas diferentes, a falta de padronização dá margem discrepâncias entre análises, principalmente porque entra em cena a subjetividade e experiência do observador. Baseado nessa premissa, este trabalho se concentrou no desenvolvimento de um sistema computacional para auxiliar a detecção, medição e classificação das rugas periorbitais, a partir de imagens coletadas de forma não padronizada na rotina de atendimento de médicos dermatologistas. Essa ferramenta minimiza a subjetividade das análises de rugas periorbitais em imagens 2D, facilitando o diagnóstico e a avaliação de tratamentos antirrugas e a comparação de casos clínicos.

uma ilustração com os pontos que devem ser marcados pelo usuário.

Figura 2. Imagem exemplifica os pontos que devem ser localizados.

A 3 ilustra os procedimento envolvidos na etapa de Aquisição. Na parte superior da figura exemplificamos todo o processo da Aquisição, sem aplicar o ajuste da distância focal, e na parte inferior ilustramos o processo de Aquisição completo. O ajuste da distância focal necessita de um valor constante de altura do olho, que funciona como limite de comparação para indicar se a imagem será ampliada ou reduzida. Nesse trabalho, o valor que utilizamos foi a média das alturas dos olhos de todas as imagens do dataset, que correspondeu, aproximadamente, a 170 pixels. A 3a apresenta a imagem original com um círculo preto colocado sobre os olhos do paciente para preservar a sua identidade. Ela possui uma dimensão de 2304x3456 pixels, com altura do olho de aproximadamente 366 pixels. Por ela exceder a média, houve a necessidade de reduzir suas proporções para 1069x1604 pixels, de maneira que a altura do olho da nova imagem se enquadre em 170 pixels (3d). As 3b e 3d apresentam em destaque com um retângulo preto, a janela de corte (de tamanho fixo) da região periorbital, e as 3c e 3f mostram o resultado do recorte. Comparando as 3c e 3f pode-se compreender de forma visual como funciona o ajuste. Nelas aparecem fotografias da mesma face, mas com aproximações diferentes entre câmera e objeto. Portanto, padronizando a altura dos olhos das imagens do dataset, pôdese aproximar o recorte da região periorbital para um valor uniforme de distância focal.

II. M ETODOLOGIA O sistema desenvolvido se enquadra no tema da visão computacional, já que é capaz de adquirir, processar e interpretar imagens correspondentes de cenas reais [8]. Em geral, esses sistemas são divididos nas 5 etapas ilustradas na Figura 1. O sistema tem como entrada uma imagem lateral da face paciente, com foco na região periorbital, e retorna a classe de enrugamento do paciente e a imagem de entrada destacando as linhas das rugas. Todo o sistema foi implementado com o Matlab r2012a versão 7.14 no Sistema Operacional Windows 8. A câmera digital usada para coletar as imagens foi uma Canon EOS Rebel XT com lente Canon EFS 18-55mm.

Figura 1. Subdivisões do sistema.

A. Aquisição A etapa de Aquisição foi dividida em dois passos, como ilustrado na Figura 1. O primeiro passo teve o propósito de ajustar as diferentes distâncias focais das imagens do dataset. O ajuste se inicia com o aumento ou com a redução da imagem de acordo com a distância entre a pálpebra superior e inferior do olho em destaque (distância essa chamada de “altura do olho”). O segundo passo isola a região periorbital da imagem ajustada. Para realizar os dois passos é necessário que um usuário localize de forma manual a pálpebra superior, inferior e o canto do olho na imagem em análise. A Figura 2 exibe

Figura 3. (a) imagem original sem mudança; (b) imagem ilustrando a região de recorte; (c) imagem recortada; (d) resultado do processo de ajuste da distância focal; (e) imagem destacando a região que será recortada; (f) resultado final do processo ajuste e recorte.

B. Pré-Processamento O Pré-Processamento aplica técnicas para aprimorar a qualidade ou destacar partes de interesse da imagem [8]. As operações efetuadas nesta etapa são ditas de baixo nível porque

2

260

Proceedings of XI Workshop de Visão Computacional ‐ October 05th‐07th, 2015

atuam diretamente nos valores de intensidade dos pixels, sem nenhum conhecimento sobre a sua função na imagem. O primeiro passo dessa etapa é separar o canal azul (B) da imagem fornecida pela etapa de Aquisição (Figura 4a). Ele foi escolhido porque destaca as rugas e as dobras da pele mais do que os canais vermelho (R) e verde (G), elevando assim as taxas de acerto do detector. Contudo, esse parâmetro pode ser alterado, pois ele é vinculado a iluminação das fotografias e a câmera utilizada. No segundo passo aplica-se a difusão anisotrópica [9], que é uma estratégia para suavizar as áreas homogêneas da imagem, eliminando ruídos, sem interferir nas bordas e arestas (Figura 4b). Os resultados da difusão estão pouco perceptíveis entre as Figuras 4b e 4a porque elas sofreram redução para se acomodar ao tamanho deste texto. Usou-se nessa etapa os parâmetros sugeridos pelo trabalho de Perona [9]. O terceiro passo aplica uma técnica conhecida como transformada de potência ou exponencial (Figura 4c), para realçar o contraste da imagem [8]. Ela obedece a Equação (1) abaixo: T (f ) = c.f y

resultados foi o filtro Sobel horizontal. Sua vantagem em relação aos outros se caracteriza pelo fato da maioria das rugas periorbitais se encontrarem na horizontal, e por apresentar pesos maiores de diferenciação em relação aos outros operadores. O resultado dessa etapa está na Figura 4e. O segundo passo é a normalização da imagem, o qual não muda sua estrutura. Seu propósito é padronizar os níveis dinâmicos de cinza de modo que tenha a média e a variância pré-definidas [10]. A nova imagem será obtida obedecendo a equação (2): r VAR0 (I(i, j) − M )2 (2) G(i, j) = M0 + VAR Na Eq. 2, o termo G(i, j) é a imagem normalizada, VAR é a variância e M é a média da imagem de entrada. Os termos M0 e VAR0 são os valores desejados para a média e a variância da imagem normalizada, que terão valores 1 e 0 respectivamente. Seu resultado é apresentado na Figura 4f. No terceiro passo usamos o método de Otsu para encontrar a imagem binária (Figura 4g). Esse método determina automaticamente o valor numérico do pixel que proporciona a menor variância entre as duas classes, a do objeto de interesse e a do fundo [8]. Na imagem binária gerada, os pixels com valor ’1’ indicam a presença de rugas, e os com valor ’0’ a ausência. Apesar dos tratamentos aplicados nas etapas anteriores, o resultado, apresentado na Figura 4g, ainda existem ruídos que contaminam a imagem. Para corrigir esse problema, nós aplicamos mais duas técnicas de filtragem de ruídos. A primeira calcula a imagem de confiança para usá-la como máscara seletora de pixels, e a segunda localiza e nomeia todas as prováveis rugas (na imagem binária) para selecionar as que tem mais chances de ser realmente uma ruga. O cálculo da imagem de confiança necessita do cálculo da imagem de orientação. Esta última frequentemente é usada em técnicas de melhoramento de imagens de impressão digital [10], e é definida como a orientação local das estruturas de cristas e vales numa imagem de impressão digital. A estrutura e o formato de uma impressa digital são estruturalmente semelhantes ao de uma região enrugada na pele, portanto, podemos assemelhar os vales da impressão digital às rugas, e as cristas às regiões da pele lisas. A imagem de orientação é calculada a partir da imagem normalizada. Calculam-se os gradientes GX e GY nas direções de x e y da imagem normalizada através do operador de Sobel. Em seguida, divide-se a imagem gerada em pequenos blocos. Posteriormente, estima-se a orientação local do pixel central de cada bloco e aplica-se um filtro passa-baixa para diminuir a influência de possíveis ruídos e imperfeições, para tornar a estimativa de orientação dos blocos mais confiáveis. Em seguida calcula-se a imagem de confiança, que fornece informações sobre a precisão da estimativa da orientação local, a qual é definida como a covariância do bloco em relação aos seus blocos vizinhos. Portanto, nos casos em que o valor da confiança é baixo, o bloco em questão não apresenta traços de orientação contínua, logo pode ser considerado uma área sem rugas. Em casos que o valor de confiança é alto,

(1)

A função T (f ) é a imagem resultante da transformada, o termo c é uma constante que assumiu o valor 1, e y é a variável que altera o contraste de f (valor do pixel). Usamos y = 1.7 baseado em resultados empíricos. O uso dessa técnica aumenta a diferença de amplitude entre os níveis de cinza das regiões com rugas em relação às sem rugas. No quarto passo (ilustrado na Figura 4d) substituímos todos os pixels que tem valor acima da média da imagem, pelo pixel com intensidade igual ao da média. Realizamos esse procedimento, porque comprovamos que existe um predomínio dos pixels mais claros que formam a pele, e possuem valores altos, ao contrário das rugas, que têm menor predominância e são formadas de pixels escuros de valores baixos. Portanto, se utilizarmos o valor da média como limiar estaremos trabalhando somente com pixels da pele, sem interferir nas rugas. Essa etapa se mostrou eficiente em eliminar pixels que consideramos inúteis, como os de pigmentos da pele, poros, pelos e regiões com excesso de iluminação. C. Segmentação A Segmentação visa dividir a imagem nos objetos de interesse que a compõem. Em nosso caso, o objetivo é diferenciar as regiões com rugas das sem rugas. Nós dividimos essa etapa em cinco partes, como apresentado na Figura 1. No primeiro passo nós aplicamos operadores derivados de primeira ordem (na imagem Pré-Processada) para localizar as bordas, que em nosso caso representam as rugas. Uma borda numa imagem é uma mudança súbita do nível de cinza entre as regiões relativamente homogêneas, logo para a detecção e realce de bordas, aplicam-se habitualmente filtros espaciais lineares baseado no gradiente da função de luminosidade. O gradiente das imagens é aproximado com o uso de máscaras de convolução ou operadores 3x3. Dentre todos os filtros, que utilizamos no projeto, o que nos proporcionou melhores

3

261

Proceedings of XI Workshop de Visão Computacional ‐ October 05th‐07th, 2015

(a)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

(i)

(j)

Figura 4. Etapa do sistema. (a) canal B; (b) difusão anisotrópica; (c) realce do contraste; (d) limiarização pela média dos pixels; (e) aplicação do operador Sobel horizontal; (f) normalização; (g) binarização; (h) seleção feita com a imagem de confiança; (i) seleção das rugas (j) imagem com rugas destacadas.

existem elementos de orientação contínua ligados ao bloco e, possivelmente, ele pertence a uma área onde há rugas. A seleção dos pixels com a imagem de confiança está na Figura 4h. O último passo é a localização e rotulação das rugas na imagem binária. Cada ruga pode ser considerada como um agrupamento de pixel brancos cercados por pixels pretos. O algoritmo de localização percorre toda a imagem binária, pixel a pixel de cima para baixo e da esquerda para a direita. Ele verifica inicialmente se o pixel corrente é branco, caso não seja, o algoritmo passa para o próximo pixel, caso seja, ele inicia uma verificação para saber se já existe algum agrupamento ou pixel rotulado próximo ao pixel corrente. Para isso, o algoritmo verifica respectivamente os pixels ao NORTE, NOROESTE, OESTE e SUDOESTE do pixel corrente. Esses quatro pixels já passaram por essa verificação em momentos anteriores, logo, ou eles são pixels pretos, que não interferem, ou são pixels brancos que fazem parte de algum agrupamento rotulado. Caso alguns dos quatro pixels já estejam rotulados, o pixel corrente também receberá o mesmo rótulo, indicando que ele está incluso no mesmo agrupamento de seus vizinhos. Mas caso nenhum dos quatro pixels sejam brancos, o pixel corrente receberá um novo rótulo, que indica que ele é o início de um novo agrupamento. Ao final da execução cada ruga (ou agrupamento) terá seu rótulo próprio. Depois da rotulação o algoritmo retira os agrupamentos com poucos pixels e de pequeno comprimento, porque acreditamos que eles têm baixa probabilidade de serem realmente rugas. O resultado desse procedimento está ilustrado na Figura 4i. A Figura 4j mostra as rugas em destaque na imagem inicial.

coletados baseados nos procedimentos técnicos de análise e classificação de rugas (medição de comprimento, profundidade, e variação das rugas) [2], [3] e [4]. Os dois últimos parâmetros coletados são conhecidos como descritores de textura de Haralick [11], e são calculados a partir da matriz GLCM (Gray-Level Co-Occurrence Matrix), que é um método de análise espacial de texturas, no qual a matriz armazena a probabilidade de ocorrência conjunta de níveis de cinza a uma certa distância ’d’ e a um ângulo ’θ’. Todos os procedimentos para os cálculos dos descritores de Haralick estão descritos em [11]. Segue abaixo os 5 parâmetros coletados: 1) Densidade da imagem - é a proporção de pixels brancos (rugas) pela quantidade total de pixels da imagem. 2) Variância média da pele - é a divisão da soma das magnitudes dos gradientes das rugas, pelo número de pixels da imagem, multiplicado por 255 [12]. 3) Comprimento da maior ruga - é a distância entre o primeiro e o último pixel na horizontal do maior agrupamento. 4) Contraste - mede a variação local na GLCM, ou seja, a intensidade de contraste entre um pixel e o seu vizinho ao longo de toda a imagem. 5) Energia - fornece a soma de elementos quadrados no GLCM. Também conhecida como a uniformidade ou o segundo momento angular. E. Reconhecimento e Interpretação A última etapa do projeto consiste em atribuir significado ao conjunto de dados usando métodos computacionais e estatísticos, e a partir daí, aprender como classificar outras amostras de dados semelhantes. Segundo Mitchell [13] aprendizagem é a capacidade de um sistema adquirir uma definição geral de categorias, fornecendo-se amostras positivas e negativas de tais categorias. Para essa tarefa nós treinamos um classificador Neural e um Fuzzy, para comparar suas taxas de desempenho.

D. Extração de Características Essa etapa visa retirar informações das imagens geradas até aqui, para serem utilizadas na etapa de Reconhecimento e Interpretação. Nós coletamos 5 (cinco) parâmetros das imagens geradas nos passos anteriores. Os três primeiro foram

4

262

Proceedings of XI Workshop de Visão Computacional ‐ October 05th‐07th, 2015

Um classificador Neural é um sistema de inferência montado com uma RNA (Rede Neural Artificial), que é um processador distribuído constituído de unidade de processamento simples, que têm a propensão natural para armazenar conhecimento experimental e torná-lo disponível para uso, além de ter a capacidade de resolver problemas não lineares, complexos, e grande capacidade de adaptação às mudanças do meio. Testamos o desempenho de diversas topologias de RNA, e entre as testadas, a que retornou melhor desempenho foi a rede com a topologia 5-2-3 (com apenas dois neurônios na camada intermediária). Classificadores Fuzzy são apropriados para problemas que não existem limites claramente definidos (por exemplo, em casos de transição entre conjuntos de rugas suave e moderada). Para montarmos o classificador nós geramos o FIS (Sistema de Inferência Fuzzy), utilizando o FCM (Fuzzy c-means clustering) para extrair um conjunto de regras que moldam o comportamento dos dados de forma automática. O FCM é uma técnica de agrupamento de dados onde, cada dado do conjunto pertence a um cluster de algum grau, que é especificado por uma relação de classificação. Essa técnica foi originalmente introduzido por Bezdec [14] como uma melhoria nos métodos de montagem anteriores.

classificador corresponde à média dos percentuais de acerto das k iterações. Em nosso caso, usamos k igual a 10, pois é uma das quantidades mais utilizadas em outros trabalhos. Mais detalhes desses dois métodos podem ser encontrados em [15]. Na Tabela I disponibilizamos as quantidades de amostras subdivididas para treinamento e teste. No método K-Folds Cross-Validation o conjunto de dados original é dividido em k partições do mesmo tamanho. A cada iteração uma das k partições é usada nos testes e as k − 1 partições restantes no treinamento. A precisão do classificador corresponde à média dos percentuais de acerto das k iterações. Em nosso caso, usamos o k igual a 10, pois é uma das quantidades mais utilizadas em outros trabalhos. Mais detalhes desses dois métodos podem ser vistos no trabalhos de Japkowicz [15]. Na Tabela I disponibilizamos as quantidades de amostras subdivididas para treinamento e testes. Tabela I D ISTRIBUIÇÃO DA AMOSTRAS PARA TREINAMENTO E TESTE .

R. Holdout KF C. Validation

III. R ESULTADOS E D ISCUSSÃO

Trein. Teste Trein. Teste

Suave 124 54 160 18

Moderado 58 26 76 8

Severo 119 52 154 17

Total 301 132 390 43

Na Tabela II nós apresentamos as taxas de acerto do sistema. Com o objetivo de comparar os desempenhos dos classificadores a mesma distribuição de dados que foi fornecida para o treinamento e teste do classificador Fuzzy também foi fornecida para o RNA. Analisando os dados da Tabela II podemos concluir que o classificador Fuzzy teve menor desempenho em relação ao RNA, nos dois métodos de reamostragem. Entretanto, a diferença percentual entre os métodos de reamostragem (no mesmo classificador) é de aproximadamente 1%. Isso reforça a ideia que os métodos de reamostragem utilizados, tendem a encontrar a estimativa de erro mais próxima da realidade, pois cada método divide o conjunto de dados de maneira diferente, contudo, as taxas de acerto permanecem bastante próximas.

Nesse momento do trabalho nós testamos o sistema afim de medir seu grau de confiabilidade, o submetendo a novas imagens e comparando seus resultados com os resultados de especialistas. O dataset foi composto por 433 fotografias da região periorbital da face de pacientes não identificados. As rugas das imagens foram classificadas por dermatologistas utilizando três níveis de severidade, segundo a Escala de Rugas Periorbitais de Fitzpatrick e Goldman [3]. Ao final, 178 imagens foram classificadas como suaves, 84 como moderadas e 171 como severas. Nós conduzimos os testes praticando duas metodologias de reamostragem diferentes: a Holdout Repetida e a K-Folds Cross-Validation. Essas técnicas são usadas para fornecer resultados mais verdadeiros de estimativa de erro. Geralmente quanto maior a quantidade de amostras melhor e mais verdadeiro são os resultados da estimativa do erro. Entretanto, na maioria dos trabalhos os dados são limitados, logo, eles terão que ser usados e reutilizados, afim de se obter um número suficientemente grande de amostras [15]. Esse processo é conhecido como reamostragem. O Holdout repetido divide os dados originais em um conjunto de treinamento e outro de teste, geralmente 2/3 para o treinamento e 1/3 para os testes, para cada iteração. A repetição do processo torna a estimativa de erro mais confiável, pois o processo de treinamento e teste é repetido sempre com diferentes sub-amostras. A taxa de erro global é média das taxas de erro das iterações. No método K-Folds Cross-Validation o conjunto de dados original é dividido em k partições do mesmo tamanho. A cada iteração uma das k partições é usada nos testes e as k − 1 partições restantes no treinamento. A precisão do

Tabela II TAXAS DE ACERTO DOS CLASSIFICADORES . Fuzzy RNA

Repeated Holdout 81, 9% 88, 7%

K-Folds C. Validation 82, 2% 89, 8%

Na Tabela III apresentamos os resultados da sensitividade e especificidade. A sensitividade é a porcentagem de instâncias classificadas corretamente como verdadeiros positivos dentre todas as que realmente são positivas (VP + FN). A especificidade é a porcentagem de instâncias classificadas corretamente como verdadeiros negativos dentre todas as que realmente são negativas (VN + FP). Nos resultados da Tabela III podemos observar que o classificador RNA teve todas as suas taxas de sensitividade acima de 92% e as taxas de especificidade acima de 95%, e com isso ele se mostrou superior ao classificador Fuzzy na taxa de sensitividade, mas por outro lado, foi inferior

5

263

Proceedings of XI Workshop de Visão Computacional ‐ October 05th‐07th, 2015

na taxa de especificidade, onde o classificador Fuzzy alcançou resultados acima de 98%.

a maioria das rugas nas imagens, e o classificador determina qual é o grau de enrugamento do paciente, utilizando para isso a escala de rugas de Fitzpatrick e Goldman. Nos testes de validação do sistema, comparou-se o desempenho de dois classificadores (um RNA e outro Fuzzy). Utilizou-se um conjunto de imagens com 433 fotografias de pacientes reais e classificadas por dermatologistas. No treinamento e testes dos classificadores, usamos as técnicas de reamostragem Holdout Repetido e K-Folds Cross-Validation para encontrarmos as métricas de desempenho mais próximas dos valores reais. Isso pôde ser comprovado nos resultados encontrados na Tabela II que mostram as taxas de acerto, com uma diferença de aproximadamente 1%, entre os dois métodos de reamostragem. Em trabalhos futuros, refinaremos os métodos para detectar e classificar rugas, e aumentaremos o número de imagem do dataset para avaliar melhor a robustez do sistema. A intenção é aumentar o número de classes e usar outros classificadores para melhorar a sensibilidade do sistema e adaptá-lo para trabalhar com outros tipos de rugas. Também há a intenção de desenvolver uma versão do sistema para dispositivos móveis, para facilitar ainda mais seu uso.

Tabela III R ESULTADOS DA SENSITIVIDADE E ESPECIFICIDADE .

Fuzzy RNA

Sensitividade Especificidade Sensitividade Especificidade

Holdout Repetido 87, 59% 98, 97% 92, 40% 95, 76%

K-Folds C. Validation 87, 07% 98, 43% 93, 25% 96, 86%

Na Figura 5 apresentamos a curva ROC (Receiver Operating Characteristic) do classificador RNA em uma instância da execução dos testes de validação. Geralmente, a sensitividade e a especificidade são características difíceis de conciliar, pois é uma relação normalmente antagônica. As curvas ROC são uma forma de representar a mesma relação com curvas ao longo de uma reta de ponto de corte. Uma curva ROC é uma representação gráfica da sensitividade ou VP, versos 1-especificidade ou FP. Logo, quanto mais próxima estiver a curva do canto superior esquerdo do gráfico melhor é a performance do classificador.

R EFERÊNCIAS [1] J. Hatzis, “The wrinkle and its measurement - a skin surface profilometric method,” Micron, vol. 35, pp. 201–219, 2004. [2] D. Shohani, E. Markovitz, S. J. Monstrey, and D. J. Narins, “The modified fitzpatrick wrinkle scale: A clinical validated measurement tool for nasolabial wrinkle severity assessment,” American Society for Dermatologic Surgery, vol. 34, pp. 85–91, 2008. [3] R. E. Fitzpatrick, M. P. Goldman, N. M. Satur, and W. D. Tope, “Pulsed carbon dioxide laser resurfacing of photo-aged facial skin,” Arch. Dermatol, vol. 132, pp. 395–402, 1996. [4] R. G. Glogau, “A esthetic and anatomic analysis of the aging skin.” Semin Cutan Med Sung, vol. 15, pp. 134–138, 1996. [5] G. O. Cula, P. R. Bargo, and N. Kollias, “Assessing facial wrinkles: Automatic detection and quantification,” Photonic Therapeutics and Diagnostics, vol. 7161, 2009. [6] V. C. Brand, R. C. Souza, H. Pedrini, and H. Lima, “Avaliação da intensidade das rugas periorbitais por processamento digital de imagens: um estudo de validação,” Surgical and Cosmetic Dermatology, pp. 15– 20, 2009. [7] G. O. Cula, P. R. Bargo, and N. Kollias, “Assessing facial wrinkles: Automatic detection and quantification,” Skin Researchand Technology, vol. 19, pp. 243–251, February 2012. [8] O. M. Filho and H. V. Neto, Processamento Digital de Imagens. Rio de Janeiro: Brasport, 1999. [9] P. Perona and J. Malik, “Scale-space and edge detection using anisotropic diffusion,” IEEE Transactions of Pattern Analysis and Machine Intelligence, vol. 12, 1990. [10] L. Hong, Y. Wan, and A. K. Jain, “Fingerprint image enhancement: Algorithm and performance evaluation,” IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 20, pp. 777–789, 1998. [11] R. Haralick, K. Shanmugam, and I. Dinstein, “Texture features for image classification,” IEEE Transactions on systems, man and cybernetics, vol. SMC-3, pp. 610–621, 1973. [12] M. Z. Lazarus, K. Srilakshmi, and M. Sandeepv, “Age classification: based on wrinkle analysis,” International Journal on Recent and Innovation Trends in Computing and Communication, vol. 1, pp. 119–124, 2013. [13] T. Mitchell, Machine Learning. Rio de Janeiro: Brasport, 1999. [14] J. Bezdec, Pattern Recognition with Fuzzy Objective Function Algorithms. New York: Plenum Press, 1981. [15] N. Japkowicz and M. Shah, Evaluating Learning Algorithms: A Classification Perspective. New York: Cambridge University Press, 2011.

Figura 5. Curva ROC.

Pelos resultados apresentados no gráfico podemos observar que os melhores desempenhos estão representados pelas curvas da classe suave e severo, e a classe moderado apresentou resultados de desempenho um pouco inferior. IV. C ONCLUSÃO A principal motivação para esse trabalho veio da dificuldade encontrada por médicos dermatologistas em utilizar imagens 2D capturadas sem padronização de iluminação, distância, ângulo e qualidade, para diagnosticar a evolução dos tratamentos dermatológicos aplicados à redução das rugas periorbitais de seus pacientes. A falta de um critério mais objetivo não só dificulta o próprio tratamento, como também complica a troca de informações entre médico e paciente quando é necessário que o médico argumente de forma concreta, e com dados objetivos, sobre os efeitos do tratamento. Diante dos argumentos, o objetivo do trabalho foi desenvolver uma ferramenta que reduzisse a subjetividade na avaliação de imagens das rugas periorbitais, sem aumentar os custos nem dificultar o procedimento de diagnóstico. Para isso, desenvolvemos um detector e classificador robusto de rugas periorbitais da face. O detector localiza e parametriza

6

264

Suggest Documents