UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA DEPARTAMENTO DE ENGENHARIA ELÉTRICA PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA

MOISÉS ARAUJO OLIVEIRA

SISTEMAS INTELIGENTES PARA DETECÇÃO DE NOVIDADES EM INSPEÇÕES NÃO-DESTRUTIVAS POR ULTRASSOM

Salvador 2017

UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA DEPARTAMENTO DE ENGENHARIA ELÉTRICA PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA

˜ DE NOVIDADES EM SISTEMAS INTELIGENTES PARA DETECC ¸ AO ˜ ˜ INSPEC ¸ OES NAO-DESTRUTIVAS POR ULTRASSOM

Mois´es Araujo Oliveira

Disserta¸c˜ao de Mestrado apresentada ao Programa de P´os-gradua¸c˜ao em Engenharia El´etrica da Universidade Federal da Bahia, como parte dos requisitos necess´arios `a obten¸c˜ao do t´ıtulo de Mestre em Engenharia El´etrica. Orientadores: Eduardo F. de Simas Filho Ivan C. da Silva

Salvador Dezembro de 2017

Ao Senhor, pois sem Ele nada seria poss´ıvel

iv

Agradecimentos Agrade¸co aos meus pais Elizabete e Araujo pelo apoio por toda a vida. Aos meus orientadores Eduardo Simas e Ivan Silva com o incentivo e suporte para o desenvolvimento dos trabalhos em uma nova ´area da pesquisa cient´ıfica. Ao LABIND/GPEND, na figura da Professora Cl´audia Farias e Ygor Tadeu, que desde 2009 compartilham o aprendizado do m´etodo cient´ıfico e a amizade fora do laborat´orio. Aos colegas do LSD da UFBA, com a convivˆencia e troca de conhecimentos durante o andamento do trabalho. Aos amigos que torceram, acompanharam, deram for¸ca para a realiza¸ca˜o durante esse per´ıodo. Agrade¸co ao Conselho Nacional de Desenvolvimento Cient´ıfico e Tecnol´ogico (CNPq) e a Coordena¸ca˜o de Aperfei¸coamento de Pessoal de N´ıvel Superior (CAPES), pela concess˜ao da bolsa de dedica¸c˜ao exclusiva e apoio financeiro.

v

Resumo da Disserta¸c˜ao apresentada ao PPGEE/UFBA como parte dos requisitos necess´arios para a obten¸ca˜o do grau de Mestre em Engenharia El´etrica

˜ DE NOVIDADES EM SISTEMAS INTELIGENTES PARA DETECC ¸ AO ˜ ˜ INSPEC ¸ OES NAO-DESTRUTIVAS POR ULTRASSOM

Mois´es Araujo Oliveira Dezembro/2017 Orientadores: Eduardo F. de Simas Filho Ivan C. da Silva Programa: Engenharia El´etrica A detec¸ca˜o de novidades ´e uma tarefa de aprendizado de m´aquina que verifica se um exemplo ou um conjunto de exemplos diferem consideravelmente dos exemplares obtidos de antem˜ao. Essa caracter´ıstica ´e tida como uma habilidade vantajosa para sistemas de aprendizado, sobretudo quando amostras s˜ao adquiridas progressivamente. Os procedimentos convencionais para identifica¸ca˜o de danos atrav´es dos ensaios n˜ao destrutivos normalmente carecem de informa¸c˜oes a priori suficientes acerca da estrutura sob investiga¸ca˜o, a fim de poder formular um modelo matem´atico. Como consequˆencia, para estruturas complexas, a necessidade de formular intuitivamente um modelo seguro pode dificultar a aplica¸ca˜o dessas t´ecnicas, tornando-as demoradas e onerosas. Neste trabalho ser´a avaliada a aplica¸ca˜o da detec¸ca˜o de novidades como alternativa a`s t´ecnicas de classifica¸ca˜o multiclasse atualmente empregadas com sucesso para o problema. Pretende-se comparar a eficiˆencia de 4 abordagens: m´aquina de vetor de suporte, baseadas em algoritmos de medi¸ca˜o de distˆancia, agrupamentos km´edias e mapas auto-organiz´aveis para identifica¸ca˜o de anomalias em sinais coletados atrav´es de ensaios n˜ao destrutivos por ultrassom. Os m´etodos utilizaram dados provenientes de trˆes inspe¸co˜es distintas: usando a t´ecnica de Tempo de Voo Difratado TOFD em chapa de a¸co soldada, a inspe¸c˜ao de p´as de aerogeradores por meio da t´ecnica Bubbler e a inspe¸c˜ao por imers˜ao de ligas de a¸co HP. Os dados coletados ser˜ao submetidos a etapas de pr´e-processamento que incluem a transformada wavelet para filtragem de ru´ıdo e a transformada discreta de Fourier para estudo no dom´ınio da frequˆencia. A an´alise de componentes principais foi empregada para a redu¸ca˜o da dimensionalidade, selecionando as caracter´ısticas intr´ınsecas a`s diferentes condi¸co˜es de cada material. vi

Abstract of Dissertation presented to PPGEE/UFBA as a partial fulfillment of the requirements for the degree of Master of Engenharia El´etrica

INTELLIGENT SYSTEMS FOR NOVELTIES DETECTION IN NON-DESTRUCTIVE ULTRASONIC INSPECTIONS

Mois´es Araujo Oliveira December/2017

Advisors: Eduardo F. de Simas Filho Ivan C. da Silva Department: Electrical Engineering Novelty detection is a machine learning task that checks whether an example or a set of examples differ considerably from the samples obtained in advance. This feature is seen as an advantageous skill for learning systems, especially when samples are progressively acquired. Conventional procedures for identifying damage through nondestructive testing usually lack sufficient a priori information about the structure under investigation in order to formulate a mathematical model. As a consequence, for complex structures, the need to intuitively formulate a secure model may hinder the application of these techniques, making them time-consuming and costly. This work will evaluate the application of a novelty detection methodology as an alternative to the multiclass classification techniques currently employed successfully for the problem. It is intended to compare the efficiency of 4 different techniques for novelties detection using support vector machine-based approaches, based on distance-measuring algorithms, k-means clustering and self-organized maps to identify anomalies in collected signals through non-destructive tests by ultrasound. The methods used data from three different inspections: using Time of Flight Diffraction (TOFD) technique in welded steel plate, the inspection of wind turbine blades by the Bubbler technique and the immersion inspection of HP alloys steel. The collected data will be subjected to pre-processing steps which include wavelet transform for noise filtering and the discrete Fourier transform for frequency domain study. Principal component analysis was used to reduce dimensionality, selecting the characteristics intrinsic to different conditions of each material.

vii

Sum´ ario Lista de Figuras

x

Lista de Tabelas

xiii

Lista de S´ımbolos

xiv

Lista de Abreviaturas

xv

1 Introdu¸c˜ ao 1.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Organiza¸c˜ao do Documento . . . . . . . . . . . . . . . . . . . . . . .

1 2 2

2 Vis˜ ao Geral sobre os Ensaios n˜ ao Destrutivos por Ultrassom 2.1 T´ecnicas de Inspe¸ca˜o por Ultrassom . . . . . . . . . . . . . . . . . . .

4 9

3 T´ ecnicas de Processamento de Sinais e Classifica¸c˜ ao Utilizadas 3.1 Normaliza¸ca˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Transformada Discreta de Fourier . . . . . . . . . . . . . . . . . . . . 3.3 Transformada Discreta wavelet . . . . . . . . . . . . . . . . . . . . . . 3.4 An´alise de Componentes Principais . . . . . . . . . . . . . . . . . . . 3.5 M´etodos de Classifica¸ca˜o Multiclasse . . . . . . . . . . . . . . . . . . 3.5.1 Redes Neurais Artificiais . . . . . . . . . . . . . . . . . . . . . 3.5.2 M´aquinas de Vetor de Suporte . . . . . . . . . . . . . . . . . . 3.6 M´etodos de Detec¸ca˜o de Novidades . . . . . . . . . . . . . . . . . . . 3.6.1 Detec¸ca˜o de novidades usando abordagem baseada em distˆancia 3.6.2 Detec¸c˜ao de novidades usando abordagem de constru¸c˜ao de dom´ınio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.6.3 Detec¸ca˜o de novidades usando abordagem baseada em mapas auto-organiz´aveis . . . . . . . . . . . . . . . . . . . . . . . . .

13 13 14 15 17 18 19 21 23 27 30 31

4 Metodologia dos ensaios 35 4.1 Experimento 1 - Solda . . . . . . . . . . . . . . . . . . . . . . . . . . 35 4.2 Experimento 2 - P´as de Aerogeradores . . . . . . . . . . . . . . . . . 37 viii

4.3 4.4 4.5

Experimento 3 - Tubos de Fornos de Pir´olise . . . . . . . . . . . . . . 40 Cadeia de Processamento de Sinais Proposta . . . . . . . . . . . . . . 41 Representa¸c˜ao dos resultados . . . . . . . . . . . . . . . . . . . . . . 44

5 Resultados e Discuss˜ oes 5.1 Solda - Experimento 1 . . . . . . . . . . . . 5.1.1 Processamento de Sinais . . . . . . . 5.1.2 Detectores de Novidade . . . . . . . 5.2 P´as de Aerogeradores - Experimento 2 . . . 5.2.1 Processamento de Sinais . . . . . . . 5.2.2 Detectores de Novidade . . . . . . . 5.3 Tubos de Fornos de Pir´olise - Experimento 3 5.3.1 Processamento de Sinais . . . . . . . 5.3.2 Detectores de Novidade . . . . . . . 5.4 Considera¸co˜es sobre os resultados obtidos . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

48 48 48 51 60 60 62 69 69 71 76

6 Conclus˜ oes

78

Referˆ encias Bibliogr´ aficas

80

A Trabalhos Publicados 87 A.1 Artigos apresentados em Congressos . . . . . . . . . . . . . . . . . . . 87

ix

Lista de Figuras 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9

Ensaio por L´ıquidos Penetrantes. . . . . . . . . . . . . . . . Ensaio por Part´ıculas Magn´eticas. . . . . . . . . . . . . . . . Ensaio por Raios-X. . . . . . . . . . . . . . . . . . . . . . . Configura¸ca˜o dos transdutores normal e angular. . . . . . . . Comportamento do Feixe Ultrassˆonico. . . . . . . . . . . . . Diagrama ilustrativo da propaga¸c˜ao das ondas de ultrassom. Ensaio por ultrassom - T´ecnica Pulso-Eco. . . . . . . . . . . Transdutor especial Bubbler. . . . . . . . . . . . . . . . . . . Ensaio por ultrassom - T´ecnica TOFD. . . . . . . . . . . . .

. . . . . . . . .

. 4 . 5 . 6 . 7 . 8 . 8 . 9 . 10 . 11

3.1 3.2 3.3 3.4

Decomposi¸ca˜o wavelet com Subamostragem. . . . . . . . . . . . . . M´aquina de Vetor de Suporte como kernel Radial Basis Function. . Comportamento de um algoritmo para detec¸ca˜o de novidades. . . . Constru¸ca˜o de modelos para detec¸ca˜o de novidades usando assinaturas de ultrassom. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Compara¸ca˜o da distˆancia entre a condi¸c˜ao normal e a novidade. . . Aplica¸ca˜o do clustering k-means. . . . . . . . . . . . . . . . . . . . . Constru¸ca˜o da hiperesfera para o SVDD. . . . . . . . . . . . . . . . Organiza¸c˜ao do mapeamento n˜ao-linear de Kohonen. . . . . . . . .

. 16 . 22 . 23

3.5 3.6 3.7 3.8 4.1 4.2

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . .

Tipos de defeitos usualmente observados em soldas. . . . . . . . . . . Corpo de prova soldado com a presen¸ca de defeitos internos inseridos de modo controlado durante a soldagem. . . . . . . . . . . . . . . . . 4.3 Esquema da realiza¸c˜ao do experimento 01 e coleta das amostras. . . . 4.4 Madeira de balsa utilizada nas p´as de aerogeradores. . . . . . . . . . 4.5 Localiza¸ca˜o da regi˜ao dos defeitos nos corpos de prova do experimento 2 4.6 Esquema da realiza¸c˜ao do experimento 02 e coleta das amostras. . . . 4.7 Amostras de tubos utilizados no experimento. . . . . . . . . . . . . . 4.8 Esquema da realiza¸c˜ao do experimento 03 e coleta das amostras. . . . 4.9 Etapas do sistema de tomada de decis˜ao. . . . . . . . . . . . . . . . . 4.10 Exemplos de poss´ıveis comportamentos da curva ROC e AUC. . . . . x

26 27 28 30 32 36 36 37 38 39 39 40 41 43 45

4.11 M´etodo para descri¸c˜ao estat´ıstica de dados boxplot. . . . . . . . . . . 46 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 5.10 5.11 5.12 5.13 5.14 5.15 5.16 5.17 5.18 5.19 5.20 5.21

Sinal t´ıpico no dom´ınio do tempo ap´os a DWT Fam´ılia Daubechie de 3o n´ıvel para as diferentes classes de interesse existentes na Solda. . . Espectros de frequˆencia t´ıpicos das classes observadas na solda. . . . . Mapas de treinamento do m´etodo ND DIST para base de dados Solda. Mapas de treinamento do m´etodo ND k-means para base de dados Solda. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Mapas de treinamento obtidos com o m´etodo de ND SOM para base de dados Solda. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Mapas de treinamento obtidos com o m´etodo de ND SVDD para base de dados Solda. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Boxplot do produto m´edio da acur´acia dos detectores de novidade para base de dados Solda. . . . . . . . . . . . . . . . . . . . . . . . . ROC constru´ıda utilizando base de dados Solda. . . . . . . . . . . . . AUC percentual variando com o tamanho dos componentes principais para o experimento 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . Sinal t´ıpico no dom´ınio do tempo ap´os a DWT Fam´ılia Daubechie 3o n´ıvel para as classes existentes nas p´as de aerogeradores. . . . . . . . Espectros de frequˆencia t´ıpicos das classes observadas nas p´as de aerogeradores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Mapas de treinamento obtidos com o m´etodo de ND DIST para base de dados p´as de aerogeradores. . . . . . . . . . . . . . . . . . . . . . . Mapas de treinamento obtidos com o m´etodo de ND k-means para base de dados p´as de aerogeradores. . . . . . . . . . . . . . . . . . . . Mapas de treinamento obtidos com o m´etodo de ND SOM para base de dados p´as de aerogeradores. . . . . . . . . . . . . . . . . . . . . . . Mapas de treinamento obtidos com o m´etodo de ND SVDD para base de dados p´as de aerogeradores. . . . . . . . . . . . . . . . . . . . . . . Boxplot do produto m´edio da acur´acia dos detectores de novidade para base de dados p´as de aerogeradores. . . . . . . . . . . . . . . . . ROC constru´ıda utilizando base de dados p´as de aerogeradores. . . . AUC percentual variando com o tamanho dos componentes principais para o experimento 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . Sinal t´ıpico no dom´ınio do tempo ap´os a DWT Fam´ılia Daubechie 3o n´ıvel para as classes existentes nos tubos HP. . . . . . . . . . . . . . . Espectros de frequˆencia t´ıpicos das classes observadas nos tubos HP. . Mapas de treinamento obtidos com o m´etodo de ND DIST para base de dados tubos HP. . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi

49 50 52 53 54 55 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71

5.22 Mapas de treinamento obtidos com o m´etodo de ND k-means para base de dados tubos HP. . . . . . . . . . . . . . . . . . . . . . . . . 5.23 Mapas de treinamento obtidos com o m´etodo de ND SOM para base de dados tubos HP. . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.24 Mapas de treinamento obtidos com o m´etodo de ND SVDD para base de dados tubos HP. . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.25 Boxplot do produto m´edio da acur´acia dos detectores de novidade para base de dados tubos HP. . . . . . . . . . . . . . . . . . . . . . 5.26 ROC constru´ıda utilizando base de dados tubos HP. . . . . . . . . . 5.27 AUC percentual variando com o tamanho dos componentes principais para o experimento 3. . . . . . . . . . . . . . . . . . . . . . . . . . .

xii

. 72 . 72 . 73 . 74 . 75 . 76

Lista de Tabelas 4.1 4.2 4.3 4.4

Dimens˜oes dos corpos de prova extra´ıdo de aerogeradores . . . . . . . Dimens˜oes dos corpos de prova dos tubos de a¸co inoxid´avel da classe HP Bases de dados usadas nos experimentos de detec¸ca˜o de novidade . . Matriz de confus˜ao t´ıpica para o total de amostras avaliadas com a detec¸ca˜o de novidades . . . . . . . . . . . . . . . . . . . . . . . . . .

5.1 5.2

Eficiˆencia percentual dos m´etodos multiclasse para o experimento 1 Acur´acia percentual dos m´etodos de detec¸c˜ao de novidades para o experimento 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 AUC percentual calculado para o experimento 1 . . . . . . . . . . . 5.4 Eficiˆencia percentual dos m´etodos multiclasse para o experimento 2 5.5 Acur´acia percentual dos m´etodos de detec¸c˜ao de novidades para os experimento 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.6 AUC percentual calculado para o experimento 2 . . . . . . . . . . . 5.7 Eficiˆencia percentual dos m´etodos multiclasse para o experimento 3 5.8 Acur´acia percentual dos m´etodos de detec¸c˜ao de novidades para o experimento 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.9 AUC percentual calculado para o experimento 3 . . . . . . . . . . . 5.10 Teste de classifica¸c˜ao Wilcoxon pareado para os valores de AUC dos detectores de novidade . . . . . . . . . . . . . . . . . . . . . . . . .

xiii

38 40 42 44

. 56 . 56 . 58 . 66 . 66 . 68 . 73 . 74 . 75 . 77

Lista de S´ımbolos αi

Multiplicadores de Lagrange, p. 29

σ(t)

Largura do kernel gaussiano, p. 31

ξi

Vari´aveis Lentas, p. 29



Conjunto de dados amostrais, p. 27

η

Taxa de aprendizado, p. 20

γ

Radia¸ca˜o gamma, p. 5

λ

Comprimento de Onda, p. 7, 8

c

Medida do baricentro para o agrupamento, p. 26

µ

Amostras de M´edia, p. 27

νc

Velocidade de Onda Transversal, p. 8

νl

Velocidade de Onda Longitudinal, p. 8

ω

Frequˆencia, p. 14

ψ

wavelet M˜ae, p. 15

σ2

Variˆancia, p. 29

a

Raio do cluster, p. 28

K

Clusters do algoritmo de agrupamento k-means, p. 27

b

Bias, p. 19

h

Fun¸c˜ao de Ativa¸ca˜o, p. 19

w

Peso Sin´aptico, p. 19

x

Sinal de Entrada da Rede Neural, p. 19

y

Sa´ıda da Rede Neural, p. 19 xiv

Lista de Abreviaturas ACB

Tubo HP com Alta Carburiza¸ca˜o, p. 38

AUC

Area Under Curve, p. 2

AvA

All vs All, p. 18

BCB

Tubo HP com Baixa Carburiza¸ca˜o, p. 38

BMU

Best Method Unit, p. 31

CP

Corpo de Prova, p. 34

DFT

Discret Fourier Transform, p. 14

DL1

P´a de aerogerador 1 com Delamina¸ca˜o, p. 36

DL2

P´a de aerogerador 2 com Delamina¸ca˜o, p. 36

DWT

Discret wavelet Transform, p. 16

END

Ensaios N˜ao Destrutivos, p. 4

FFT

Fast Fourier Transform, p. 14

FF FNr FPTC FPr

Falta de Fus˜ao, p. 34 False Negative rate, p. 42 Falta de Penetra¸ca˜o/Trinca, p. 34 False Positive rate, p. 42

IE

Inclus˜ao de Esc´oria, p. 34

LP

L´ıquidos Penetrantes, p. 4

MC

Matriz de Confus˜ao, p. 42

MIG

Metal Inert Gas, p. 34 xv

MLP

MultiLayer Perceptron, p. 20

MS3

P´a de aerogerador 3 com Matriz Seca, p. 36

ND

Novelty Detection, p. 1

NF

Total de Condi¸co˜es Negativas, p. 42

NP

Total de Condi¸co˜es Positivas, p. 42

OvA

One vs All, p. 18

PCA

Principal Component Analysis, p. 2

PM

Part´ıculas Magn´eticas, p. 5

PO

Porosidade, p. 34

RBF

Radial-Basis Function, p. 21

RNA

Redes Neurais Artificiais, p. 19

ROC

Receiver Operation Characteristic, p. 2

SAE

Society of Automotive Engineers - EUA, p. 34

SCB

Tubo HP sem Carburiza¸c˜ao, p. 38

SD

Solda Sem Defeito, p. 34

SF

P´a de aerogerador sem falha, p. 36

SOM SVDD SVM

Self-Organizing Map, p. 30 Support Vector Data Description, p. 29 Support Vector Machine, p. 21

TIG

Tungsten Inert Gas, p. 34

TNr

True Negative rate, p. 42

TOFD TPr US

Time of Flight Detection, p. 11 True Positive rate, p. 42 Ultrassom, p. 1

xvi

Cap´ıtulo 1 Introdu¸ c˜ ao A determina¸c˜ao de descontinuidades e defeitos internos em materiais ´e muito importante para garantir a integridade de estruturas em diferentes ramos industriais, e tamb´em na constru¸c˜ao civil. A inspe¸c˜ao n˜ao-destrutiva por ultrassom (US) tem sido largamente aplicada para esse objetivo. A alta sensibilidade de identifica¸c˜ao, a possibilidade de defini¸c˜ao do tamanho e localiza¸ca˜o da descontinuidade sem que haja a necessidade de processos intermedi´arios s˜ao algumas vantagens do ensaio por ultrassom em compara¸ca˜o com outros tipos de ensaios n˜ao destrutivos. Contudo, a interpreta¸ca˜o dos resultados depende muito da experiˆencia do inspetor. A classifica¸c˜ao autom´atica de defeitos em inspe¸c˜ao ultrassˆonica vem sendo estudada h´a alguns anos. Diversas t´ecnicas como redes neurais artificiais, ´arvores de decis˜ao e discriminantes lineares foram utilizadas com sucesso. Entretanto, normalmente, os sistemas de classifica¸ca˜o s˜ao projetados para identificar sinais, ou parˆametros deles extra´ıdos, que pertencem a um n´ umero limitado de classes, estabelecido previamente a partir das amostras dispon´ıveis para treinamento [1]. Tradicionalmente, quando a amostra de uma nova classe, que n˜ao estava presente no conjunto de treinamento, ´e apresentada a um sistema de classifica¸c˜ao ela ´e associada a uma das classes conhecidas `a priori [2]. Esta ´e a quest˜ao abordada pelos m´etodos de detec¸ca˜o de novidades (ND - Novelty Detection). Dado o fato de que nunca ´e poss´ıvel treinar um sistema de aprendizado de m´aquina utilizando todas as classes de objetos poss´ıveis, torna-se importante que ele seja capaz de diferenciar entre informa¸co˜es conhecidas e desconhecidas durante o teste[3]. V´arios estudos apontam que a detec¸ca˜o de novidades ´e uma tarefa extremamente ´ por esta raz˜ao que existem v´arios modelos de ND que demonstraram desafiadora. E ter bons resultados em problemas diferentes. Deste modo ´e claramente evidente que n˜ao h´a uma u´nica abordagem para a detec¸ca˜o de novidades e o sucesso depende n˜ao 1

apenas do tipo de m´etodo utilizado, mas tamb´em das propriedades estat´ısticas dos dados tratados [4].

1.1

Objetivos

Neste trabalho, ´e proposto um sistema autom´atico de aux´ılio a` decis˜ao, baseado em t´ecnicas de detec¸ca˜o de novidades, para a identifica¸ca˜o de defeitos em diferentes conjuntos de sinais obtidos durante ensaios n˜ao destrutivos por ultrassom: um ensaio utilizando a t´ecnica TOFD em um corpo de prova soldado, um ensaio com transdutor Bubbler simulando a imers˜ao de amostras de p´as de aerogeradores e um ensaio por imers˜ao de tubos de a¸co retirados de fornos de pir´olise. Os objetivos espec´ıficos desse trabalho incluem: • Aplica¸ca˜o de ferramentas de processamento digital de sinais para a an´alise dos conjuntos de dados, como a normaliza¸c˜ao dos padr˜oes, a filtragem de ru´ıdo com a transformada wavelet discreta e a avalia¸c˜ao no dom´ınio da frequˆencia com a transformada discreta de Fourier; • Verificar o efeito da dimensionalidade dos conjuntos de dados por meio da sele¸ca˜o de caracter´ısticas essenciais para a classifica¸ca˜o autom´atica por interm´edio da An´alise de Componentes Principais PCA; • Constru¸c˜ao de quatro abordagens para a detec¸c˜ao de novidades: baseado em distˆancia, agrupamento k-means, m´aquina de vetor de descri¸c˜ao de dados e mapas auto-organiz´aveis. • Avaliar estatisticamente o desempenho dos detectores constru´ıdos, como a m´edia da eficiˆencia global, visualiza¸c˜ao de gr´aficos boxplot, acur´acia, curva ROC (Receiver Operation Characteristic)e a respectiva AUC (Area Under Curve), e o teste de classifica¸c˜ao Wilcoxon pareado; • Comparar os m´etodos de aprendizado n˜ao supervisionado da detec¸c˜ao de novidades com o aprendizado supervisionado dos classificadores multiclasse redes neurais artificiais e m´aquinas de vetor de suporte.

1.2

Organiza¸c˜ ao do Documento

Este documento est´a organizado conforme descrito a seguir: No Cap´ıtulo 2, ´e apresentada uma vis˜ao geral sobre a inspe¸ca˜o n˜ao destrutiva e suas diferentes t´ecnicas, detalhando, em especial, as inspe¸co˜es por ultrassom. 2

No Cap´ıtulo 3, s˜ao expostos os fundamentos te´oricos das ferramentas para o processamento digital de sinais e sele¸ca˜o de caracter´ısticas empregadas neste trabalho, juntamente com o aprendizado de m´aquina supervisionado comumente realizado para os ensaios por ultrassom e as abordagens da detec¸c˜ao de novidades propostas. O Cap´ıtulo 4 discorre sobre a metodologia dos ensaios e classifica¸ca˜o utilizada no projeto bem como a apresenta¸ca˜o das caracter´ısticas dos conjunto de sinais utilizados no trabalho. No Cap´ıtulo 5, s˜ao discutidos os resultados obtidos com sinais experimentais conforme a metodologia proposta. No Cap´ıtulo 6, as conclus˜oes e perspectivas futuras do trabalho s˜ao apresentadas.

3

Cap´ıtulo 2 Vis˜ ao Geral sobre os Ensaios n˜ ao Destrutivos por Ultrassom Os ensaios n˜ao destrutivos (END) s˜ao empregados para avaliar a integridade dos materiais sem destru´ı-los ou introduzir altera¸co˜es em suas caracter´ısticas. Adotados na vistoria de mat´eria prima, no controle de processos industriais, montagem e inspe¸c˜ao final, os END s˜ao eficientes m´etodos que podem indicar a existˆencia de descontinuidades com poucos mil´ımetros de dimens˜ao, sendo um procedimento indispens´avel para o monitoramento da qualidade dos produtos fabricados pela ind´ ustria moderna [5]. O ensaio por l´ıquidos penetrantes (LP) ´e um m´etodo desenvolvido especialmente para a detec¸ca˜o de falhas superficiais. A principal vantagem do m´etodo ´e a sua simplicidade de execu¸ca˜o, interpreta¸ca˜o dos resultados e o pouco tempo de treinamento do inspetor [6]. Visto que o indicativo do defeito equipara-se com uma fotografia, a avalia¸c˜ao dos resultados ´e direta. Contudo, a inspe¸c˜ao por l´ıquidos penetrantes detecta t˜ao somente descontinuidades abertas para a superf´ıcie, dado que o LP requer a entrada no defeito para ser revelado consoante `a Figura 2.1. Figura 2.1: Ensaio por L´ıquidos Penetrantes.

Fonte: Adaptado de [7].

4

O ensaio por part´ıculas magn´eticas (PM) ´e empregado na descoberta de defeitos superficiais e subsuperficiais em materiais ferromagn´eticos. Pode ser executado em pe¸cas acabadas e semiacabadas inclusive durante as etapas de fabrica¸c˜ao [8]. Os benef´ıcios da t´ecnica PM compreendem o resultado instantˆaneo e a realiza¸ca˜o em grande faixa de temperatura, contudo o prop´osito ´e restrito aos materiais ferromagn´eticos. As pe¸cas est˜ao sujeitas a danos superficiais e, em algumas varia¸co˜es da inspe¸ca˜o por PM, as indica¸co˜es de descontinuidades n˜ao s˜ao constatadas visivelmente (Figura 2.2). Figura 2.2: Ensaio por Part´ıculas Magn´eticas.

Fonte: Adaptado de [8].

A radiografia ´e um m´etodo utilizado para inspe¸ca˜o n˜ao destrutiva que emprega a absor¸c˜ao diferenciada da radia¸c˜ao penetrante na pe¸ca inspecionada. Diferen¸cas na densidade e varia¸co˜es de espessura do material, ou modifica¸co˜es nas caracter´ısticas de absor¸ca˜o causadas por mudan¸cas de composi¸ca˜o, resultam em concentra¸co˜es distintas de radia¸c˜ao incidente no corpo inspecionado. Essa varia¸c˜ao na medida de radia¸c˜ao absorvida poder´a indicar a presen¸ca de uma falha interna ou defeito no objeto [9]. O ensaio por radiografia tem restri¸c˜oes relacionadas `a prote¸c˜ao da sa´ ude do operador, dados os preju´ızos provenientes da exposi¸c˜ao aos raios-X e `a radia¸c˜ao γ para o ser humano. Ademais, cuidados s˜ao exigidos para a prote¸ca˜o do meio ambiente e da vizinhan¸ca em torno do ensaio. A Figura 2.3 exemplifica uma inspe¸c˜ao n˜ao destrutiva por raios-X sendo efetuada num corpo de prova. .

5

Figura 2.3: Ensaio por Raios-X.

Fonte: Adaptado de [10].

O ensaio por ultrassom (US) ´e um m´etodo n˜ao destrutivo que tem por objetivo a detec¸ca˜o de danos internos, presentes nos mais variados tipos ou forma de materiais sejam eles ferrosos ou n˜ao. O transdutor, ou cabe¸cote, ´e constitu´ıdo de uma carca¸ca met´alica e um elemento piezoel´etrico respons´avel por gerar as ondas mecˆanicas com frequˆencia variando na faixa de 100kHz a 50 MHz, ap´os a excita¸c˜ao por um pulso el´etrico [5]. As propriedades fundamentais para um transdutor comumente utilizado em END por US s˜ao listadas a seguir [11]: • Tipo: contato direto, angular, imers˜ao. A sele¸ca˜o do transdutor ´e influenciada pelas caracter´ısticas do material, como a rugosidade da superf´ıcie, acessibilidade, temperatura, posi¸c˜ao do defeito no material inspecionado e a velocidade de inspe¸ca˜o; • Diˆametro do cristal piezoel´etrico sensor, que ´e acondicionado dentro de um compartimento ligeiramente maior; • Frequˆencia Nominal, relacionada com o aumento da penetra¸c˜ao da onda ultrassˆonica para uma frequˆencia menor, enquanto que a resolu¸c˜ao e a nitidez focal aumentam utilizando uma frequˆencia maior; • Largura de banda, cuja parcela da resposta em frequˆencia esteja em conformidade com limites de amplitude especificados na ind´ ustria, como o limite de -6dB (50% da amplitude m´axima); • Dura¸ca˜o da forma de onda, que relaciona o n´ umero de ciclos de onda gerados 6

pelo transdutor a cada vez que ´e pulsado. Um transdutor com largura de banda estreita tem mais ciclos do que um outro com maior largura de banda A Figura 2.4 mostra a constru¸c˜ao interna e a propaga¸c˜ao de onda ultrassˆonica obtida para transdutores do tipo normal e angular: Figura 2.4: Configura¸c˜ao dos transdutores normal e angular. (b) Angular

(a) Normal

Fonte: Adaptado de [11].

O perfil real do feixe ultrassˆonico ´e complexo, com gradientes de press˜ao diferentes nas dire¸co˜es transversal e axial. A regi˜ao de propaga¸ca˜o do feixe ´e dividida em duas zonas: o campo pr´oximo e o campo distante. O campo pr´oximo ´e a regi˜ao do transdutor onde a press˜ao sonora passa por uma s´erie de oscila¸co˜es, e encerra no u´ltimo pico na distˆancia N desde a face do transdutor. A medida N representa o foco natural do transdutor conforme a Equa¸c˜ao 2.1. N=

D2 .f D2 [mm] ou N = [mm] 4.v 4.λ

(2.1)

onde: • N = comprimento do campo pr´oximo em mm; • D = diˆametro do cristal piezoel´etrico em µm; • f = frequˆencia em Hz; • v = velocidade de propaga¸ca˜o do som no material em m/s; • λ = comprimento de onda (v/f) em 1/m. O campo distante ´e a regi˜ao al´em de N onde a press˜ao sonora gradualmente cai para zero `a medida que o diˆametro do feixe se expande e sua energia se dissipa. A Figura 2.5 ilustra os dois componentes. 7

Figura 2.5: Comportamento do Feixe Ultrassˆonico.

Fonte: Adaptado de [11].

Em fun¸c˜ao das varia¸c˜oes de press˜ao sonora dentro do campo pr´oximo, n˜ao ´e poss´ıvel avaliar com precis˜ao as falhas usando t´ecnicas baseadas em amplitude. O valor de N significa a maior distˆancia para a qual ´e poss´ıvel utilizar o foco do feixe sˆonico atrav´es de uma lente ac´ ustica. Existem diferentes formas de propaga¸ca˜o das ondas de ultrassom, destacando-se as ondas de placa (ou de Lamb) que tˆem uma vibra¸ca˜o complexa ocorrendo em materiais onde a espessura ´e menor que o λ do sinal de ultrassom introduzido nele [11]. As ondas longitudinais s˜ao ondas de compress˜ao, nas quais o movimento da part´ıcula est´a na mesma dire¸c˜ao da propaga¸c˜ao da onda. As ondas transversais apresentam movimento perpendicular a` dire¸ca˜o da propaga¸ca˜o. As ondas longitudinais (ou de Rayleigh) tˆem um movimento el´ıptico das part´ıculas e percorrem a superf´ıcie de um material. Sua velocidade νl ´e de aproximadamente 90% da velocidade de cisalhamento νc e a sua profundidade de penetra¸c˜ao ´e equivalente a uma unidade de λ. A Figura 2.6 apresenta um resumo da propaga¸c˜ao das ondas ultrassˆonicas: Figura 2.6: Diagrama ilustrativo da propaga¸ca˜o das ondas de ultrassom.

Fonte: Adaptado de [11].

8

O m´etodo ultrassˆonico apresenta uma grande precis˜ao na determina¸ca˜o da posi¸ca˜o do defeito interno, da estima¸ca˜o do formato, tamanho e da profundidade de penetra¸ca˜o para a detec¸c˜ao da falha. Essas caracter´ısticas associadas `a seguran¸ca do operador s˜ao as principais vantagens do ensaio por ultrassom [5]. Todavia, a inspe¸ca˜o por US requer grande conhecimento te´orico e experiˆencia do inspetor. Efeitos de dispers˜ao em fun¸c˜ao do tamanho de gr˜ao do material (quando este ´e da ordem de 10% do λ), absor¸ca˜o, atenua¸ca˜o e divergˆencia sˆonica constituem dificuldades para a interpreta¸c˜ao dos resultados de ensaios por ultrassom [6].

2.1

T´ ecnicas de Inspe¸ c˜ ao por Ultrassom

A t´ecnica pulso eco ´e aquela em que um u´nico transdutor ´e utilizado para emiss˜ao e recep¸c˜ao das ondas ultrassˆonicas propagadas dentro do material. Posiciona-se o transdutor utilizando um meio acoplante em uma das faces, podendo ser verificada a profundidade da descontinuidade, suas dimens˜oes, e localiza¸ca˜o. A visualiza¸ca˜o A-Scan ´e o modo trivial de apresenta¸ca˜o do sinal ultrassˆonico, em que ´e poss´ıvel exibir a cada ponto da varredura a amplitude da onda versus o tempo, conforme a Figura 2.7 [5]. Figura 2.7: Ensaio por ultrassom - T´ecnica Pulso-Eco.

Fonte: Adaptado de [5].

O conhecimento do ensaio por ultrassom manual ´e fator preponderante para o desenvolvimento da automa¸c˜ao do procedimento cuja estrutura pode incluir a movimenta¸ca˜o dos transdutores e/ou material inspecionado, a t´ecnica de acoplamento, a coleta e o processamento dos dados, o controle do sistema, os dados da posi¸c˜ao relativa a` regi˜ao e a exibi¸ca˜o dos resultados do ensaio graficamente [12]. Outra forma de acoplar o ultrassom do transdutor a um corpo de prova se d´a por meio da ´agua, imergindo o transdutor e a pe¸ca inspecionada dentro de um 9

reservat´orio. Os transdutores de imers˜ao oferecem algumas vantagens em rela¸c˜ao aos transdutor de contato direto devido ao acoplamento uniforme, que reduz as varia¸co˜es de sensibilidade, e o foco que aumenta a detec¸ca˜o dos pequenos refletores [12]. Assim, a aplica¸ca˜o com os transdutores de imers˜ao pode empregar a focaliza¸ca˜o com lentes ac´ usticas para criar um feixe em formato de ampulheta que se estreita para uma pequena ´area focal e depois se expande [11]. O gr´afico de sinais analisado para o ensaio por imers˜ao ´e diferente do pulso-eco. Entre o pulso inicial e as reflex˜oes da interface do material haver´a um pico adicional causado pela onda sonora refletida da a´gua para o corpo de prova. O operador deve ajustar o equipamento para ignorar o pico do pulso inicial, de modo que a primeira reflex˜ao analisada ser´a proveniente da parede frontal. Para materiais que sofrem degrada¸ca˜o em fun¸ca˜o do contato direto com a ´agua, o ensaio ultrassˆonico por imers˜ao usando um Bubbler surge como alternativa de acoplamento. O Bubbler geralmente possui uma pequena entrada de ´agua que deve ser bombeada para um reservat´orio e assim fornecer de forma constante o acoplamento, enquanto permite uma blindagem cont´ınua para a face do transdutor na superf´ıcie da inspe¸ca˜o como ilustrado na Figura 2.8. Assim, o feixe sˆonico ´e transmitido ao material do corpo de prova utilizando uma coluna d’´agua com altura suficiente para assegurar apenas a utiliza¸ca˜o da regi˜ao do ultrassom que ´e de interesse, reduzindo ru´ıdos e turbulˆencias [13]. Figura 2.8: Transdutor especial Bubbler.

Fonte: Adaptado de [13].

No Brasil, h´a uma grande aplica¸c˜ao do ultrassom automatizado com sistemas convencionais. Um procedimento autom´atico comumente empregado utiliza um sensor que cont´em uma grande quantidade de elementos piezoel´etricos separados em uma u ´nica estrutura, colocados para emitir os pulsos de ultrassom sequencialmente [14]. Este sistema, chamado Phased Array, ´e capaz de realizar a inspe¸c˜ao atrav´es da t´ecnica Time of Flight Detection - TOFD para soldas principalmente por quest˜oes normativas. Al´em de outras vantagens, observa-se uma redu¸c˜ao significativa do 10

tempo de inspe¸ca˜o, com a chance de alcan¸car resultados em tempo real, redu¸ca˜o dos reparos de soldas e diminui¸ca˜o no atraso ou interrup¸ca˜o das etapas de fabrica¸ca˜o das pe¸cas [15]. A t´ecnica TOFD destaca-se como alternativa para detec¸c˜ao e dimensionamento de falhas em estruturas soldadas face `as dificuldades encontradas nas t´ecnicas ultrassˆonicas convencionais. A configura¸ca˜o b´asica usa um arranjo com os transdutores transmissor-receptor simetricamente espa¸cados ao longo do cord˜ao de solda [16]. As sapatas s˜ao constru´ıdas em material acr´ılico com um aˆngulo de incidˆencia para gerar ondas longitudinais com largura de feixe sˆonico suficiente para que o m´aximo de ´area seja inspecionada [17]. O primeiro sinal a chegar ´e o da onda lateral gerado a partir da largura de feixe do transdutor, enquanto os outros dois sinais s˜ao reflex˜oes difratadas das extremidades superior e inferior do defeito, seguido pela reflex˜ao do eco de fundo. Caso n˜ao exista defeito as reflex˜oes observadas ser˜ao apenas a onda lateral e o eco de fundo [18]. A Figura 2.9 exibe um esquema de inspe¸c˜ao para uma solda com a presen¸ca de um defeito do tipo trinca. Figura 2.9: Ensaio por ultrassom - T´ecnica TOFD.

Fonte: Adaptado de [19].

Os percursos L1 e L2 da onda ultrassˆonica para a determina¸ca˜o dos defeitos em um arranjo transmiss˜ao-recep¸ca˜o com os transdutores angulares s˜ao obtidos atrav´es das Equa¸c˜oes 2.2 e 2.3.

11

L12 = d2 + (S + X)2 ,

(2.2)

L22 = d2 + (S − X)2

(2.3)

onde S ´e a metade da distˆancia entre os transdutores que se mant´em fixa durante o ensaio, d ´e a profundidade do defeito e X o valor do deslocamento lateral em dire¸ca˜o a` solda [20]. Portanto, com o movimento lateral do par de transdutores, ´e poss´ıvel calcular o tempo total de atraso da onda ultrassˆonica nas extremidades com a velocidade longitudinal da onda vl e o tempo de percurso t no interior do material de acordo com Equa¸ca˜o 2.4: vl .t =

q

d2 + (S + X)2 +

q

d2 + (S − X)2

(2.4)

Ao derivar a Equa¸ca˜o 2.4 em termos do deslocamento lateral X, o menor atraso do tempo de propaga¸c˜ao ocorre com a presen¸ca do defeito no ponto central dos transdutores, resultando na Equa¸ca˜o 2.5: √ vl .t = 2 d2 + S 2

(2.5)

Dessa forma, ´e analisada somente a distˆancia entre os pontos de sa´ıda do feixe nos transdutores e o tempo de percurso da onda no material, permitindo obter a profundidade do defeito.

12

Cap´ıtulo 3 T´ ecnicas de Processamento de Sinais e Classifica¸ c˜ ao Utilizadas A Se¸ca˜o 2.1 introduziu a no¸ca˜o dos ensaios n˜ao destrutivos por ultrassom com os diferentes tipos de inspe¸co˜es e a coleta das assinaturas correspondentes a`s condi¸co˜es existentes no corpo de prova. A metodologia para an´alise dos sinais ultrassˆonicos atrav´es dessas assinaturas obtidas ser´a apresentada nesse cap´ıtulo.

3.1

Normaliza¸c˜ ao

Para identificar mudan¸cas na forma dos sinais de ultrassom em rela¸c˜ao a uma popula¸c˜ao de assinaturas normais, independentemente dos valores absolutos de amplitude, a normaliza¸c˜ao deve ser aplicada. Esse est´agio de pr´e-processamento retira o v´ınculo das amplitudes absolutas, preservando informa¸c˜oes sobre a forma geral das assinaturas. Um prop´osito da normaliza¸ca˜o ´e transformar as caracter´ısticas do sinal ultrassˆonico, de forma que as assinaturas “normais” e “anormais” sejam mais facilmente separ´aveis. CLIFTON e TARASSENKO [21] avaliaram cinco m´etodos de normaliza¸c˜ao durante a aplica¸ca˜o da detec¸ca˜o de novidades para assinaturas de vibra¸ca˜o provenientes da turbinas a` g´as. A normaliza¸c˜ao component-wise tem por objetivo fornecer uma separa¸c˜ao adequada entre os padr˜oes “normais” e “anormais” em termos de sua forma geral, ao mesmo tempo em que ´e removida a dependˆencia dos valores absolutos de amplitude, da m´edia e desvio padr˜ao do conjunto de amostras. O termo padr˜ao ser´a empregado nesta se¸c˜ao para se referir a uma assinatura de ultrassom cuja normaliza¸c˜ao foi aplicada. Um padr˜ao ´e definido por xni , onde i = 1. . . I representa o conjunto de dados das assinaturas e n = 1. . . N ´e o total de

13

elementos da i-´esima assinatura. A fun¸c˜ao de normaliza¸c˜ao component-wise N(xi ) ´e definida como uma transforma¸c˜ao linear dos n elementos ou componentes xi presentes em um conjunto de dados, conforme a Equa¸ca˜o 3.1: N (xi ) =

 



n : [1 . . . N ] .



(n)

xi



− µ(n) 

σ (n)

(3.1)



onde (µ(n) , σ (n) ) s˜ao vetores de m´edia e desvio padr˜ao com tamanho N , calculados para todos os i componentes por meio das Equa¸c˜oes 3.2 e 3.3:

µn = σ = n

3.2

I 1X xni I i=1

I 1 X (xn − µn )2 1 − I i=1 i

(3.2)

!1/2

(3.3)

Transformada Discreta de Fourier

A an´alise espectral do sinal de ultrassom permite obter a distribui¸ca˜o de energia do sinal no dom´ınio da frequˆencia sendo poss´ıvel extrair tamb´em informa¸co˜es de fase, que poderiam ser mascaradas no dom´ınio do tempo, a fim de realizar a caracteriza¸ca˜o do material avaliado [22]. Dada uma fun¸c˜ao absolutamente integr´avel, a sua transformada de Fourier cont´ınua ´e definida pela Equa¸ca˜o 3.4: F (ω) =

Z ∞ −∞

f (t)e−jωt dt.

(3.4)

Para sinais discretos e limitados no tempo, utiliza-se a Transformada Discreta de Fourier DFT (Discret Fourier Transform). Esta transforma¸ca˜o ´e importante em termos computacionais, uma vez que pode ser implementada atrav´es do algoritmo da Transformada R´apida de Fourier (FFT -Fast Fourier Transform) que coleta o total de amostras do vetor, aproximando-o a` pr´oxima potˆencia de 2, elevando a eficiˆencia computacional do processamento [23]. A Equa¸c˜ao 3.5 apresenta a express˜ao da DFT, na qual N ´e o comprimento do −j2π vetor de entrada onde WN = e N . F [k] =

N −1 X

f [n]WNnk

(3.5)

n=0

Assim, a transformada de Fourier de tempo discreto para uma sequˆencia de 14

2π comprimento finito pode ser amostrada em ω = (que periodiza a sequˆencia). N Portanto, a DFT pode ser avaliada como a transforma¸c˜ao peri´odica de um sinal peri´odico, ou uma amostragem da Discret-Time Fourier Transform para um sinal de comprimento finito [24]. Assim, o uso da an´alise espectral para a assinatura do pulso ultrassˆonico ´e uma ferramenta importante de avalia¸ca˜o da mudan¸ca na frequˆencia do pico espectral dos transdutores banda larga ao interagir com varia¸co˜es microestruturais induzidas nos ´ poss´ıvel correlacionar o efeito da mudan¸ca na rela¸ca˜o diferentes tipos de materiais. E entre as amplitudes de pico para altas e baixas frequˆencias com o tamanho de gr˜ao e outros eventos metal´ urgicos que modificam a natureza microestrutural de a¸cos inoxid´aveis, entre outros aspectos.

3.3

Transformada Discreta wavelet

As transforma¸c˜oes wavelet, particularmente as wavelets ortonormais e biortogonais com suporte finito, surgiram como uma nova ferramenta matem´atica para a decomposi¸c˜ao multiresolu¸c˜ao de sinais de tempo cont´ınuo com poss´ıveis aplica¸c˜oes em vis˜ao computacional, codifica¸c˜ao de sinal e outros. Para analisar estruturas de sinais com escalas diferenciadas nos dom´ınios tempofrequˆencia com diferentes suportes temporais, a transformada wavelet decomp˜oe um sinal em vers˜oes expandidas e transladadas das fun¸c˜oes wavelet [25]. Assim, as wavelets reproduzem um sinal transiente de modo mais adequado que as senoides, visto que s˜ao capazes de decompor a dinˆamica global e local de um sinal. Considere a fam´ılia de fun¸c˜oes obtida deslocando e expandindo uma wavelet “m˜ae”ψ(t) na Equa¸c˜ao 3.6 [24]: 1

t−b ψa,b (t) = q ψ a |a|

!

(3.6)

onde a,b ∈ < (a6=0), e a normaliza¸ca˜o garante que kψa,b (t)k = kψ(t)k. Assumindo que a wavelet satisfaz a condi¸c˜ao de admissibilidade (Equa¸ca˜o 3.7). Cψ =

Z ∞ −∞

|Ψ(ω)|2 dω < ∞ |ω|

(3.7)

onde Ψ(ω) ´e a Transformada de Fourier de ψ(t). Ψ(ω) ter´a sempre que decair o suficiente para que a condi¸c˜ao de admissibilidade se reduza ao requisito de que Ψ(0)=0. Como a transformada de Fourier ´e zero na origem e o espectro cai em alta frequˆencias, a wavelet possui um comportamento de passa-faixa. Agora a Equa¸ca˜o 3.7 ´e normalizada para que tenha energia unit´aria conforme Equa¸ca˜o 3.8:

15

1 Z∞ kψ(t)k = |ψ(t)| dt = |Ψ(ω)|2 dω = 1 2π −∞ −∞ 2

Z ∞

2

(3.8)

logo, kψa,b (t)k2 = kψ(t)k2 . Assim a transformada wavelet cont´ınua CWT (Continuous wavelet Transform) de uma fun¸c˜ao ´e definida na Equa¸c˜ao 3.9: CW Tf (a, b) =

Z ∞ −∞

Ψ∗a,b (t)f (t)dt = hΨa,b (t), f (t)i .

(3.9)

As wavelets ortogonais dilatadas por a apresentam varia¸co˜es de sinal na posi¸ca˜o b. A constru¸c˜ao dessas bases pode estar relacionada a aproxima¸c˜oes de sinais multirresolu¸ca˜o. Desse modo, h´a uma equivalˆencia inesperada entre bases de wavelet e filtros de espelho conjugado usados em bancos de filtros discretos. Neste trabalho, em vez de uma constru¸ca˜o direta em tempo cont´ınuo, utilizaremos filtros de tempo discreto. Daubechies iniciou a constru¸c˜ao das fam´ılias produzindo esquemas de decomposi¸ca˜o das wavelets de forma muito pr´atica, uma vez que s˜ao implement´aveis atrav´es de filtros de tempo discreto cujo comprimento ´e finito [26]. A transformada discreta wavelet (DWT - Discret wavelet Transform) se baseia na decomposi¸ca˜o do sinal em aproxima¸co˜es e detalhes, atrav´es de filtros de suaviza¸ca˜o (passa baixa) e outros trazendo informa¸c˜oes de detalhes (passa alta) conforme ilustrado na Figura 3.1 [24]. Figura 3.1: Decomposi¸c˜ao wavelet com Subamostragem.

Fonte: Adaptado de [25].

Inicialmente, o sinal ´e subdividido, por meio de filtros passa-baixa e passa-alta, com frequˆencia de corte variando com a`quela do sinal amostrado, visto que a largura de banda do sinal digital varia conforme o Teorema de Nyquist [27]. Para efetuar a an´alise wavelet ´e necess´ario escolher uma fun¸ca˜o prot´otipo (wavelet m˜ae ψ(t)). Na DWT, os filtros digitais passa-baixa e passa-alta s˜ao projetados com base em uma fun¸c˜ao wavelet escolhida previamente e usados para gerar duas vers˜oes filtradas do sinal original. Posteriormente, os sinais passam por um processo 16

denominado sub-amostragem, no qual a quantidade de amostras dos novos sinais (filtrados) ´e reduzida por um fator de dois [28]. A remo¸ca˜o de ru´ıdo ´e vantajosa para algumas aplica¸co˜es de imagens ultrassˆonicas e END, em que o sinal recebido cont´em muito ru´ıdo. A filtragem wavelet ´e uma ferramenta consolidada em muitas aplica¸c˜oes de ensaios n˜ao destrutivos, e um problema principal na filtragem de ru´ıdo com wavelet ´e a sele¸ca˜o do limite o´timo [29]. O ru´ıdo geralmente se manifesta como uma estrutura de gr˜ao fino (em imagens por exemplo) e a wavelet fornece uma representa¸c˜ao em escala por coeficientes em escalas mais finas. A transformada wavelet produz um grande n´ umero de pequenos coeficientes, devido ao ru´ıdo, e um pequeno n´ umero de grandes coeficientes, relacionados `as caracter´ısticas importantes do sinal [30]. O limiar ´e uma t´ecnica n˜ao linear simples, que opera em um dos coeficientes da wavelet para descarte dos valores relacionados ao ru´ıdo, removendo os coeficientes inferiores a um valor fixo. Assim, a t´ecnica fornece uma redu¸ca˜o de ru´ıdo sem afetar as caracter´ısticas significativas do sinal, e os coeficientes restantes s˜ao usados para reconstruir o sinal. ADAMO et al. [30] realizaram um estudo comparativo na sele¸ca˜o da wavelet m˜ae em imagens de ultrassom. Verificaram que as fun¸c˜oes de wavelet com maior ordem de filtro (3a ou 4a ordem) s˜ao mais efetivas quando o n´ıvel de ru´ıdo aumenta. As fam´ılias Daubechies e Symlet oferecem resultados muito semelhantes.

3.4

An´ alise de Componentes Principais

A an´alise de componentes principais PCA (Principal Component Analysis) ´e uma t´ecnica estat´ıstica de processamento de sinais que objetiva encontrar uma transforma¸ca˜o linear tal que a projeta¸ca˜o deles seja n˜ao-correlacionada (ortogonais) e grande parcela da energia (variˆancia) esteja concentrada em um pequeno n´ umero de componentes. Para isso, s˜ao exploradas informa¸c˜oes estat´ısticas de at´e segunda ordem (m´edias e variˆancias)[31]. Considerando-se um vetor x = [x1 , ..., xN ]T aleat´orio com N elementos, assume-se que ele tenha m´edia zero, E{x} = 0. Ent˜ao, a proje¸c˜ao zi de x na dire¸c˜ao de um outro vetor vi pode ser expressa pela Equa¸ca˜o 3.10: zi =

viT x

=

N X

vki xk .

(3.10)

k=1

Na transforma¸ca˜o por PCA, os componentes zi (i = 1, ..., N ) devem ser ortogonais e ordenados (de modo decrescente) pela variˆancia das proje¸c˜oes, sendo, ent˜ao, z1 a proje¸ca˜o de m´axima variˆancia. Como E{x} = 0, ent˜ao E{zi } = 0. Portanto, a variˆancia da proje¸c˜ao zi ´e 17

calculada por E{zi2 }. Seguindo a defini¸ca˜o da PCA, z1 tem m´axima variˆancia; logo, v1 pode ser encontrado pela maximiza¸c˜ao da Equa¸c˜ao 3.11: J1P CA (v1 ) = E{zi2 } = E{(v1T x)2 } E{(v1T x)2 } == v1T E{xxT }v1 = v1T Cx v1 ,

(3.11)

onde Cx ´e a matriz de covariˆancia de x. A solu¸c˜ao para o problema de maximiza¸c˜ao de J1P CA pode ser encontrada na ´algebra linear, em fun¸c˜ao dos autovetores e1 , e2 , ..., eN da matriz Cx . A ordem dos autovetores ´e tal que os autovalores associados satisfazem d1 > d2 > ... > dN . Desta forma, a solu¸c˜ao para a Equa¸ca˜o 3.12 ´e dada por: v i = ei ,

1≤i≤N

(3.12)

A transforma¸c˜ao por PCA pode ser expressa na forma matricial: z = Vx, onde z = [z1 , z2 , . . . , zN ]T e V = [v1 , v2 , . . . , vN ]T . MOHD ARIS et al. [32] abordam a capacidade das t´ecnicas de PCA para determinar as condi¸c˜oes da integridade estrutural de laminados fibra-metal em carbono utilizando ondas de Lamb e reconstru¸c˜ao do sinal no dom´ınio do tempo atrav´es da CWT. Os resultados mostraram que, em todos os casos considerados, foi poss´ıvel distinguir as condi¸co˜es de estados n˜ao danificados, avariados e reparados, com precis˜ao promissora e repetibilidade dos resultados.

3.5

M´ etodos de Classifica¸ c˜ ao Multiclasse

A classifica¸ca˜o multiclasse ´e um problema central na aprendizagem de m´aquina, uma vez que as aplica¸c˜oes requerem uma discrimina¸c˜ao entre v´arias classes que s˜ao onipresentes. Na aprendizagem de m´aquina, as aplica¸c˜oes podem variar desde reconhecimento de caracteres manuscritos at´e a categoriza¸c˜ao de texto. Em raz˜ao da classifica¸ca˜o bin´aria ser bem compreendida, uma abordagem comum para a classifica¸ca˜o multiclasse envolve o uso direto de classificadores bin´arios padr˜ao para codificar e treinar os r´otulos de sa´ıda atrav´es da abordagem OvA (One vs All um contra todos). O esquema OvA assume que, para cada classe, existe um u ´ nico separador (simples) entre essa classe e todas as outras classes. A alternativa todos contra todos (AvA All-versus-All) ´e mais expressiva pois assume a existˆencia de um separador entre duas classes [33]. SCHOLKOPF e SMOLA [34] discutem que provavelmente n˜ao h´a um m´etodo multiclasse capaz de abordar todas as hip´oteses e, para fins pr´aticos, a escolha do m´etodo deve ser feita dependendo das restri¸co˜es, como o n´ıvel de precis˜ao desejado, o tempo dispon´ıvel para desenvolvimento, o treinamento e a natureza do problemas 18

de classifica¸c˜ao. Contudo, na pr´atica, a escolha do melhor m´etodo ´e uma tarefa desafiadora. Mesmo para uma abordagem fixa multiclasse, existem muitos detalhes que podem ser ajustados. Nesta se¸c˜ao ser˜ao apresentados alguns m´etodos de classifica¸c˜ao multiclasse largamente utilizados na literatura para a tarefa de avalia¸c˜ao de sinais ultrassˆonicos, como as redes neurais artificiais e as m´aquinas de vetor de suporte.

3.5.1

Redes Neurais Artificiais

As Redes Neurais Artificiais (RNA) s˜ao compostas de unidades b´asicas de processamento (neurˆonios) distribu´ıdas paralelamente, garantindo a habilidade de adapta¸ca˜o e aprendizagem. Uma rede suficientemente treinada pode adquirir capacidade de generaliza¸c˜ao, quando s˜ao apresentadas `as entradas dados diferentes dos utilizados durante o seu treinamento [35]. O modelo n˜ao linear de um neurˆonio artificial foi proposto inicialmente por McCulloch utilizando entradas, representadas por xi , ponderadas por peso sin´aptico wi e somadas em um combinador linear [35]. Uma fun¸c˜ao de ativa¸c˜ao restringe a sa´ıda da rede, reduzindo-a a valores finitos, descrito pela Equa¸ca˜o 3.13. y=h

n X

!

wi xi + bi

(3.13)

i=1

onde y ´e a sa´ıda da rede Neural, h ´e a fun¸ca˜o de ativa¸c˜ao e b ´e o vi´es. O algoritmo Perceptron foi definido nos anos 1950 e serviu de base para o desenvolvimento dos modelos de rede neural nos anos de 1980 e 1990. Consiste basicamente de classificadores que buscam encontrar um hiperplano de separa¸c˜ao, minimizando a distˆancia de pontos mal classificados para o limite de decis˜ao [36]. Este algoritmo, de fato, usa o gradiente estoc´astico descendente para minimizar o crit´erio linear por partes. Isso significa que, em vez de calcular a soma das contribui¸c˜oes do gradiente de cada observa¸c˜ao seguida de um passo na dire¸c˜ao do gradiente negativo, um passo ´e tomado depois que cada observa¸ca˜o ´e visitada. Assim, as observa¸co˜es mal classificadas s˜ao visitadas em alguma sequˆencia, e os parˆametros do hiperplano s˜ao atualizados [36]. Alguns problemas relacionados com o uso do Perceptron s˜ao apontados a seguir: • Quando os dados s˜ao separ´aveis, existem muitas solu¸co˜es e qual delas ´e encontrada depende dos valores iniciais; umero “finito” de etapas pode ser muito grande. Quanto menor o espa¸co, • O n´ mais tempo ´e requerido;

19

• Quando os dados n˜ao s˜ao separ´aveis, o algoritmo n˜ao converge, e os ciclos se desenvolvem, podendo ser longos e, portanto, dif´ıceis de detectar; Para superar as limita¸co˜es pr´aticas do perceptron, uma estrutura de rede neurais Perceptron Multicamada (MLP - MultiLayer Perceptron) foi desenvolvida. Os recursos b´asicos do MLP incluem o modelo de cada neurˆonio na rede com uma fun¸ca˜o de ativa¸c˜ao n˜ao-linear diferenci´avel. A rede cont´em uma ou mais camadas ocultas dos n´os de entrada e sa´ıda que exibem um alto grau de conectividade, determinado por pesos sin´apticos [35]. A popularidade do aprendizado em tempo real para o treinamento supervisionado de MLP foi melhorado pelo desenvolvimento do algoritmo backpropagation, que fornece uma “aproxima¸ca˜o”da trajet´oria no espa¸co de peso calculado pelo gradiente descendente. Quanto menor for o parˆametro da taxa de aprendizado η, menor ser´a a mudan¸ca nos pesos sin´apticos na rede de uma itera¸ca˜o para a pr´oxima, e mais suave dar-se-´a a trajet´oria at´e os pesos sin´apticos conforme a Equa¸ca˜o 3.14. O MLP ´e parametrizado por uma arquitetura A (representando um parˆametro discreto) e um vetor de peso w (composto por elementos cont´ınuos) segundo a Equa¸ca˜o 3.15:

F (w, x) =

m1 X

woj ϕ

j=0

m0 X

!

(3.14)

wji xi

i=0



(3)

F (w, x) = ϕ A1



(3.15)

onde w ´e o vetor de peso ordenado, x ´e o vetor de entrada, ϕ ´e a fun¸ca˜o de ativa¸ca˜o. Esta mudan¸ca de arquitetura oferecida pelo backpropagation, entretanto, ´e alcan¸cada ao custo de η mais lenta. Se, por outro lado, tornarmos η muito grande para acelerar o aprendizado, as mudan¸cas resultantes nos pesos sin´apticos assumem tal forma que a rede pode tornar-se inst´avel [35]. A inicializa¸c˜ao da rede MLP com backpropagation ´e feita com pesos aleat´orios. Durante o processo de aprendizagem, um vetor de entrada ´e apresentado para a rede e propagado para determinar os valores da sa´ıda. O vetor de sa´ıda produzido pela rede ´e comparado com o vetor de sa´ıda desejado, resultando num sinal de erro, que ´e propagado em dire¸c˜ao aos neurˆonios da camada de entrada atrav´es da rede para permitir o ajuste dos pesos. Este processo ´e repetido at´e que a rede responda, para cada vetor de entrada, com um vetor de sa´ıda com valores suficientemente pr´oximos do desejado [35]. O m´etodo Levenberg-Marquardt ´e uma combina¸c˜ao entre o m´etodo de Newton, que converge rapidamente perto de um m´ınimo local ou global, mas tamb´em pode divergir, e o gradiente descendente, que ´e assegurado por convergˆencia atrav´es de 20

uma sele¸c˜ao adequada do parˆametro tamanho do passo, convergindo lentamente. Considerando a otimiza¸ca˜o de uma fun¸ca˜o de segunda ordem F(w), sendo g seu vetor de gradiente e H a matriz Hessiana, de acordo com o m´etodo de LevenbergMarquardt, o ajuste ´otimo ∆w aplicado ao vetor de parˆametro w ´e definido por: ∆w = [H + ΛI]−1 g

(3.16)

onde I ´e a matriz identidade das mesmas dimens˜oes de H; Λ ´e um parˆametro de regulariza¸ca˜o ou carregamento que obriga a matriz de soma (H + Λ I) a ser definida de forma positiva e bem condicionada ao longo do c´alculo. A vers˜ao aproximada do algoritmo de Levenberg-Marquardt, com base no vetor gradiente e no Hessiano, ´e um m´etodo de otimiza¸c˜ao de primeira ordem que ´e adequado para problemas de estimativa dos m´ınimos quadrados n˜ao-lineares. Al´em disso, o algoritmo ´e realizado em forma de lote. LIU et al. [37] utilizaram uma rede neural do tipo backpropagation com m´etodo Levenberg-Marquadt e 3 camadas ocultas para classificar automaticamente dados provenientes de quatro tipos de pontos com solda em uma pe¸ca de a¸co austen´ıtico nos quais havia 4 tipos de defeito. Os sinais coletados foram analisados no dom´ınio da frequˆencia ap´os a realiza¸ca˜o da transformada wavelet. A precis˜ao de classifica¸ca˜o e identifica¸ca˜o de defeitos foi superior a 96%, cujo resultado do teste permitiu verificar a viabilidade da detec¸ca˜o por ultrassom da soldagem por pontos

3.5.2

M´ aquinas de Vetor de Suporte

A m´aquina de vetor de suporte (SVM - Support Vector Machine) ´e uma m´aquina de aprendizagem bin´aria que, dada uma amostra de treinamento, constr´oi um hiperplano como superf´ıcie decis´oria de tal forma que a margem de separa¸ca˜o entre exemplos positivos e negativos ´e maximizada [35]. Para descrever formalmente a constru¸ca˜o de uma SVM para realizar uma tarefa destinada ao reconhecimento de padr˜oes, esta depende de duas opera¸co˜es matem´aticas: mapeamento n˜ao-linear de um vetor de entrada em um espa¸co de caracter´ıstica com alta dimens˜ao que est´a oculto tanto para a entrada quanto para a sa´ıda e constru¸ca˜o de um hiperplano ideal para separar as caracter´ısticas descobertas [36]. Na verdade, n˜ao precisamos especificar uma transforma¸ca˜o h(x), mas definir apenas a fun¸ca˜o do kernel K(x,x’) que computa produtos internos no espa¸co transformado. O kernel deve ser uma fun¸ca˜o sim´etrica semi-positiva definida [36]. Trˆes escolhas populares para a defini¸c˜ao do kernel na literatura SVM: a fun¸c˜ao de base radial, o polinˆomio de grau n-´esimo e a rede Neural. Considerando a fun¸ca˜o de base radial da Equa¸ca˜o 3.17, este pode ser descrito sob a forma de uma estrutura em camadas, conforme listado a seguir e ilustrado na Figura 3.2: 21

K(x, x0 ) = exp(−γ k x − x0 k2 )

(3.17)

• Camada de Entrada - Consiste de m0 n´os de fonte, onde m0 ´e a dimensionalidade do vetor x; • Camada Oculta: Possui o mesmo n´ umero de unidades de computa¸ca˜o como o tamanho da amostra de treino N. Cada unidade ´e descrita matematicamente por uma fun¸c˜ao de base radial. Comumente, observa-se o uso de uma fun¸c˜ao gaussiana (como RBF), em que cada unidade computacional na camada oculta da rede; • Camada de Sa´ıda - Consiste, geralmente, em uma u´nica unidade computacional. Claramente, n˜ao h´a restri¸c˜ao no tamanho da camada de sa´ıda, exceto para dizer que tipicamente o tamanho da camada de sa´ıda ´e muito menor que o da camada oculta. Figura 3.2: M´aquina de Vetor de Suporte como kernel Radial Basis Function.

Fonte:Adaptado de [35].

Para a constru¸c˜ao de uma SVM com kernel RBF, o n´ umero de fun¸c˜oes de base radial e seus centros s˜ao determinados automaticamente pelo n´ umero de vetores de suporte e seus valores, respectivamente, identificados como parˆametros (σ,C). A dimensionalidade do espa¸co de caracter´ısticas ´e determinada pelo n´ umero dos vetores de suporte extra´ıdos dos dados de treinamento considerando a solu¸ca˜o para o problema da otimiza¸ca˜o apresentada na Equa¸ca˜o 3.18 que envolve somente os recursos de entrada transformados h(xi ) atrav´es de produtos internos. Para determinadas escolhas particulares de h, o c´alculo dos produtos internos podem ser simplificados: 22

LP =

N N N X X X 1 k β k2 +C ξi − αi [yi (xTi β + β0 ) − (1 − ξi )] − µi ξi . 2 i=1 i=1 i=1

(3.18)

A fun¸ca˜o do Lagrangiano dual ´e expressa sob a forma indicada na Equa¸ca˜o 3.19: LD =

N X i=1

αi −

N X N 1X 0 0 0 αi αi yi yi hh(xi ), h(xi )i. 2 i=1 i0 =1

(3.19)

A solu¸ca˜o da fun¸ca˜o de transforma¸ca˜o pode ser reescrita conforme a Equa¸ca˜o 3.20: f (x) = h(x)T β + β0 =

N X

αi yi hh(x), h(xi )i + β0 .

(3.20)

i=1

Assim, dado os coeficientes αi , o valor de β0 pode ser determinado pela resolu¸ca˜o de yi ,f(xi ) = 1 na Equa¸ca˜o 3.20 para qualquer (ou todos) xi para o qual 0 < αi < o parˆametro de penalidade C. Portanto, as Equa¸c˜oes 3.19 e 3.20 envolvem a solu¸c˜ao da fun¸c˜ao de transforma¸ca˜o h(x) somente atrav´es de produtos internos.

3.6

M´ etodos de Detec¸ c˜ ao de Novidades

A detec¸c˜ao de novidades (ND - Novelty Detection) pode ser definida como a capacidade de reconhecer que um est´ımulo difere em alguns aspectos dos est´ımulos conhecidos (outliers). Isto pode ser uma habilidade u´til para sistemas de aprendizagem, tanto natural como artificial [38, 39]. O problema do reconhecimento de padr˜oes convencional normalmente incide sobre a classifica¸c˜ao de duas ou mais classes. J´a os problemas multiclasse s˜ao, frequentemente, decompostos em v´arios sistemas de classifica¸c˜ao com duas classes, que ´e considerada a tarefa b´asica [40, 41], como pode ser observado na Figura 3.3. Figura 3.3: Comportamento de um algoritmo para detec¸ca˜o de novidades.

Fonte:Adaptado de [42].

23

O interesse na detec¸ca˜o de novidades decorreu do estudo de sistemas de controle. Estruturas de alta integridade n˜ao podiam usar o procedimento de classifica¸c˜ao tradicional por uma s´erie de raz˜oes entre as quais est˜ao a ocorrˆencia de anormalidades raras ou a ausˆencia de dados que descrevam todas as condi¸c˜oes de falha [4]. A detec¸c˜ao de novidades ofereceu uma solu¸c˜ao para esse problema modelando dados da condi¸c˜ao normal, usando uma medida de distˆancia e um limite para determinar poss´ıveis anormalidades. Nos u ´ltimos anos, a detec¸ca˜o de novidades foi utilizada em v´arias aplica¸co˜es tais como interpreta¸c˜ao de mamografias [43] e outros problemas de diagn´ostico m´edico [44, 45], detec¸c˜ao de falhas e anomalias em sistemas industriais complexos [46], identifica¸c˜ao de danos estruturais [1, 47], problemas de seguran¸ca eletrˆonica, como detec¸ca˜o de fraude em cart˜ao de cr´edito ou celular [48, 49], vigilˆancia por v´ıdeo [50], rob´otica m´ovel [51], redes de sensores [52], astronomia [53] e minera¸ca˜o de texto [54]. Em determinadas aplica¸co˜es, o problema torna-se complicado pela existˆencia de v´arias classes de interesse, alta dimensionalidade, caracter´ısticas ruidosas e falta de amostras suficientes. Neste sentido, as abordagens de ND tentaram acompanhar esses problemas para oferecer solu¸co˜es que podem ser usadas no mundo real. MARKOU e SINGH [4] apresentam princ´ıpios importantes relacionados a` detec¸ca˜o de novidades: 1. Princ´ıpio de robustez e troca: um m´etodo de ND deve ser capaz de apresentar um desempenho robusto em dados de teste que maximize a exclus˜ao de novas amostras, minimizando a retirada de sinais conhecidos. Esse trade-off (troca) deve ser, de forma limitada, previs´ıvel e sob controle experimental; 2. Princ´ıpio da escala uniforme de dados: para auxiliar a ND, deve ser poss´ıvel que todos os dados de teste e os dados de treinamento ap´os a normaliza¸c˜ao estejam dentro do mesmo intervalo; 3. Princ´ıpio de minimiza¸ca˜o de parˆametros: a ND deve visar minimizar o n´ umero de fatores que s˜ao definidos pelo usu´ario; 4. Princ´ıpio da generaliza¸c˜ao: o sistema deve ser capaz de generalizar sem confundir a informa¸c˜ao generalizada; 5. Princ´ıpio da independˆencia: os modelos de ND devem ser independentes do n´ umero de recursos e das classes dispon´ıveis e devem oferecer um desempenho admiss´ıvel no contexto de conjunto de dados desequilibrado, com baixo n´ umero de amostras e ru´ıdo; 6. Princ´ıpio da adaptabilidade: um sistema que reconhece novas amostras durante o teste deve poder usar essas informa¸co˜es para um novo treinamento; 24

7. Princ´ıpio da complexidade computacional: uma s´erie de aplica¸co˜es de ND est˜ao online e, portanto, a complexidade computacional de um mecanismo ND deve ser a menor poss´ıvel. As diferentes t´ecnicas de ND podem ser classificadas em duas categorias principais de acordo com seu procedimento de treinamento: n˜ao-supervisionado e semisupervisionado [28, 55]. O treinamento semi-supervisionado manuseia dados assinalados das classes positiva (normal) e negativa (anormal). Contudo, o ˆexito de uma abordagem semisupervisionada para a aplica¸c˜ao da detec¸c˜ao de novidade sustenta-se na qualidade dos dados anormais angariados, cuja obten¸c˜ao n˜ao ´e trivial. Partindo do princ´ıpio de que somente assinaturas normais s˜ao disponibilizadas, a solu¸c˜ao elementar para treinar um detector de novidades ´e a gera¸c˜ao artificial de dados anormais para localizar uma fronteira ao redor dos dados normais. Ato cont´ınuo, o detector de novidades pode ser treinado para discriminar os dados normais dos anormais produzidos artificialmente. No entanto, ´e dif´ıcil para este m´etodo gerar um conjunto de dados quase normais pertencentes a uma classe anormal para problemas com dimens˜oes elevadas e esta abordagem ´e limitada pelo requisito de que n˜ao haja justaposi¸c˜ao entre as classes normal e anormal [28]. A tarefa de treinamento n˜ao-supervisionado requer exclusivamente dados normais n˜ao identificados. No decorrer da estrutura¸c˜ao do modelo de normalidade, o conhecimento do dom´ınio a priori dispon´ıvel pode ser explorado para caracterizar o comportamento do conjunto de dados mais adequadamente. ´ poss´ıvel adiantar que uma abordagem supervisionada para a constru¸ca˜o de um E modelo normal seria mais plaus´ıvel para viabilizar uma caracteriza¸ca˜o mais precisa da normalidade do que uma abordagem n˜ao supervisionada. Al´em disso, para v´arias aplica¸c˜oes da detec¸c˜ao de novidades, diversas observa¸c˜oes essenciais precisam ser contempladas ao adotar uma t´ecnica de ND [21, 56]. A precis˜ao e credibilidade de um detector, a normaliza¸c˜ao de dados, o n´ umero m´ınimo de ajustes dos parˆametros, a complexidade computacional entre outros variados aspectos complementares, abrangendo a distribui¸c˜ao de dados, os tipos de novidades, a acessibilidade aos r´otulos para cada ponto de dados, a sa´ıda de um detector de novidades (pontua¸c˜ao ou r´otulos) e os dom´ınios de prop´osito t´ıpico. O tipo da novidade ´e desconhecido em todos os dom´ınios de uma aplica¸c˜ao. A t´ıtulo de exemplo, um evento de novidade pode evoluir com o passar do tempo para uma fun¸c˜ao estipulada ou uma novidade circunstancial pode surgir no futuro, que difere das novidades anteriores. Outrossim, a novidade que j´a aconteceu poder´a tornar-se uma condi¸c˜ao dita normal ao longo do tempo. Isto posto, a detec¸ca˜o de novidades dinˆamicas (atualizadas 25

em tempo real) estimula o desenvolvimento das t´ecnicas existentes. Neste trabalho, os sistemas para detec¸ca˜o de novidade foram desenvolvidos usando treinamento n˜ao supervisionado em 4 tipos: m´aquinas de vetor de suporte, sistemas baseados em distˆancia, clustering k-means e mapas auto-organiz´aveis. A Figura 3.4 ilustra o processo de constru¸ca˜o dos modelos e detec¸ca˜o de novidades. Um modelo de normalidade ´e mostrado neste exemplo para ser constru´ıdo a partir das n assinaturas de ultrassom. As assinaturas de teste s˜ao ent˜ao comparadas a esse modelo. O processo da detec¸c˜ao de novidades categoriza cada assinatura de ultrassom testada como sendo “normal” ou “anormal” e um score de novidade ´e calculado para cada assinatura avaliada. Figura 3.4: Constru¸c˜ao de modelos para detec¸c˜ao de novidades usando assinaturas de ultrassom.

Fonte:Adaptado de [21].

Ap´os a normaliza¸ca˜o de todas as assinaturas e a realiza¸ca˜o das demais etapas de pr´e-processamento, um modelo de normalidade pode ser constru´ıdo para caracterizar vetores normais. Os padr˜oes que d˜ao origem a desvios deste modelo, se significativos em magnitude, podem ent˜ao ser classificados como novos. Esta se¸ca˜o descreve a aplica¸ca˜o dos algoritmos para um conjunto de treinamento com padr˜oes normais, para construir um modelo de normalidade utilizando os sinais ultrassˆonicos. A avalia¸ca˜o desses modelos como base para a detec¸ca˜o de novidades ´e discutido na Se¸c˜ao 4.4.

26

3.6.1

Detec¸ c˜ ao de novidades usando abordagem baseada em distˆ ancia

Os m´etodos baseados em distˆancia, incluindo o clustering ou vizinhan¸ca, s˜ao um outro tipo de t´ecnica que pode ser utilizada para realizar uma tarefa equivalente `a estima¸c˜ao da fun¸c˜ao densidade de probabilidade dos dados. Estas tarefas contam com as m´etricas de distˆancia bem definidas para calcular a medida de similaridade entre dois pontos [57]. CLIFTON [58] define como c o baricentro de todos os dados de treinamento normais, e dmax a distˆancia euclidiana m´axima de todos os dados de treinamento normais para c. Dada uma amostra de teste x, a sa´ıda rdist (x) ´e definida pela Equa¸ca˜o 3.21: rdist (x) =

d(x, c) dmax

(3.21)

Esta ´e a distˆancia mais pr´oxima da descri¸ca˜o de dados vizinhos, onde ´e assumido que uma matriz de distˆancia ou dissimilaridade ´e dada como entrada. Portanto, n˜ao h´a distˆancias calculadas. Um limiar a de uma sa´ıda no rdist (x) define um limite esf´erico de raio a.dmax da forma¸ca˜o centroide c, ilustrada pela Figura 3.5. Figura 3.5: Compara¸c˜ao da distˆancia entre a condi¸ca˜o normal e a novidade.

Fonte:Adaptado de [28].

Para a detec¸ca˜o da novidade, a amostra de teste cujo raio rdist (x) > a ´e considerada anormal no que diz respeito aos dados de treino normais. Caso o valor do limiar seja a = 1, ou seja, corresponda a um raio igual `a distˆancia dmax , ser´a classificado como condi¸c˜ao normal, igual a todos os dados de treino. A defini¸c˜ao do parˆametro a > 1 permite que seja alcan¸cado um limite superior aos dados de treino, e que, portanto, o m´etodo seja capaz de generalizar com maior precis˜ao a ocorrˆencia de dados normais durante a etapa de teste em compara¸ca˜o aos dados anormais. 27

O algoritmo k-means ´e um dos mais populares m´etodos de estrutura¸ca˜o dos dados de contorno devido a` sua simplicidade de implementa¸ca˜o. A t´ecnica pode tratar um tipo complexo de dados apenas articulando um algoritmo de agrupamento capaz de lidar com esses tipos de dados complexos e espec´ıficos. O processo de teste ´e r´apido, pois os dados testados s˜ao comparados meramente com um pequeno n´ umero de clusters em vez de usar todos os dados normais [59]. Entretanto, o desempenho desta abordagem ´e decidido pelo m´etodo de captura das estruturas de cluster dos dados normais. Portanto, a medida de distˆancia ou densidade utilizada pelo algoritmo de agrupamento precisa ser otimizada e continua a ser um desafio para esta t´ecnica de ND. A ferramenta avalia um conjunto de dados amostrais Ω = {x1 ; x2 ; x3 ; ...; xN } onde N ´e a quantidade total de amostras. O algoritmo iterativamente separa os dados em K (K < N) clusters distintos de Ω tal que a soma dos erros quadr´aticos ´e m´ınima. Portanto, o m´etodo k-means deve minimizar o erro da fun¸c˜ao de erro Ek−means que ´e definida como a soma dos quadrados das distˆancias euclidianas entre os centros sua popula¸c˜ao de amostras [58]. Assim, o c´alculo do erro e da m´edia µ para a constru¸c˜ao do cluster ´e realizado atrav´es das Equa¸co˜es 3.22 e 3.23: Ek−means (x) =

k X X

kx − µk2

(3.22)

j=1 xΩi

µj =

1 X x Nj xΩi

(3.23)

onde µj ´e um prot´otipo associado ao cluster e kth , e pode ser considerado como o centro do respectivo cluster. Durante o processo de teste do m´etodo k-means, os dados que n˜ao se enquadram em nenhum cluster ser˜ao considerados novidade, conforme apresentado na Figura 3.6. Figura 3.6: Aplica¸c˜ao do clustering k-means.

Fonte:Adaptado de [28].

28

A otimiza¸ca˜o de µj come¸ca com uma localiza¸ca˜o aleat´oria dos prot´otipos. Todos os dados de treinamento s˜ao atribu´ıdos ao prot´otipo mais pr´oximo, ent˜ao o valor de µj ´e atualizado para a m´edia desse conjunto de pontos. Este processo de re-estimativa se repete at´e que os locais do prot´otipo sejam est´aveis. O parˆametro k, o n´ umero de clusters para o qual os dados de treinamento pertencem, ´e sintonizado com valida¸ca˜o cruzada em nossos experimentos para obter um detector de novidades com bom desempenho. A complexidade computacional da forma¸ca˜o de um detector de novidades baseado em cluster depende rigorosamente do algoritmo de agrupamento empregado para gerar clusters a partir dos dados. Para o algoritmo de agrupamento k-means, devido ao uso da t´ecnica baseada em heur´ıstica, a complexidade computacional ´e ent˜ao linear no tamanho dos dados. O m´etodo Elbow ´e uma das maneiras de selecionar a quantidade de clusters (K) no algoritmo, analisando a porcentagem de variˆancia explicada como uma fun¸c˜ao do n´ umero de clusters. Quando o salto entre uma quantidade de cluster e o valor subsequente ´e irrelevante, o valor de K correspondente ´e selecionado para segmentar os dados [40]. A sa´ıda da novidade R(x) (Equa¸c˜ao 3.24) da amostra de teste x ´e dada por sua menor distˆancia normalizada para um centro de cluster como apresentado na Equa¸ca˜o 3.25: R(x) =

1 X kx − µi k Ni xΩi

(3.24)

1 kx − µi k Ri

(3.25)

r(x) = min i

Um limiar local em R(x) ´e definido para ser Rimax ≥ 1, a fim de permitir que todos os dados de treino normais sejam aceitos em um conjunto Ωi. Note-se que o raio a = 1 corresponde a um limite esf´erico com um raio Rimax a partir do centro de Ωi, enquanto a > 1 corresponde a um limite esf´erico com um raio de maior Rimax . PAVLOPOULOU et al. [1] avaliou danos estruturais de comp´ositos laminados utilizando ondas guiadas com a detec¸ca˜o de novidades. Neste caso, o processamento de sinal permitiu a extra¸ca˜o das caracter´ısticas adequadas com o uso de algoritmos para o reconhecimento de padr˜oes e redu¸c˜ao da dimens˜ao com a PCA n˜ao-linear, correlacionando com o defeito.

29

3.6.2

Detec¸ c˜ ao de novidades usando abordagem de constru¸ c˜ ao de dom´ınio

Uma das t´ecnicas de ND comumente usada ´e baseada em SVM para a constru¸ca˜o de um limiar decis´orio esf´erico/hiperplano que separe/agrupe a maioria dos pontos de dados normais [28]. A SVM de uma classe ´e um algoritmo n˜ao-supervisionado que aprende uma fun¸c˜ao de decis˜ao para a detec¸c˜ao de novidade: classificando novos dados como semelhantes ou diferentes do conjunto de treinamento [39, 60]. O m´etodo de Support Vector Data Description SVDD descrito por TAX e DUIN [61] assume uma abordagem esf´erica, em vez de planar. O SVDD obt´em um limite esf´erico, no espa¸co de caracter´ısticas, em torno dos dados. O volume desta hiperesfera ´e minimizado, para reduzir o efeito da incorpora¸ca˜o de valores at´ıpicos na solu¸ca˜o. A hiperesfera resultante ´e caracterizada por um centro a e um raio R > 0 como distˆancia de a para qualquer vetor de suporte o limite, do qual o R2 ser´a minimizado. O centro a ´e uma combina¸ca˜o linear dos vetores de suporte. O problema de minimiza¸ca˜o torna-se ent˜ao:

minR2 + C

n X

ξi

(3.26)

kxi − ak2 ≤ R2 + ξi , ξi ≥ 0

(3.27)

R,a

i=1

para i:1,. . ., n. Assim como na formula¸c˜ao tradicional, pode-se exigir que todas as distˆancias dos pontos de dados xi para o centro sejam menores que R, mas para criar uma margem suave, as vari´aveis lentas ξi com o parˆametro de penalidade C s˜ao usadas, ilustrado na Figura 3.7. Figura 3.7: Constru¸c˜ao da hiperesfera para o SVDD.

Fonte:Adaptado de [28].

30

Depois de resolver a Equa¸ca˜o 3.27 por introdu¸ca˜o dos multiplicadores Lagrange ´ αi , um novo ponto de dados z pode ser testado para estar dentro ou fora da classe. E considerado normal quando a distˆancia ao centro ´e menor ou igual ao raio, usando o kernel Gaussiano como uma fun¸ca˜o de distˆancia em dois pontos de dados (ver 3.28): − kz − xk2 kz − xk = αi exp σ2 i=1 2

n X

!

≥ −R2 /2 + CR

(3.28)

O desempenho do m´etodo SVDD depende totalmente da sele¸c˜ao de dois parˆametros: a largura de σ na fun¸c˜ao do kernel de Gauss e do parˆametro de penalidade C. Uma configura¸c˜ao pequena (ou grande) desses dois parˆametros pode levar a um limite inadequado do SVDD devido ao overtraining (excesso de ajuste) ou em casos de amostras insuficientes para o processo de treinamento. Como os dados anormais n˜ao est˜ao dispon´ıveis durante o processo de treinamento, C pode ser configurado como C = 1 / (N . eSVDD), onde N ´e o total dos dados de treinamento, eSVDD ´e o erro na detec¸ca˜o dados normais, ou seja, a fra¸ca˜o de dados normais que pode ser rejeitado. Para a largura do kernel σ, a abordagem de busca em grade foi utilizada para a sele¸c˜ao de um valor adequado, conforme trabalhado por [28]. O m´etodo SVDD tem sido aplicado em diferentes a´reas como em casos nos quais ocorre o tratamento de dados para extra¸c˜ao de caracter´ısticas com o objetivo de reduzir a dimens˜ao e aumentar o desempenho na ND [62, 63]

3.6.3

Detec¸ c˜ ao de novidades usando abordagem baseada em mapas auto-organiz´ aveis

O Self-Organizing Map (SOM) ou mapas de Kohonen s˜ao um dos exemplos da arquitetura da rede neural artificial introduzido por KOHONEN [64] que pode ser interpretado como uma t´ecnica de visualiza¸ca˜o, pois pode realizar uma proje¸ca˜o de um espa¸co multidimensional de entrada para um bidimensional de sa´ıda, criando assim uma estrutura de mapa. A localiza¸c˜ao dos pontos na sa´ıda visa refletir as semelhan¸cas entre os objetos correspondentes da entrada. Portanto, o SOM permite a visualiza¸c˜ao de rela¸c˜oes entre objetos em espa¸co multidimensional. O m´etodo fornece um mapeamento n˜ao-linear entre um espa¸co de dados original de alta dimens˜ao e um mapa bidimensional de neurˆonios. Os neurˆonios s˜ao organizados de acordo com uma grade regular, de tal forma que os vetores semelhantes no espa¸co de entrada s˜ao representados pelos neurˆonios pr´oximos na grade. Portanto, a t´ecnica SOM visualiza as associa¸co˜es de dados no espa¸co de alta dimens˜ao na entrada [65, 66], que pode ser observada na Figura 3.8. 31

Figura 3.8: Organiza¸ca˜o do mapeamento n˜ao-linear de Kohonen.

Fonte:Adaptado de [64].

Os resultados obtidos pelo m´etodo SOM em (3.29) s˜ao alcan¸cados minimizando a seguinte fun¸c˜ao de erro em rela¸ca˜o aos prot´otipos wr e ws : e=

X X

D(xµ , wr ) + k

XX

r xµ ∈Vr

D(xr , ws )

(3.29)

r s6=r

onde: • xµ s˜ao os objetos no espa¸co de alta dimens˜ao; • wr e ws s˜ao os prot´otipos de objetos na grade; • D(,) ´e a distˆancia euclidiana ao quadrado; • Vr ´e a regi˜ao de Voronoi correspondente ao prot´otipo wr . O n´ umero de prot´otipos deve ser suficientemente grande para satisfazer a igualdade D(xµ ,ws )=D(xµ ,wr ) + D(wr ,ws ) A fun¸c˜ao de erro SOM pode ser decomposta como a soma de dois erros: quantifica¸c˜ao e topol´ogico. O primeiro minimiza a perda de informa¸c˜ao, quando os padr˜oes de entrada s˜ao representados por um conjunto de prot´otipos. Ao minimizar o segundo, ´e assegurada a correla¸c˜ao m´axima entre as desigualdades do prot´otipo e as distˆancias de neurˆonio correspondentes, garantindo assim a visualiza¸c˜ao das rela¸co˜es de dados no espa¸co de entrada [35, 66]. A otimiza¸c˜ao de (3.29) ´e obtida por um m´etodo iterativo consistindo em duas etapas. Primeiro, um algoritmo de quantifica¸c˜ao que representa cada padr˜ao de entrada pelo prot´otipo vizinho mais pr´oximo ´e executado. Esta opera¸ca˜o minimiza o primeiro componente da Equa¸ca˜o 3.29. Em seguida, os prot´otipos est˜ao dispostos ao longo da grade dos neurˆonios, atenuando o segundo componente na fun¸c˜ao de erro [66, 67]. 32

Este problema de otimiza¸c˜ao pode ser solucionado explicitamente com a Equa¸ca˜o 3.30 de adapta¸ca˜o para qualquer prot´otipo: PM P

x ∈Vr

r=1

wrs = PM Pµ r=1

hrs xµ

xµ ∈Vr

hrs

(3.30)

onde M ´e o n´ umero de neurˆonios e hrs ´e uma fun¸ca˜o de vizinhan¸ca. Por exemplo, o kernel K gaussiano de largura σ(t) que ´e adaptada em cada itera¸ca˜o do algoritmo usando a seguinte regra σ(t) = σi (σf /σi )(t/Niter ) . Nesse caso σi = M/2 ´e tipicamente assumido na literatura, e σf ´e o parˆametro que determina o grau de suaviza¸c˜ao da curva principal gerada pelo algoritmo SOM [66]. O ”Kohonen SOM” ´e um SOM est´atico com uma estrutura fixa: o tamanho da grade e o n´ umero de n´os devem ser determinados a priori. Isso resulta em uma limita¸ca˜o significativa no mapeamento final, pois ´e improv´avel que a estrutura mais adequada seja conhecida de antem˜ao. Antes do treino, os pesos de cada n´o devem ser inicializados. Normalmente, estes ser˜ao definidos para pequenos valores aleat´orios padronizados. Os pesos no SOM s˜ao inicializados de modo que 0 < wrs < 1. Para determinar a melhor unidade de correspondˆencia, um m´etodo ´e iterar atrav´es de todos os n´os e calcular a distˆancia euclidiana entre o vetor de peso em cada n´o e o vetor de entrada atual. O n´o com um vetor de peso mais pr´oximo do vetor de entrada ´e marcado como o melhor da unidade da m´aquina BMU (Best Method Unit). A distˆancia euclidiana ´e dada por (3.31): D=

v ui=n uX t (V

i

− Wrs (i))2

(3.31)

i=0

onde V ´e o vetor de entrada atual e W ´e o vetor de peso do n´o. A cada itera¸ca˜o, ap´os a determina¸ca˜o do BMU, o pr´oximo passo ´e calcular quais dos outros n´os est˜ao dentro do na vizinhan¸ca da BMU. Todos esses n´os ter˜ao seus vetores de peso alterados na pr´oxima etapa. Deve-ser calculado o raio da vizinhan¸ca para determinar se cada n´o est´a dentro da distˆancia radial ou n˜ao [65]. Uma caracter´ıstica do algoritmo de aprendizagem de Kohonen ´e que a ´area da vizinhan¸ca se encolhe ao longo do tempo. Isto ´e conseguido tornando o raio da vizinhan¸ca menor ao longo do tempo [66]. Para tal, a fun¸c˜ao exponencial de decaimento expressa em Equa¸c˜ao 3.32 ´e empregada: −t τ t = 1, . . . , n

σ(t) = σo exp





(3.32)

onde σo ´e a largura da rede no tempo t0 , τ indica uma constante de tempo e t ´e o tempo. 33

Ao longo do tempo, a vizinhan¸ca ir´a encolher para o tamanho de um u ´ nico n´o, o BMU, mas tamb´em o efeito da aprendizagem deve ser proporcional `a distˆancia entre um n´o e o BMU. Assim, na vizinhan¸ca do BMU o processo de aprendizagem n˜ao deve ter qualquer efeito. Desse modo, a taxa de aprendizado deve desaparecer em rela¸c˜ao `a distˆancia com um comportamento gaussiana. Ao ser determinado o raio, as itera¸c˜oes atrav´es de todos os n´os na rede servir˜ao para determinar se eles encontram-se no raio ou n˜ao. Se um n´o for encontrado dentro da vizinhan¸ca, ´e dito normal e seu vetor de peso ´e ajustado pela Equa¸ca˜o 3.33: W (t + 1) = W (t) + Θ(t)η(t)(V (t) − W (t)

(3.33)

onde η(t) ´e a taxa de aprendizado que decai com o tempo calculada a cada itera¸ca˜o usando a Equa¸c˜ao 3.34, e Θ(t) para representar a quantidade de influˆencia que a distˆancia de um n´o da BMU tem em sua aprendizagem com a Equa¸ca˜o 3.35: −t , t = 1, . . . , n η(t) = η(0)exp τ ! −D2 , t = 1, . . . , n Θ(t) = exp 2σ 2 (t) 



34

(3.34) (3.35)

Cap´ıtulo 4 Metodologia dos ensaios Neste trabalho foi verificada a aplica¸ca˜o das t´ecnicas para detec¸ca˜o de novidades `as assinaturas obtidas dos trˆes experimentos de inspe¸c˜ao por ultrassom escolhidos em fun¸c˜ao da aplica¸c˜ao pr´atica das t´ecnicas e novas metodologias de an´alise para a identifica¸c˜ao e classifica¸c˜ao dos defeitos associados `as condi¸c˜oes dos materiais. A realiza¸c˜ao dos experimentos ocorreu em parceria com o Grupo de Pesquisas em Ensaios N˜ao-Destrutivos (GPEND) no Instituto Federal da Bahia - Campus Salvador. Este cap´ıtulo aborda os experimentos executados, assim como, a sistematiza¸c˜ao aplicada para verifica¸ca˜o dos resultados.

4.1

Experimento 1 - Solda

O corpo de prova (CP) (ver Figura 4.2) inspecionado ´e composto de duas chapas de a¸co carbono SAE1020 com dimens˜oes 1000x500x15,5 mm unidas utilizando uma combina¸c˜ao das t´ecnicas arco el´etrico TIG, MIG e eletrodo revestido. Foram identificadas atrav´es de exame radiogr´afico as condi¸c˜oes subsequentes ao longo do cord˜ao de solda (ver Figura 4.1): • Sem defeito (SD); • Falta de Fus˜ao (FF): falha observada quando n˜ao h´a fus˜ao entre o metal da solda e as superf´ıcies da placa base. N´ıvel de corrente muito baixa, velocidade de soldagem muito alta, ˆangulo de inclina¸c˜ao da tocha incorreto, presen¸ca da pel´ıcula de o´xido na superf´ıcie, limpeza inadequada das juntas e prepara¸ca˜o de solda muito estreita s˜ao algumas das causas. • Falta de Penetra¸c˜ao/Trinca (FPTC); defeito que ocorre quando a solda n˜ao penetra a espessura inteira do metal base. As causas s˜ao bem similares `a ocorrˆencia da falta de fus˜ao;

35

• Inclus˜ao de Esc´oria (IE): indica a presen¸ca de material s´olido estranho que pode ser met´alico ou n˜ao; • Porosidade (PO): ´e a contamina¸c˜ao da solda sob a forma de um g´as preso e que ´e liberado `a medida que a solidifica¸c˜ao ocorre, afetando negativamente o cord˜ao de solda. Figura 4.1: Tipos de defeitos usualmente observados em soldas.

Fonte: Elaborado pelo autor.

Figura 4.2: Corpo de prova soldado com a presen¸ca de defeitos internos inseridos de modo controlado durante a soldagem.

Fonte: Elaborado pelo autor.

36

O ensaio TOFD foi executado atrav´es de varredura manual, com um passo de 5 mm entre cada sinal utilizando os equipamentos a seguir: • Transdutores Olympus Panametrics® C543-SM, sapata acr´ılica com aˆngulo de incidˆencia igual a 45o , frequˆencia central 5 MHz, tamanho do cristal 3 mm, e comprimento de onda λ igual a 648 µm.; • Gerador de pulsos Olympus Panametrics® modelo 5077PR, respons´avel pela excita¸ca˜o de um trem de pulsos de onda quadrada com tens˜ao de 5 V e ganho de 10 dB, em que os transdutores de transmiss˜ao e recep¸ca˜o foram conectados; • Oscilosc´opio digital Tektronix® modelo TDS 2024B com frequˆencia de amostragem ajustada a 250 MHz A comunica¸c˜ao com o oscilosc´opio foi realizada atrav´es de uma porta USB2.0 por um computador com uma interface utilizando o software LabVIEW® . Em seguida, os sinais foram armazenados em plataforma desktop para armazenamento e processamento dos sinais, de acordo com a ilustra¸ca˜o da Figura 4.3. Cada assinatura coletada foi digitalizada com 2500 componentes. Figura 4.3: Esquema da realiza¸ca˜o do experimento 01 e coleta das amostras.

Fonte: Elaborado pelo autor.

4.2

Experimento 2 - P´ as de Aerogeradores

Para a inspe¸ca˜o do sistema e´olico, o ensaio visual pode detectar alguns defeitos, tais como altera¸c˜ao na cor das superf´ıcies dos componentes, que podem indicar varia¸co˜es de temperatura ou deteriora¸ca˜o, e o som proveniente dos rolamentos pode indicar deforma¸ca˜o da condi¸ca˜o f´ısica [68, 69]. 37

Contudo, muitas das falhas mais t´ıpicas, como rachaduras e rugosidades nas superf´ıcies das p´as, curtos-circuitos el´etricos no gerador e superaquecimento da caixa multiplicadora de velocidades de um aerogerador, exigem uma abordagem mais sofisticada para a manuten¸c˜ao [70]. O ensaio ultrassˆonico pulso-eco Bubbler com os aerogeradores utilizou trˆes corpos de prova retirados das p´as de uma turbina e´olica constitu´ıdos de uma camada com madeira de balsa medindo 10 mm de espessura, recoberta por uma fibra de vidro em matriz de pol´ımeros, conforme o esquema na Figura 4.4. Figura 4.4: Madeira de balsa utilizada nas p´as de aerogeradores.

Fonte: Adaptado de [71].

Os trˆes corpos de prova apresentam regi˜oes sem falha (SF) e a sinaliza¸c˜ao de dois defeitos do tipo delamina¸c˜ao (descolamento entre a fibra e o n´ ucleo) e matriz seca (ausˆencia de fibra) [72], respectivamente identificados como DL1, DL2, MS3. A Tabela 4.1 revela as dimens˜oes dos CP com a espessura da camada de fibra, conforme indicado na Figura 4.5. Tabela 4.1: Dimens˜oes dos corpos de prova extra´ıdo de aerogeradores Corpo de Prova DL1 - Delamina¸c˜ao DL2 - Delamina¸c˜ao MS3 - Matriz Seca

Espessura (mm)

Comprimento (mm)

Largura (mm)

5,1 5,1 4,9

229 226 224

201 226 216

38

Figura 4.5: Localiza¸ca˜o da regi˜ao dos defeitos nos corpos de prova do experimento 2 (a) DL1

(b) DL2

(c) MS3

Fonte: Elaborado pelo autor.

O ensaio utilizou um transdutor Olympus Panametrics® V303, com frequˆencia central de 1 MHz, tamanho do cristal 13mm conectado ao gerador de pulsos Olympus Panametrics® modelo 5077PR configurado com os mesmos parˆametros de forma de onda e excita¸c˜ao para o experimento 1, cuja forma de onda era observada e digitalizada num oscilosc´opio digital Tektronix® modelo TDS 2024B com frequˆencia de amostragem ajustada a 500MHz. O Bubbler foi constru´ıdo com altura suficiente para que a coluna d’´agua definida para o experimento fosse igual `a medida do campo pr´oximo N do transdutor selecionado, com o prop´osito de evitar interferˆencias ac´ usticas. A varredura ultrassˆonica ocorreu em modo manual, com uma malha de espa¸camento igual a 5mm entre cada ponto sobre as regi˜oes defeituosas e sem defeito, sendo adquiridas 100 assinaturas com 2500 componentes cada para os danos observados. A Figura 4.6 exemplifica o ensaio praticado. Figura 4.6: Esquema da realiza¸ca˜o do experimento 02 e coleta das amostras.

Fonte: Elaborado pelo autor.

39

4.3

Experimento 3 - Tubos de Fornos de Pir´ olise

Os fornos de pir´olise s˜ao equipamentos indicados para a produ¸ca˜o de hidrocarbonetos na ind´ ustria petroqu´ımica, cujos tubos que constituem as serpentinas dessas m´aquinas est˜ao submetidos a temperaturas superiores a 1000o C. Durante a rea¸c˜ao qu´ımica no interior das serpentinas nos fornos de pir´olise, carbono sob a forma de g´as ´e liberado e provoca danos `a parede interna do tubo, denominados carburiza¸ca˜o [73]. Em virtude desse fenˆomeno, tubos de a¸co inoxid´avel come¸caram a ser utilizados devido `as suas caracter´ısticas de resistˆencia ao trabalho em elevadas temperaturas e menor espessura. Portanto, a importˆancia em definir o momento ideal para a substitui¸ca˜o desses tubos das serpentinas com base no grau da carburiza¸ca˜o recorrendo a ensaios n˜ao-destrutivos tem sido alvo de pesquisas recentes [73]. Neste experimento, foram disponibilizadas 03 amostras de tubos em a¸co inoxid´avel da fam´ılia HP40 retiradas durante servi¸co de um mesmo forno de pir´olise, ap´os diferentes tempos de opera¸ca˜o. A Tabela 4.2 exp˜oe as dimens˜oes dos corpos de prova mostrados na Figura 4.7. Tabela 4.2: Dimens˜oes dos corpos de prova dos tubos de a¸co inoxid´avel da classe HP Corpo de Prova SCB - Sem Carburiza¸ca˜o BCB - Baixa Carburiza¸ca˜o ACB - Alta Carburiza¸c˜ao

Diˆametro externo (mm)

Diˆametro interno (mm)

7,9 7,2 7,0

6,19 6,2 6,19

Figura 4.7: Amostras de tubos utilizados no experimento.

Fonte: Elaborado pelo autor.

40

O ensaio ultrassˆonico por imers˜ao convencional foi executado com os mesmos equipamentos da Se¸c˜ao 4.2, submergindo os corpos de prova em um tanque com a´gua, e a taxa de amostragem definida para o oscilosc´opio igual a 250MHz, coletando 200 assinaturas com 2500 componentes cada para as regi˜oes de interesse, conforme ilustrado pela Figura 4.8. Figura 4.8: Esquema da realiza¸ca˜o do experimento 03 e coleta das amostras.

Fonte: Elaborado pelo autor.

4.4

Cadeia de Processamento de Sinais Proposta

As t´ecnicas de processamento digital de sinais s˜ao ferramentas de grande aplica¸ca˜o na extra¸c˜ao de caracter´ısticas e classifica¸c˜ao de sinais ultrassˆonicos dado que a interpreta¸ca˜o dos resultados de amplitude no dom´ınio do tempo ´e, em muitos casos, dif´ıcil. Ap´os a normaliza¸ca˜o indicada para a classifica¸ca˜o utilizando detec¸ca˜o de novidades apontada no trabalho de CLIFTON e TARASSENKO [21], a filtragem do ru´ıdo e reconstru¸c˜ao dos sinais ultrassˆonicos atrav´es da Transformada wavelet Discreta foi realizada selecionando a fam´ılia Daubechies, at´e o 3 n´ıvel de aproxima¸ca˜o, conforme apontado pelo estudo de ADAMO et al. [30]. Em seguida, a execu¸ca˜o da an´alise do espectro de frequˆencia utilizou a amplitude das assinaturas com a realiza¸ca˜o da FFT, resultando em 2048 coeficientes espectrais. A sele¸ca˜o de caracter´ısticas com o PCA foi executada usando o algoritmo FastICA. Esse m´etodo ´e largamente conhecido pela eficiˆencia da implementa¸ca˜o do algoritmo fast-fixed point voltado para a an´alise de componentes independentes. Contudo, 41

a sele¸c˜ao dos parˆametros de autovalor e a defini¸c˜ao do n´ umero dos componentes principais foi adotada para a proje¸ca˜o desejada que descreve o conjunto de assinaturas, preservando a parcela relevante da informa¸c˜ao original. Neste sentido, a compacta¸ca˜o dos dados ´e um processo valioso, pois a an´alise de uma grande quantidade de informa¸ca˜o reduziria a eficiˆencia do sistema. A Tabela 4.3 apresenta o tamanho das bases de dados obtidas para os detectores de novidade constru´ıdos. Tabela 4.3: Bases de dados usadas nos experimentos de detec¸ca˜o de novidade Experimento Solda P´as de Aerogeradores Tubos de Fornos de Pir´olise

# Classes Novidade

# Assinaturas Normais Treinamento

4

120

40

3

60

2

120

# Assinaturas Novidades

Valida¸c˜ao Teste

Valida¸ca˜o

Teste

40

100

100

20

20

50

50

40

40

40

40

A valida¸c˜ao cruzada foi empregada atrav´es do k-Fold para a constru¸c˜ao de 10 subconjuntos de dados. A cada sorteio de um conjunto, 50 inicializa¸c˜oes foram executadas, entre as quais os melhores resultados foram destacados. O objetivo deste procedimento ´e garantir a amostragem aleat´oria estratificada, evitando-se que um determinado conjunto de amostras interfira na independˆencia estat´ıstica da resposta de treinamento dos m´etodos. O treinamento foi realizado integralmente com o software MATLAB® usando algoritmos pr´oprios adequados aos m´etodos RNA, SVM e a implementa¸c˜ao das quatro abordagens para detec¸c˜ao de novidades, com todas as etapas cumpridas no mesmo computador. O procedimento proposto para a detec¸ca˜o de novidades pode operar em paralelo com um classificador tradicional, se j´a existirem classes conhecidas para o problema em quest˜ao. O diagrama de blocos da Figura 4.9 ilustra a sequˆencia de etapas.

42

Figura 4.9: Etapas do sistema de tomada de decis˜ao.

A aplica¸ca˜o dos classificadores multiclasse utilizaram os seguintes parˆametros: • RNA: algoritmo Levenberg-Marquardt backpropagation com 5 neurˆonios na camada oculta, fun¸ca˜o de ativa¸ca˜o tangente sigm´oide tansig, erro=10−6 ; • SVM: constru¸ca˜o dos vetores de suporte usando kernel RBF com o valor (σ; ν) o´timo para os casos. As abordagens para detec¸c˜ao de novidades foram implementadas seguindo os crit´erios estabelecidos na Se¸c˜ao 3.5, listados a seguir: • distˆancia: limiar de partida com raio a = 1, selecionado empiricamente a fim de permitir alguma ´area fora dos dados de treino normais para ser inclu´ıdo dentro do limite de normalidade; • k-means: N´ umero de agrumapentos K = 3 e raio r = 10, com a constru¸ca˜o de um limiar local definido iterativamente para cada cluster. • SVDD : (σ;C)=(1,50;0,10) para a constru¸ca˜o da hiperesfera que delimitar´a as classes normais e a identifica¸ca˜o das novidades. • m´etodo SOM: partindo de 2 classes desconhecidas reduzindo linearmente para 1 sobre as primeiras 50 itera¸c˜oes, enquanto os pesos s˜ao ajustados ap´os cada padr˜ao. A taxa de aprendizado ´e reduzida linearmente de 0,9 para 0,05. Na fase de convergˆencia do m´etodo, a aprendizagem apenas atualiza o n´o vencedor e a taxa de aprendizado ´e reduzida de 0,05 para 0,01 em mais de 400 itera¸co˜es.

43

4.5

Representa¸c˜ ao dos resultados

De acordo com a revis˜ao bibliogr´afica, a avalia¸ca˜o do desempenho das abordagens da detec¸ca˜o de novidades utilizadas na literatura atual pode ser realizada atrav´es da ´ curva ROC, o respectivo valor da Area sob a Curva (AUC), entre outras m´etricas estat´ısticas, incluindo eficiˆencia m´edia, mediana, bem como a execu¸c˜ao do teste pareado de Wilcoxon [28, 38, 40]. O objetivo essencial da detec¸c˜ao de novidades ´e maximizar a sua sensibilidade minimizando a taxa de falsos positivos [74]. Assim, devem ser avaliados os seguintes parˆametros, conforme a matriz de confus˜ao MC da Tabela 4.4: • Taxa de Verdadeiros Positivos TPr (True Positive Rate) ou sensibilidade: Probabilidade de detec¸ca˜o que define quantos resultados positivos corretos, TP, ocorrem entre todas as amostras positivas, NP=TP+FP, dispon´ıveis durante o teste, conforme definido em (4.1). TPr =

Σ TP NP

(4.1)

• Taxa de Falsos Positivos FPr (False Positive Rate): Probabilidade de detec¸ca˜o que define quantos resultados incorretamente classificados como positivos, FP, ocorrem entre todas as amostras negativas, NF=FN+TN, dispon´ıveis durante o teste, de acordo com a Equa¸ca˜o 4.2. FPr =

Σ FP NF

(4.2)

´ a probabilidade de • Taxa de Falso Negativo (FNr - False Negative Rate): E um resultado positivo dado que um evento desta classe n˜ao esteja presente. Portanto, FNr = 1 - TPr. • Taxa de Verdadeiro Negativo ou especificidade (TNr - True Negative Rate): Probabilidade de medir a propor¸ca˜o de eventos negativos corretamente identificados como tal. Desse modo, TNr = 1 - FPr. Tabela 4.4: Matriz de confus˜ao t´ıpica para o total de amostras avaliadas com a detec¸ca˜o de novidades Classe Observada

Classe Prevista Condi¸ca˜o Positiva

Condi¸ca˜o Negativa

Observa¸c˜ao Positiva Observa¸c˜ao Negativa

TP FN

FP TN

44

A acur´acia para um detector de novidades tamb´em ´e importante, uma vez que representa o grau de acerto e exclus˜ao das amostras comparadas com o seu valor verdadeiro, calculada pela Equa¸ca˜o 4.3. TP + TN Acur´acia = P Total das amostras P

P

(4.3)

A curva ROC (Receiver Operation Characteristic) ´e uma figura de m´erito para a visualiza¸c˜ao, avalia¸c˜ao e sele¸c˜ao de classificadores bin´arios. A t´ecnica baseia-se na constru¸c˜ao gr´afica de coordenadas no qual a taxa de verdadeiros positivos ´e associada ao eixo das ordenadas e a taxa de falsos positivos ao eixo das abscissas ou sensibilidade versus (1-especificidade) [75]. A curva ROC ideal se assemelha a um degrau. A ´area sob curva ROC (AUC) ilustrada na Figura 4.10 ´e uma apresenta¸c˜ao quantitativa integrada que mede a discrimina¸ca˜o dessa figura estat´ıstica e, portanto, esse valor pode ser utilizado como uma medida de qualidade para um detector de novidades. Figura 4.10: Exemplos de poss´ıveis comportamentos da curva ROC e AUC.

A fim de comparar diretamente diferentes curvas ROC mais facilmente, um u ´ nico indicador de desempenho da AUC pode resumir o comportamento da curva [28]. Quanto maior o valor AUC, melhor o desempenho do detector de novidades. Portanto, o valor de AUC calculado ser´a empregado para medir o desempenho dos quatro detectores de novidade selecionados para avalia¸ca˜o [60]. Outra abordagem estat´ıstica de compara¸c˜ao do comportamento da acur´acia/eficiˆencia dos treinamentos executados ´e embasada no uso dos diagramas de caixa (boxplot). Boxplots graficamente retratam grupos de dados num´ericos lidando com cinco quantidades [76]: 45

• M´ınimo: menor valor da observa¸c˜ao; • M´aximo: maior valor da observa¸c˜ao; • Quartis (Q1 , Q2 , Q3 ): S˜ao valores dados a partir do conjunto de observa¸c˜oes ordenado em ordem crescente, que dividem a distribui¸c˜ao em quatro partes iguais. Dado n como o n´ umero total de elementos da amostra, Qj ser´a um elemento entre Xk e Xk+1 , calculado a partir da Equa¸c˜ao 4.4: j(n + 1) Qj = Xk + − k (Xk+1 − Xk ) 4 ! j(n + 1) para j=1,2,3. onde k= 4 !

(4.4)

O primeiro quartil, Q1 , ´e o n´ umero que limita 25% das observa¸co˜es abaixo e 75% acima, enquanto que o terceiro quartil, Q3 , delimita 75% das observa¸c˜oes abaixo e 25% acima. J´a Q2 ´e a mediana, 50% das observa¸co˜es. Os valores de limite inferior e superior podem ser calculados utilizando a Equa¸ca˜o 4.5 e a Equa¸c˜ao 4.6:

Limite inferior = Q1 − 1, 5.(Q3 − Q1 )

(4.5)

Limite superior = Q3 + 1, 5.(Q3 − Q1 )

(4.6)

Nesta situa¸ca˜o, os valores al´em destes limites s˜ao encarados como discrepantes e assinalados por asterisco exibidos pela Figura 4.11. Figura 4.11: M´etodo para descri¸c˜ao estat´ıstica de dados boxplot.

46

Dado que a revis˜ao bibliogr´afica aponta que o tamanho do conjunto de dados pode afetar o desempenho dos detectores, uma etapa de treinamento foi realizada para avaliar os mesmos quatro detectores representativos em diferentes tamanhos do conjunto de dados, a fim de justificar a sele¸c˜ao da PCA. Foram constru´ıdos conjuntos de dados normais para treinamento de 2, 50, 100, 150, 200 e 2048 componentes principais respectivamente para os trˆes experimentos. Este salto na dimens˜ao dos conjuntos foi empregada em fun¸c˜ao da forte correla¸c˜ao dos sinais verificada durante a aplica¸c˜ao da PCA, o que levou ao truncamento do espectro fazendo que o total de coeficientes (2048) fosse o u ´ltimo n´ıvel de an´alise. Os parˆametros em cada detector s˜ao sintonizados da mesma maneira que no conjunto de experimentos principal e os mesmos limiares s˜ao definidos para calcular os valores da AUC. Al´em dessas ferramentas, o teste de classifica¸c˜ao Wilcoxon pareado foi aplicado aos resultados de AUC obtidos para os trˆes experimentos descritos, a fim de avaliar o desempenho geral e relativo dos m´etodos utilizados para a detec¸ca˜o das novidades. O teste de classifica¸ca˜o Wilcoxon ´e um teste n˜ao param´etrico para duas popula¸co˜es, quando as observa¸c˜oes s˜ao emparelhadas [77]. O problema das hip´oteses e as respectivas condi¸co˜es s˜ao apresentadas na Equa¸c˜ao 4.7:  H



 H : ∆ > 0, 05 0 : ∆ < 0, 05 0  H : Aceito H : Rejeitado 1 1

(4.7)

Neste caso, ´e testada a hip´otese nula de que os dados das duas popula¸c˜oes s˜ao amostras de distribui¸c˜oes cont´ınuas com medianas iguais, contra a alternativa que n˜ao s˜ao. O teste pressup˜oe que as duas amostras s˜ao independentes. Al´em disso, o comprimento pode ser diferente entre as amostras. Para todos os resultados de desempenho dos detectores de novidades utilizando a AUC apresentadas no Cap´ıtulo 5, foi realizado o teste de Wilcoxon com n´ıvel de significˆancia igual a 0,05. Ambos os resultados do teste de hip´otese h e p foram listados. Valores de h = 1 indicam uma rejei¸c˜ao da hip´otese nula no n´ıvel de significˆancia igual a 0,05 e h = 0 indica uma falha na rejei¸c˜ao da hip´otese nula no 0,05 n´ıvel de significˆancia.

47

Cap´ıtulo 5 Resultados e Discuss˜ oes Este cap´ıtulo discute cada um dos experimentos executados individualmente com rela¸ca˜o a`s etapas apresentadas na cadeia de processamento proposta na Se¸ca˜o 4.4 e os resultados obtidos atrav´es das m´etricas definidas na Se¸ca˜o 4.5

5.1

Solda - Experimento 1

5.1.1

Processamento de Sinais

Ap´os coleta das amostras e normaliza¸c˜ao, a etapa do processamento digital de sinais teve in´ıcio com a filtragem atrav´es da transformada discreta wavelet conforme exibido na Figura 5.1. A janela temporal apresentada contempla o tempo de amostragem para que a amostra coletada englobasse desde a reflex˜ao superficial at´e o eco de fundo e as poss´ıveis difra¸c˜oes associadas com os defeitos sinalizados pelo raio-x. ´ poss´ıvel notar que a an´alise no dom´ınio do tempo possui um tra¸co caracter´ıstico E intr´ınseca para os sinais considerados t´ıpicos de cada um dos defeitos associados ao corpo de prova soldado do experimento 1. Por exemplo, a Figura 5.1a, associada `a condi¸ca˜o sem defeito, destaca uma amplitude de reflex˜ao do eco de fundo superior a`s demais condi¸c˜oes que apresentam diversas reflex˜oes para o tempo de amostragem da amostra coletada. Isso permite tomar como ponto de partida ao longo do ensaio, mas requer novamente a capacita¸c˜ao do inspetor respons´avel para caracterizar as outras condi¸co˜es. Desse modo, seguindo a cadeia de implementa¸c˜ao indicada na Figura 4.9 o resultado da FFT permitiu avaliar o especto de frequˆencia para cada assinatura de classe do corpo de prova. Os sinais normalizados t´ıpicos s˜ao apresentados na Figura 5.2. Pode-se observar algumas caracter´ısticas particulares de cada classe de interesse, como o maior espalhamento espectral dos sinais t´ıpicos da falta de penetra¸ca˜o/trinca. 48

Figura 5.1: Sinal t´ıpico no dom´ınio do tempo ap´os a DWT Fam´ılia Daubechie de 3o n´ıvel para as diferentes classes de interesse existentes na Solda. (a) Sem Defeito

(b) Falta de Fus˜ ao

(c) Falta de Penetra¸c˜ao/Trinca

(d) Inclus˜ ao de Esc´ oria

(e) Porosidade

49

Figura 5.2: Espectros de frequˆencia t´ıpicos das classes observadas na solda. (a) Sem Defeito

(b) Falta de Fus˜ ao

(c) Falta de Penetra¸c˜ao/Trinca

(d) Inclus˜ ao de Esc´ oria

(e) Porosidade

50

5.1.2

Detectores de Novidade

Ap´os a aplica¸c˜ao da FFT para obter o espectro de frequˆencia dos sinais ultrassˆonicos, foi realizada a redu¸ca˜o de dimensionalidade com a PCA para assegurar a maior parte da energia associada ao conjunto de sinais. Essa etapa foi implementada principalmente para evitar que o tamanho do conjunto de dados afete o desempenho dos detectores, dado que estudos preliminares na literatura apontam uma grande varia¸ca˜o de desempenho entre os m´etodos quando o tamanho dos dados de treinamento ´e pequeno. O melhor resultado das assinaturas para as classes de solda ocorreu com a limita¸c˜ao de 200 componentes principais dos 2048 coeficientes da FFT dispon´ıveis. Em seguida, teve in´ıcio a tarefa de classifica¸c˜ao utilizando as abordagens com a detec¸ca˜o de novidades. Os mapas de treinamento t´ıpicos foram constru´ıdos para representar a distribui¸ca˜o bidimensional das amostras utilizadas no modelo, sinalizando a regi˜ao lim´ıtrofe para a classifica¸c˜ao das amostras de novidade, mostradas na Figura 5.3, referentes `a abordagem baseada em distˆancia cujos resultados para a identifica¸ca˜o das novidades associadas `a Falta de Fus˜ao (Figura 5.3a) e Inclus˜ao de Esc´oria (Figura 5.3c) apresentaram uma eficiˆencia global superior a`s condi¸co˜es Porosidade (Figura 5.3d) e Falta de Penetra¸ca˜o/Trinca (Figura 5.3b). As sinaliza¸c˜oes em preto e azul indicam a classe normal utilizada para o treinamento e teste respectivamente, separada por um limiar tracejado das diferentes condi¸co˜es anormais sinalizadas em vermelho para cada m´etodo de ND. A classe Falta de Fus˜ao apresenta-se sem sobreposi¸ca˜o espacial, com a indica¸ca˜o de elevada sensibilidade e acur´acia na classifica¸ca˜o e pequena especificidade; enquanto que a classe Inclus˜ao de Esc´oria exibe um pequeno registro associado a` taxa de falsos positivos. A decis˜ao de contorno para as classes Porosidade e Falta de Penetra¸c˜ao/Trinca, classes com menor acur´acia, indica que o comportamento da primeira classe tem uma baixa dispers˜ao espacial em torno do limiar de novidade, sugerindo que a dimens˜ao do defeito pode ser confundida com um estado normal da solda. A an´alise da classe FPTC sugere uma investiga¸ca˜o maior no comportamento do sinal em virtude da taxa de falsos negativos ter sido maior que as demais condi¸co˜es exploradas durante o teste do detector. A heterogeneidade na presen¸ca dos defeitos simulados para o corpo de prova soldado resultou na imprecis˜ao associada com a regi˜ao das assinaturas da classe Porosidade, devido a existˆencia de assinaturas normais. Para o caso da Falta de Penetra¸c˜ao/Trinca, o efeito aponta para uma configura¸c˜ao de novos outliers, sem rela¸ca˜o com a condi¸ca˜o normal.

51

Figura 5.3: Mapas de treinamento do m´etodo ND DIST para base de dados Solda. (b) Falta de Penetra¸c˜ao/Trinca

(a) Falta de Fus˜ ao dist

2

Treino Valida¸c˜ao Teste Limiar

1.8

Treino Valida¸c˜ao Teste Limiar

1.05 1 0.95 Sa´ıda ND

Sa´ıda ND

1.6

dist

1.1

1.4 1.2

0.9 0.85 0.8 0.75

1

0.7

0.8 0

20

40

60 80 Amostras

100

120

0.65 0

20

(c) Inclus˜ ao de Esc´ oria

40

1.1

Treino Valida¸c˜ao Teste Limiar

1

Sa´ıda ND

0.9 Sa´ıda ND

120

dist

1.1 Treino Valida¸c˜ ao Teste Limiar

1.2

100

(d) Porosidade

dist

1.3

60 80 Amostras

1 0.9

0.8 0.7

0.8

0.6 0.7

0.5

0.6 0

20

40

60 80 Amostras

100

120

0

20

40

60 80 Amostras

100

120

A Figura 5.4 mostra o comportamento dos mapas associados `a abordagem utilizando o k-means. A distribui¸ca˜o espacial das novidades para o n´ umero de clusters aponta que a identifica¸c˜ao das novidades para as classes Falta de Fus˜ao e Inclus˜ao de Esc´oria, observadas nas Figuras 5.4a e 5.4c respectivamente, tamb´em alcan¸caram uma eficiˆencia global superior a`s condi¸co˜es Porosidade e Falta de Penetra¸ca˜o/Trinca, exibidas nesta ordem nas Figuras 5.4d e 5.4b. Ou seja, o resultado alcan¸cado ´e similar `a abordagem usando o m´etodo baseado em distˆancia. Contudo, a taxa de falsos negativos com o n´ umero de novidades para as classes Porosidade e Falta de Penetra¸ca˜o/Trinca ´e maior, devido a` condi¸ca˜o associada com a localiza¸ca˜o e a geometria dos defeitos apontados pela an´alise da solda na Figura 4.2, gerando outros tipos de outliers.

52

Figura 5.4: Mapas de treinamento do m´etodo ND k-means para base de dados Solda. (b) Falta de Penetra¸c˜ao/Trinca

(a) Falta de Fus˜ ao kmeans

2.2

Treino Valida¸c˜ao Teste Limiar

2

Treino Valida¸c˜ ao Teste Limiar

1 0.8 Sa´ıda ND

Sa´ıda ND

1.8

kmeans

1.2

1.6 1.4

0.6 0.4

1.2

0.2

1 0.8 0

20

40

60 80 Amostras

100

0

120

0

20

(c) Inclus˜ ao de Esc´ oria

60 80 Amostras

100

120

(d) Porosidade

kmeans

1.5

40

kmeans

1.1 Treino Valida¸c˜ ao Teste Limiar

Treino Valida¸c˜ ao Teste Limiar

1

Sa´ıda ND

0.9

Sa´ıda ND

1

0.5

0.8 0.7 0.6

0

0.5 0

20

40

60 80 Amostras

100

120

0

20

40

60 80 Amostras

100

120

A Figura 5.5 revela a sa´ıda do mapa de treinamento para a abordagem empregando os mapas auto-organiz´aveis. Inicialmente, pode-se depreender que a eficiˆencia desse m´etodo ´e inferior a`s abordagens k-means e baseada em distˆancia. A an´alise exclusiva dos mapas aponta que para a classe Falta de Penetra¸ca˜o/Trinca, al´em do incremento na taxa de falso positivo observada, as assinaturas usadas na valida¸c˜ao tamb´em colaboraram para um acr´escimo da taxa de falso negativo. Mais uma vez o mapa relacionado a` classe Falta de Fus˜ao exposto na Figura 5.5a aponta que o detector constru´ıdo identificou integralmente de maneira correta as amostras valendo-se dessa abordagem, seguido em termos de eficiˆencia pelas classes Inclus˜ao de Esc´oria (Figura 5.5c), Porosidade e Falta de Penetra¸c˜ao/Trinca, cujos mapas s˜ao exibidos nas Figuras 5.5d e 5.5b.

53

Figura 5.5: Mapas de treinamento obtidos com o m´etodo de ND SOM para base de dados Solda. (b) Falta de Penetra¸c˜ao/Trinca

(a) Falta de Fus˜ ao som

1800

Treino Valida¸c˜ao Teste Limiar

1600

Treino Valida¸c˜ao Teste Limiar

450 400

1200

Sa´ıda ND

Sa´ıda ND

1400

som

500

1000 800

350 300 250

600

200

400 200

150 0

20

40

60 80 Amostras

100

120

0

20

som

120

Treino Valida¸c˜ao Teste Limiar

450 400 Sa´ıda ND

Sa´ıda ND

700

100

som

500 Treino Valida¸c˜ ao Teste Limiar

800

60 80 Amostras

(d) Porosidade

(c) Inclus˜ ao de Esc´ oria 900

40

600 500

350 300 250

400 200

300

150

200 0

20

40

60 80 Amostras

100

120

100 0

20

40

60 80 Amostras

100

120

A Figura 5.6 exibe o comportamento das assinaturas ap´os a abordagem de constru¸ca˜o de dom´ınio usando a m´aquina de vetor de descri¸ca˜o de dados. Verifica-se que o detector de novidades estabeleceu um modelo coerente, cuja eficiˆencia na identifica¸ca˜o das amostras de novidade para as classes Falta de Fus˜ao (Figura 5.6a) e Inclus˜ao de Esc´oria (Figura 5.6c) tiveram melhor resultado comparado com as falhas Falta de Penetra¸ca˜o/Trinca e Porosidade, retratados nas Figuras 5.6b e 5.6d.

54

Figura 5.6: Mapas de treinamento obtidos com o m´etodo de ND SVDD para base de dados Solda. (a) Falta de Fus˜ ao

(b) Falta de Penetra¸c˜ao/Trinca

svmtax

0.9

svmtax

0.55 Treino Valida¸c˜ao Teste Limiar

0.85 0.8

Treino Valida¸c˜ ao Teste Limiar

0.5 Sa´ıda ND

Sa´ıda ND

0.75 0.7 0.65

0.45

0.6

0.4 0.55 0.5

0.35

0.45 0

20

40

60 80 Amostras

100

0

120

20

(c) Inclus˜ ao de Esc´ oria

120

Treino Valida¸c˜ao Teste Limiar

0.5 0.45 Sa´ıda ND

0.6 Sa´ıda ND

100

svmtax

0.55 Treino Valida¸c˜ao Teste Limiar

0.65

60 80 Amostras

(d) Porosidade

svmtax

0.7

40

0.55

0.4

0.5

0.35

0.45

0.3

0.4

0.25 0

20

40

60 80 Amostras

100

120

0

20

40

60 80 Amostras

100

120

As Tabelas 5.1 e 5.2 apresentam o produto m´edio dos melhores resultados alcan¸cados de eficiˆencia dos classificadores multiclasse e da acur´acia dos detectores de novidade selecionados, respectivamente, para o experimento em quest˜ao. A compara¸c˜ao direta entre as eficiˆencias alcan¸cadas mostra que rede neural artificial e a SVM com kernel rbf s˜ao equivalentes com um valor pouco superior de eficiˆencia em todas as classes apresentadas para o algoritmo da RNA. Para as abordagens da detec¸c˜ao de novidades foi destacado em negrito o maior valor do produto da acur´acia m´edia para cada classe. Como destacado pelos mapas, a detec¸ca˜o alcan¸cada atrav´es dos m´etodos baseado em distˆancia e k-means tiveram melhor desempenho, sobressaindo-se sobre as abordagens SVDD e SOM.

55

Tabela 5.1: Eficiˆencia percentual dos m´etodos multiclasse para o experimento 1 Experimento

Solda

Classe Classificadores Detectada RNA bcp SVM kernel SD FF FPTC IE PO

98,97 100,00 97,91 99,01 94,97

94,00 90,00 97,00 96,00 95,00

Tabela 5.2: Acur´acia percentual dos m´etodos de detec¸c˜ao de novidades para o experimento 1 Experimento

Classe Detectada

M´etodos de ND Dist

k-means

Solda

FF FPTC IE PO

99,21±0,41 71,00±4,59 97,86±0,00 59,41±10,23

98,93±0,69 72,72±4,49 97,64±0,67 65,24±8,86

SVDD

SOM

89,15±3,57 72,35±0,89 56,11±4,34 53,03±2,97 84,07±3,41 71,14±0,83 70,06±1,32 69,98±1,38

Para cada abordagem da detec¸c˜ao de novidade, a avalia¸c˜ao da performance resultou na constru¸ca˜o da Figura 5.7 com os gr´aficos boxplot dos melhores resultados de cada subconjunto treinado. Os resultados para a abordagem baseada em distˆancia apontam elevada eficiˆencia m´edia de detec¸c˜ao com baixa dispers˜ao para as classe Falta de Fus˜ao e Inclus˜ao de Esc´oria, uma eficiˆencia razo´avel preservando a dispers˜ao baixa com rela¸ca˜o a` classe Falta de Penetra¸ca˜o/Trinca, e uma elevada dispers˜ao com eficiˆencia m´edia razo´avel. O m´etodo k-means tem um comportamento similar `a abordagem baseada em distˆancia para distribui¸ca˜o das eficiˆencias m´edias de detec¸ca˜o das novidades associadas a`s classes do experimento solda. Os m´etodos SOM e SVDD mostraram consistˆencia equivalente, com baixa dispers˜ao da eficiˆencia obtida entre os subconjuntos treinados para as classes Falta de Fus˜ao, Inclus˜ao de Esc´oria e Porosidade, al´em de uma dispers˜ao maior com eficiˆencia m´edia inferior `as demais condi¸c˜oes de novidade para a classe Falta de Penetra¸c˜ao/Trinca. Entretanto, os valores m´edios para acur´acia dos detectores baseados em mapas auto-organiz´aveis e m´aquina de vetor com descri¸c˜ao de dados foram inferiores em termos absolutos comparados com as abordagens baseada em distˆancia e o k-means. 56

Figura 5.7: Boxplot do produto m´edio da acur´acia dos detectores de novidade para base de dados Solda.

A Figura 5.8 aponta o comportamento do melhor resultado para ROC alcan¸cado entre os quatro m´etodos de treinamento para detec¸c˜ao da classe novidade investigada. Novamente, as classes Falta de Fus˜ao e Inclus˜ao de Esc´oria apresentaram um comportamento quase ideal. Essa condi¸c˜ao implica em uma baixa taxa de falsos positivos (maior especificidade) e tamb´em uma alta taxa de verdadeiros positivos (maior sensibilidade) para as metodologias aplicadas. A ROC calculada para a classe Porosidade apresenta uma curvatura em que a taxa de verdadeiros positivos cresce mais lentamente quando a taxa de falsos positivos atinge 10% e segue de forma irregular at´e 60% de FPr. Com rela¸c˜ao `a classe Falta de Penetra¸c˜ao/Trinca, o crescimento da taxa de verdadeiros positivos se desloca ao alcan¸car 20% e, depois atingir 50%, tem sua taxa de varia¸c˜ao reduzida para uma faixa de falsos positivos entre 10% e 95%. Assim, verifica-se uma acur´acia m´edia baixa como observada anteriormente pelos gr´aficos boxplot. A Tabela 5.3 re´ une os valores m´aximos alcan¸cados para a AUC das curvas ROC apresentadas na Figura 5.8. Em negrito foram apontadas as melhores condi¸c˜oes para as classes Falta de Fus˜ao e Inclus˜ao de Esc´oria com a abordagem baseada em distˆancia e o SOM para Falta de Penetra¸ca˜o/Trinca e Porosidade

57

Figura 5.8: ROC constru´ıda utilizando base de dados Solda. (a) Falta de Fus˜ ao

(b) Falta de Penetra¸c˜ao/Trinca

(c) Inclus˜ ao de Esc´ oria

(d) Porosidade

Tabela 5.3: AUC percentual calculado para o experimento 1

Experimento

Classe Detectada

AUC dos M´etodos de ND Dist

Solda

FF FPTC IE PO

97,09±0,31 70,96±2,26 97,19±1,03 76,36±4,79

k-means

SVDD

SOM

97,09±0,31 97,09±0,31 97,09±0,31 70,86±2,46 70,75±2,57 71,27±2,05 97,19±1,03 96,99±1,15 97,19±1,03 74,40±4,01 75,87±4,44 76,53±5,21

A Figura 5.9 apresenta o comportamento do resultado da AUC com rela¸c˜ao `a dimensionalidade do conjunto de dados em escala logar´ıtmica utilizada para a constru¸c˜ao e treinamento dos quatro m´etodos da detec¸c˜ao de novidades estudados para o experimento da inspe¸c˜ao n˜ao destrutiva da junta soldada. Nota-se a justificativa pela escolha do conjunto com aproximadamente 100% dos componentes principais associados com as assinaturas das classes de solda em torno de 200 pontos. Al´em disso, o m´etodo de mapas auto-organiz´aveis se mostra 58

mais sens´ıvel `a varia¸c˜ao da dimensionalidade do conjunto de treinamento e teste, seguido pela abordagem k-means. Os m´etodos baseado em distˆancia e SVDD s˜ao mais est´aveis para uma dimensionalidade menor dos padr˜oes utilizados. Figura 5.9: AUC percentual variando com o tamanho dos componentes principais para o experimento 1. (a) Falta de Fus˜ ao

(b) Falta de Penetra¸c˜ao/Trinca

(c) Inclus˜ ao de Esc´ oria

(d) Porosidade

59

5.2 5.2.1

P´ as de Aerogeradores - Experimento 2 Processamento de Sinais

A Figura 5.10 re´ une os A-Scans t´ıpicos para a regi˜ao sem defeito e os trˆes tipos de defeitos encontrados nos CP retirados das p´as de aerogeradores. Foi definida uma janela de tempo que englobasse somente a primeira reflex˜ao ap´os a coluna ´ not´avel a dificuldade de interpreta¸ca˜o d’´agua definida para o transdutor utilizado. E dos padr˜oes para o reconhecimento das classes associadas aos danos observados em qualquer condi¸ca˜o. Figura 5.10: Sinal t´ıpico no dom´ınio do tempo ap´os a DWT Fam´ılia Daubechie 3o n´ıvel para as classes existentes nas p´as de aerogeradores. (a) Sem Falha

(b) Delamina¸c˜ao 1

(c) Delamina¸c˜ ao 2

(d) Matriz Seca 3

A Figura 5.11 permite examinar a faixa de frequˆencia em que o conjunto de dados ´e melhor caracterizado por suas instˆancias. De forma inicial, ´e observado que para a condi¸c˜ao sem defeito (Figura 5.11a), a energia associada ao especto situa-se em torno da frequˆencia central de 1MHz. 60

Com rela¸c˜ao `as diferentes condi¸c˜oes de defeito, a classe DL1, observada na Figura 5.11b, tem um queda acentuada de energia e h´a um espalhamento maior para as classes DL2 (Figura 5.11c) e MS3 (Figura 5.11d). Figura 5.11: Espectros de frequˆencia t´ıpicos das classes observadas nas p´as de aerogeradores. (a) Sem Falha

(b) Delamina¸c˜ao 1

(c) Delamina¸c˜ ao 2

(d) Matriz Seca 3

Essa diferencia¸ca˜o revelada ser´a de grande valia para a extra¸ca˜o de caracter´ısticas com a an´alise de componentes principais executada na sequˆencia da cadeia de processamento designada para a classifica¸c˜ao utilizando os detectores de novidades estudados.

61

5.2.2

Detectores de Novidade

A Figura 5.12 apresenta o melhor comportamento obtido para as amostras coletadas apresentadas ao detector de novidades constru´ıdo a partir da abordagem baseada em distˆancia. Os resultados do teste com as amostras de novidades mostram um desempenho excelente para esse m´etodo, com um limiar bem definido e uma taxa de falsos positivos praticamente nula para todas as trˆes classes de defeito investigadas. Figura 5.12: Mapas de treinamento obtidos com o m´etodo de ND DIST para base de dados p´as de aerogeradores. (a) Delamina¸c˜ ao 1

(b) Delamina¸c˜ao 2

dist

5

dist

3

Treino Valida¸c˜ao Teste Limiar

4

Treino Valida¸c˜ao Teste Limiar

2.5

Sa´ıda ND

Sa´ıda ND

2

3

2

1.5

1

1 0.5

0

0

0

10

20

30 40 Amostras

50

0

60

10

20

30 Amostras

40

50

60

(c) Matriz Seca 3 dist

2.5

Treino Valida¸c˜ao Teste Limiar

Sa´ıda ND

2

1.5

1

0.5

0 0

10

20

30 40 Amostras

50

60

A sa´ıda do treinamento para a detec¸c˜ao da classe DL1, simbolizada pela Figura 5.12a, apresenta um comportamento tipicamente ideal. Para as classes DL2 (Figura 5.12b) e MS3 (Figura 5.12c), ´e poss´ıvel notar a presen¸ca de uma pequena ocorrˆencia de falsos negativos em torno da origem do mapa, com nenhuma indica¸ca˜o de falsos positivos. 62

A abordagem para detec¸c˜ao de novidades utilizando o clustering k-means ´e exemplificada atrav´es dos mapas na Figura 5.13. A sensibilidade para identificar as novidades vinculadas `as classes DL1 (Figura 5.13a), DL2 (Figura 5.13b) e MS3 (Figura 5.13c) mostrou-se elevada para as trˆes condi¸co˜es investigadas. Foi notado um comportamento mais disperso das novidades para o cluster obtido para a condi¸c˜ao DL1. Figura 5.13: Mapas de treinamento obtidos com o m´etodo de ND k-means para base de dados p´as de aerogeradores. (b) Delamina¸c˜ao 2

(a) Delamina¸c˜ ao 1 kmeans

12

Treino Valida¸c˜ao Teste Limiar

10

Treino Valida¸c˜ao Teste Limiar

4 3.5 Sa´ıda ND

8 Sa´ıda ND

kmeans

4.5

6

3 2.5 2

4

1.5 2

1 0.5

0 0

10

20

30 Amostras

40

50

60

0

10

20

30 40 Amostras

50

60

(c) Matriz Seca 3 kmeans

4

Treino Valida¸c˜ ao Teste Limiar

3.5

Sa´ıda ND

3 2.5 2 1.5 1 0.5 0

10

20

30 40 Amostras

50

60

Um comportamento mais agregado das novidades testadas ´e visualizado para as classes DL2 e principalmente MS3, que possui uma baixa dispers˜ao espacial do cluster definido para o conjunto de testes. Enquanto isso, h´a uma pequena especificidade relacionada com as amostras de valida¸ca˜o para as condi¸co˜es DL2 e MS3. A Figura 5.14 re´ une todas as sa´ıdas dos treinamentos efetuados para os mapas auto-organiz´aveis aplicados aos experimento 2. Essa abordagem, diferentemente das outras verificadas ao longo da aplica¸c˜ao de ND para os corpos de prova das p´as 63

de aerogeradores, teve um comportamento de especificidade maior para todas as amostras da classe normal apresentadas durante a fase de valida¸ca˜o. O limiar de decis˜ao entre a condi¸c˜ao normal e a novidade foi bem pr´oximo da origem, apresentando uma caracter´ıstica bem uniforme do conjunto treinado. Entretanto, ainda assim o m´etodo sinaliza uma eficiˆencia satisfat´oria na identifica¸ca˜o das novidades apresentadas. Figura 5.14: Mapas de treinamento obtidos com o m´etodo de ND SOM para base de dados p´as de aerogeradores. (a) Delamina¸c˜ ao 1

(b) Delamina¸c˜ao 2

som

6000 5000 4000

Treino Valida¸c˜ao Teste Limiar

1000 Sa´ıda ND

Sa´ıda ND

som

1500 Treino Valida¸c˜ao Teste Limiar

3000 2000

500

1000

0

0 0

10

20

30 40 Amostras

50

0

60

10

20

30 40 Amostras

50

60

(c) Matriz Seca 3 som

1200

Treino Valida¸c˜ ao Teste Limiar

1000

Sa´ıda ND

800

600

400

200

0 0

10

20

30 Amostras

40

50

60

A Figura 5.15 destaca as condi¸co˜es associadas com a sa´ıda do treinamento obtido para a abordagem SVDD. Em todas as classes, a fronteira de decis˜ao obtida se comportou da mesma forma, embora menor em termos absolutos se comparado com as abordagens baseadas em distˆancia e k-means. Para o caso da classe DL1, observado na Figura 5.15a, nota-se que a sa´ıda da novidade mostrou-se linear, com a apari¸ca˜o de somente alguns pontos de especificidade durante a valida¸ca˜o do m´etodo. As classes DL2 (Figura 5.15b) e MS3 (Figura 5.15c) 64

tiveram a regi˜ao do vetor de suporte das novidades bem definida, com sensibilidade tamb´em satisfat´oria, embora a especificidade associada com as amostras de valida¸ca˜o seja maior para as duas condi¸c˜oes. Figura 5.15: Mapas de treinamento obtidos com o m´etodo de ND SVDD para base de dados p´as de aerogeradores. (b) Delamina¸c˜ao 2

(a) Delamina¸c˜ ao 1 svmtax

1.3

Treino Valida¸c˜ao Teste Limiar

1.2

Treino Valida¸c˜ao Teste Limiar

1.2

1.1

1.1

1

1

Sa´ıda ND

Sa´ıda ND

svmtax

1.3

0.9 0.8

0.9 0.8

0.7

0.7

0.6

0.6 0.5

0.5 0

10

20

30 Amostras

40

50

60

0

10

20

30 40 Amostras

50

60

(c) Matriz Seca 3 svmtax

1.2

Treino Valida¸c˜ao Teste Limiar

1.1

Sa´ıda ND

1 0.9 0.8 0.7 0.6 0.5 0.4 0

10

20

30 40 Amostras

50

60

A Tabela 5.4 compara o produto m´edio das eficiˆencias para a RNA e SVM destinadas para o modelo de aprendizado supervisionado dos classificadores multiclasse para as amostras de p´as de aerogeradores, em que novamente ´e poss´ıvel apurar um resultado satisfat´orio para os m´etodos. A Tabela 5.5 aponta que o m´etodo baseado em distˆancia e o k-means tˆem uma acur´acia elevada para a identifica¸c˜ao de novidades relacionadas com os defeitos observados nos corpos de prova de aerogeradores.

65

Tabela 5.4: Eficiˆencia percentual dos m´etodos multiclasse para o experimento 2 Experimento

P´as de Aerogeradores

Classe Classificadores Detectada RNA bcp SVM kernel rbf SF DL1 DL2 MS3

96,25 82,50 100,00 100,00

92,00 90,00 100,00 92,00

Tabela 5.5: Acur´acia percentual dos m´etodos de detec¸c˜ao de novidades para os experimento 2

Experimento

Classe Detectada

P´as de Aerogeradores

DL1 DL2 MS3

M´etodos de ND Dist

k-means

SVDD

SOM

98,98±1,78 99,13±1,53 92,76±3,49 85,52±3,18 98,68±2,64 97,82±2,62 90,04±4,38 76,54±2,35 97,51±3,56 96,11±2,35 90,49±3,93 79,49±3,81

A Figura 5.16 apresenta os boxplots de eficiˆencia para os melhores resultados obtidos em cada uma das 4 abordagens diferentes para os 10 subconjuntos de treinamento e teste definidos aleatoriamente para a detec¸c˜ao de novidades. Figura 5.16: Boxplot do produto m´edio da acur´acia dos detectores de novidade para base de dados p´as de aerogeradores.

Como era esperado, ap´os a an´alise dos mapas de treinamento, o comportamento da eficiˆencia m´edia foi bastante elevado para as abordagens baseada em distˆancia e k-means, seguido pelo m´etodo SVDD e, por u ´ ltimo, a m´etrica SOM. Os resultados foram bastante compactos em termos percentuais para as classes de acordo com o 66

m´etodo selecionado para a detec¸ca˜o de novidades, com destaque para o baseado em distˆancia menos disperso. A constru¸ca˜o das curvas ROC para cada classe associada ao experimento 2 sugere um comportamento bem similar entre as curvas resultantes. A melhor condi¸c˜ao obtida em todos os m´etodos de ND a partir dos conjuntos de dados das trˆes condi¸co˜es observadas para o experimento 2 est´a ilustrada na Figura 5.17. Neste caso, ´e poss´ıvel indicar qualquer uma das m´etricas de detec¸ca˜o das novidades para a an´alise dos defeitos das p´as de aerogeradores, gracas `a elevada sensibilidade de ambos com uma rela¸c˜ao de (1-especificidade) pequena. Figura 5.17: ROC constru´ıda utilizando base de dados p´as de aerogeradores. (b) Delamina¸c˜ao 2

(a) Delamina¸c˜ ao 1

(c) Matriz Seca 3

A Tabela 5.6 apresenta os valores de AUC que corroboram com as curvas ROC constru´ıdas. Os valores s˜ao bem pr´oximos, com uma pequena vantagem para o detector elaborado a partir da distˆancia.

67

Tabela 5.6: AUC percentual calculado para o experimento 2

Experimento

Classe Detectada

P´as de Aerogeradores

DL1 DL2 MS3

AUC dos M´etodos de ND Dist

k-means

SVDD

SOM

95,50±0,00 95,50±0,00 95,49±0,00 95,20±0,00 95,30±0,00 95,30±0,00 95,29±0,00 95,10±0,00 95,50±0,00 95,50±0,00 95,20±0,00 94,60±0,00

Esse resultado elevado de AUC foi obtido com a sele¸c˜ao de 100 componentes principais conforme indicado pelo comportamento do desempenho observado na Figura 5.18. Os m´etodos baseado em distˆancia e k-means sofreram menor oscila¸ca˜o com um n´ umero reduzido de componentes, enquanto que a abordagem SOM teve uma varia¸ca˜o maior com uma dimensionalidade comprimida do conjunto Figura 5.18: AUC percentual variando com o tamanho dos componentes principais para o experimento 2. (b) Delamina¸c˜ao 2

(a) Delamina¸c˜ ao 1

(c) Matriz Seca 3

68

5.3 5.3.1

Tubos de Fornos de Pir´ olise - Experimento 3 Processamento de Sinais

A Figura 5.19 mostra o comportamento mais comum do sinal ultrassˆonico obtido para as amostras de tubos coletadas dos fornos de pir´olise sujeitos a diferentes condi¸co˜es com rela¸ca˜o a` exposi¸ca˜o da temperatura de trabalho e tempo de opera¸ca˜o. A interpreta¸c˜ao do resultado a partir da visualiza¸c˜ao A-Scan para os sinais coletados do ensaio usando a t´ecnica de imers˜ao convencional com os tubos HP ainda ´e insuficiente para caracterizar de forma imediata a condi¸ca˜o de carburiza¸ca˜o indicada previamente. Contudo, ´e not´avel um ind´ıcio de queda na amplitude com a condi¸c˜ao de alta carburiza¸ca˜o na Figura 5.19c em compara¸ca˜o com a situa¸ca˜o de baixa carburiza¸ca˜o (Figura 5.19b), e para o estado sem carburiza¸c˜ao, conforme a Figura 5.19a. Figura 5.19: Sinal t´ıpico no dom´ınio do tempo ap´os a DWT Fam´ılia Daubechie 3o n´ıvel para as classes existentes nos tubos HP. (a) Sem Carburiza¸c˜ao

(b) Baixa Carburiza¸c˜ ao

(c) Alta Carburiza¸c˜ao

69

A Figura 5.20 mostra o comportamento no dom´ınio da frequˆencia para os diferentes est´agios de carburiza¸c˜ao investigados. A condi¸c˜ao sem carburiza¸c˜ao, observada na Figura 5.20a, tem seu pico m´aximo de energia em torno do valor central da banda de frequˆencia analisada, enquanto que o est´agio de baixa carburiza¸c˜ao (Figura 5.20b) tem um deslocamento na frequˆencia central do pico de maior intensidade com algumas reflex˜oes pr´oximas da frequˆencia nominal do transdutor, e o est´agio de alta carburiza¸ca˜o (Figura 5.20c) tem um n´ umero maior de picos em torno da frequˆencia de interesse. Figura 5.20: Espectros de frequˆencia t´ıpicos das classes observadas nos tubos HP. (a) Sem Carburiza¸c˜ao

(b) Baixa Carburiza¸c˜ ao

(c) Alta Carburiza¸c˜ao

A an´alise atrav´es da sele¸ca˜o das caracter´ısticas com a compacta¸ca˜o dos componentes principais extra´ıdos ser´a essencial para a aplica¸ca˜o dos algoritmos de aprendizagem n˜ao supervisionada dos detectores de novidade discutidos na Subse¸ca˜o 5.3.2

70

5.3.2

Detectores de Novidade

A Figura 5.21 mostra o comportamento da sa´ıda do treinamento das amostras apresentadas ao modelo baseado em distˆancia para as duas condi¸co˜es associadas aos tubos HP40. O limiar da detec¸ca˜o de novidade foi bem definido para o conjunto de treino utilizado, e idˆentico para as duas classes estudadas. Apesar disso, ambos os est´agios de baixa carburiza¸c˜ao (Figura 5.21a) e alta carburiza¸c˜ao (Figura 5.21b) apresentaram uma quantidade de novidades testadas erroneamente classificadas como normais, produzindo uma taxa de falsos negativos consider´avel para o experimento, assim como a ocorrˆencia de sinais utilizados na valida¸c˜ao classificados equivocadamente como novidades. Esse comportamento pode estar relacionado `a condi¸c˜ao irregular do est´agio de carburiza¸ca˜o associado com a regi˜ao inspecionada durante a realiza¸ca˜o do experimento 3. Tal condi¸c˜ao ´e poss´ıvel ser investigada atrav´es de ensaios mecˆanicos com an´alise da composi¸c˜ao microestrutural dos tubos inspecionados. Figura 5.21: Mapas de treinamento obtidos com o m´etodo de ND DIST para base de dados tubos HP. (b) Alta Carburiza¸c˜ao

(a) Baixa Carburiza¸c˜ ao dist

1.06

1.02 1 Sa´ıda ND

Sa´ıda ND

1.02

Treino Valida¸c˜ao Teste Limiar

1.04

Treino Valida¸c˜ ao Teste Limiar

1.04

dist

1.06

1 0.98

0.98 0.96 0.94

0.96

0.92

0.94 0.9

0.92 0

20

40

60 80 Amostras

100

120

0.88 0

20

40

60 80 Amostras

100

120

J´a a Figura 5.22 exibe o resultado do treinamento para a abordagem utilizando o clustering kmeans a partir do conjunto de treinamento dos diferentes n´ıveis de carburiza¸ca˜o. O limiar de detec¸ca˜o foi superior em compara¸ca˜o ao m´etodo baseado em distˆancia apresentado anteriormente, e diferente entre os dois est´agios tamb´em. Contudo, a observa¸c˜ao de falsos negativos, assim como a indica¸c˜ao para algumas amostras de valida¸ca˜o classificada como falsos positivos, se mant´em.

71

Figura 5.22: Mapas de treinamento obtidos com o m´etodo de ND k-means para base de dados tubos HP. (a) Baixa Carburiza¸c˜ ao kmeans

1.1

kmeans

1.1 Treino Valida¸c˜ ao Teste Limiar

1.08

Treino Valida¸c˜ ao Teste Limiar

1.08 1.06 1.04 Sa´ıda ND

1.06 Sa´ıda ND

(b) Alta Carburiza¸c˜ao

1.04 1.02

1.02 1 0.98

1 0.96 0.98

0.94 0.92

0.96 0

20

40

60 80 Amostras

100

0

120

20

40

60 80 Amostras

100

120

A realiza¸c˜ao do treinamento a partir da abordagem com o m´etodo de mapas auto-organiz´aveis ´e exibido na Figura 5.23. A constru¸c˜ao da fronteira de decis˜ao para a identifica¸ca˜o das novidades n˜ao teve uma eficiˆencia satisfat´oria como pode ser observado para a condi¸c˜ao de baixa carburiza¸c˜ao (Figura 5.23a) e tamb´em para a alta carburiza¸ca˜o (Figura 5.23b). Mesmo que o m´etodo tenha obtido uma alta sensibilidade com rela¸ca˜o a`s amostras de novidades apresentadas ao detector, o grau de especificidade foi elevado para os sinais de valida¸ca˜o estudados, o que reduz a eficiˆencia global para a abordagem SOM. Figura 5.23: Mapas de treinamento obtidos com o m´etodo de ND SOM para base de dados tubos HP. (a) Baixa Carburiza¸c˜ ao

(b) Alta Carburiza¸c˜ao

som

480 460 440

som

500

Treino Valida¸c˜ao Teste Limiar

Treino Valida¸c˜ ao Teste Limiar

450 Sa´ıda ND

Sa´ıda ND

420 400 380 360

400 350

340

300 320 300

250 0

280 0

20

40

60 Amostras

80

100

120

72

20

40

60 80 Amostras

100

120

Os resultados do treinamento para o detector de novidades a partir do m´etodo m´aquina de vetor de suporte de descri¸c˜ao de dados s˜ao mostrados na Figura 5.24. A fronteira de decis˜ao para a novidade ocorreu num patamar inferior aos demais m´etodos. Ambas as classes de baixa carburiza¸ca˜o (Figura 5.24a) e alta carburiza¸ca˜o (Figura 5.24b) n˜ao apresentaram ocorrˆencia de falsos positivos, apesar da indica¸ca˜o de amostras com atributos que foram classificados como falsos negativos nas duas condi¸co˜es estudadas. Figura 5.24: Mapas de treinamento obtidos com o m´etodo de ND SVDD para base de dados tubos HP. (b) Alta Carburiza¸c˜ao

(a) Baixa Carburiza¸c˜ ao Treino Valida¸c˜ ao Teste Limiar

Treino Valida¸c˜ ao Teste Limiar

0.53 0.52 Sa´ıda ND

Sa´ıda ND

0.52

svmtax

0.54

svmtax

0.53

0.51 0.5

0.51 0.5 0.49

0.49

0.48 0.48 0

20

40

60 80 Amostras

100

120

0.47 0

20

40

60 80 Amostras

100

120

A Tabela 5.7 mostra que a identifica¸c˜ao dos est´agios de carburiza¸c˜ao com os algoritmos de aprendizado supervisionado para os sinais ultrassˆonicos coletados tˆem uma eficiˆencia inferior `aqueles obtidos nos outros experimentos, mas sendo ainda poss´ıvel distinguir os dois n´ıveis de defeito existentes nos tubos das serpentinas de fornos de pir´olise. Tabela 5.7: Eficiˆencia percentual dos m´etodos multiclasse para o experimento 3 Experimento

Tubos de Fornos de Pir´olise

Classe Classificadores Detectada RNA bcp SVM kernel rbf SCB BCB ACB

93,89 84,83 88,34

92,00 84,00 87,00

O desempenho medido atrav´es da acur´acia dos m´etodos da detec¸ca˜o de novidades para o experimento 3 ´e apresentado na Tabela 5.8. O desempenho global comparado com os demais experimentos tamb´em ´e inferior,embora seja poss´ıvel identificar com 73

melhor acur´acia a baixa carburiza¸c˜ao com a abordagem k-means e o n´ıvel de alta carburiza¸ca˜o atrav´es do m´etodo SVDD. Tabela 5.8: Acur´acia percentual dos m´etodos de detec¸c˜ao de novidades para o experimento 3 Experimento

Classe Detectada

Tubos de Fornos de Pir´olise

BCB ACB

M´etodos de ND Dist

k-means

SVDD

SOM

76,40±3,91 81,17±4,34 78,20±1,30 71,43±0,00 76,83±4,76 75,32±4,34 82,04±2,41 71,43±0,00

A Figura 5.25 exibe os boxplots constru´ıdos para os 10 melhores resultados da acur´acia para cada subconjunto sorteado para valida¸c˜ao dos m´etodos de ND. O m´etodo baseado em distˆancia teve uma acur´acia m´edia equivalente ao clustering k-means, mas a dispers˜ao entre as classes teve comportamento oposto: o boxplot para a BCB foi mais curto do que a ACB com o m´etodo de distˆancia, ao contr´ario do observado para a abordagem k-means. O resultado para as acur´acias m´edias dos subconjuntos observadas no boxplot dos mapas auto-organiz´aveis foi o menor de todos, sem apresentar dispers˜ao consider´avel, enquanto que o boxplot do SVDD teve uma distribui¸c˜ao da eficiˆencia diferente dos demais, com um valor m´edio equiparado `as abordagens baseadas em distˆancia e k-means Figura 5.25: Boxplot do produto m´edio da acur´acia dos detectores de novidade para base de dados tubos HP.

A Figura 5.26 ilustra o comportamento da melhor curva ROC para cada m´etodo ´ poss´ıvel de detec¸ca˜o de novidades utilizado com rela¸ca˜o a` identifica¸ca˜o das classes. E inferir que as quatro abordagens utilizadas para essa aplica¸ca˜o tem uma sensibilidade de detec¸c˜ao para o caso do est´agio de alta carburiza¸c˜ao do que para a situa¸c˜ao de baixa carburiza¸ca˜o na faixa de 0 a 20% de FPr. 74

Figura 5.26: ROC constru´ıda utilizando base de dados tubos HP. (a) Baixa Carburiza¸c˜ ao

(b) Alta Carburiza¸c˜ao

A Tabela 5.9 apresenta os valores de AUC alcan¸cados para as m´etricas de detec¸ca˜o de novidades para identifica¸ca˜o dos n´ıveis de carburiza¸ca˜o associados com os corpos de prova em tubos de a¸co inoxid´avel da classe HP 40. Essa forma de avalia¸ca˜o permite observar um destaque para a abordagem utilizado o SVDD para os dois graus de carburiza¸ca˜o, embora o patamar de AUC esteja pr´oximo para as demais m´etricas. Tabela 5.9: AUC percentual calculado para o experimento 3 Experimento

Classe Detectada

Tubos de Fornos de Pir´olise

BCB ACB

AUC dos M´etodos de ND Dist

k-means

SVDD

SOM

83,71±5,78 83,62±5,59 84,04±5,28 83,32±5,60 84,54±3,27 84,84±3,17 85,25±3,02 84,64±3,23

A Figura 5.27 aponta a escolha de 200 componentes principais para a constru¸ca˜o dos detectores de novidades selecionados em estudo no experimento 3. A oscila¸ca˜o do resultado da AUC do m´etodo dos mapas auto-organiz´aveis para uma condi¸ca˜o de baixa dimensionalidade uma vez mais ´e destacada para esses conjuntos de treinamentos. Entretanto, o m´etodo SVDD e o k-means tiveram um comportamento de menor dispers˜ao com rela¸ca˜o a` baixa dimensionalidade.

75

Figura 5.27: AUC percentual variando com o tamanho dos componentes principais para o experimento 3. (a) Baixa Carburiza¸c˜ ao

5.4

(b) Alta Carburiza¸c˜ao

Considera¸c˜ oes sobre os resultados obtidos

A an´alise global das figuras que comparam a dimensionalidade dos componentes principais das amostras utilizadas no treinamento revelam notoriamente que o tamanho do conjunto dos dados afeta o desempenho do detector de novidades. Em especial, quando o tamanho das assinaturas de treinamento ´e inferior `a 50 componentes principais, h´a uma grande instabilidade de desempenho entre as quatro abordagens. O mapa auto-organiz´avel ´e particularmente sens´ıvel ao tamanho dos dados de treinamento, apresentando uma linha muito mais flutuante do que os outros trˆes m´etodos quando o tamanho do conjunto de dados ´e menor que a sele¸ca˜o aproximada de 100% das caracter´ısticas extra´ıdas pelo PCA. Vale ressaltar que durante a realiza¸ca˜o da sele¸ca˜o dos componentes principais, a elevada correla¸ca˜o entre os sinais resultou num truncamento das amostras para um n´ umero de componentes menor, assegurando que a obten¸c˜ao dos valores correspondiam `a 100% da energia do espectro. Para comparar o desempenho relativo da AUC entre um par de detectores para todos os experimentos executados, o teste de classifica¸c˜ao Wilcoxon pareado foi realizado utilizando os valores das Tabelas 5.3, 5.6 e 5.9. O resultado do teste de hip´oteses h e valor p s˜ao detalhados na Tabela 5.10. Em cada c´elula da tabela, o valor superior ´e o valor p do teste de classifica¸c˜ao Wilcoxon: o valor inferior ´e o resultado do teste de hip´otese h, com um n´ıvel de significˆancia igual a 0,05.

76

Tabela 5.10: Teste de classifica¸c˜ao Wilcoxon pareado para os valores de AUC dos detectores de novidade

Dist (h) k-means (h) SVDD (h)

k-means

SVDD

SOM

0.0391 1

0.3008 0 0.0078 1

0.1641 0 0.0273 1 0.0977 0

O teste mostra estatisticamente que o m´etodo baseado em distˆancia ´e levemente superior ao k-means e bem melhor que os m´etodos da m´aquina de vetor de descri¸ca˜o de dados e mapas auto-organiz´aveis. Para o m´etodo clustering k-means, ele se sobressai comparado a m´aquina de vetor de descri¸ca˜o de dados e os mapas auto-organiz´aveis, cujos m´etodos mostram um desempenho de AUC relativamente parecido entre os pares, pois o valor h resultante para a compara¸ca˜o entre SVDD-SOM ´e nulo. Em resumo, a partir dos resultados alcan¸cados da avalia¸ca˜o experimental, o teste Wilcoxon aponta que o m´etodo da distˆancia supera os outros trˆes m´etodos que tˆem uma similaridade em desempenho quando comparados diretamente com rela¸c˜ao `a m´etrica de avalia¸c˜ao utilizando o resultado de AUC para a melhor curva ROC.

77

Cap´ıtulo 6 Conclus˜ oes Este trabalho avaliou a aplica¸ca˜o de quatro m´etodos de detec¸ca˜o de novidades n˜ao supervisionados para problemas pr´aticos de inspe¸c˜ao n˜ao destrutiva por ultrassom como suporte a` tomada de decis˜ao. Nesse contexto, uma avalia¸c˜ao comparativa completa de aspectos qualitativos e quantitativos para quatro m´etodos selecionados de ND foi realizada em trˆes conjuntos de dados com diferentes dimens˜oes e diferentes complexidade do problema. A realiza¸c˜ao do pr´e-processamento dos sinais no dom´ınio do tempo coletados durante a inspe¸ca˜o ultrassˆonica com a remo¸ca˜o de ru´ıdo utilizando a DWT waveletm˜ae Daubechie de 3a ordem, a an´alise no dom´ınio da frequˆencia usando a FFT e a redu¸ca˜o da dimensionalidade com PCA, mostraram-se bastante u ´teis para preparar os dados apresentados aos classificadores multiclasse e aos detectores de novidade. O desempenho dos detectores de novidade foi avaliado utilizando as curvas ROC, a m´etrica AUC, o teste de classifica¸c˜ao de paridade Wilcoxon, juntamente com a eficiˆencia m´edia. Os resultados da avalia¸c˜ao mostram que os m´etodos baseado em distˆancia e clustering kmeans s˜ao relativamente est´aveis e alcan¸caram um melhor desempenho em compara¸c˜ao com os outros detectores que tˆem um comportamento similar em termos de AUC. Os limites de detec¸c˜ao de novidades dos m´etodos SVDD e SOM apresentaram menor acur´acia do que os dos outros dois m´etodos no contexto do conjunto de dados. Al´em disso, o m´etodo SVDD parece ser mais sens´ıvel pois consumiu um tempo de treinamento e de mem´oria maiores do que os outros trˆes m´etodos. Os detectores k-means e baseado distˆancia s˜ao conceitualmente simples, apresentando um desempenho geral do boxplot superior aos outros dois m´etodos. Em particular, a abordagem baseada em distˆancia atinge valores de AUC mais altos em todos os conjuntos de dados. Este resultado indica que ´e mais prov´avel que obtenhamos um bom desempenho de detec¸ca˜o se AUC for o principal objetivo. A complexidade computacional dessas t´ecnicas tamb´em ´e um aspecto importante. Normalmente, os m´etodos probabil´ısticos, baseados em reconstru¸ca˜o e dom´ınio, tˆem 78

fases de treinamento dilatadas, mas com testes curtos. Em diversas aplica¸co˜es, isso n˜ao ´e um inconveniente, pois os modelos podem ser treinados offline, enquanto o teste ´e crucial para sua execu¸ca˜o em tempo real. No entanto, os m´etodos baseados em distˆancia, usualmente, s˜ao computacionalmente pesados durante os testes, despontando como um entrave significativo nos aspectos de aplica¸co˜es com necessidade de resposta em tempo real. Portanto, os trabalhos futuros da pesquisa devem ser voltados para as abordagens baseadas em distˆancia a fim de melhorar sua eficiˆencia computacional como, por exemplo, padr˜oes de classifica¸ca˜o utilizando algoritmos de vizinhan¸ca mais eficientes, al´em da constru¸ca˜o de prot´otipos cujo sistema para tomada de decis˜ao utilizando a detec¸ca˜o de novidades em tempo real sejam adotados.

79

Referˆ encias Bibliogr´ aficas [1] PAVLOPOULOU, S., WORDEN, K., SOUTIS, C. “Novelty detection and dimension reduction via guided ultrasonic waves: Damage monitoring of scarf repairs in composite laminates”, Journal of Intelligent Material Systems and Structures, v. 27, n. 4, pp. 549–566, 2016. [2] MARKOU, M., SINGH, S. “Novelty detection: a review—part 2:: neural network based approaches”, Signal processing, v. 83, n. 12, pp. 2499–2521, 2003. [3] LIU, C., HARLEY, J. B., YING, Y., et al. “Singular value decomposition for novelty detection in ultrasonic pipe monitoring”. In: SPIE Smart Structures and Materials+ Nondestructive Evaluation and Health Monitoring, pp. 86921R–86921R. International Society for Optics and Photonics, 2013. [4] MARKOU, M., SINGH, S. “Novelty detection: a review—part 1: statistical approaches”, Signal processing, v. 83, n. 12, pp. 2481–2497, 2003. [5] ANDREUCCI, R. Ensaio por Ultrassom. Revista ABENDI, 2016. [6] CARVALHO, D. J. T. Desenvolvimento e aplica¸c˜ao de t´ecnicas inovadoras de Ensaios N˜ao Destrutivos (END) com c´elulas bacterianas. Tese de Doutorado, Faculdade de Ciˆencias e Tecnologia, 2012. [7] WELDEN, C. “Basic steps for inspection with diepenetrants”. Acessado em 26 de setembro de 2017. Dispon´ıvel em: . [8] WORMAN, J. “Magnetic Particle Examination”. Acessado em 26 de setembro de 2017. Dispon´ıvel em: . [9] PEREIRA, J. A. V. Estudo e Aplica¸c˜ao de Ensaios N˜ao Destrutivos. L´ıquidos penetrantes, Ultra sons, Radiografia digital-T´ecnica tangencial medi¸ca˜o de espessuras. Tese de Mestrado, FEUP, 2013. [10] WORKFORCE, E. “Radiography Testing (RT)”. Acessado em 26 de setembro de 2017. Dispon´ıvel em: . 80

[11] NELLIGAN, T. Ultrasonic Transducers Technical Notes. Relat´orio t´ecnico, Olympus NDT, 2011. [12] ARIZMENDI, C. J., GARCIA, W. L., QUINTERO, M. A. “Automatic welding detection by an intelligent tool pipe inspection”, Journal of Physics: Conference Series, , n. 1, pp. 012082, 2015. [13] CHAPLIN, R. Industrial Ultrasonic Inspection: Levels 1 and 2. FriesenPress, 2017. [14] CERQUEIRA, A. S. Avalia¸ca˜o da t´ecnica de ultrassom Phased Array na inspe¸ca˜o de juntas soldadas dissimilares e cladeadas com diferentes espessuras de amanteigamento. Tese de Mestrado, UFRGS, 2009. [15] TROMBINI, M. Avalia¸c˜ao da t´ecnica de ultrassom phased array para a otimiza¸c˜ ao do controle de qualidade em a¸cos laminados e forjados. Tese de Mestrado, Unicamp, 2015. [16] SAMEEUDDIN, S., POUDEL, A., LI, S., et al. “Automated defect classification using artificial neural networks”. In: 23rd Annual Research Symposium 2014, pp. 125–131, 2014. [17] LALITHAKUMARI, S., SHEELARANI, B., VENKATRAMAN, B. “Artificial Neural Network based Defect Detection of Welds in TOFD Technique”, International Journal of Computer Applications, v. 41, n. 20, 2012. [18] MOLES, M., ROBERTSON, L., SINCLAIR, T. “Developments in Time-OfFlight Diffraction (TOFD)”. In: 18th World Conference on Nondestructive Testing, pp. 16–20. Citeseer, 2012. [19] SOLUTION, A. “TOFD SCANNER”. Acessado em 25 de setembro de 2017. Dispon´ıvel em: . [20] DE MOURA, E. P. Reconhecimento de padr˜oes de defeitos de soldagem em sinais ultrassˆonicos obtidos pela t´ecnica TOFD utilizando redes neurais artificiais. Tese de Doutorado, Universidade Federal do Rio de Janeiro, COPPE, 2003. [21] CLIFTON, D., TARASSENKO, L. “Condition monitoring of gas-turbine engines”, Transfer Report, Department of Engineering Science, University of Oxford, 2006. [22] DINIZ, P. S. R., SILVA, E. A. B., NETTO, S. L. Digital signal processing: system analysis and design. Cambridge University Press, 2010. 81

[23] OPPENHEIM, A. V., SCHAFER, R. W. Discrete-time signal processing. Pearson Higher Education, 2010. [24] VETTERLI, M., KOVACEVIC, J. Wavelets and subband coding, v. 1. PrenticeHall, Englewood Cliffs, New Jersey., 1995. [25] AKANSU, A. N., HADDAD, R. A. Multiresolution signal decomposition: transforms, subbands, and wavelets. Academic Press, New Jersey Institute of Technology Newark, NJ, 2001. [26] MALLAT, S. A wavelet tour of signal processing: the sparse way. Academic press, 2008. ´ ´ [27] DE LA HERMOSA GONZALEZ, R. R., MARQUEZ, F. P. G., DIMLAYE, V., et al. “Pattern recognition by wavelet transforms using macro fibre composites transducers”, Mechanical Systems and Signal Processing, v. 48, n. 1, pp. 339–350, 2014. [28] DING, X., LI, Y., BELATRECHE, A., et al. “An experimental evaluation of novelty detection methods”, Neurocomputing, v. 135, pp. 313–327, 2014. [29] ZHOU, Z., MA, B., JIANG, J., et al. “Application of wavelet filtering and Barker-coded pulse compression hybrid method to air-coupled ultrasonic testing”, Nondestructive Testing and Evaluation, v. 29, n. 4, pp. 297–314, 2014. doi: 10.1080/10589759.2014.941840. [30] ADAMO, F., ANDRIA, G., ATTIVISSIMO, F., et al. “A comparative study on mother wavelet selection in ultrasound image denoising”, Measurement, v. 46, n. 8, pp. 2447–2456, 2013. doi: 10.1016/j.measurement.2013.04.064. [31] JOLLIFFE, I. Principal component analysis. Wiley Online Library, 2002. [32] MOHD ARIS, K. D., MUSTAPHA, F., SALIT, M. S., et al. “Condition Structural Index using Principal Component Analysis for undamaged, damage and repair conditions of carbon fiber–reinforced plastic laminate”, Journal of Intelligent Material Systems and Structures, v. 25, n. 5, pp. 575– 584, 2014. [33] HAR-PELED, S., ROTH, D., ZIMAK, D. “Constraint classification for multiclass classification and ranking”. In: Advances in neural information processing systems, pp. 809–816, 2003. [34] SCHOLKOPF, B., SMOLA, A. J. Learning with kernels: support vector machines, regularization, optimization, and beyond. MIT press, 2001. 82

[35] HAYKIN, S. S. Neural networks and learning machines, v. 3. Pearson Upper Saddle River, NJ, USA, 2009. [36] JOHN LU, Z. The elements of statistical learning: data mining, inference, and prediction. Wiley Online Library, 2010. [37] LIU, J., XU, G., REN, L., et al. “Defect intelligent identification in resistance spot welding ultrasonic detection based on wavelet packet and neural network”, The International Journal of Advanced Manufacturing Technology, v. 90, n. 9-12, pp. 2581–2588, 2017. [38] PIMENTEL, M. A., CLIFTON, D. A., CLIFTON, L., et al. “A review of novelty detection”, Signal Processing, v. 99, pp. 215–249, 2014. [39] PEDREGOSA, F., VAROQUAUX, G., GRAMFORT, A., et al. “Scikit-learn: Machine Learning in Python ”, Journal of Machine Learning Research, v. 12, pp. 2825–2830, 2011. [40] DE FARIA, E. R., DE LEON FERREIRA, A. C. P., GAMA, J., et al. “MINAS: multiclass learning algorithm for novelty detection in data streams”, Data Mining and Knowledge Discovery, v. 30, n. 3, pp. 640–680, 2016. [41] FARIA, E. R., GONC ¸ ALVES, I. J., DE CARVALHO, A. C., et al. “Novelty detection in data streams”, Artificial Intelligence Review, v. 45, n. 2, pp. 235–269, 2016. ´ [42] PRIETO, M. D., CORRALES, J. A. C., MILLAN, D. Z., et al. “Evaluation of Novelty Detection Methods for Condition Monitoring applied to an Electromechanical System”. In: Fault Diagnosis and Detection, InTech, 2017. [43] BORACCHI, G., CARRERA, D., WOHLBERG, B. “Novelty detection in images by sparse representations”. In: Intelligent Embedded Systems (IES), 2014 IEEE Symposium on, pp. 47–54. IEEE, 2014. [44] CICHOSZ, P., JAGODZINSKI, D., MATYSIEWICZ, M., et al. “Novelty detection for breast cancer image classification”. In: Proc. of SPIE Vol, v. 10031, pp. 1003135–1, 2016. [45] LI, W., MO, W., ZHANG, X., et al. “Outlier detection and removal improves accuracy of machine learning approach to multispectral burn diagnostic imaging”, Journal of biomedical optics, v. 20, n. 12, pp. 121305–121305, 2015. 83

[46] NADER, P., HONEINE, P., BEAUSEROY, P. “λp -norms in One-Class Classification for Intrusion Detection in SCADA Systems”, IEEE Transactions on Industrial Informatics, v. 10, n. 4, pp. 2308–2317, 2014. [47] DERVILIS, N., CHOI, M., TAYLOR, S., et al. “On damage diagnosis for a wind turbine blade using pattern recognition”, Journal of sound and vibration, v. 333, n. 6, pp. 1833–1850, 2014. [48] LI, S., TUNG, W. L., NG, W. K. “A novelty detection machine and its application to bank failure prediction”, Neurocomputing, v. 130, pp. 63–72, 2014. [49] KANG, P., KIM, K., CHO, N. “Toll Fraud Detection of Voip Services via an Ensemble of Novelty Detection Algorithms.” International Journal of Industrial Engineering, v. 22, n. 2, 2015. [50] MORRIS, G., ANGELOV, P. “Real-time novelty detection in video using background subtraction techniques: State of the art a practical review”. In: Systems, Man and Cybernetics (SMC), 2014 IEEE International Conference on, pp. 537–543. IEEE, 2014. ¨ [51] OZBILGE, E. “On-line expectation-based novelty detection for mobile robots”, Robotics and Autonomous Systems, v. 81, pp. 33–47, 2016. [52] TUNA, G., GUNGOR, V. C., GULEZ, K. “An autonomous wireless sensor network deployment system using mobile robots for human existence detection in case of disasters”, Ad Hoc Networks, v. 13, pp. 54–68, 2014. [53] HUIJSE, P., ESTEVEZ, P. A., PROTOPAPAS, P., et al. “Computational intelligence challenges and applications on large-scale astronomical time series databases”, IEEE Computational Intelligence Magazine, v. 9, n. 3, pp. 27–39, 2014. [54] PURARJOMANDLANGRUDI, A., GHAPANCHI, A. H., ESMALIFALAK, M. “A data mining approach for fault diagnosis: An application of anomaly detection algorithm”, Measurement, v. 55, pp. 343–352, 2014. [55] MARSLAND, S. “Novelty detection in learning systems”, Neural computing surveys, v. 3, n. 2, pp. 157–195, 2003. [56] CLIFTON, D. A., BANNISTER, P. R., TARASSENKO, L. “Application of an intuitive novelty metric for jet engine condition monitoring”. In: IEA/AIE, pp. 1149–1158. Springer, 2006. 84

[57] HE, Z., XU, X., DENG, S. “Discovering cluster-based local outliers”, Pattern Recognition Letters, v. 24, n. 9, pp. 1641–1650, 2003. [58] CLIFTON, L. A. Multi-channel novelty detection and classifier combination. Tese de Doutorado, University of Manchester, 2007. [59] VAN DER HEIJDEN, F., DUIN, R. P. W., DE RIDDER, D., et al. Classification, parameter estimation and state estimation: An engineering approach using MATLAB. John Wiley & Sons, 2004. [60] DE MOURA, N. N., DE SEIXAS, J. M. “Novelty detection in passive SONAR systems using support vector machines”. In: Computational Intelligence (LA-CCI), 2015 Latin America Congress on, pp. 1–6. IEEE, 2015. [61] TAX, D. M., DUIN, R. P. “Support vector data description”, Machine learning, v. 54, n. 1, pp. 45–66, 2004. [62] WANG, S., YU, J., LAPIRA, E., et al. “A modified support vector data description based novelty detection approach for machinery components”, Applied Soft Computing, v. 13, n. 2, pp. 1193–1205, 2013. [63] MCBAIN, J., TIMUSK, M. “Feature extraction for novelty detection as applied to fault detection in machinery”, Pattern Recognition Letters, v. 32, n. 7, pp. 1054–1061, 2011. [64] KOHONEN, T. “The self-organizing map”, Neurocomputing, v. 21, n. 1, pp. 1–6, 1998. [65] AGUAYO, L., BARRETO, G. A. “Novelty Detection in Time Series Using Self-Organizing Neural Networks: A Comprehensive Evaluation”, Neural Processing Letters, pp. 1–28, 2017. [66] OLSZEWSKI, D. “Fraud detection using self-organizing map visualizing the user profiles”, Knowledge-Based Systems, v. 70, pp. 324–334, 2014. [67] HESKES, T. “Self-organizing maps, vector quantization, and mixture modeling”, IEEE Transactions on Neural Networks, v. 12, n. 6, pp. 1299–1305, 2001. [68] TANG, J., SOUA, S., MARES, C., et al. “An experimental study of acoustic emission methodology for in service condition monitoring of wind turbine blades”, Renewable Energy, v. 99, pp. 170–179, 2016. [69] DREWRY, M., GEORGIOU, G. “A review of NDT techniques for wind turbines”, Insight-Non-Destructive Testing and Condition Monitoring, v. 49, n. 3, pp. 137–141, 2007. 85

[70] JASINIEN, E., RAIUTIS, R., VOLEIIS, A., et al. “NDT of wind turbine blades using adapted ultrasonic and radiographic techniques”, InsightNon-Destructive Testing and Condition Monitoring, v. 51, n. 9, pp. 477–483, 2009. [71] GRUNEWALD, S. “New 3D Printing Material Mimics Light Weight Balsa Wood for use in Wind Turbine Construction”, Retrieved, v. 11, n. 7, 2014. [72] KATNAM, K., COMER, A., ROY, D., et al. “Composite repair in wind turbine blades: an overview”, The Journal of Adhesion, v. 91, n. 1-2, pp. 113–139, 2015. [73] SILVA, I. C. Avalia¸c˜ao da Carburiza¸c˜ao em A¸cos HP por ensaio magn´etico n˜ao-destrutivo. Tese de Doutorado, Universidade Federal do Rio de Janeiro, COPPE, 2006. [74] BATISTA, G. E., PRATI, R. C., MONARD, M. C. “A study of the behavior of several methods for balancing machine learning training data”, ACM Sigkdd Explorations Newsletter, v. 6, n. 1, pp. 20–29, 2004. [75] HUANG, J., LING, C. X. “Using AUC and accuracy in evaluating learning algorithms”, IEEE Transactions on knowledge and Data Engineering, v. 17, n. 3, pp. 299–310, 2005. [76] SOLBERG, H. E., LAHTI, A. “Detection of outliers in reference distributions: performance of Horn’s algorithm”, Clinical chemistry, v. 51, n. 12, pp. 2326– 2332, 2005. [77] JIANG, J. Large sample techniques for statistics. Springer Science & Business Media, 2010.

86

Apˆ endice A Trabalhos Publicados Durante o desenvolvimento do trabalho, os artigos foram aceitos para apresenta¸ca˜o em congressos nacionais listados a seguir:

A.1

Artigos apresentados em Congressos

Oliveira, M. A., Silva, L. C., Simas Filho, E. F., Silva, I. C., Albuquerque, M. C. S., Farias, C. T. T. “Detec¸c˜ao de Novidades na Classifica¸c˜ao de Defeitos em Junta Soldada de A¸co SAE 1020.” In: XXXIV Congresso Nacional de Ensaios N˜ao Destrutivos e Inspe¸c˜ao. S˜ao Paulo, 2016 Resumo: A classifica¸c˜ao autom´atica de defeitos em juntas soldadas utilizando inspe¸c˜ao ultrassˆonica vem sendo estudada h´a alguns anos. Diversas t´ecnicas como redes neurais artificiais, a´rvores de decis˜ao e discriminantes lineares foram utilizadas com sucesso. Entretanto, normalmente, os sistemas de classifica¸c˜ao s˜ao projetados para identificar sinais que pertencem a um n´ umero limitado de classes, estabelecido previamente a partir das amostras dispon´ıveis para treinamento. Se na opera¸c˜ao do sistema ocorrer uma condi¸c˜ao diferente das existentes no treinamento (classe de sinal desconhecida), ela ser´a associada a` condi¸ca˜o conhecida mais semelhante. Essa limita¸c˜ao pode representar um problema quando o conjunto de treinamento n˜ao ´e representativo de todas as poss´ıveis condi¸c˜oes do material. Este trabalho prop˜oe utilizar uma t´ecnica de projeto de sistemas de classifica¸ca˜o denominada ”detec¸ca˜o de novidades”para identifica¸ca˜o de defeitos em juntas soldadas a partir de inspe¸co˜es por ultrassom pela t´ecnica TOFD. Neste caso, o classificador ser´a capaz de reconhecer uma amostra de entrada que n˜ao pertence a nenhum dos padr˜oes de treinamento, possibilitando maior flexibilidade ao sistema. Sinais de ultrassom TOFD, tomados por varredura numa chapa de a¸co SAE1020 soldada onde existem diferentes tipos de defeito, ser˜ao utilizados para alimentar um sistema de classifica¸ca˜o por redes neurais 87

artificiais. Oliveira, M. A., Simas Filho, E. F., Santos, Y. T. B, Silva, I. C., Albuquerque, M. C. S., Farias, C. T. T. “Identifica¸c˜ao de Danos em P´as de Turbinas E´olicas Utilizando Classifica¸c˜ao Autom´atica Atrav´es de Detec¸c˜ao de Novidades.” In: 14a Conferˆencia sobre Tecnologia de Equipamentos, Rio de Janeiro, 2017. Resumo: A utiliza¸c˜ao de energias renov´aveis e, especialmente, a energia e´olica vem crescendo anualmente no Brasil. Este tipo de gera¸c˜ao se mostra como uma alternativa vi´avel em decorrˆencia do potencial elevado de instala¸c˜ao das usinas. A integridade e seguran¸ca dos materiais empregados tem papel importante, necessitando de inspe¸ca˜o em intervalos regulares, principalmente aqueles que comp˜oem as p´as das turbinas e´olicas que est˜ao sujeitas a maior desgaste em opera¸c˜ao. Os m´etodos de classifica¸ca˜o autom´atica de defeitos podem ser utilizados nos ensaios n˜ao destrutivos ultrassˆonicos para auxiliar no processo de tomada de decis˜ao. Neste trabalho ´e proposta a aplica¸ca˜o de um sistema de classifica¸ca˜o atrav´es da t´ecnica de detec¸ca˜o de novidades com a an´alise de outliers para os sinais ultrassˆonicos coletados em corpos de prova obtidos a partir de p´as e´olicas. O sistema ser´a treinado utilizando apenas sinais da condi¸ca˜o sem defeito. Para extra¸ca˜o de caracter´ısticas foram utilizadas diferentes t´ecnicas de processamento digital de sinais. A an´alise de componentes principais foi utilizada para sele¸c˜ao das caracter´ısticas mais representativas para descrever os sinais medidos, reduzindo a dimens˜ao dos dados apresentados ao classificador. Os resultados mostram que o sistema de classifica¸c˜ao ´e capaz de contribuir para a identifica¸c˜ao de defeitos produzidos durante o processamento das p´as e´olicas. Silva, L. C., Oliveira, M. A., Simas Filho, E. F., Albuquerque, M. C. S., Silva, I. C., Farias, C. T. T. “Classifica¸c˜ao de falhas em solda por meio de m´aquina de aprendizado extremo aplicadas a inspe¸c˜oes n˜ao-destrutivas por ultrassom.” In: 14a Conferˆencia sobre Tecnologia de Equipamentos, Rio de Janeiro, 2017. ´ utilizado um m´etodo de treinamento de Redes Neurais Artificiais Resumo: E conhecido como M´aquinas de Aprendizado Extremo para classifica¸ca˜o de defeitos em inspe¸co˜es n˜ao- destrutivas por ultrassom em regi˜oes de solda de chapas de a¸co-carbono. Essa estrat´egia de treinamento visa a diminui¸ca˜o do esfor¸co computacional necess´ario para o desenvolvimento do classificador, sendo adequada para o uso em sistemas embarcados dedicados. As assinaturas espectrais (ap´os transformada de Fourier) dos sinais de defeitos comumente observados em soldas tais como falta de fus˜ao, porosidade e inclus˜ao de esc´oria, s˜ao utilizadas para projetar e testar o m´etodo de classifica¸ca˜o proposto. O m´etodo ´e comparado com t´ecnicas de classifica¸ca˜o baseadas 88

em topologias de Redes Neurais Artificiais estabelecidas na literatura. Os resultados obtidos indicam que o uso de M´aquinas de Aprendizado Extremo ´e vantajoso sob o ponto de vista do tempo de treinamento do classificador em rela¸c˜ao aos outros algoritmos. Deste modo, o m´etodo proposto se apresenta como uma boa op¸ca˜o para treinamento em campo utilizando dispositivos port´ateis dedicados. Rodrigues, L. F. M., Cruz, F. C., Simas Filho, E. F., Santos, Y. T. B, Oliveira, M. A., Silva, I. C., Albuquerque, M. C. S., Farias, C. T. T. “Sistema de classifica¸ca˜o aplicado na detec¸ca˜o de danos em p´as de aerogeradores inspecionados por ultrassom.” In: 14a Conferˆencia sobre Tecnologia de Equipamentos, Rio de Janeiro, 2017. Resumo: A contribui¸c˜ao da gera¸c˜ao de energia el´etrica, atrav´es da fonte e´olica, aumentou nos u ´ltimos anos no Brasil. Entre as vantagens da gera¸ca˜o e´olica pode-se destacar o pre¸co competitivo da energia produzida e o fato do recurso prim´ario ser renov´avel. As p´as s˜ao componentes importantes de um gerador e´olico e, geralmente, s˜ao feitas de materiais comp´ositos. As principais causas de defeitos nestes elementos s˜ao: descargas atmosf´ericas, esfor¸cos mecˆanicos, desbalanceamentos, delamina¸c˜oes, etc. As t´ecnicas de inspe¸ca˜o n˜ao destrutivas ultrassˆonicas s˜ao comumente aplicadas na manuten¸c˜ao de equipamentos industriais. Contudo, devido `as condi¸c˜oes de opera¸ca˜o dos aerogeradores e a` natureza do material comp´osito, as ondas ultrassˆonicas podem sofrer atenua¸c˜ao e dispers˜ao, dificultando a interpreta¸c˜ao dos resultados diretamente pelo operador. Neste trabalho, utilizou-se t´ecnicas de inteligˆencia artificial e processamento digital de sinais para a detec¸c˜ao de defeitos em se¸c˜oes de p´as e´olicas. Os corpos de prova foram ensaiados pela t´ecnica ultrassˆonica por imers˜ao n˜ao convencional, Bubbler. A transformada de Fourier foi utilizada na extra¸c˜ao de caracter´ısticas e um sistema de suporte `a decis˜ao, baseado em ´arvore de decis˜ao, foi implementado. O sistema proposto alcan¸cou eficiˆencia m´edia superior a 97% na classifica¸ca˜o dos sinais.

89