Classificador paraconsistente de atributos de imagens mamográficas aplicado no processo de diagnóstico do câncer de mama assistido por computador
Anexos
Informações
Título
Classificador paraconsistente de atributos de imagens mamográficas aplicado no processo de diagnóstico do câncer de mama assistido por computador
Autor(es)
Fábio Vieira do Amaral
Orientador(es)
Jair Minoro Abe
Data de Defesa
24/06/2013
Resumo (EN)
In this work, a Paraconsistent Classifier for the diagnosis of breast cancer based on the attributes of mamographic images was developed. The architecture of the Paraconsistent Artificial Neural Network used is divided into three phases: the first one with Paraconsistent Artificial Learning Neural Cells (CNAPa's), the second with Paraconsistent Artificial Simple Logic Connection Neural Cells (CNAPCls's ) and in the third stage, with Arificial Paraconsistent decision Neural Cells (CNAPd's). The system implements eight sets of mammographic attributes, where for each picture attribute, a neural network with decision making from the final results of processing each set of attributes was created. In order to mitigate the effects of false positives diagnoses and true positives, an algorithm was developed to calibrate the cutoff between benign and malignant cases. In order to analyze the performance of the Paraconsistent classifier, the results will be compared with the results of the following classifiers: Multi-Layer Perceptron (MLP), a dual stage classifier (ART2LDA) based on Adaptive Resonance Theory (ART) and a classifier implemented with nonlinear optimization techniques and combinatorics, associated with the classification capabilities of Radial basis Functions - (RBF-Simulated Annealing).To perform the simulations, two different databases were used. The first one, to classify calcifications, is composed of 143 samples divided into 64 benign cases and 79 malignant cases represented by form. The second is intended for mammographic masses and tumors classification, and is composed by 57 regions of interest divided into 37 malignant and 20 benign cases, represented by form factors, transition edges and texture measures. The performances of the classifiers in discriminating benign and malignant cases are compared in terms of area under the Receiver Operating Characteristic Curve (Az). The higher the value of Az, the better the performance of the classifier.The experiments with calcifications show: Paraconsistent Classifier (Az = 0.986), MLP classifier (Az = 0.70), ART2LDA Classifier (Az = 0.696) and RBF Classifier - Simulated Annealing (Az = 0.94). For experiments with mammographic masses and tumors show: Set 1, Paraconsistent Classifier (Az = 0.939), MLP classifier (Az = 0.994), ART2LDA Classifier (Az = 0.901) and RBF Classifier - Simulated Annealing (Az = 0.912). Set 2, Paraconsistent Classifier (Az = 9 0.935), MLP classifier (Az = 0.994), ART2LDA Classifier (Az = 0.890) and RBF Classifier - Simulated Annealing (Az = 0.924). Set 3, Paraconsistent Classifier (Az = 0.875), MLP classifier (Az = 0.970), ART2LDA Classifier (Az = 0.850) and RBF Classifier - Simulated Annealing (Az = 0.996). Set 4, Paraconsistent Classifier (Az = 0.500), MLP classifier (Az = 0.887), ART2LDA Classifier (Az = 0.767) and RBF Classifier - Simulated Annealing (Az = 0.907). Set 5, Paraconsistent Classifier (Az = 0.929), MLP classifier (Az = 0.987), ART2LDA Classifier (Az = 0.884) and RBF Classifier - Simulated Annealing (Az = 0.998). Set 6, Paraconsistent Classifier (Az = 0.939), MLP classifier (Az = 0.982), ART2LDA Classifier (Az = 0.885) and RBF Classifier - Simulated Annealing (Az = 0.999). In the case of the Paraconsistent Classifier, the eighth experiment was composed of the total image attributes relating to mammographic masses and tumors (Az = 0.939). In the particular case of the RBFSort Simulated Annealing experiment with all the image attributes, it was proved its unfeasibility, due to the complexity of their algorithm, where the processing time tends to infinity for a larger number of elements. For the experiments, the Paraconsistent classifier used 20% of the samples for the neural network training, against the total number of samples available minus one for the other classifiers. The results demonstrate the qualities of Paraconsistent classifier when using a small number of samples for training the neural network and its low processing time. The proposed classifier can be rated as a Computer-Aided Diagnosis system (CAD).
Resumo
Foi desenvolvido um Classificador Paraconsistente para auxiliar no diagnóstico do câncer de mama, com base na classificação de atributos de imagens mamográficas. A arquitetura da Rede Neural Artificial Paraconsistente utilizada é dividida em três fases: na primeira, há as Células Neurais Artificiais Paraconsistentes de aprendizado (CNAPa); na segunda, há as Células Neurais Artificiais Paraconsistentes de Conexão lógica simples (CNAPCls); na última, há as Células Neurais Artificiais Paraconsistentes de decisão (CNAPd). O sistema implementa oito conjuntos de atributos mamográficos, nos quais, para cada um deles, foi criada uma rede neural, com a tomada de decisão baseada nos resultados finais do processamento de cada conjunto de atributos. Para mitigar os efeitos dos diagnósticos, formados por falsos positivos e verdadeiros positivos, desenvolveu-se um algoritmo para calibração do valor de corte entre os casos benignos e malignos. A fim de analisar o desempenho do classificador, os resultados foram comparados com os resultados dos seguintes classificadores: o Multi-Layer Perceptron (MLP); um classificador de duplo estágio (ART2LDA) fundamentado na Adaptive Resonance Theory (ART); e um classificador implementado segundo técnicas de otimização não linear e combinatória associadas à capacidade de classificação das funções de bases radiais (RBF-Simulated annealing). Para realizar as simulações são utilizadas duas bases de dados distintas. Uma para classificação de calcificações, composta por 143 amostras, divididas em 64 casos benignos e 79 casos malignos, representadas por fatores de forma; e outra para classificação das massas mamográficas e tumores, composta por 57 regiões de interesse, divididas em 37 malignas e 20 benignas, representadas por fatores de forma, transição de bordas e medidas de textura. O desempenho dos classificadores ao discriminar casos benignos e malignos é comparado em termos da área sob curva, Receiver Operating Characteristic (Az). Quanto maior for o valor de Az melhor será o desempenho do classificador. Nos experimentos com calcificações, mostram: classificador paraconsistente (Az = 0,986); classificador MLP (Az = 0,70); classificador ART2LDA (Az = 0,696); e classificador RBF-Simulated annealing (Az = 0,94). Nos experimentos com massas mamográficas e tumores, mostram: Conjunto 1, classificador paraconsistente (Az = 0,939), classificador MLP (Az = 0,994), classificador ART2LDA (Az = 0,901) e classificador RBF-Simulated annealing (Az = 0,912); Conjunto 2, classificador paraconsistente (Az = 0,935), classificador MLP (Az = 0,994), classificador ART2LDA (Az = 0,890) e classificador RBF-Simulated annealing (Az = 0,924); Conjunto 3, classificador paraconsistente (Az = 0,875), classificador MLP (Az = 0,970), classificador ART2LDA (Az = 0,850), e classificador RBF-Simulated annealing (Az = 0,996); Conjunto 4, classificador paraconsistente (Az = 0,500), classificador MLP (Az = 0,887), classificador ART2LDA (Az = 0,767) e classificador RBF-Simulated annealing (Az = 0,907); Conjunto 5, classificador paraconsistente (Az = 0,929), classificador MLP (Az = 0,987), classificador ART2LDA (Az = 0,884) e classificador RBF-Simulated annealing (Az = 0,998); Conjunto 6, classificador paraconsistente (Az = 0,939), classificador MLP (Az = 0,982), classificador ART2LDA (Az = 0,885) e classificador RBF-Simulated annealing (Az = 0,999). Para o classificador paraconsistente, houve um oitavo experimento, composto pelo total de atributos de imagens relativos às massas mamográficas e tumores (Az = 0,939). No caso particular do classificador RBF-Simulated annealing, o experimento com todos os atributos de imagens se mostrou inviável, graças à complexidade do seu algoritmo, em que o tempo de processamento tende ao infinito para um número maior de elementos. Nos experimentos, o classificador paraconsistente utilizou 20% das amostras para treinamento da rede neural contra o total de amostras disponíveis menos uma para os demais classificadores. Os resultados demonstram as qualidades do classificador paraconsistente ao utilizar um número reduzido de amostras para treinamento da rede neural e pelo seu baixo tempo de processamento. O classificador proposto pode ser considerado um Computer-Aided Diagnosis (CAD).
Tipo
Tese
Palavras-chave
Computer-Aided Diagnosis, Câncer de Mama, Lógica Paraconsistente Anotada Evidencial Et, Rede Neural Artificial Paraconsitente
Área de Concentração
Gestão de Sistemas de Operação
Grupo de Pesquisa da UNIP cadastrado no CNPq
Lógica Paraconsistente e Inteligência Artificial
Instituição
UNIP
Direito de Acesso
Acesso Aberto