Implementação de redes neurais convolucionais (CNNS) para auxílios no diagnóstico de câncer de pulmão utilizando banco de dados open source
Documento
Informações
Título
Implementação de redes neurais convolucionais (CNNS) para auxílios no diagnóstico de câncer de pulmão utilizando banco de dados open source
Autor(es)
Antônio Sérgio Graton Júnior | João Lucas Roldão Rocha | Mateus Bernardi de Oliveira
Orientador(a)
Avelino Palma Pimenta Júnior
Coorientador(a)
Eliana Leão do Prado Battaglion; Kleython José Coriolano Cavalcanti de Lacerda
Resumo
O Câncer de pulmão é um dos tipos de câncer mais letais do mundo, sendo responsável por milhões de mortes anuais e frequentemente diagnosticado em estágios avançado. Diante desse cenário, técnicas de inteligência artificial têm se destacado como ferramentas promissoras para o desenvolvimento de sistemas de apoio ao diagnóstico médico. Este trabalho tem como objetivo implementar e avaliar modelos de aprendizado de máquina, com ênfase em Redes Neurais Convulsionais (CNNs), para prever o diagnóstico de câncer de pulmão a partir de um conjunto de dados open source disponibilizado na plataforma Kaggle. O estudo foi conduzido no ambiente Google Colab, utilizando a linguagem Python e bibliotecas como Pandas, NumPy Scikit-learn, Matplotlib, Seaborn e TensorFlow/Keras. O conjunto de dados analisado contém 309 registros de pacientes, compostos por atributos clínicos e comportamentais relacionados a fatores de risco e sintomas associados ao câncer de pulmão. As etapas metodológicas envolveram pré-processamento, análise exploratória, visualização gráfica e aplicação de cinco modelos de classificação: Regressão Logística, Naive Bayes Gaussiano, Floresta Aleatória, K-Vizinhos Mais próximos (KNN) e rede Neural Convolucional. Os resultados obtidos demonstraram desempenho expressivo dos modelos, com destaque para o KNN, que atingiu acurácia de 94,64%, e para a Rede Neural Convolucional, que alcançou 95,91% de acurácia no conjunto de treino e 91,07% na validação, apresentando curvas de aprendizado estáveis e sem indicativos de sobreajuste. A análise exploratória também permitiu identificar padrões relevantes, como a forte correlação entre tabagismo, tosse persistente, fadiga e falta de ar com diagnósticos positivos. Conclui-se que técnicas de aprendizado supervisionado, especialmente CNNs, apresentam grande potencial como ferramentas de apoio ao diagnóstico de câncer de pulmão, mesmo com bases tabulares e de tamanho reduzido. O trabalho destacado ainda a viabilidade de utilizar ferramentas e dados open source para o desenvolvimento de soluções acessíveis e reprodutíveis na área da saúde.
Palavras-chave
Neoplasias pulmonares | Inteligencia artificial | Aprendizado de máquina | Diagnóstico assistido por computador
Curso
Ciência da Computação
Data de Defesa
23/11/2025
Local/Campus
Ribeirão Preto
Direito de Acesso
Acesso Aberto