dc.description.abstract | A doença de chagas (DC), também conhecida como tripanossomíase americana é uma zoonose cujo agente etiológico é o protozoário Trypanosoma cruzi, considerada um dos maiores problemas de saúde pública na América central e América do sul. Estima-se que existem cerca de 16 a 18 milhões de pessoas portadoras da DC, em média 300.000 novos casos por ano. No campo da inteligência artificial, existem vários algoritmos de classificação, que possuem diferentes métodos para a indução do conhecimento. O objetivo deste trabalho foi fazer o levantamento de dados soros epidemiológicos, além de comparar o potencial da utilização de aprendizagem de máquina e da seleção automática de atributos na discriminação de indivíduos chagásicos e não chagásicos baseados em dados clínicos e sociodemográficos. Trata-se de um estudo transversal com amostragem não probabilística com 132 indivíduos crianças e adultos residentes em povoados localizados no município de Itabaianinha/SE. Foram realizados exames sorológicos para DC, aplicados questionários sociodemográficos e de conhecimento relacionados à DC e realizada avaliação clínica geral e da deglutição. Foi efetuado os testes dos algoritmos regressão linear (RL), regressão logística, árvore de decisão c4. 5, máquinas de vetores de suporte (SVM), redes de função de base radial (RBF) e rede neural perceptron multicamadas (MLP), variando seus respectivos parâmetros de configuração, usando validação cruzada k-fold, em busca da melhor configuração, sendo comparados apenas a RL e a MLP, devido os resultados serem os mais indicativos. Para a construção da base de dados foram observados os caracteres sociodemográficos, sintomas, alteração clinica e testes de deglutição. Foram identificados 24 indivíduos (7,04%) soropositivos, os quais relataram algum tipo de manifestação clinica cardíaca e foi possível detectar alterações na deglutição. Dentre todos os testes utilizados, o MLP usando algoritmo genético foi o que apresentou a melhor performance em distinguir os indivíduos chagásicos dos não chagásicos, atingindo uma sensibilidade de 78,33%, uma especificidade de 75,0%, e uma acurácia de 95,95% ± 5,36%. No box-plot, o MLP associado ao algoritmo genético apresentou uma maior área quando comparado com a RL, além de apresentar uma melhor divisão das instâncias classificadoras. Baseado nos resultados estabelecidos, o presente estudo revelou a existência de uma população soropositiva para DC sem acompanhamento para sua condição de saúde, alguns apresentando alterações na deglutição que podem estar relacionadas à fase crônica. Em relação aos algoritmos, a MLP apresentou melhores resultados para predição dos indivíduos chagásicos dos não chagásicos quando comparada a Regressão Linear. | pt_BR |