Dissertação
Classificação de risco neonatal usando aprendizado de máquina e dados dos sistemas de informação de saúde pública e de censo demográfico brasileiro
Autor
Moreira, Jorge Rafael Hara
Institución
Resumen
The infant mortality rate is considered one of the most critical indicators of society.
From it, it is possible to portray the living conditions of a given country or region, where
high indices may reflect a low social and economic development level of the assessed
population. Despite the improvement in recent years, Brazil still needs to improve in
reducing this index, especially in some regions of the country that lack infrastructure and
face more severe socioeconomic problems. Inserted in the composition of infant mortality,
studies show that the largest share of deaths come from the neonatal component, requiring
greater attention from the public authorities in this segment. Thus, predicting the risk of
a baby dying in its first days of life can positively impact the public health system and,
consequently, Brazilian society. This work uses machine learning techniques and data from
health information systems and the Brazilian demographic census to generate classifiers
that make it possible to issue an alert to the health system in case of risk of neonatal
death, directing attention to maternal and newborn follow-up. The classifiers were trained
using a large dataset by linking records from five databases. In addition, the data set was
enriched with new variables allowing a broader study of the factors that influence neonatal
mortality. The results reveal f1-score and AUC rates above 89% in the neonatal death
risk classification, showing that the proposed classifier is viable as one more resource for
preventing neonatal deaths and improving the health system. A taxa de mortalidade infantil é considerada um dos indicadores mais importantes
de uma sociedade. A partir dela, é possível retratar as condições de vida de um determinado país ou região, onde a presença de índices elevados pode refletir baixo nível de
desenvolvimento social e econômico da população avaliada. O Brasil, apesar da melhora
nos últimos anos, ainda enfrenta desafios para reduzir esse índice, principalmente em
algumas regiões do país que carecem de infraestrutura e enfrentam problemas socioeconômicos mais graves. Inserida na composição da mortalidade infantil, estudos mostram
que a maior parcela dos óbitos são provenientes do componente neonatal, exigindo maior
atenção do poder público neste segmento. Assim, predizer o risco de um bebê morrer nos
seus primeiros dias de vida pode gerar impactos positivos ao sistema de saúde público e,
consequentemente, à sociedade brasileira. Este trabalho utiliza técnicas de aprendizado de
máquina e dados dos sistemas de informação em saúde e de censo demográfico brasileiro
para gerar classificadores que possibilitam emitir um alerta ao sistema de saúde em caso
de risco de óbito neonatal, direcionando a atenção ao acompanhamento materno e ao
recém-nascido. Os classificadores foram treinados usando um grande conjunto de dados
formado a partir de um processo de vinculação de registros de cinco bases de dados
distintas. Além disso, o conjunto de dados foi enriquecido com novas variáveis permitindo
um estudo mais amplo dos fatores influenciadores da mortalidade neonatal. Os resultados
revelam taxas de f1-score e AUC acima de 89% na classificação de risco de óbito neonatal,
mostrando que o classificador proposto é viável como mais um recurso para prevenção de
óbitos neonatais e aprimoramento do sistema de saúde.