doctoralThesis
Aprendizagem de máquina aplicada à execução da marcha em diabéticos tipo 2
Registro en:
SILVA, Patrícia Mayara Moura da. Aprendizagem de máquina aplicada à execução da marcha em diabéticos tipo 2. Orientador: Fabrícia Azevêdo da Costa Cavalcanti. 2023. 168f. Tese (Doutorado em Fisioterapia) - Centro de Ciências da Saúde, Universidade Federal do Rio Grande do Norte, Natal, 2023.
Autor
Silva, Patrícia Mayara Moura da
Resumen
Introduction: Diabetes is characterized by a set of metabolic diseases that can cause several changes. One of them occurs in the sensorimotor function, which generates changes in
gait execution, such as longer stance phase, shorter steps and inadequate plantar pressure
distribution. Quantitative methods for assessing changes in gait patterns can be decisive in
designing treatment strategies. Also, they can help in preventing complications caused by
diabetes. With advances in machine learning (ML) techniques, automated pattern recognition in the face of massive amounts of data has become an essential tool in the medical field
due to its ability to predict clinical complications before the disease gets worse. Objectives:
To investigate ML models on gait assessment data from type 2 diabetic patients in order
to identify gait patterns that may predict clinical complications of diabetes. Methods: The
study involved two methodological phases: 1) Protocol and Systematic Review elaboration;
2) Development and improvement of predictive models of unsupervised and supervised BF for
exploratory data analysis, detection of diabetes and detection of clinical complications in diabetes based on glycated hemoglobin (HbA1c) levels. The data for carrying out the study was
provided through a partnership with Florida International University (FIU) during a sandwich doctorate (Edital No. 02/2020 – CAPES/PRINT) between September 2021 and June
2022. The data were pre-processed and implemented in different ML models. The ML models used were evaluated for their efficiency based on the silhouette analysis for unsupervised
ML, metrics based on the confusion matrix for supervised ML, and conventional statistics,
adopting a significance level of 5%. Results: Phase 1 resulted in two articles: Article 1 - The
published protocol defined the methodology that guided the review; Article 2 - The systematic review, under consideration, resulted in four studies (208 participants) included. Two
used ML as a predictive method, one used conventional statistics based on multiple stepwise
regression, and one used the Fuzzy classifier, an uncertainty method. Studies achieved at least
75% in adequately reporting 19 Transparent Reporting of a multivariable prediction model
for Individual Prognosis or Diagnosis (TRIPOD) items. Three of the included studies were
classified as high risk of bias. Phase 2 resulted in three articles in the submission process:
Article 3 – K-Means separated the data set into two groups (silhouette = 0.47). Gait speed,
step length and plantar pressure distribution patterns were statistically different (p < 0.05)
between diabetics and non-diabetics. Among diabetics, there was a statistically significant
difference (p < 0.05) in plantar pressure distribution patterns. Article 4 – Supervised ML
algorithms using gait data showed high sensitivity in the distribution of plantar pressure in
the heel region to classify diabetics from non-diabetics. Article 5 – The XGB classifier showed
better results in classifying diabetes complications based on HbA1c levels, reaching an AUC
of 0.99, a precision of 0.91, a recall of 0.90 and an f1-score of 0.89. For this classification, the most relevant gait characteristics were left support base, mean left pressure over time in the
metatarsal region (I-III) and mean active sensor area in the phalanges (III-IV). Conclusion:
The literature shows few studies using gait data as predictors of diabetes. Type 2 diabetics
presented changes in gait performance, with differences in plantar pressure distribution in
individuals with higher glycemic levels. Different regions of plantar pressure distribution were
relevant in the classification of diabetics or non-diabetics and in detecting complications in
diabetes. These findings have been supported in the literature. Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES Introdução: A diabetes caracteriza-se por um conjunto de doenças metabólicas que podem
causar diversas alterações. Uma delas ocorre na função sensório-motora que gera modificações
na execução da marcha, como: fase de apoio mais longa, passos mais curtos e inadequada
distribuição da pressão plantar. Métodos quantitativos de avaliação das alterações do padrão
de marcha podem ser decisivos para traçar estratégias de tratamento. Além disso, eles podem
ajudar na prevenção de complicações causadas pela diabetes. Com os avanços das técnicas
de aprendizagem de máquina (AM), o reconhecimento automatizado de padrões diante da
enorme quantidade de dados vem se tornando uma ferramenta essencial na área médica devido à capacidade de prever complicações clínicas antes que a doença se agrave. Objetivos:
investigar modelos de AM sobre dados de avaliação da marcha de pacientes diabéticos, tipo 2,
a fim de identificar os padrões de execução de marcha que possam prever complicações clínicas da diabetes. Métodos: O estudo envolveu duas etapas metodológicas: 1) Elaboração de
protocolo e Revisão Sistemática; 2) Desenvolvimento e aprimoramento de modelos preditivos
de AM não supervisionada e supervisionada para análise exploratória de dados, detecção da
diabetes e detecção de complicações clínicas na diabetes baseadas nos níveis de hemoglobina
glicada (HbA1c). Os dados para execução do estudo foram fornecidos mediante parceria com
a Florida International University (FIU) durante doutorado sanduíche (Edital No. 02/2020 –
CAPES/PRINT) entre setembro de 2021 e junho de 2022. Os dados foram pré-processados e
implementados em diferentes modelos de AM. Os modelos de AM utilizados foram avaliados
quanto a sua eficiência baseando-se na análise de silhouette para AM não supervisionada,
métricas de AM supervisionada baseadas na matriz de confusão e estatística convencional
adotando-se o nível de significância de 5%. Resultados: Etapa 1 resultou em dois artigos:
Artigo 1 - O protocolo já publicado definiu a metodologia a ser seguida na revisão; Artigo 2 -
A revisão sistemática, em apreciação, resultou em quatro estudos (208 participantes) incluídos. Dois usaram AM como método preditivo, um utilizou estatística convencional baseada
em regressão múltipla stepwise e um o classificador Fuzzy que é um método de incerteza. Os
estudos atingiram pelo menos 75% em reportar adequadamente 19 itens do Transparent Reporting of a multivariable prediction model for Individual Prognosis or Diagnosis (TRIPOD).
Três dos estudos incluídos foram classificados como alto risco de viés. Etapa 2 resultou em
três artigos, em processo de submissão: Artigo 3 – K-Médias separou o conjunto de dados
em dois grupos (silhouette = 0,47). Os padrões de velocidade, comprimento do passo e distribuição de pressão plantar da marcha foram estatisticamente diferentes (p < 0,05) entre
diabéticos e não diabéticos. Além disso, entre os diabéticos, observou-se uma diferença de
estatística significativa (p < 0,05) nos padrões de distribuição de pressão plantar. Artigo 4
– Algoritmos de AM supervisionada usando dados de marcha mostraram alta sensibilidade na distribuição da pressão plantar na região do calcanhar para classificar diabéticos de não
diabéticos. Artigo 5 – O classificador XGB apresentou melhores resultados para classificar
complicações na diabetes baseados no nível de HbA1c, alcançando AUC de 0,99, precisão de
0,91, recall de 0,90 e f1-score de 0,89. As características da marcha mais relevantes para essa
classificação foram base de apoio esquerda, pressão esquerda média ao longo do tempo na
região dos metatarsos (I-III) e média da área do sensor ativo nas falanges (III-IV). Conclusão: A literatura mostra poucos estudos sobre o uso de dados de marcha como preditores
da diabetes. Diabéticos tipo 2 apresentam alterações alterações execução da marcha, com
diferenças na distribuição da pressão plantar dos indivíduos com maiores níveis glicêmicos.
Regiões diferentes de distribuição da pressão plantar foram relevantes na classificação de diabéticos ou não diabéticos e na detecção de complicações na diabetes. Ambos achados são respaldados na literatura.