doctoralThesis
Algoritmos de particionamento aplicados à análise estatística de formas
Algoritmos de partição aplicados à análise estatística de formas
Autor
ASSIS, Elaine Cristina de
Institución
Resumen
A análise estatística de forma é usada para tomar decisões observando a forma de objetos. A forma de um objeto é a informação restante quando os efeitos de locação, escala e rotação são removidos com a utilização de operações matemáticas adequadas. Algoritmos de agrupamento por particionamento encontram uma partição que maximiza ou minimiza algum critério numérico. Esta pesquisa apresenta algoritmos de agrupamento baseados em protótipos e em busca, adaptados para os dados da área de análise estatística de formas. Esses algoritmos são novas versões dos algoritmos de agrupamento K-médias e KI-médias, Subida da Encosta, Busca Tabu, apropriados para o tratamento de dados de formas bidimensionais. Para avaliar a formação dos agrupamentos para os algoritmos propostos, novos critérios de agrupamento foram gerados para dados de formas a partir de estatísticas de testes de hipóteses e critérios usuais já existentes na literatura. A fim de melhorar a qualidade dos resultados de agrupamento, os algoritmos foram também analisados quando foram utilizados em conjunto com o método Bagging que faz uma reamostragem com repetição para os dados de entrada e gerou grupos através de uma votação majoritária. Estudos de simulação foram realizados para validar esses métodos propostos e três conjuntos de dados reais disponíveis na literatura também foram considerados. A qualidade dos experimentos foi avaliada pelo índice Rand corrigido e os resultados mostraram que os algoritmos propostos para formas bidimensionais são eficientes para os conjuntos de dados analisados. FACEPE Partitioning clustering algorithms find a partition that maximizes or minimizes some numeric criteria. Statistical shape analysis is used to make decisions by observing the shape of objects. The shape of an object is the remaining information when the location, scale and rotation effects are removed with the use of appropriate mathematical operations. This research presents clustering algorithms based on prototypes and in search adapted to the data of the area of statistical shape analysis. These algorithms are new versions of the K-means and KI-means, Hill Climbing and Tabu Search clustering algorithms, suitable for the treatment of two-dimensional data. In order to evaluate the formation of the clusters for the proposed algorithms, new clustering criteria were generated for form data from test statistics of hypotheses and usual criteria already existent in the literature. In order to improve the quality of clustering results, the algorithms were also analyzed when they were used in conjunction with the Bagging method, which makes a resampling with repetition for the input data and generated groups through a majority vote. Simulation studies were performed to validate these proposed methods and three real data sets available in the literature were also considered. The quality of the experiments was evaluated by the corrected Rand index and the results showed that the algorithms proposed for planar shapes are efficient for the data sets analyzed.