Texto para Discussão (TD)
Clusterização hierárquica espacial
Texto para Discussão (TD) 1427: Clusterização hierárquica espacial;
Hierarchical spatial clustering
Autor
Carvalho, Alexandre Xavier Ywata de
Albuquerque, Pedro Henrique Melo
Almeida Junior, Gilberto Rezende de
Guimarães, Rafael Dantas
Resumen
Este estudo apresenta uma nova metodologia para clusterização hierárquica espacial de polígonos contíguos, com base em um sistema de coordenadas georreferenciadas. O algoritmo proposto é construído a partir de uma modificação do algoritmo de clusterização hierárquica tradicional, comumente utilizado na literatura de análise multivariada. De acordo com o método proposto neste trabalho, a cada passo do processo sequencial de junção de clusters, impõe-se que somente conglomerados (grupos de polígonos originais, como municípios, estados ou setores censitários) vizinhos possam ser unidos para formar um novo cluster maior. Neste caso, foram definidos como vizinhos polígonos que possuem um vértice em comum (vizinhança do tipo queen) ou uma aresta em comum (vizinhança do tipo rook). O estudo apresenta aplicações da nova metodologia para clusterização dos municípios brasileiros, no ano de 2000, com base em um conjunto de variáveis socioeconômicas. Diversos métodos de clusterização são estudados, assim como diferentes tipos de distâncias entre vetores. Os métodos estudados foram: centroid, single linkage, complete linkage, average linkage e average linkage weighted, Ward’s minimum variance e método da mediana. As distâncias utilizadas foram: norma Lp (em particular, as normas L1 e L2), Mahalanobis e distância euclidiana corrigida pela variância (variance corrected) – caso particular da distância de Mahalanobis. Finalmente, apresenta-se uma discussão sobre alguns métodos comumente utilizados para seleção do número de clusters. 79 p. : il.