Tesis
Coclusterização em comitês de filtros colaborativos e em análise de atividade cerebral
Co-clustering in collaborative filtering committees and in brain activity analysis
Registro en:
DRUMOND, Thalita Firmo. Coclusterização em comitês de filtros colaborativos e em análise de atividade cerebral. 2016. 1 recurso online (91 p.). Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação, Campinas, SP.
Autor
Drumond, Thalita Firmo, 1989-
Institución
Resumen
Orientador: Fernando José Von Zuben Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação Resumo: Os avanços em tecnologia de informação têm promovido um crescimento acentuado em geração e armazenamento de dados, produzidos praticamente em todos os campos de atividade humana. Com isso têm surgido demandas específicas de análise e extração de conhecimento dessa massa de dados, buscando um melhor entendimento dos processos envolvidos, a detecção de tendências e o suporte a decisões nas mais variadas áreas. Nesse contexto, buscam-se o estudo e o desenvolvimento de técnicas de aprendizado de máquina e ferramentas de mineração de dados eficientes e escaláveis. Uma dessas ferramentas é a coclusterização, uma técnica que visa agrupar simultaneamente objetos e seus atributos, encontrando grupos que apresentem algum padrão de coerência interna. Essa família de algoritmos tem sido aplicada em dados de expressão gênica, a fim de identificar grupos de genes com padrões de expressão coerentes sob um conjunto de condições. Existem também vários trabalhos usando a coclusterização para filtragem colaborativa, uma abordagem comumente usada para sistemas de recomendação, visando sugerir conteúdos, como livros e filmes, que possam ser de interesse para um usuário. Neste trabalho, diferentes técnicas de coclusterização foram exploradas em dois domínios de aplicação. Primeiramente, um framework de filtragem colaborativa, que utiliza uma fatoração booleana de matrizes baseada em coclusterização, foi estendido através de uma abordagem de ensemble robusta e escalável, utilizando projeções aleatórias para a redução de dimensão e um método de vizinhança aproximada. A agregação de cada uma das técnicas foi estudada separadamente, com experimentos em bases de dados reais usualmente adotadas na literatura. O ensemble proposto também foi comparado com técnicas tradicionais e com o estado-da-arte, apresentando resultados competitivos. Em uma segunda linha de trabalho, uma técnica de coclusterização contígua foi aplicada em séries temporais de atividade cerebral, buscando encontrar padrões de atividade temporal coerente entre regiões do cérebro. Os padrões encontrados foram utilizados para construir um mapa cerebral funcional dinâmico, expresso por padrões de conectividade que evoluem com o tempo. Os mapas funcionais obtidos são relevantes para a visualização dos numerosos padrões encontrados pelo algoritmo de coclusterização, permitindo a discriminação entre pacientes e controles Abstract: The advances in information technology are promoting the generation and storage of an ever-increasing amount of data, produced by virtually all fields of human activity. So, there are distinguished demands for the analysis and knowledge extraction of these data, aiming at better understanding the involved processes, detecting trends and supporting decisions in the most varied fields. In this context, the study and development of scalable and efficient data mining tools and machine learning frameworks are highly desirable. One of such techniques is co-clustering, which aims to cluster simultaneously objects and their attributes, locating groups presenting some internal coherence pattern. This family of algorithms has been commonly applied to gene expression data, in order to identify groups of genes with coherent expression patterns under a group of conditions. There are also several works using co-clustering for collaborative filtering, an approach commonly used for recommender systems, which aims to suggest objects or contents, such as movies or books, that might interest a user. In this work, different co-clustering techniques were explored in two different application domains. First, a collaborative filtering framework, using a co-clustering-based matrix factorization technique, was extended through a robust and scalable ensemble approach using random projections for dimensionality reduction and approximate nearest neighbors. The agregation of each technique was studied individually, with experiments on real-world datasets commonly used in the litterature. The proposed ensemble was also compared to traditional and state-of-the-art techniques, exhibiting competitive results. Secondly, a contiguous co-clustering technique was applied to different neuronal brain activity time-series, looking for coherent temporal activity patterns between brain regions. Patterns found were used to construct a dynamic brain mapping, expressed by connectivity patterns that evolve with time. Those obtained functional maps are relevant for visualization of the numerous patterns found by the co-clustering algorithm, allowing the discrimination between patients and controls Mestrado Engenharia de Computação Mestra em Engenharia Elétrica 2014/11125-1 FAPESP