Tesis
Quality Flow : a collaborative quality-aware platform for experiments in eScience = Quality Flow: uma plataforma colaborativa orientada a qualidade para experimentos em eScience
Quality Flow : uma plataforma colaborativa orientada a qualidade para experimentos em eScience
Registration in:
Author
Sousa, Renato Beserra, 1988-
Institutions
Abstract
Orientador: Claudia Maria Bauzer Medeiros Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação Resumo: Muitos procedimentos de pesquisa científica dependem da análise de dados obtidos de fontes de dados heterogêneas. A validade dos resultados de pesquisa depende, entre outros, da qualidade dos dados - um tópico recorrente na pesquisa em computação há décadas. Embora existam muitas propostas para a avaliação da qualidade de dados, ainda há problemas em aberto, como mecanismos flexíveis para a avaliação de qualidade e maneiras para derivar a qualidade dos dados. O objetivo desta dissertação é trabalhar nesses problemas. A principal contribuição da dissertação é a criação do QualityFlow: uma plataforma colaborativa para avaliação de qualidade para experimentos em eScience. As principais contribuições são: suportar à criação de workflows científicos com parâmetros de qualidade, permitindo a adição de atributos de qualidade a workflows, permitindo ao mesmo tempo que usuários disintos definam métricas de qualidade específicas para o mesmo workflow; permitir aos usuários manter o histórico de diferentes avaliações de qualidade para um mesmo processo, provendo assim melhor compreensão do real valor dos dados e workflows; e permitir aos cientistas customizar dimensões de qualidade de dados e métricas de qualidade colaborativamente. O QualityFlow foi desenvolvido como um protótipo web, e executado para dois experimentos ¿ um baseado em dados reais e o outro em um workflow de exemplo Abstract: Many scientific research procedures rely upon the analysis of data obtained from heterogeneous sources. The validity of the research results depends, among others, on the quality of data. Data quality is a topic that has pervaded computer science research for decades. Though there are many proposals for data quality assessment, there are still open problems such as mechanisms to support flexible quality assessment and ways to derive data quality. The goal of this dissertation is to work on these issues. The main contribution of this dissertation is the proposal of QualityFlow: a quality-aware collaborative platform for experiments in eScience. The following contributions were accomplished: to support the creation of quality-aware scientific workflows, allowing the addition of quality attributes to workflows, while at the same time letting distinct users define their specific quality metrics for the same workflow; to allow users to keep track of different quality assessments for a given process, thereby providing insights into the actual value of data and workflow; and to allow scientists to customize data quality dimensions and quality metrics collaboratively. QualityFlow was developed as a web prototype, and executed in two experiments - one based upon a real problem and the other on a sample workflow Mestrado Ciência da Computação Mestre em Ciência da Computação
Subjects
Related items
Showing items related by title, author, creator and subject.
-
Development of a water quality index using a fuzzy logic: A case study for the sorocaba river
Roveda, Sandra Regina Monteiro Masalskiene; Bondança, Ana Paula Maia; Silva, João Guilherme Soares; Roveda, José Arnaldo Frutuoso; Rosa, André Henrique -
Development of a water quality index using a fuzzy logic: A case study for the sorocaba river
Universidade Estadual Paulista (Unesp) (2010-11-25)Due to growing urbanization and industrialization, the environment is suffering from pollution of rivers, degradation of soils and deteriorated air quality. Quality indices appear to be useful to evaluate the conditions ... -
Development of a water quality index using a fuzzy logic: A case study for the sorocaba river
Universidade Estadual Paulista (Unesp) (2010-11-25)Due to growing urbanization and industrialization, the environment is suffering from pollution of rivers, degradation of soils and deteriorated air quality. Quality indices appear to be useful to evaluate the conditions ...