logo-ri

Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)

Please use this identifier to cite or link to this item: https://www.repositorio.mar.mil.br/handle/ripcmb/845425
Title: Prov-Dominoes: an exploratory analysis approach for provenance data
Authors: Alencar, Victor Bezerra
Keywords: Engenharia e Sistemas de Informação
Análise exploratória de dados
Proveniência
GPU
DGPM knowledge areas: Engenharia naval
Issue Date: 2020
Publisher: Universidade Federal Fluminense (UFF)
Description: Proveniência, o registro da história de uma informação, tem se tornado cada vez maisrelevante para a compreensão, auditoria e reprodução de tarefas computacionais. Os pro-cessos de análise de proveniência muitas vezes podem ser custosos para o usuário devidoao grande volume de dados, aos múltiplos relacionamentos e às informações implícitasem meio a esses dados. Algumas ferramentas existentes fornecem suporte à análise deproveniência com base em diagramas de vínculo entre nós, contando com recursos devisualização sobre arestas e vértices. Outras são ferramentas baseadas em fluxos de tra-balho, como VisTrails e Taverna. No entanto, nenhuma delas suporta a exploração dedados de proveniência implícitos, como as inferências das restrições do modelo de dadosPROV. Neste trabalho, apresentamos Prov-Dominoes, uma ferramenta projetada paraexplorar dados de proveniência interativamente. Prov-Dominoes promove as relações deproveniência entre entidades, atividades e agentes em elementos de primeira classe, repre-sentados por peças de dominó. Além disso, permite aos usuários combinar tais peças dedominó visual e interativamente, usando GPU. Prov-Dominoes foi avaliado em estudos decaso distintos a fim de observar sua relevância. Foi possível descobrir relações implícitasem um conjunto de dados de características de animais, identificar os parâmetros queinfluenciaram os resultados da execução de um fluxo de trabalho e destacar as atividadesessenciais em uma casa inteligente. Também avaliamos o desempenho de combinações se-quenciais executadas em Prov-Dominoes ao lidar com dados de proveniência com milharesde relações, contrastando suas execuções em GPU e CPU. Os resultados mostraram que,para um grande conjunto de dados, GPU superou CPU em duas ordens de magnitude.
Dissertação de Mestrado apresentada ao Programa de Pós-Graduação em Computação da Universidade Federal Fluminense como requisito parcial para a obtenção do Grau de Mestre em Computação.Área de concentração: Engenharia de Sistemas e Informação (ESI).
Abstract: AbstractProvenance, the record of the history of a piece of information, has become increasinglyrelevant to understanding, auditing, and reproducing computational tasks. The prove-nance analysis processes can often be overwhelming to the user due to the large volume ofdata, the multiple relationships among data, and the implicit information buried into thedata. Some existing tools provide provenance analysis support based on node-link dia-grams, relying on visualization features over edges and vertices. Others are workflow-basedtools, such as VisTrails and Taverna. However, none of them support the exploration ofimplicit provenance data, such as the inferences of the PROV Data Model Constraints.In this work, we introduce Prov-Dominoes, a tool designed to explore provenance datainteractively. Prov-Dominoes promotes the provenance relationships among entities, ac-tivities, and agents into first-class elements, represented by domino tiles. Moreover, itallows users to combine and compose such domino tiles visually and interactively, us-ing GPU. We evaluated Prov-Dominoes over distinct case studies, helping us to observeProv-Dominoes in action. We were able to uncover implicit relationships in a dataset ofanimal characteristics, identify the parameters that influenced workflow execution results,and highlight essential activities in a smart home. We also evaluated the performance ofsequential combinations executed in Prov-Dominoes when dealing with provenance datawith thousands of relations, contrasting their executions in GPU and CPU. The resultsshowed that, for a large data set, GPU outperformed CPU by two orders of magnitude.
Access: Open access
URI: https://www.repositorio.mar.mil.br/handle/ripcmb/845425
Type: Master thesis
Appears in Collections:Tecnologia da Informação: Coleção de Dissertações

Files in This Item:
File Description SizeFormat 
Dissertacao_CCVictorAlencar.pdf1,72 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.