logo-ri

Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)

Please use this identifier to cite or link to this item: https://www.repositorio.mar.mil.br/handle/ripcmb/844259
Title: Ciência de dados aplicada à conservação e à bioprospecção marinha: síntese do banco de dados do SISBIO para Arraial do Cabo (RJ) e Fernando de Noronha (PE), Brasil
metadata.dc.contributor: Coutinho, Ricardo
Authors: Menezes, Rafael Gomes de
metadata.dc.contributor.advisor: Coutinho, Ricardo
Keywords: Biodiversidade
Espécie Exótica
Banco de Dados
DGPM knowledge areas: Ciência, Tecnologia e Inovação
Issue Date: 2019
Publisher: Instituto de Estudos do Mar Almirante Paulo Moreira (IEAPM)
Universidade Federal Fluminense (UFF)
Description: A Reserva Extrativista Marinha de Arraial do Cabo/RJ (ResexMar-AC) e o Parque Nacional Marinho de Fernando de Noronha/PE (ParnaMar-FN) são as duas Unidades de Conservação Federais marinhas com os maiores fluxos turísticos do Brasil. Há 10 anos, as pesquisas realizadas nessas Unidades têm sido mediadas e armazenadas pelo SISBio. Este trabalho propõe uma metodologia para síntese das informações recebidas pelos relatórios acumulados neste banco de dados. Para isso, foi desenvolvida uma ferramenta (BioMining) para aprimoramento da busca e processamento dos dados, utilizada também no suporte a algoritmos de aprendizado de máquina com modelos de classificação supervisionada de texto no contexto dos dados textuais do SISBio, que foram testados no âmbito desta dissertação. As informações dos relatórios foram classificadas em sete categorias: ‘Táxons’, ‘Locais’, ‘Impactos’, ‘Fiscalização’, ‘Monitoramento’, ‘Pesquisas futuras’, e ‘Ações de gestão’. O modelo linear SVM (Support Vector Machine) e o ensemble RFC (Random Forest Classifier) obtiveram as melhores acurácias na classificação dos textos, com a máxima atingida de 84%, e as categorias com menores precisões foram ‘Fiscalização’ e ‘Impactos’, devido à menor quantidade de amostras. O ParnaMar-FN apresentou uma quantidade de relatórios e uma média de palavras significativamente maiores, e isto estimulou um aumento da acurácia dos modelos de classificação de textos. Além disso, os dados sobre a biodiversidade das unidades sugerem que a ResexMar-AC possui um ambiente marinho mais rico (corroborando com a literatura), com destaque para os invertebrados sésseis, enquanto no ParnaMar-FN as pesquisas focam na megafauna (golfinhos, peixes e tartarugas). Dados presentes na literatura da área sugerem que as espécies listadas na ResexMar-AC possuem um maior potencial biotecnológico, com destaque para espécies exóticas e para espécies nativas consideradas exóticas em outros locais do mundo. O tema da bioinvasão se apresentou como bastante relevante em ambas unidades, sendo considerada como impactante e necessitária de monitoramento e pesquisas futuras, com destaque para os invertebrados marinhos na região da Enseada dos Anjos na ResexMar-AC, e os vertebrados terrestres no ParnaMar-FN. O turismo também se apresentou como uma das atividades mais reportadas como impactantes e deficitárias de fiscalização e de ordenamento nas unidades, ficando atrás das atividades pesqueiras na ResexMar-AC, conforme esperado, devido à diversidade de atividades extrativistas na unidade. Em virtude destes resultados, este trabalho tem o potencial de avançar no preenchimento das lacunas entre as descobertas científicas e as tomadas de decisão, evidencia algumas lacunas do conhecimento, e ressalta o potencial da ciência de dados no âmbito da conservação e biotecnologia marinha.
Abstract: The Marine Extractive Reserve of Arraial do Cabo/RJ (ResexMar-AC) and the Marine National Park of Fernando de Noronha/PE (ParnaMar-FN) are the two Federal Marine Conservation Units with the largest tourist flow in Brazil For the past 10 years, the results of the research conducted in these areas has been stored by the SISBio online system. Here we propose a synthesis methodology for the vast amount of reported information received and accumulated in this database. We developed a tool (BioMining) to improve the search and data processing, which is also used as support to machine learning algorithms with supervised text classification models in the context of SISBio textual data, which were tested and investigated. The reported information were classified into seven categories: 'Taxa', 'Location', 'Impacts', ‘Inspection’, 'Monitoring', 'Future researches', and 'Management actions'. The linear model SVM (Support Vector Machine) and the ensemble RFC (Random Forest Classifier) obtained the best accuracy in the classification of the texts, reaching the maximum of 84%, and the categories with less precision were 'Inspection' and 'Impacts', due to the smaller amount of samples. ParnaMar-FN presented a significantly larger number of reports and mean number of words, and this stimulated an increase in the accuracy of the text classification models. In addition, data on the biodiversity of the protected areas suggest that ResexMar-AC has a richer marine environment (corroborating with the literature), with emphasis on sessile invertebrates, while in ParnaMar-FN the surveys focus on the megafauna (dolphins, fishes and turtles). Available literature suggests that the species listed in the ResexMar-AC have a greater biotechnological potential, highlighting exotic species and native species considered exotic in other parts of the world. The bioinvasion presented itself as quite relevant in both units, being considered as impacting and a necessary target for monitoring and future researches, principally the marine invertebrates at Anjos Bay in Arraial do Cabo, and the terrestrial vertebrates in Fernando de Noronha Archipelago. Tourism also presented itself as one of the activities most reported as impacting and requiring inspection and planning in the units, after the fisheries activities in ResexMar-AC, as expected, due to the diversity of extractive activities in this unit. The results of this thesis enhances the potential in filling the gaps between scientific information and decision making, highlighting some knowledge gaps and the potential of data science in the field of marine biotechnology and conservation.
Access: Open access
URI: http://www.repositorio.mar.mil.br/handle/ripcmb/844259
Type: Master thesis
Appears in Collections:Ciência, Tecnologia e Inovação: Coleção de Dissertações

Files in This Item:
File Description SizeFormat 
Dissertacao Mestrado Rafael G Menezes.pdf25,71 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons