Vaz, Cátia RaquelSimão, JoséFleitas, Calmenelias Pino2020-12-102020-12-102019-12-12FLEITAS, Calmenelias Pino - Parallel execution of pipelines using bioinformatics tools. Lisboa: Instituto Superior de Engenharia de Lisboa, 2019. Dissertação de mestrado.http://hdl.handle.net/10400.21/12436Projecto final para obtenção do grau de Mestre em Engenharia Informática e de ComputadoresThe project “Parallel execution of pipelines using bioinformatic tools”, from now on referred to as NGSPipesV2, is part of a platform that allows the creation and execution of pipelines (set of tools to execute). NGSPipesV2 extends the project “Infrastructure to support the execution of workflows for bioinformatics”, from now on referred to as NGSPipesV1. NGSPipesV1 project was developed within the final project of the Licenciatura em Engenharia Informática e de Computadores (LEIC) of Instituto Superior de Engenharia de Lisboa (ISEL). The main goal of both projects is to help the scientific community to perform biological data processing using Next Generation Sequencing (NGS) techniques. For this purpose, both NGSPipes projects supports the creation and execution of pipelines (e.g. sequences of tasks), avoiding scientists to solve problems like installing tools and their dependencies and write scripts in order to execute pipelines. NGSPipesV2 extends NGSPipesV1 with the main objectives of adding support for the parallel execution of pipelines, orchestrate the execution of pipelines in remote clusters and improve the expressiveness of metadata for tools annotation.O projeto “Execução paralela de fluxos de trabalho usando ferramentas bioinformáticas”, de agora em diante nomeado como NGSPipesV2, é parte de uma plataforma que permite criar e executar pipelines (conjunto de ferramentas para executar). NGSPipesV2 é uma extensão do projeto “Infraestrutura de suporte à execução de fluxos de trabalho para a bioinformática”, de agora em diante nomeado como NGSPipesV1. O projeto NGSPipesV1 foi desenvolvido no contexto do projeto final da Licenciatura em Engenharia Informática e de Computadores (LEIC) do Instituto Superior de Engenharia de Lisboa (ISEL). O objetivo principal de ambos os projetos NGSPipes é apoiar a comunidade científica a realizar o processamento de dados biológicos utilizando técnicas de Next Generation Sequensing (NGS). Para isto é suportada a criação e execução de pipelines, isto é sequências de tarefas, evitando que os cientistas tenham de resolver problemas tais como: a instalação de ferramentas e as suas dependências e escrever scripts para poder executar os seus fluxos de trabalho. NGSPipesV2 estende NGSPipesV1 com os objetivos principais de adicionar suporte para a execução de pipelines em paralelo, orquestrar a execução de pipelines em clusters remotos e melhorar a expressividade dos metadados para anotação das ferramentas.engNGSPipesPipelineFluxo de trabalhoExecutionExecuçãoTool metadata.Metadados das ferramentasParallel execution of pipelines using bioinformatics toolsmaster thesis202551490