Name: | Description: | Size: | Format: | |
---|---|---|---|---|
1.64 MB | Adobe PDF |
Authors
Advisor(s)
Abstract(s)
The project “Parallel execution of pipelines using bioinformatic tools”, from now
on referred to as NGSPipesV2, is part of a platform that allows the creation and
execution of pipelines (set of tools to execute).
NGSPipesV2 extends the project “Infrastructure to support the execution of workflows
for bioinformatics”, from now on referred to as NGSPipesV1. NGSPipesV1
project was developed within the final project of the Licenciatura em Engenharia
Informática e de Computadores (LEIC) of Instituto Superior de Engenharia de
Lisboa (ISEL).
The main goal of both projects is to help the scientific community to perform
biological data processing using Next Generation Sequencing (NGS) techniques.
For this purpose, both NGSPipes projects supports the creation and execution of
pipelines (e.g. sequences of tasks), avoiding scientists to solve problems like installing
tools and their dependencies and write scripts in order to execute pipelines.
NGSPipesV2 extends NGSPipesV1 with the main objectives of adding support for
the parallel execution of pipelines, orchestrate the execution of pipelines in remote
clusters and improve the expressiveness of metadata for tools annotation.
O projeto “Execução paralela de fluxos de trabalho usando ferramentas bioinformáticas”, de agora em diante nomeado como NGSPipesV2, é parte de uma plataforma que permite criar e executar pipelines (conjunto de ferramentas para executar). NGSPipesV2 é uma extensão do projeto “Infraestrutura de suporte à execução de fluxos de trabalho para a bioinformática”, de agora em diante nomeado como NGSPipesV1. O projeto NGSPipesV1 foi desenvolvido no contexto do projeto final da Licenciatura em Engenharia Informática e de Computadores (LEIC) do Instituto Superior de Engenharia de Lisboa (ISEL). O objetivo principal de ambos os projetos NGSPipes é apoiar a comunidade científica a realizar o processamento de dados biológicos utilizando técnicas de Next Generation Sequensing (NGS). Para isto é suportada a criação e execução de pipelines, isto é sequências de tarefas, evitando que os cientistas tenham de resolver problemas tais como: a instalação de ferramentas e as suas dependências e escrever scripts para poder executar os seus fluxos de trabalho. NGSPipesV2 estende NGSPipesV1 com os objetivos principais de adicionar suporte para a execução de pipelines em paralelo, orquestrar a execução de pipelines em clusters remotos e melhorar a expressividade dos metadados para anotação das ferramentas.
O projeto “Execução paralela de fluxos de trabalho usando ferramentas bioinformáticas”, de agora em diante nomeado como NGSPipesV2, é parte de uma plataforma que permite criar e executar pipelines (conjunto de ferramentas para executar). NGSPipesV2 é uma extensão do projeto “Infraestrutura de suporte à execução de fluxos de trabalho para a bioinformática”, de agora em diante nomeado como NGSPipesV1. O projeto NGSPipesV1 foi desenvolvido no contexto do projeto final da Licenciatura em Engenharia Informática e de Computadores (LEIC) do Instituto Superior de Engenharia de Lisboa (ISEL). O objetivo principal de ambos os projetos NGSPipes é apoiar a comunidade científica a realizar o processamento de dados biológicos utilizando técnicas de Next Generation Sequensing (NGS). Para isto é suportada a criação e execução de pipelines, isto é sequências de tarefas, evitando que os cientistas tenham de resolver problemas tais como: a instalação de ferramentas e as suas dependências e escrever scripts para poder executar os seus fluxos de trabalho. NGSPipesV2 estende NGSPipesV1 com os objetivos principais de adicionar suporte para a execução de pipelines em paralelo, orquestrar a execução de pipelines em clusters remotos e melhorar a expressividade dos metadados para anotação das ferramentas.
Description
Projecto final para obtenção do grau de Mestre em Engenharia Informática e de Computadores
Keywords
NGSPipes Pipeline Fluxo de trabalho Execution Execução Tool metadata. Metadados das ferramentas
Citation
FLEITAS, Calmenelias Pino - Parallel execution of pipelines using bioinformatics tools. Lisboa: Instituto Superior de Engenharia de Lisboa, 2019. Dissertação de mestrado.
Publisher
Instituto Superior de Engenharia de Lisboa