Análisis de secuencias repetidas de ADN en el lenguado Solea senegalensis mediante tratamiento de datos procedentes de NGS (Next Generation Sequencing)

Identificadores
Statistics
Share
Metadata
Show full item recordAuthor/s
Benítez Mateo, ÁlvaroDate
2018-09-05Advisor
Cross Pacheco, Ismael
Department
Bioquímica y Biología Molecular, Microbiología, Medicina Preventiva, Salud PúblicaAbstract
Los elementos repetitivos conforman un gran porcentaje del genoma de los seres vivos.
Además, suponen un enorme impacto en la regulación génica, la inactivación y eliminación de
genes, en la estructura cromosómica y en la evolución de los genomas. Por otra parte, el rápido
desarrollo de las tecnologías de secuenciación masiva de genomas permite obtener una gran
cantidad de información que ha de ser tratada con herramientas bioinformáticas para poder ser
anotada y organizada. Por todo ello, se han analizado cuatro paquetes de datos procedentes de la
secuenciación del transcriptoma de Solea senegalensis mediante la plataforma Galaxy-
RepeatExplorer, siendo esta una especie de pez de gran importancia económica y que está
siendo estudiada a fin de solucionar los problemas que rodean su cría en cautividad.
Los análisis de los datos han permitido obtener más de 2.500 clusters indicativos de
posibles elementos repetitivos, de los cuales se han analizado los 32 más significativos. Así, se
han encontrado varios elementos que pueden constituir satélites y retrotransposones que no se
hallaban en las bases de datos consultadas, mostrándose este como un sistema muy eficiente de
identificación y caracterización de posibles elementos repetitivos de novo en especies no
modelo. Además, una vez establecido el proceso, se ha generado un diagrama de trabajo o
workflow que recoge los diferentes pasos llevados a cabo con las herramientas disponibles en la
plataforma Galaxy-RepeatExplorer para llegar a obtener los resultados mostrados. Repetitive elements constitute a large percentage of the genome of the living thing genomes. In addition, they have a huge impact on gene regulation, gene inactivation and deletion, chromosome structure and genome evolution. On the other hand, the rapid development of next genome sequencing technologies makes it possible to obtain a large amount of information that needs to be treated with bioinformatics tools in order to be recorded and organized. Therefore, four data packages from the sequencing of the Solea senegalensis transcriptome using the Galaxy-RepeatExplorer platform have been analysed. This is a species of fish of great economic importance and is being studied in order to solve the problems related with its captive breeding.
Data analysis has allowed to compilate over 2500 indicative clusters of possible repetitive elements, the 32 most important of these have been analyzed. Thus, several elements have been found that can constitute satellites and retrotransposons that were not found in the databases consulted, showing this as a very efficient system of identification and characterization of possible repetitive elements de novo in non-model species in a fast way. In addition, once the process has been established, a working diagram or workflow has been generated that gathers the different steps carried out with the tools available in the Galaxy-RepeatExplorer platform to obtain the results shown.