Compresión de datos generados por secuenciación de ADN por nanoporos

Izquierdo, Nicolás - Larghero, Gonzalo

Supervisor(es): Martín, Alvaro - Dufort, Guillermo

Resumen:

La secuenciación de ADN es una de las tecnologías con mayor crecimiento y potencial dentro del siglo XXI. Dentro de este contexto, recientemente la empresa Oxford Nanopore Technologies desarrolló el dispositivo MinION, capaz de secuenciar cadenas de ADN a través de una tecnología novedosa que ofrece ventajas destacables sobre otras anteriores. Como es usual en los datos de secuenciación, los archivos generados (de formato fast5) tienen un tamaño promedio grande, lo cual dificulta su almacenamiento y transmisión. Para esto se apunta a la creación de un compresor de datos, desarrollado específicamente con el objetivo de minimizar el tamaño de este tipo de archivos. La metodología utilizada para evaluar los resultados es el desarrollo de un software usando el lenguaje C++, de nombre F5Comp, el cual es comparado con otros compresores específicos tanto para el formato fast5 como generales. Se comparan tanto tiempos de ejecución como tasas de compresión. Los resultados obtenidos de la comparación indican que F5Comp desarrollado específicamente para el formato fast5 tiene mejores resultados en cuanto a reducción de espacio de almacenamiento, al coste de tener mayores tiempos de ejecución.


Detalles Bibliográficos
2020
Compresión de datos
Nanoporos
Secuenciación de ADN
HDF5
FAST5
Español
Universidad de la República
COLIBRI
https://hdl.handle.net/20.500.12008/27339
Acceso abierto
Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)