Compresión de datos generados por secuenciación de ADN por nanoporos
Supervisor(es): Martín, Alvaro - Dufort, Guillermo
Resumen:
La secuenciación de ADN es una de las tecnologías con mayor crecimiento y potencial dentro del siglo XXI. Dentro de este contexto, recientemente la empresa Oxford Nanopore Technologies desarrolló el dispositivo MinION, capaz de secuenciar cadenas de ADN a través de una tecnología novedosa que ofrece ventajas destacables sobre otras anteriores. Como es usual en los datos de secuenciación, los archivos generados (de formato fast5) tienen un tamaño promedio grande, lo cual dificulta su almacenamiento y transmisión. Para esto se apunta a la creación de un compresor de datos, desarrollado específicamente con el objetivo de minimizar el tamaño de este tipo de archivos. La metodología utilizada para evaluar los resultados es el desarrollo de un software usando el lenguaje C++, de nombre F5Comp, el cual es comparado con otros compresores específicos tanto para el formato fast5 como generales. Se comparan tanto tiempos de ejecución como tasas de compresión. Los resultados obtenidos de la comparación indican que F5Comp desarrollado específicamente para el formato fast5 tiene mejores resultados en cuanto a reducción de espacio de almacenamiento, al coste de tener mayores tiempos de ejecución.
2020 | |
Compresión de datos Nanoporos Secuenciación de ADN HDF5 FAST5 |
|
Español | |
Universidad de la República | |
COLIBRI | |
https://hdl.handle.net/20.500.12008/27339 | |
Acceso abierto | |
Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0) |
Sumario: | La secuenciación de ADN es una de las tecnologías con mayor crecimiento y potencial dentro del siglo XXI. Dentro de este contexto, recientemente la empresa Oxford Nanopore Technologies desarrolló el dispositivo MinION, capaz de secuenciar cadenas de ADN a través de una tecnología novedosa que ofrece ventajas destacables sobre otras anteriores. Como es usual en los datos de secuenciación, los archivos generados (de formato fast5) tienen un tamaño promedio grande, lo cual dificulta su almacenamiento y transmisión. Para esto se apunta a la creación de un compresor de datos, desarrollado específicamente con el objetivo de minimizar el tamaño de este tipo de archivos. La metodología utilizada para evaluar los resultados es el desarrollo de un software usando el lenguaje C++, de nombre F5Comp, el cual es comparado con otros compresores específicos tanto para el formato fast5 como generales. Se comparan tanto tiempos de ejecución como tasas de compresión. Los resultados obtenidos de la comparación indican que F5Comp desarrollado específicamente para el formato fast5 tiene mejores resultados en cuanto a reducción de espacio de almacenamiento, al coste de tener mayores tiempos de ejecución. |
---|