Búsqueda de genes utilizando modelos de Markov ocultos
Supervisor(es): Testuri, Carlos E.
Resumen:
Actualmente, la secuenciación de genomas de distintas especies plantea desafíos en el análisis e interpretación de volúmenes importantes de información sobre la composición de los mismos. Uno de los problemas es resolver qué regiones, dentro del genoma, constituyen genes (región de ADN que controla una característica hereditaria de un organismo). Una metodología es la descodificación de la información genética mediante la aplicación de modelos ocultos de Markov, a la búsqueda de genes. Los modelos ocultos de Markov permiten describir procesos con señales observables, modelando propiedades estadísticas estables de las mismas; permitiendo implementar sistemas de reconocimiento y predicción de las observaciones. El presente trabajo consiste en el desarrollo de una aplicación de búsqueda de secuencias de nucleótidos candidatas a clasificar como gen; la misma es extensible y consta de (a) un núcleo central que implementa los problemas de evaluación de secuencias y entrenamiento de modelos ocultos de Markov, el cual incorpora un esquema de utilización de memoria flexible, y (b) una interfaz gráfica a dichas implementaciones que específicamente resuelve el problema de identificar genes contenidos en un genoma. Los resultados prácticos obtenidos no son los que inicialmente se esperaban; no obstante, para los casos estudiados, se identificaron correctamente aproximadamente la mitad de los genes.
2005 | |
MODELOS DE MARKOV ADN |
|
Español | |
Universidad de la República | |
COLIBRI | |
http://hdl.handle.net/20.500.12008/3084 | |
Acceso abierto | |
Licencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC BY-NC-ND 4.0) |
Sumario: | Actualmente, la secuenciación de genomas de distintas especies plantea desafíos en el análisis e interpretación de volúmenes importantes de información sobre la composición de los mismos. Uno de los problemas es resolver qué regiones, dentro del genoma, constituyen genes (región de ADN que controla una característica hereditaria de un organismo). Una metodología es la descodificación de la información genética mediante la aplicación de modelos ocultos de Markov, a la búsqueda de genes. Los modelos ocultos de Markov permiten describir procesos con señales observables, modelando propiedades estadísticas estables de las mismas; permitiendo implementar sistemas de reconocimiento y predicción de las observaciones. El presente trabajo consiste en el desarrollo de una aplicación de búsqueda de secuencias de nucleótidos candidatas a clasificar como gen; la misma es extensible y consta de (a) un núcleo central que implementa los problemas de evaluación de secuencias y entrenamiento de modelos ocultos de Markov, el cual incorpora un esquema de utilización de memoria flexible, y (b) una interfaz gráfica a dichas implementaciones que específicamente resuelve el problema de identificar genes contenidos en un genoma. Los resultados prácticos obtenidos no son los que inicialmente se esperaban; no obstante, para los casos estudiados, se identificaron correctamente aproximadamente la mitad de los genes. |
---|