A machine learning approach to predict gene expression signatures, local gene networks, and key genes for biological functions of interest.

Loading...
Thumbnail Image
Date
2015
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Un objetivo importante en la investigación biológica es descubrir genes relevantes para funciones biológicas de interés. Estas funciones pueden tener distintos grados de complejidad, desde procesos biológicos específicos a características complejas como “enfermedades metabólicas” en humanos o “tiempo de floración” en plantas. Esta tesis presenta “Discriminative Local Subspaces” (DLS), un método computacional que combina técnicas de aprendizaje de máquina supervisado y coexpresión para predecir redes de genes capaces de exponer nuevos genes y señalar cuáles son importantes para una función biológica de interés. Además presenta GENIUS, un servidor web que permite a la comunidad científica aprovechar las capacidades de DLS a través de una interfaz amistosa. En contraste con las redes de coexpresión tradicionales, DLS usa el conocimiento disponible en GeneOntology (GO) para generar conjuntos de entrenamiento informativos y guiar la búsqueda de “firmas de expresión”: patrones de expresión distintivos para los genes que participan en una función biológica de interés. Luego, DLS une los genes que se coexpresan con estas firmas para formar una red génica que contiene tanto genes conocidos como nuevos, para la función biológica de interés. Nuestras evaluaciones sistemáticas demuestran que DLS puede predecir genes nuevos con precisiones comparables a los métodos altamente discriminativos “Support Vector Maquines” (SVM), pero manteniendo la representación intuitiva e informativa que proveenlas redes de coexpresión. Más aún, nuestras evaluaciones muestran que, en contraste con estos métodos, DLS mejora su precisión sistemáticamente al aumentar la cantidad de datos experimentales disponibles. Además, nuestras evaluaciones en escenarios reales muestran que GENIUS puede realizar nuevos descubrimientos de manera efectiva. En particular,GENIUS predijo un nuevo gen, clave para mejorar la eficiencia del uso del nitrógeno en plantas, lo cual fue validado experimentalmente. Por lo tanto, creemos que GENIUS puede ayudar a generar hipótesis concretas a partir de conocimiento previo, realizar nuevos descubrimientos y, por lo tanto, mejorar nuestra comprensión molecular sobre los sistemas biológicos. GENIUS actualmente puede ser utilizado en ocho importantes organismos y es de libre acceso en http://networks.bio.puc.cl/genius.
Description
Tesis (Doctor in Engineering Sciences)--Pontificia Universidad Católica de Chile, 2015
Keywords
Citation