Estudio de la relación secuencia / estructura / función en dominios catalíticos de polimerasas de ADN.

Loading...
Thumbnail Image
Date
2013
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
La clasificación de proteínas en familias comienza con el trabajo propuesto por Dayhoff en la década de los 70. Desde entonces la clasificación basada en secuencia ha sido el método principal para el agrupamiento de proteínas. En general las familias proteicas manifiestan una diversidad contenida en sus secuencias, no obstante existen casos conocidos donde la divergencia puede llegar a los límites de la detección por parte de los métodos basados en secuencia. El hallazgo de Chothia y Lesk en la década de los 80 (la estructura es más conservada que la secuencia), permite la introducción de la información estructural en los sistemas de clasificación de proteínas. Sin embargo su uso se vio restringido por la gran diferencia entre estructuras y secuencias disponibles. Pese a que esta diferencia aún existe, en la actualidad es posible encontrar familias de proteínas para las cuales existe una gran cantidad de estructuras resueltas y que además poseen gran divergencia a nivel de secuencia (e.g globinas, polimerasas de ADN). Estas familias constituyen buenos modelos para mejorar nuestro entendimiento de la relación secuencia/estructura/función en proteínas. De particular interés son las polimerasas de ADN, debido a que participan en una función esencial en los sistemas biológicos, constituyen un gen muy antiguo en la historia de la evolución, cuentan con una gran cantidad de estructuras disponibles, y además concentran un interés biotecnológico asociado. Inicialmente, las polimerasas de ADN fueron clasificadas en tres familias (A, B y C) de acuerdo a la similitud a nivel de secuencia con tres genes de polimerasas de E. coli (polA, polB y polC). A principios de los 90, se efectúa la primera revisión de su clasificación, resultando en una extensión a las familias D y X (polimerasas pertenecientes a euriarqueotas y similares a polimerasa beta de humanos, respectivamente). A fines de esta década una nueva extensión de la clasificación se hace necesaria con el descubrimiento de polimerasas involucradas en la reparación de daño por radiación UV (familia Y). En síntesis, actualmente se acepta una clasificación en 6 familias de polimerasas (A, B, C, D, X e Y), mediante un criterio basado en la similitud de sus secuencias únicamente. Miembros de distintas familias comparten muy baja similitud entre ellos, por debajo de los límites de detección confiables. También se ha observado que dentro de una misma familia es posible detectar gran diversidad de secuencias. En la literatura se ha demostrado cuantitativamente que alineamientos de secuencias muy disímiles (porcentaje de identidad de secuencia menor a 30%) contienen un número considerable de aminoácidos mal alineados. En consecuencia, surge el cuestionamiento de la validez de la clasificación actual de las polimerasas de ADN, dado que ésta ha sido construida en base a comparaciones entre proteínas remotamente relacionadas que presentan una baja similitud de secuencia. En contraposición a esta diversidad a nivel de secuencia, el depósito de estructuras cristalizadas de polimerasas revela similitudes importantes a nivel estructural entre enzimas que pertenecen a distintas familias. Por tanto, es posible que existan relaciones entre familias de polimerasas de ADN que aún no han sido descritas debido a una limitación tecnológica en el estudio de tales relaciones. En esta tesis doctoral, se realizó un estudio sistemático de las relaciones estructurales en los dominios catalíticos de polimerasas de ADN utilizando herramientas avanzadas de comparación estructural (i.e. alineamientos estructurales). Considerando que la estructura de las proteínas es más conservada que su secuencia, este tipo de técnica permite indagar en relaciones de similitud estructural y evolutivas de proteínas con alta divergencia a nivel de sus secuencias, como es el caso de las polimerasas de ADN. Además esta información puede ser utilizada para mejorar la relación señal-ruido en alineamientos de secuencia incrementando la sensibilidad y especificidad en la detección de relaciones remotas. Los resultados obtenidos muestran que a nivel de cadenas completas y dominios catalíticos funcionales, la clasificación propuesta en familias sigue siendo válida, aunque la variación estructural observada es mayor que la esperada inicialmente, mostrando que existe diversidad dentro de familias tanto a nivel de secuencias como a nivel estructural. Por otra parte, a nivel de dominios estructurales, las palmas corresponden al dominio más conservado, detectándose relaciones entre las palmas de las familias A,B e Y, mientras que las palmas de las familias C y X forman grupos estructurales independientes. La comparación del dominio de pulgares y dedos muestran que éstos corresponden a los dominios con mayor grado de variación estructural y de secuencia. Adicionalmente, la clasificación de polimerasas de ADN no se respeta cuando se realizan agrupamientos con esta clase de dominios estructurales. Por otra parte se detectaron relaciones cruzadas entre dedos y pulgares de diferentes familias. En el caso de los dedos de la familia A y pulgares de la familia B, los datos obtenidos sugieren que estos segmentos no son análogos estructurales. Por otra parte los dedos de la familia X y pulgares de la familia Y presentan una similitud estructural que además pudo ser comprobada mediante análisis de alineamientos de múltiples secuencias derivados de la estructura. No obstante, esta relación no pudo ser recuperada cuando se emplearon alineamientos de secuencia derivados por métodos tradicionales, mostrando que la estrategia de alineamientos estructurales mejora la relación señal-ruido en la detección de relaciones remotas. Finalmente, los resultados de esta comparación cruzada de dedos de familia X y pulgares de familia Y, sugieren que estos segmentos son análogos estructurales. Por último la información recopilada de las comparaciones estructurales fue resumida en un mapa de relaciones estructurales de polimerasas de ADN donde se muestran no sólo las relaciones a nivel de dominios estructurales, sino también complementada con los dominios accesorios presentes en polimerasas de ADN. La evidencia recopilada, sugiere que las cinco familias de polimerasas para las que se tiene estructura se habrían originado en tres eventos independientes, lo que se fundamenta en la existente de tres grupos estructurales principales: el grupo formado por polimerasas de las familias A, B e Y, las polimerasas de la familia C y las polimerasas de la familia X.
Description
Tesis (Doctor en Ciencias Biológicas, mención Genética Molecular y Microbiología)--Pontificia Universidad Católica de Chile, 2013
Keywords
Citation