Biblioteca genómica, Historia, Construcción de la biblioteca Genómica, Tipos de vectores, ¿Cómo seleccionar un vector, Aplicaciones



Una biblioteca genómica es una colección de ADN genómico total a partir de un solo organismo. El ADN se almacena en una población de vectores idénticos, cada uno que contiene un inserto de ADN diferente. Con el fin de construir una biblioteca genómica, el ADN del organismo se extrae de las células y luego se digirió con una enzima de restricción para cortar el ADN en fragmentos de un tamaño específico. Los fragmentos se insertan en el vector usando la enzima, ADN ligasa. A continuación, el ADN del vector puede ser tomado por un organismo huésped-comúnmente una población de Escherichia coli o de levadura-con cada célula que contiene sólo una molécula de vector. Uso de una célula huésped para llevar el vector permite la fácil amplificación y recuperación de clones específicos de la biblioteca para el análisis.

Hay varios tipos de vectores disponibles con varias capacidades de inserción. En general, las bibliotecas realizadas a partir de organismos con genomas más grandes requieren vectores que ofrecen insertos más grandes, con lo que se necesitan menos moléculas de vector para hacer la biblioteca. Los investigadores pueden elegir un vector también teniendo en cuenta el tamaño del inserto ideal para encontrar un número deseado de clones necesarios para la cobertura del genoma completo.

Las bibliotecas genómicas se usan comúnmente para aplicaciones de secuenciación. Ellos han jugado un papel importante en toda la secuenciación del genoma de varios organismos, incluyendo el genoma humano y varios organismos modelo. Las bibliotecas genómicas también se utilizan en estudios de comparación entre diferentes especies.

Historia

El primer genoma basado en el ADN secuenciado en su totalidad nunca se logró por el dos veces ganador del Premio Nobel, Frederick Sanger, en 1977 - Sanger y su equipo de científicos crearon una biblioteca del bacteriófago Phi X 174, para su uso en la secuenciación del ADN. La importancia de este éxito contribuyó a la demanda cada vez mayor para la secuenciación de genomas a la terapia génica investigación. Los equipos son ahora capaces de catalogar polimorfismos en los genomas e investigar los genes candidatos que contribuyen a enfermedades tales como la enfermedad de Parkinson, la enfermedad de Alzheimer, la esclerosis múltiple, la artritis reumatoide, y la diabetes Tipo 1. Estos son debido al avance de los estudios de asociación del genoma completo de la capacidad de crear y bibliotecas secuencia genómica. Antes, la vinculación y el candidato-gen estudios fueron algunas de las únicas aproximaciones.

Construcción de la biblioteca Genómica

Construcción de una biblioteca genómica implica la creación de muchas moléculas de ADN recombinantes. ADN genómico de un organismo se extrae y luego se digirió con una enzima de restricción. Para los organismos con genomas muy pequeños, los fragmentos digeridos se pueden separar por electroforesis en gel. Los fragmentos se separaron a continuación, pueden ser extirpados y se clonaron en el vector separado. Sin embargo, cuando un gran genoma se digiere con una enzima de restricción, hay demasiados fragmentos a impuestos especiales individualmente. El conjunto de fragmentos debe ser clonado junto con el vector, y la separación de los clones puede ocurrir después. En cualquiera de los casos, los fragmentos se ligaron en un vector que ha sido digerido con la misma enzima de restricción. El vector que contiene los fragmentos insertados de DNA genómico a continuación, se puede introducir en un organismo huésped.

A continuación se presentan los pasos para la creación de una biblioteca genómica de un gran genoma.

  • Extraer y purificar el ADN.
  • Se digiere el ADN con una enzima de restricción. Esto crea fragmentos que son similares en tamaño, cada uno conteniendo uno o más genes.
  • Insertar los fragmentos de ADN en vectores que fueron cortados con el mismo enzima de restricción. Utilice la enzima ADN ligasa para sellar los fragmentos de ADN en el vector. Esto crea un gran número de moléculas recombinantes.
  • Estas moléculas recombinantes son tomados por una bacteria hospedadora por transformación, la creación de una biblioteca de ADN.
  • A continuación se muestra un diagrama de los pasos que se describen arriba.

    La determinación de título de la biblioteca

    Después de una biblioteca genómica se construye con un vector viral, tales como el fago lambda, el título de la biblioteca se puede determinar. Cálculo del título permite a los investigadores para aproximar el número de partículas virales infecciosas se crearon con éxito en la biblioteca. Para hacer esto, las diluciones de la biblioteca se utilizan para transfectar cultivos de E. coli de concentraciones conocidas. Los cultivos se sembraron en placas de agar y se incubaron durante la noche. El número de placas virales se cuentan y se puede utilizar para calcular el número total de partículas virales infecciosas en la biblioteca. La mayoría de vectores virales también llevan un marcador que permite a los clones que contienen un inserto a ser distinguidos de aquellos que no tienen un inserto. Esto permite a los investigadores determinar también el porcentaje de partículas virales infecciosas en realidad que llevan un fragmento de la biblioteca.

    Un método similar se puede utilizar para titular las bibliotecas genómicas realizadas con vectores no virales, tales como plásmidos y BACs. Una ligadura de prueba de la biblioteca se puede utilizar para transformar E. coli. La transformación se extiende entonces en placas de agar y se incubó durante toda la noche. El título de la transformación se determina contando el número de colonias presentes sobre las placas. Estos vectores tienen generalmente un marcador seleccionable que permite la diferenciación de los clones que contienen un inserto de aquellos que no lo hacen. Al hacer esta prueba, los investigadores también pueden determinar la eficiencia de la ligadura y hacer ajustes según sea necesario para asegurarse de que obtener el número deseado de clones de la biblioteca.

    Biblioteca Screening

    Con el fin de aislar los clones que contienen las regiones de interés a partir de una biblioteca, la biblioteca primero debe estar apantallado. Un método de detección es la hibridación. Cada célula huésped transformada de una biblioteca contendrá sólo un vector con un inserto de ADN. Toda la biblioteca se puede sembró en placas sobre un filtro sobre los medios de comunicación. El filtro y las colonias se preparan para la hibridación y después se marcan con una sonda. La diana de ADN-inserto de interés-puede ser identificado por la detección tales como autorradiografía debido a la hibridación con la sonda como se ve a continuación.

     Otro método de detección es con la reacción en cadena de polimerasa. Algunas bibliotecas se almacenan como grupos de clones y el cribado por PCR es una forma eficaz de identificar las piscinas que contienen clones específicos.

    Tipos de vectores

    El tamaño del genoma varía entre los diferentes organismos y el vector de clonación se debe seleccionar en consecuencia. Para un gran genoma, un vector con una gran capacidad debería ser elegido de modo que un número relativamente pequeño de clones son suficientes para la cobertura de todo el genoma. Sin embargo, a menudo es más difícil de caracterizar un inserto contenido en un vector de mayor capacidad.

    A continuación se muestra una tabla con varios tipos de vectores de uso común para las bibliotecas genómicas y el tamaño de inserción que cada uno tiene en general.

    Los plásmidos

    Un plásmido es una molécula de ADN circular de doble cadena comúnmente utilizado para la clonación molecular. Los plásmidos son generalmente de 2 a 4 kilobases de pares de longitud y son capaces de llevar insertos de hasta 15kb. Los plásmidos que contienen un origen de replicación permitiendo que se replican en el interior de una bacteria de forma independiente del cromosoma del huésped. Los plásmidos comúnmente llevan un gen de resistencia a los antibióticos que permite la selección de células bacterianas que contienen el plásmido. Muchos plásmidos también llevan un gen reportero que permite a los investigadores a distinguir los clones que contienen un inserto de aquellos que no lo hacen.

    El fago lambda

    Phage? es un virus de ADN de doble cadena que infecta E. coli. El? cromosoma es 48.5kb largo y puede transportar insertos hasta 25kb. Estos insertos sustituyen secuencias virales no esenciales en el? cromosoma, mientras que los genes necesarios para la formación de partículas virales y la infección se mantienen intactos. El inserto de ADN se replica con el ADN viral, por lo que, en conjunto se empaquetan en partículas virales. Estas partículas son muy eficientes en la infección y multiplicación que conduce a una mayor producción de la recombinante? cromosomas. Sin embargo, debido al tamaño del inserto más pequeño, bibliotecas hacen con? fago puede requerir muchos clones para la cobertura completa del genoma.

    Cósmidos

    Vectores cósmidos son plásmidos que contienen una pequeña región del bacteriófago? DNA llama la secuencia cos. Esta secuencia permite el cósmido a envasar en el bacteriófago? partículas. Estas partículas que contienen una linealizado cósmido-se introduce en la célula huésped mediante transducción. Una vez dentro del huésped, los cósmidos circularize con la ayuda de ligasa de ADN del huésped y, a continuación la función como plásmidos. Los cósmidos son capaces de llevar insertos de hasta 45kb de tamaño.

    Vectores del bacteriófago P1

    Vectores de bacteriófago P1 pueden contener insertos 70 - 100kb de tamaño. Comienzan como moléculas de ADN lineales empaquetados en partículas de bacteriófago P1. Estas partículas se inyectan en una cepa de E. coli que expresa la recombinasa Cre. El vector lineal se convierte en P1 circularizó por recombinación entre dos sitios loxP en el vector. P1 vectores contienen generalmente un gen de resistencia a los antibióticos y un marcador de selección positiva para distinguir los clones que contienen un inserto de aquellos que no lo hacen. P1 vectores también contienen un plásmido replicón P1, que asegura sólo una copia del vector está presente en una célula. Sin embargo, hay un segundo replicón P1-P1 llama el replicón-lítico que es controlado por un promotor inducible. Este promotor permite la amplificación de más de una copia del vector por célula antes de la extracción de ADN.

    Cromosomas artificiales P1

    P1 cromosomas artificiales tienen características de los vectores P1 y cromosomas artificiales bacterianos. Similares a los vectores P1, que contienen un plásmido y un replicón lítico como se describió anteriormente. A diferencia de vectores P1, ellos no necesitan ser empaquetados en partículas de bacteriófago para la transducción. En su lugar, se introdujeron en E. coli en forma de moléculas de ADN circular a través de electroporación tal como BAC son. También similar a BAC, estos son relativamente más difíciles de preparar debido a un único origen de replicación.

    Cromosomas artificiales bacterianos

    Cromosomas artificiales bacterianos son moléculas circulares de ADN, generalmente cerca de 7 kb de longitud, que son capaces de mantener insertos de hasta 300 kb de tamaño. Vectores BAC contienen un replicón derivado de E. coli factor F, lo que asegura que se mantienen a una copia por célula. Una vez que un inserto se ligó en un BAC, el BAC se introduce en cepas deficientes de recombinación de E. coli por electroporación. La mayoría de los vectores BAC contienen un gen de resistencia a los antibióticos y también un marcador de selección positiva. La figura de la derecha representa un vector de BAC de ser cortado con una enzima de restricción, seguido por la inserción de ADN extraño que se re-recocido por una ligasa. En general, este es un vector muy estable, pero puede ser difícil de preparar debido a un único origen de replicación como PACs.

    Cromosomas artificiales de levadura

    Cromosomas artificiales de levadura son moléculas de ADN lineales con las características necesarias de un cromosoma de levadura auténtica, incluyendo los telómeros, un centrómero, y un origen de replicación. Grandes insertos de ADN se pueden ligar en el medio del YAC de modo que no es un "brazo" del YAC a cada lado de la pieza de inserción. El YAC recombinante se introduce en levadura por transformación; marcadores seleccionables presentes en el YAC permiten la identificación de los transformantes exitosos. YAC pueden contener inserciones hasta 2000KB, pero la mayoría de bibliotecas YAC contienen insertos 250-400kb de tamaño. Teóricamente no hay un límite superior en el tamaño de insertar un YAC puede contener. Se trata de la calidad en la preparación de ADN utilizado para las inserciones que determina el límite de tamaño. El aspecto más difícil de utilizar YAC es el hecho de que son propensos a la reordenación.

    ¿Cómo seleccionar un vector

    La selección de vector requiere uno para asegurar la biblioteca hecho es representativo de todo el genoma. Cualquier inserción del genoma derivado de una enzima de restricción debe tener las mismas posibilidades de estar en la biblioteca en comparación con cualquier otro inserto. Además, las moléculas recombinantes deben contener grandes insertos suficientes que garanticen el tamaño de la biblioteca es capaz de ser manejada convenientemente. Esto se determina en particular por la cantidad de clones necesarios para tener en una biblioteca. La cantidad de clones para obtener una muestra de todos los genes se determina por el tamaño del genoma del organismo, así como el tamaño medio de inserto. Esto se representa por la fórmula:

    donde,

     es el número necesario de recombinantes

     es la probabilidad de que cualquier fragmento deseado en el genoma se producirá al menos una vez en la biblioteca creada

     es la proporción fraccional del genoma en un único recombinante

     puede ser demostrado además ser:

    donde,

     es el tamaño de inserto

     es el tamaño del genoma

    Por lo tanto, aumentando el tamaño del inserto permitiría un menor número de clones necesarios para representar un genoma. La proporción del tamaño del inserto en comparación con el tamaño del genoma representa la proporción de la respectiva genoma en un solo clon. Aquí es la ecuación con todas las partes consideradas:

    Selección de ejemplo Vector

    La fórmula anterior se puede utilizar para determinar el nivel de confianza del 99% que todas las secuencias en un genoma se representan mediante el uso de un vector con un tamaño de inserto de veinte mil pares de bases. El tamaño del genoma del organismo es tres mil millones de pares de bases en este ejemplo.

     clones

    Por lo tanto, se requieren aproximadamente 688.060 clones para garantizar un 99% de probabilidad de que una secuencia dada de ADN a partir de este genoma tres mil millones de pares de bases estará presente en una biblioteca utilizando un vector con un tamaño de inserto de veinte mil pares de bases.

    Aplicaciones

    Después se crea una biblioteca, el genoma de un organismo puede ser secuenciado para dilucidar cómo afectan los genes de un organismo o para comparar organismos similares en el nivel de genoma. Los estudios de asociación del genoma completo antes mencionados pueden identificar genes candidatos procedentes de muchos rasgos funcionales. Los genes pueden ser aislados a través de bibliotecas genómicas y utilizarse en líneas celulares humanas o modelos animales para la investigación adicional. Por otra parte, la creación de clones de alta fidelidad con la representación-y precisa del genoma sin problemas de estabilidad-contribuiría así como productos intermedios para la secuenciación de escopeta o el estudio de genes completos en el análisis funcional.

    Secuenciación jerárquica

    Un uso importante de las bibliotecas genómicas es secuenciación escopeta hierarchichal, que también se llama de arriba hacia abajo, o mapa basado en la secuenciación de clon por clon. Esta estrategia fue desarrollada en la década de 1980 para la secuenciación de genomas completos antes de técnicas de alto rendimiento para la secuenciación estaban disponibles. Los clones individuales de las bibliotecas genómicas pueden ser cortados en fragmentos más pequeños, por lo general de 500 pb a 1000 pb, que son más manejables para la secuenciación. Una vez que un clon de una biblioteca genómica se secuencia, la secuencia se puede utilizar para rastrear la biblioteca para otros clones que contienen insertos que se solapan con el clon secuenciado. Los nuevos clones solapantes pueden secuenciarse luego formando un contig. Esta técnica, denominada paseo cromosómico, puede ser explotado para la secuencia de cromosomas enteros.

     Secuenciación del genoma escopeta entera es otro método de secuenciación del genoma que no requiere una biblioteca de vectores de alta capacidad. Más bien, se utiliza algoritmos informáticos para ensamblar secuencia corta lee para cubrir todo el genoma. Las bibliotecas genómicas se utilizan a menudo en combinación con la secuenciación del genoma completo por esta razón escopeta. Un mapa de alta resolución puede ser creado por secuenciación de ambos extremos de los insertos de varios clones en una biblioteca genómica. Este mapa proporciona secuencias de distancias conocidas aparte, que pueden ser utilizados para ayudar con el conjunto de la secuencia de lecturas adquirido a través de la secuenciación de escopeta. La secuencia del genoma humano, que se declaró en el año 2003, se reunió con ambos una biblioteca BAC y secuenciación escopeta.

    Los estudios de asociación del genoma completo

    Los estudios de asociación del genoma completo de las aplicaciones generales de encontrar objetivos y polimorfismos genéticos específicos dentro de la raza humana. De hecho, el proyecto internacional HapMap se crea a través de una asociación de científicos y agencias de varios países para catalogar y utilizar estos datos. El objetivo de este proyecto es comparar las secuencias genéticas de diferentes individuos para aclarar las similitudes y las diferencias dentro de las regiones cromosómicas. Los científicos de todas las naciones participantes están catalogando estos atributos con los datos de población de ascendencia africana, asiática y europea. Esas evaluaciones del genoma puede dar lugar a terapias más diagnósticos y medicamentos a la vez que ayuda a los equipos futuros se centran en la orquestación de la terapéutica con características genéticas en mente. Estos conceptos ya están siendo explotados en la ingeniería genética. Por ejemplo, un equipo de investigación ha construido en realidad un vector lanzadera PAC que crea una biblioteca que representa una cobertura de dos veces del genoma humano. Esto podría servir como un recurso increíble para identificar genes o conjuntos de genes, que causa la enfermedad. Por otra parte, estos estudios pueden servir como una forma poderosa para investigar la regulación transcripcional, ya que se ha visto en el estudio de baculovirus. En general, los avances en la construcción de la biblioteca genómica y secuenciación del ADN ha permitido el descubrimiento eficiente de diferentes dianas moleculares. La asimilación de estas funciones a través de tales métodos eficientes puede acelerar el empleo de nuevos fármacos candidatos.