Raquel+Pascua

DETERMINACIÓN DE UNA PROTEÍNA DESCONOCIDA EN //Renibacterium salmoninarum// __**
 * __


 * __ ABSTRACT __**

Actualmente estamos viviendo una revolución a nivel de secuenciación y descripción de las innumerables proteínas que existen en la naturaleza. Estudios recientes intentan informar acerca de la función de muchas de estas proteínas. Podríamos estimar que poseemos conocimiento de aproximadamente el 75 % de las proteínas existentes en nuestro planeta, mientras que todavía queda un 25 % por conocer. Actualmente, hay numerosas investigaciones que se dedican al estudio de estas proteínas con función desconocida, ya que pueden ser la clave de multitud enfermedades que nos afectan. Muchas de estas enfermedades están causadas por patógenos y el estudio de los mismos nos permite un avance en las investigaciones de las enfermedades que provocan. //Renibacterium salmoninarum// es uno de ellos. Se trata del agente causante de una enfermedad renal bacteriana, y una amenaza de manera significativa para la producción sana y sostenible de los salmónidos en todo el mundo.

En este trabajo nos proponemos determinar la función de una de las hipotéticas proteínas hasta ahora descritas en este microorganismo. Para ello, primero se deben analizar las características más importantes de la proteína. A continuación, se realizará el análisis funcional de genes mediante la utilización de la genética reversa para conocer su función. Es muy importante poder introducir la proteína en un vector de clonación (plásmido) para poder trabajar con ella. Después, se pueden introducir mutaciones en el gen de dicha proteína, mediante recombinación simple, para observar qué aspectos de la bacteria se ven afectados. También se podría deleccionar parte del gen; pero en el caso de tratarse de una mutación letal, en la que si mutamos el gen el microorganismo se muere, no se podrá realizar ese estudio. En ese caso, deberemos utilizar otro tipo de técnicas. Una alternativa podría consistir en aumentar o disminuir la expresión del gen mediante la modificación de promotores, analizando los posibles resultados y observando que características se ven alteradas. Además se puede fusionar la proteína problema a un tag (tagging o epítope) para poder observar su localización y, de esta manera, ayudar en la identificación de la función. Incluso se le puede añadir el tag para que sea reconocido por anticuerpos y así poder purificarla. Al finalizar, se combinan todos los resultados para deducir la función de la proteína, hasta entonces desconocida. = =

= **__ INTRODUCCIÓN __** =

//Renibacterium salmoninarum// es una bacteria Gram positiva, perteneciente al grupo de las Actinobacterias. Se trata de un microorganismo de alto contenido en G+C. Si se realiza un cultivo, se puede observar que forma bacilos cortos que, con frecuencia, se asocian en parejas (diplobacilos) . Es aeróbia, catalasa positivo, citocromo oxidasa negativa, no es móvil, no produce ácido a partir de azúcares y no forma esporas. Todas las cepas requieren cisteína para el crecimiento. El crecimiento óptimo se produce a 15-18 ° C; el crecimiento es muy lento a 5 o 22°C, y no existe a 37°C. El crecimiento en todos los medios de cultivo es lento y a menudo requieren varias semanas de incubación. El análisis taxonómico sería: organismo celular; Bacteria ; Actinobacteria  ; Actinobacteria (clase)  ; Actinobacteridae  ; Actinomycetales  ; Micrococcineae  ; Micrococcaceae  ; Renibacterium  ; // [|Renibacterium salmoninarum] .//

Es un patógeno difícil de cultivar in vitro, la manipulación genética es un reto, y los tratamientos actuales y las estrategias preventivas son sólo marginalmente eficaces en la prevención de la enfermedad. El genoma completo de //R. salmoninarum// ATCC 33209 fue secuenciado y coincidió ser un cromosoma circular de 3.155.250 pares de bases, que se estima que contiene 3.507 marcos de lectura abierta (ORF). Debido a la existencia de nuevos retos en la investigación con este organismo, la secuenciación del genoma ha sido completada y analizada. Los resultados de los numerosos estudios realizados demuestran que la secuencia de este agente patógeno evolucionó, a través de la reducción genómica y adquisición horizontal de genes, de los miembros del género no patógeno //Arthrobacter sp;// existiendo, además, regiones de sintenia. Un conjunto limitado de factores de virulencia putativos, parecen haber sido adquiridos a través de la transmisión horizontal después de la divergencia de las especies. Estos factores incluyen polisacáridos capsulares, moléculas para el secuestro de grupos hemo, y han secretado el antígeno de superficie celular p57 (conocido como antígeno soluble mayor). También se han realizado exámenes en el genoma que han revelado una serie de ORFs homólogos a los genes de resistencia a los antibióticos, incluyendo los genes codificantes de β-lactamasas, de proteínas de eflujo, de glucosiltransferasas de macrólidos, y metiltransferasas de rRNA. La secuenciación del genoma proporciona nuevos conocimientos sobre la evolución de //R. salmoninarum// y puede facilitar la identificación de los objetivos de la quimioterapia y vacunas, que podrian utilizarse para la prevención y tratamiento de las infecciones en los cultivos. 

Loop-mediated isothermal amplification (LAMP) es una técnica novedosa para la amplificación de ácidos nucleicos. Posee una alta especificidad, sensibilidad y rapidez y no requiere un equipo costoso ni reactivos. Se ha desarrollado y evaluado un método LAMP para la detección rápida de //R. salmoninarum.// Este método es más sensible que la reacción en cadena de la polimerasa en tiempo real o PCR cuantitativa (qPCR) , aunque también puede ser detectada por ésta. Cepas aisladas de diferentes regiones forman un grupo muy homogéneo tanto en términos de sus propiedades morfológicas, bioquímicas, fisiológicas como antigénicas. La bacteria constituye una genoespiece altamente conservada, y los estudios en diferentes partes del mundo indican que existe una diversidad genética relativamente baja. Ha sido considerada como una especie estrictamente aerobia. Sin embargo, estudios recientes demuestran que //R. salmoninarum// crece mejor con una atmósfera microaerófila. De esta manera, el tamaño de las colonias es más grande y la cantidad de colonias mucoides aumenta en condiciones aeróbicas. El cultivo de microaerófilos podría ser una posibilidad para aumentar la sensibilidad del método de cultivo para la detección de este agente patógeno de crecimiento lento.

//R. salmoninarum// es uno de los pocos agentes bacterianos patógenos de vertebrados que se sabe que fue transmitido verticalmente por la infección durante la maduración del óvulo. Este patógeno puede también transmitirse horizontalmente a partir de peces infectados por compartir un abastecimiento de agua. La transmisión horizontal puede ser directa, a través del contacto con peces enfermos y con aguas contaminadas; también puede ser indirecta por intermedio de los equipos de faena o de la alimentación con residuos procedentes de criaderos de peces. La transmisión vertical es la vía más frecuente de contaminación. Las bacterias están presentes en los flujos ováricos y pueden ser la fuente que ha sido detectada en los huevos de algunas hembras salmónidas infectadas. Se reproduce en las poblaciones salvajes y cultivadas de salmónidos en casi todas las regiones y zonas donde tienen su hábitat natural o donde han sido aclimatados. No se ha aportado ninguna prueba concluyente respecto a la presencia de //R. salmoninarum// en la población de salmónidos de Australia, Nueva Zelanda, Rusia, o de algunos países del Mediterráneo. La profilaxis o prevención de la infección es difícil, debido en parte a la capacidad de la bacteria para sobrevivir a la fagocitosis y a que, posiblemente, se replica dentro de macrófagos.  Se trata del agente etiológico que causa la enfermedad renal bacteriana (ERB) que ocurren en todo tipo de salmónidos.  Esta bacteria vive tanto extra-celular e intra-celularmente en el huésped. Se necesita sólo un gramo de la bacteria para causar la enfermedad. Como métodos de diagnóstico se han desarrollado técnicas serológicas y moleculares para detectar un antígeno de la superficie de la bacteria, la proteína p57. Algunos peces infectados por la cohabitación, en los que la carga bacteriana era muy baja, sólo se detectaron mediante esta técnica. Se trata de una enfermedad crónica, una infección sistémica caracterizada por lesiones granulomatosas en el riñón y otros órganos. Esta bacteria está muy extendida en casi todos los países donde se cultivan salmónidos y también afecta a la naturaleza de las poblaciones de peces.

= =

=**__ MATERIALES Y MÉTODOS __**=

El objetivo de este trabajo es determinar la función de una proteína de //R. salmoninarum// hasta ahora desconocida. Para ello, se debe escoger la proteína que queremos analizar del genoma de la bacteria escogida. Analizaremos el contexto genético en el que se encuentra, así como sus características principales. Para ello nos ayudaremos de los diferentes programas bioinformáticos.

**//__ A.- Análisis del contexto genómico y de las propiedades de la proteína __//**
Del microorganismo //Renibacterium salmoninarum// ATCC 33209 escogemos una hipotética proteína, en nuestro caso RSal33209_0145.

El contexto genómico en el que podemos encontrar la proteína seleccionada se muestra en la figura 1. Es un contexto coherente para este análisis, ya que al trabajar con una bacteria se deben evitar los posibles efectos polares. En las bacterias existen los llamados operones, unidades genéticas funcionales formadas por un grupo o complejo de genes capaces de ejercer una regulación de su propia expresión, por medio de sustratos con los que interaccionan las proteínas codificadas por dichos genes. Como deseamos conocer la función de la proteína, se realizarán mutaciones para observar las modificaciones en la expresión; por lo que no se deben ver afectados otro tipo de genes. Los efectos polares son aquellos que se producen cuando al modificar una proteína, se ven afectadas el resto de las proteínas del operón. Por esto, evitaremos escoger una proteína que comparta el mismo cuadro de lectura con otras proteínas adyacentes. Se trata de una proteína de 351 aminoácidos, cuya secuencia posee un 61% de GC, y un 39% de AT. La secuencia génica de la proteína hipotética  RSal33209_0145 se muestra a continuación:

<span style="background-color: #ffffff; display: block; font-family: 'Courier New',Courier,monospace; font-size: 10pt; text-align: center;">ATGGCTAATCCGCTGCGTCGTTGGCAGGCCGAGTTGAAGAGCACCTTCACCGGCCAGGAAGAGTCACGGCCGG AATGGGTGGAGCGCCTTGCCGACGGCGACGACGCGGGCTACTTCACGGCGTCGTCAACCGTTTGGTCAGTTCA TTCGTCGATGATTACCATCGTTGCCGGCGTGCGCGCGTTACTAATGCAGGCACTGCACCCTGGCGCGCTGGCT GGCGTCTGGGACCACTCGCGCTTCCGCGAAGATCCCCTGGGTCGACTAGCCGGGACCATCCGGTGGATCTTCA GCGTCAGCTACGGATCAACCGCTACCGCCCAGGGCGCCTCCAATTGGGTCCTACGCCTTCATCAAACTGTGCG CGGCGATTTTGTTGACGGGCATGGTGTTAGCCGCCGCTATTCAGCCGCCGACCCTGAGCTACTGCGCTGGGTG CACATCGCCTTCATGGACGCCTTCTTGACCGCAAATCAGCGCTATGGTCGACGCGTCAACGGCGACACCTATG TGCGCGAGTGGGCCCAAGCCGGACAGCTGATGGGCGTTGCCGATGCCCCGCTAACCGAGGCGCAGATGCGCGC GGAACTGGGTCAATGGTTCGACGACGGCGATCTTCGCGCTGATGATCTAGTAGCCGAGGTGGTGGCGTTCATT CGCAACCCGCCGCTACCGCCGTCACAACGTGGTGGGTATCGGGTAATTTTCGCCGCTGCGGTGGACTCGTTGG ACCCTGAAGTATCGGCAGCTACTCGGCCTGCAACGGTCAAGATTTCCCTGGCTAACTCGTTGGAGCGTCAAAA CAGTGCTCGGCATTGTTCATCTGGGGCTGGGCAAAGTGGGACCCAGCCAACAAGCTGCGTTGCGGAGGATTGC GCGGCTTCAGCAAGAACCGTGAACCGACAGCAAAATGCCCCGATATTGGACGGAGCCGCTGAAATTTTGGCGG CTCCGTCCAATATCGGGGCAGGATTTGAAATAATTAGTGCTGTTCGCCTGTGGTCAGGTCCTGAGTCTGAACG ATCAAGCCACGCAATGAGCCCGTCACGCCCTTGA <span style="-moz-background-inline-policy: -moz-initial; background: none repeat scroll 0% 50% white; display: block; text-align: center;">Fig2.- Secuencia génica monocatenaria que codifica la proteína RSal33209_0145 de //R. salmoninarum//. La secuencia de la proteína se ha obtenido de la bases de datos de NCBI: [] Si traducimos esta secuencia con ayuda de un programa informático, el resultado es el siguiente:

MANPLRRWQAELKSTFTGQEESRPEWVERLADGDDAGYFTASSTVWSVHSSMITIVAGVRALL MQALHPGALAGVWDHSRFREDPLGRLAGTIRWIFSVSYGSTATAQGASNWVLRLHQTVRGDF VDGHGVSRRYSAADPELLRWVHIAFMDAFLTANQRYGRRVNGDTYVREWAQAGQLMGVAD APLTEAQMRAELGQWFDDGDLRADDLVAEVVAFIRNPPLPPSQRGGYRVIFAAAVDSLDPEV SAATRPATVKISLANSLERQNSARHCSSGAGQSGTQPTSCVAEDCAASARTVNRQQNAPILDG AAEILAAPSNIGAGFEIISAVRLWSGPESERSSHAMSPSRP *

Fig3.- Secuencia proteica de RSAL33209_0145 de //R. salmoninarum//. La secuencia se ha obtenido mediante    [|Your lab data]

Podemos realizar un Blast para comprobar si posee algún dominio conservado. Comprobamos que presenta un dominio conservado perteneciente a la superfamilia DUF2236. Este es un dominio conservado en varias proteínas con función desconocida de 145 especies diferentes, tanto eucariotas como procariotas. Otra región detectada es la COG3662, cuya función tampoco se conoce.

Para conocer los dominios conservados de la proteína, podemos hacer un alineamiento con alguna de las proteínas presentes en distintos microorganismos que posean los mismos dominios conservados :



Además, podemos utilizar otro tipo de programas bioinformáticos para realizar el alineamiento. Es el caso del MEGA 4.1.

Los microorganismos utilizados para este alineamiento son: //Renibacterium salmoninarum ATCC 33209; Arthrobacter aurescens TC1; Arthrobacter sp. FB24; Arthrobacter chlorophenolicus A6; Clavibacter michiganensis subsp. Sepedonicus; Clavibacter michiganensis subsp. Michiganensis; Sanguibacter keddieii DSM 10542.//

Podemos analizar los parámetros de la proteína gracias a un programa bioinformático: [|ExPASy ProtParam tool]. De esta manera conocemos que está formada por 351 aa, que posee un peso molecular de 38030.4 kDal y un punto isoeléctrico teórico de 5.93. Además nos informa de otras muchas características como son la composición,… Las características que nos proporciona ExPASy son:


 * Number of amino acids:** 351;**Molecular weight:** 38030.4;**Theoretical pI:** 5.93

Asn (N) 10= 2.8%; Asp (D) 20= 5.7%; Cys (C) 3= 0.9%; Gln (Q) 16= 4.6% ;Glu (E) 18= 5.1%; Gly (G) 28= 8.0%; His (H) 8= 2.3%; Ile (I) 13= 3.7%; Leu (L) 26= 7.4%; Lys (K) 2= 0.6%; Met (M) 7= 2.0%; Phe (F) 11= 3.1%; Pro (P) 18= 5.1%; Ser (S) 33= 9.4%; Thr (T) 17= 4.8%; Trp (W) 10= 2.8%; Tyr (Y) 6= 1.7%; Val (V) 25= 7.1%; Pyl (O) 0= 0.0%; Sec (U) 0= 0.0%; (B) 0= 0.0%; (Z) 0= 0.0%; (X) 0= 0.0%;
 * Amino acid composition:** Ala (A); 49= 14.0%; Arg (R) 31= 8.8%;


 * Total number of negatively charged residues (Asp + Glu):** 38
 * Total number of positively charged residues (Arg + Lys):** 33

Nitrogen N 498 Oxygen O 510 Sulfur S 10
 * Atomic composition:** Carbon C 166 Hydrogen H 2592


 * Formula:** C1662H2592N498O510S10 **Total number of atoms:** 5272

-Ext. coefficient 64065 Abs 0.1% (=1 g/l) 1.685, assuming all pairs of Cys residues form cystines -Ext. coefficient 63940 Abs 0.1% (=1 g/l) 1.681, assuming all Cys residues are reduced
 * Extinction coefficients:** Extinction coefficients are in units of M-1 cm-1, at 280 nm measured in water.

>20 hours (yeast, in vivo). >10 hours (Escherichia coli, in vivo).
 * Estimated half-life:** The N-terminal of the sequence considered is M (Met). The estimated half-life is: 30 hours (mammalian reticulocytes, in vitro).


 * Instability index:** The instability index (II) is computed to be 45.22 This classifies the protein as unstable.


 * Aliphatic index:** 77.95


 * Grand average of hydropathicity (GRAVY):** -0.256

Además podemos hacer un análisis de la secuencia de la proteína para conocer si se podría tratar de una proteína de membrana, una proteína coiled-coil, si se excreta o no… El análisis de esta proteína nos indica que no se trata de proteínas coiled coils, ya que en su secuencia no existen dominios que nos permitan esta configuración.



Además, podemos analizar la situación de la proteína. Deducimos que se trata de una proteína que debe ser excretada ya que la predicción es que se localiza en la parte exterior de la célula, pero que carece de péptido señal. Para conocer su situación, la existencia o no del péptido señal poseemos muchos métodos. Es necesario comprobarlo por cada uno de ellos, ya que de esta manera podremos asegurar mejor nuestras conclusiones. Para comprobar este resultado podemos analizar la existencia del péptido señal en toda la secuencia.

Prediction: Signal peptide Signal peptide probability: 0.623 Max cleavage site probability: 0.315 between pos. 26 and 27

Si analizamos la secuencia de la proteína y lo comparamos con las secuencias de corte de las enzimas de restricción conocidas, nos damos cuenta que posee numerosos cortes para varias enzimas. Podemos hacer una representación de estos posibles cortes.



**//__B.- Estudio de la función de la proteína.__//**
Nuestro método se basa en la introducción de fragmentos de DNA, uno de los cuales contendrá el gen de interés, en vectores. Éstos son moléculas de DNA (plásmidos o DNA de bacteriófagos) capaces tanto de transportar fragmentos ajenos a su estructura original como de multiplicarlos dentro de bacterias. Si se conoce un pequeño fragmento de la secuencia de aminoácidos de una proteína cuyo gen se desea "clonar" (multiplicar), se pueden diseñar métodos para identificar qué bacterias llevan el vector que transporta dicho gen.

Para ello es imprescindible el uso de la técnica de la reacción en cadena de la polimerasa, más conocida como PCR. Es una técnica que permite replicar entre cientos de miles y millones de veces, en el transcurrir de pocas horas e in vitro, pequeñas cantidades de DNA.
 * ===__**PCR: amplificación e introducción en un vector**__===

Una vez escogida la proteína y analizadas sus características, se necesita aumentar el número de copias del gen para poder llevar a cabo el estudio. Para ello realizamos una PCR (reacción en cadena de la polimerasa). El método se basa en la realización cíclica de tres reacciones sucesivas llevadas a cabo a distintas temperaturas. Estas reacciones se repiten cíclicamente. La muestra se calienta, en el primer paso, hasta lograr la separación de las dos cadenas que constituyen el DNA, hecho que se conoce como "desnaturalización". En el segundo paso, la temperatura se reduce hasta la denominada temperatura de anillamiento para permitir el "apareamiento" de los primers o cebadores, (oligonucleóridos), con cada una de las hebras separadas del DNA molde. Se trata de segmentos de DNA de cadena simple, sintetizados en el laboratorio y diseñados de tal manera que permiten definir los límites del segmento de DNA que se desea replicar. Obviamente, para que se pueda producir el apareamiento, cada uno de estos primers debe ser complementario del tramo al que tienen que unirse en las cadenas separadas del DNA molde. En tercer lugar, una enzima DNA polimerasa extiende los primers, en el espacio comprendido entre ambos, sintetizando las secuencias complementarias de las hebras del DNA molde. Para ello, la DNA polimerasa usa desoxidonucleósidos trifosfato (dNTPs) agregados a la mezcla de reacción. La temperatura a la que se realiza el tercer paso está condicionada por aquélla a la cual "trabaja" la enzima DNA polimerasa. Al cabo del primer ciclo de tres reacciones (desnaturalización, apareamiento, extensión) el tramo de DNA elegido se ha duplicado. El resultado de la aplicación de numerosos ciclos "en cadena" da lugar a la amplificación geométrica del segmento de DNA delimitado por los //primers//.

Uno de los aportes fundamentales de esta metodología a la investigación básica en biología molecular consiste, precisamente, en la rapidez y eficiencia mediante las cuales se realiza una tarea que antes requería largas y tediosas jornadas. El producto que se obtiene al finalizar la reacción -una gran cantidad de un fragmento génico con alto grado de pureza- favorece la tarea de los investigadores empeñados en ampliar nuestros conocimientos sobre la estructura y función de los genes. Las cantidades de los distintos reactivos que debemos añadir a la mezcla varían dependiendo del tipo de reacción que deseemos realizar. Sin embargo los reactivos que no deben faltar son: H2O, disolución Buffer, MgCl2, dNTPs, primer Forward, primer Reverse, polimerasa y DNA.

Para replicar el DNA en un principio se utilizaba la DNA polimerasa de la bacteria //Escherichia coli//. Pero esta enzima resultaba desactivada debido a la alta temperatura requerida para desnaturalizarla doble cadena del DNA, por lo cual debía agregarse enzima fresca al comenzar el tercer paso de cada ciclo. Este inconveniente fue solucionado cuando se la reemplazó por su equivalente de la bacteria "termófila" //Thermus aquaticus//. En efecto, la DNA polimerasa de este microorganismo, denominada Taq polimerasa, actúa eficientemente entre los 75° C y los 80° C y resiste más de dos horas a 93° C. De esta manera es posible mezclar todos los componentes de la PCR al comenzar el primer ciclo y la reacción en cadena puede llevarse a cabo mediante equipos automatizados que realizarán los ciclos térmicos programados. Esta polimerasa carece de función exonucleasa correctora y añade una cola de poliA a los amplificados, por lo que la polimerizaciones más inespecífica y podemos obtener mutaciones. Por ello, utilizaremos la Pfu o la Pwo polimerasa que son más específicas.

Para la realización de la PCR debemos encontrar los primers adecuados. Los primers deben contener entre 15 y 18 nucleótidos complementarios a la secuencia que queremos amplificar y terminar en un nucleótido C o G. Además deben poseer una temperatura de anillamiento similar. Nosotros hemos escogido:

- Primer directo: 5’- ATGGCTAATCCGCTGCG-3’ Temperatura de anillamiento: 54.3ºC - Primer reverso: 5’-TCAAGGGCGTGACGG-3’ Temperatura de anillamiento: 53ºC

En este caso la Temperatura de anillamiento del proceso seria 53ºC, ya que a una temperatura superior, el primer reverso no aparearía. Si colocamos los primers sobre la doble cadena de DNA para ver como aparearían el resultado seria el siguiente: Además como queremos introducir la secuencia en un vector de clonación deberemos introducir las secuencias de corte de las enzimas de restricción que nos permitan realizarlo. Por lo tanto, los primers estarán formados por la secuencia complementaria al DNA que queremos multiplicar, las secuencias de corte de las enzimas, y las secuencias que permitan que dicho corte sea eficaz

En nuestro caso, //Renibacterium salmoninarum// no presenta vectores de clonación adecuados (plásmidos), por lo que utilizaremos el plásmido pBR322 de //Escherichia coli.// Este plásmido posee una región que codifica la proteína que le hace tetraciclina resistente (TcR). En esta región se concentran los puntos de corte para la mayoría de las enzimas de restricción. Escogemos las enzimas BamHI y SalI, cuyas secuencias de corte son:



Normalmente las enzimas no cortan si solo añadimos la diana de corte. Existen secuencias que nos favorecen los cortes enzimáticos. Las secuencias que permiten realizar el corte con las enzimas escogidas son: Por lo tanto, los primers que utilizo para la amplificación por PCR son:

-Primer directo: 5’- CGCGGATCCATGGCTAATCCGCTGCG-3’ Temperatura de anillamiento: 67ºC -Primer reverso: 5’-ACGCGTCGATCAAGGGCGTGACGG-3’ Temperatura de anillamiento: 67,3 ºC

La situación analizada sería :

Una vez amplificado, corto con las enzimas de restricción los amplificados y los plásmidos. Los pongo en contacto y el fragmento de la secuencia de la proteína quedará inserto en la secuencia del plásmido.

A pesar de todo, muchas veces este proceso no se lleva a cabo debido a que las enzimas no cortan correctamente, o no se introduce correctamente en el plásmido. En estos casos se utilizan los plásmidos comerciales pGem T easy. Se trata de un plásmido artificialmente linealizado. En los extremos posee dianas de corte para numerosas enzimas y finaliza en extremos de timina (T) libres.



Por lo tanto, en la PCR deberemos utiliza la Taq polimerasa, ya que es la única que deja colas monocatenarias. De esta manera nuestro gen se introduce en el plásmido eficazmente.


 * ===__**Mutagénesis mediante plásmidos suicidas**__===

Para conocer la función de la proteína podemos alterar el gen que la codifica y observar los posibles cambios que pueden existir en la morfología, funcionalidad, crecimiento,… del microorganismo. Inicialmente lo podemos realizar mediante mutagénesis. Para ello, utilizamos plásmidos suicidas. Los plásmidos suicidas son aquellos que son incapaces de replicarse dentro del microorganismo, poseen una región interna del gen que queremos mutagenizar y se integran en el genoma de la bacteria mediante recombinación simple. Como pBR322 es un plásmido de //E. coli//, posiblemente sea un plásmido suicida para //R. salmoninarum.// Necesitamos seleccionar unos primers internos que nos permitan amplificar la región interna del gen de la proteína que estamos analizando. Después introduciremos los fragmentos en pBR322 y, como el plásmido es Ampicilina resistente (Amp R ), podremos seleccionar las mutadas y observar los posibles cambios. Es necesario que posea una región interna para que el gen no se complete cuando se inserte el plásmido. Si fuese un segmento de uno de los extremos los que introducimos en el plásmido, cuando se inserte el gen se mantendrá completo y no podremos observar los cambios. Para la búsqueda de los primers internos utilizamos un programa bioinformático Primer 3. Éste nos localiza los primers más adecuados para realizar la amplificación de la región interna. Por lo tanto, esos serán los primers utilizados en la amplificación por PCR del segmento interno.



Después de fabricar las secuencias, las introducimos en los plásmidos y con ellos transformamos las células. Como el plásmido es Ampicilina resistente (Amp R) podremos seleccionar las bacterias mutadas y, así, observar los posibles cambios en la estructura, funcionalidad, morfología, crecimiento,… Si tras sembrar 10 veces no obtenemos crecimiento, se trata de un gen esencial para el crecimiento y la mutación es letal para el microorganismo. En ese caso debemos hacer otro tipo de mutaciones para sobreexpresar el gen y subexpresarlo.

También podemos unir la proteína a un tag (epítope o tagging) para poder conocer su situación. El tag más utilizado es la proteína fluorescente verde (GFP). Podemos fusionar ambas proteínas mediante una PCR fusión. Al buscar cual es la secuencia del gen que codifica la proteína fluorescente verde, observamos que el marco de lectura en el cual se produce la GFP se sitúa en la cadena complementaria.. Por lo tanto, si hacemos la reversa y la complementaria la secuencia que debemos utilizar para realizar la PCR fusión es:
 * === **__PCR fusión__** ===



Los primers se construyen de manera que se pueda realizar correctamente el proceso de fusión. Es importante tener en cuenta que para que nuestro producto se pueda transcribir y traducir correctamente debemos eliminar el codón de Stop de la proteína problema. Los primers utilizados en la PCR fusión son:

- Primer 1: 5’- ATGGCTAATCCGCTGCGTCG-3’ Temperatura de anillamiento: 59,6 ºC - Primer 2: 5’-TCCTTTACTCATAGGGCGTGACGG-3’ Temperatura de anillamiento: 59,1 ºC - Primer 3: 5’- CACGCCCTATGAGTAAAGGAGAAGAAC -3’ Temperatura de anillamiento: 59,1 ºC - Primer 4: 5’- CTATTTGTATAGTTCATCCATGCCATGTG -3’ Temperatura de anillamiento: 57,3 ºC

Además hemos analizado los primers para calcular sus temperaturas de anillamiento y comprobar que las PCR se van a llevar a cabo correctamente. Si lo colocamos en las secuencias sería:



Y por lo tanto, el proceso seria el siguiente:

Y el resultado de la fusión sería:

Se podría añadir en las primers el sitio de corte de un enzima para introducirlo posteriormente en un plásmido.

En muchas ocasiones el microorganismo natural solo posee una copia del gen. Por eso cuando nosotros introducimos el plásmido con la proteína unida a GFP, no funciona igual que con la cepa silvestre. En estos casos lo que queremos es unir el gen de la GFP al gen silvestre del genoma de la bacteria. Para ello podemos utilizar o recombinación o plásmidos suicidas. Como hemos indicado anteriormente, si introducimos el final o el inicio de un gen mediante un plásmido suicida, a expresión de éste no se ve modificada. A veces esto no funciona y debemos introducir el gen completo, en vez del extremo 3’ únicamente. En ese caso obtendríamos un merodiploide, ya que poseería dos copias de un mismo gen.

También podemos formar un mutante de delección por PCR. Para ello deseamos eliminar la parte central de la proteína. A continuación se muestra la zona eliminada de la proteína como: ** ::::::::: **
 * ===__ **Mutante de delección por PCR** __===

El proceso de producción de mutantes mediante delección por PCR está muy relacionado con la fusión de proteínas por PCR. Cogemos la secuencia de DNA que codifica nuestra proteína y diseñamos los primers para llevar a cabo el proceso. Los primers utilizados en la PCR fusión son: - Primer 1: 5’-ATGGCTAATCCGCTGCGTCGTTG-3’ - Primer 2: 5’- CGGCTACTAGAGGCGTAGGACCC -3’ - Primer 3: 5’-TCCTACGCCTCTAGTAGCCGAGGT 3’ - Primer 4: 5’-TCAAGGGCGTGACGGGCTC -3’ Las temperaturas de anillamiento serian: - Para el primer 1: 61,9 ºC - Para el primer 2: 61,7 ºC - Para el primer 3: 61,8 ºC - Para el primer 4: 61,4 ºC

Si lo colocamos en las secuencias en un esquema representativo de nuestro gen, la situación sería:



El resultado del proceso de delección sería el siguiente: Por lo que habríamos eliminado el segmento central de la proteína. Si hubiesemos añadido unos sitios de corte en los primers 1 y 4 en la última PCR, podríamos incluirlos en un plásmido y observar los posibles efectos.


 * ===__ **Sobreexpresión y subexpresión del gen.** __===

Cuando las mutaciones en la proteína son letales, podemos modificar la expresión modificando el promotor. Podemos colocar un promotor muy fuerte o uno muy débil y observaremos que funciones se ven alteradas. El proceso que debemos seguir se basa en recombinación y plásmidos suicidas. Si hacemos que recombine el extremo 5´ de nuestro gen con un plásmido suicida en el que hemos introducido un promotor más o menos activo, conseguiremos modificar la expresión de nuestro gen. Mediante la técnica de PCR también podemos producir mutagénesis en la secuencia génica de la proteína. Ésta técnica nos permite introducir una mutación en un lugar deseado. Para ello se requiere de dos primers mutagénicos que solapen y otros dos primers que apareen correctamente. Tenemos una molécula de DNA, y lo vamos a separar en dos reacciones de PCR. En una de ellas introducimos los dos cebadores, uno complementario (primer directo) y otro complementario salvo en un nucleótido (primer reverso). Me va a generara moléculas que hayan introducido la mutación. En la otra PCR introduzco un cebador 3 que presente la mutación complementaria al primer 2 y un primer 4 que aparee correctamente con el extremo del gen. Después desnaturalizo ambos productos y los pongo en contacto. Se forman estructuras de doble cadena parcial. Con una polimerasa, alargo las cadenas en el sentido 5’ --> 3’ obteniendo productos de doble cadena. La secuencia se ha alterado en un único nucleótido.
 * ===__** Mutación de un aa. **__===

Con el alineamiento realizado anteriormente, podemos observar diferentes dominios conservados. Observamos que hay aminoácidos que se conservan en todos los microorganismos. Por ejemplo, en nuestro caso se conserva el ácido aspártico, entre otros. Mediante una técnica de PCR vamos a modificar ese ácido aspártico por otro aminoácido, la alanina. Así podremos observar cómo se ve modificada la función de la proteína. Generalmente los dominios más conservados son aquellos que son muy importantes en la función de la enzima, y por eso se conservan. Escogemos un amioácido que esté conservado en los siete individuos que estamos analizando. Por ejemplo, el ácido aspártico que está marcado en rojo en el alineamiento. Vamos a sustituirlo por una alanina.

MANPLRRWQAELKSTFTGQEESRPEWVERLADGDDAGYFTASSTVWSVHSSMITIVAGVRALL MQALHPGALAGVWDHSRFREDPLGRLAGTIRWIFSVSYGSTATAQGASNWVLRLHQTVRGDF V__ D __GHGVSRRYSAADPELLRWVHIAFMDAFLTANQRYGRRVNGDTYVREWAQAGQLMGVA DAPLTEAQMRAELGQWFDDGDLRADDLVAEVVAFIRNPPLPPSQRGGYRVIFAAAVDSLDP EVSAATRPATVKISLANSLERQNSARHCSSGAGQSGTQPTSCVAEDCAASARTVNRQQNAP ILDGAAEILAAPSNIGAGFEIISAVRLWSGPESERSSHAMSPSRP

El ácido aspártico es uno de los veinte aminoácidos y se encuentra codificado por los codones: GAU o GAC. Por otro lado, la alanina se encuentra codificada por los codones GCU, GCC, GCA y GCG. En el gen, la localización del ácido aspártico se muestra a continuación.

<span style="-moz-background-inline-policy: -moz-initial; background: none repeat scroll 0% 50% white; display: block; text-align: center;">ATGGCTAATCCGCTGCGTCGTTGGCAGGCCGAGTTGAAGAGCACCTTCACCGGCCAGGAAG AGTCACGGCCGGAATGGGTGGAGCGCCTTGCCGACGGCGACGACGCGGGCTACTTCACGG CGTCGTCAACCGTTTGGTCAGTTCATTCGTCGATGATTACCATCGTTGCCGGCGTGCGCGCG TTACTAATGCAGGCACTGCACCCTGGCGCGCTGGCTGGCGTCTGGGACCACTCGCGCTTCC GCGAAGATCCCCTGGGTCGACTAGCCGGGACCATCCGGTGGATCTTCAGCGTCAGCTACGG ATCAACCGCTACCGCCCAGGGCGCCTCCAATTGGGTCCTACGCCTTCATCAAACTGTGCGC GGCGATTTTGTT**__ GAC __**GGGCATGGTGTTAGCCGCCGCTATTCAGCCGCCGACCCTGAGCTA CTGCGCTGGGTGCACATCGCCTTCATGGACGCCTTCTTGACCGCAAATCAGCGCTATGGTC GACGCGTCAACGGCGACACCTATGTGCGCGAGTGGGCCCAAGCCGGACAGCTGATGGG CGTTGCCGATGCCCCGCTAACCGAGGCGCAGATGCGCGCGGAACTGGGTCAATGGTTCG ACGACGGCGATCTTCGCGCTGATGATCTAGTAGCCGAGGTGGTGGCGTTCATTCGCAACC CGCCGCTACCGCCGTCACAACGTGGTGGGTATCGGGTAATTTTCGCCGCTGCGGTGGACT CGTTGGACCCTGAAGTATCGGCAGCTACTCGGCCTGCAACGGTCAAGATTTCCCTGGCTA ACTCGTTGGAGCGTCAAAACAGTGCTCGGCATTGTTCATCTGGGGCTGGGCAAAGTGGG ACCCAGCCAACAAGCTGCGTTGCGGAGGATTGCGCGGCTTCAGCAAGAACCGTGAACC GACAGCAAAATGCCCCGATATTGGACGGAGCCGCTGAAATTTTGGCGGCTCCGTCCAAT ATCGGGGCAGGATTTGAAATAATTAGTGCTGTTCGCCTGTGGTCAGGTCCTGAGTCTGAA CGATCAAGCCACGCAATGAGCCCGTCACGCCCTTGA

Por lo tanto, deseamos realizar un cambio de un nucleótido: Para ello, seguiremos el procedimiento anteriormente descrito basado en la utilización de tres PCRs. Los primers utilizados en dichas PCRs son: - Primer 1: 5’-ATGGCTAATCCGCTGCGTCGTTG-3’ - Primer 2: 5’- GCCCGGCAACAAAATCGCCG -3’ - Primer 3: 5’- TTTGTTGCCGGGCATGGTGTTAG 3’ - Primer 4: 5’-TCAAGGGCGTGACGGGCTC -3’ Las temperaturas de anillamiento serian: - Para el primer 1: 61,9 ºC - Para el primer 2: 62,1 ºC - Para el primer 3: 60,4 ºC - Para el primer 4: 61,4 ºC

Si lo colocamos estos primers en la secuencia obtendríamos: El resultado seria:

Existe una manera más rápida de obtener la secuencia de nuestra proteína mutada. Además nos permitiría realizar varias mutaciones puntuales sin necesidad de realizar tres PCR para cada una de ellas. Este método consiste en introducir nuestro gen con las dianas de restricción dentro de un plásmido. Si hacemos una PCR con los primers mutados y complementarios, obtengo una descendencia de plásmidos mutados.

Para conocer la función de la proteína es necesario purificarla. Si se purifica la proteína de interés mediante las técnicas convencionales (HPLC, centrifugación,…) se tardarían meses y la cantidad de proteína que se obtendría sería mínima. Actualmente existen técnicas de biología molecular más modernas que nos permiten hacerlo en pocas semanas. El método consiste en introducir un epítopo (región de una proteína reconocida por un anticuerpo). El método se denomina epitope tagging. Los tags más importantes son: His5, FLAG y GST, entre otros. Nosotros utilizaremos His5. Consiste en añadirle a la proteína una cola de cinco histidinas. Para ello utilizaremos el plásmido pET21. En bacterias no existe ninguna proteína que posea una cola de histidinas de manera natural. Por lo tanto, cuando la purifiquemos con la ayuda de anticuerpos no separaremos ninguna proteína junto con la nuestra.
 * ===__**Purificación de la proteína**__===

Necesitamos cortar pET21 con dos enzimas de restricción, y al incluir la proteína en el plásmido, siempre que hayamos eliminado el codón de stop, la proteína quedará unida a una cola de histidinas.

Para poder introducir nuestra proteína en éste plásmido, debemos incluir un sitio de corte en los primers de la PCR, para cualquiera de las enzimas que cortan cerca de la cola de Histidinas. Además debemos tener en cuenta que nuestro gen no debe contener el codón de Stop para que la proteína se pueda unir a la cola de Histidinas.

Nosotros vamos a cortar con EcoR1 y Hind III. El método de corte de estas enzimas es el siguiente:

Para permitir el corte mediante estas enzimas de restricción, debemos añadir una serie de nucleótidos característicos de cada diana de reconocimiento.

Por lo tanto, los primers utilizados serán: Primer directo: 5’-CCGGAATTCATGGCTAATCCGCTGCG - 3’ Primer reverso: 5’-CCCAAGCTTAGGGCGTGACGG -3’ Debemos analizar la temperatura de anillamiento de los primers para conocer si la PCR se va a llevar a cabo correctamente. Para el primer 1 la temperatura de anillamiento es 62.7 ºC y para el primer 2 la temperatura es 62 ºC.

La situación sería: = = == Hasta ahora tenemos las secuencias de las proteínas y la del plásmido. Buscamos las secuencias de las enzimas de restricción en el plásmido y eliminamos el fragmento comprendido entre ambas:

Ahora añadiremos nuestro inserto, una vez añadido las secuencias de corte adecuadas. Si nos damos cuenta, estamos trabajando con la cadena reversa del plásmido. Observamos que los sitios de corte están invertidos. Nos ayuda conocer la situación de las enzimas de restricción: ==

Por lo tanto, deberemos trabajar con la cadena reversa de nuestro gen a la que debemos eliminar el codón de stop. TCA AGGGCGTGACGGGCTCATTGCGTGGCTTGATCGTTCAGACTCAGGACC TGACCACAGGCGAACAGCACTAATTATTTCAAATCCTGCCCCGATATTGGAC GGAGCCGCCAAAATTTCAGCGGCTCCGTCCAATATCGGGGCATTTTGCTGT CGGTTCACGGTTCTTGCTGAAGCCGCGCAATCCTCCGCAACGCAGCTTGTT GGCTGGGTCCCACTTTGCCCAGCCCCAGATGAACAATGCCGAGCACTGTT TTGACGCTCCAACGAGTTAGCCAGGGAAATCTTGACCGTTGCAGGCCGA GTAGCTGCCGATACTTCAGGGTCCAACGAGTCCACCGCAGCGGCGAAATT ACCCGATACCCACCACGTTGTGACGGCGGTAGCGGCGGGTTGCGAATGA ACGCCACCACCTCGGCTACTAGATCATCAGCGCGAAGATCGCCGTCGTCG AACCATTGACCCAGTTCCGCGCGCATCTGCGCCTCGGTTAGCGGGGCATC GGCAACGCCCATCAGCTGTCCGGCTTGGGCCCACTCGCGCACATAGGTG TCGCCGTTGACGCGTCGACCATAGCGCTGATTTGCGGTCAAGAAGGCGTC CATGAAGGCGATGTGCACCCAGCGCAGTAGCTCAGGGTCGGCGGCTGAA TAGCGGCGGCTAACACCATGCCCGTCAACAAAATCGCCGCGCACAGTTTG ATGAAGGCGTAGGACCCAATTGGAGGCGCCCTGGGCGGTAGCGGTTGATC CGTAGCTGACGCTGAAGATCCACCGGATGGTCCCGGCTAGTCGACCCAGG GGATCTTCGCGGAAGCGCGAGTGGTCCCAGACGCCAGCCAGCGCGCCAG GGTGCAGTGCCTGCATTAGTAACGCGCGCACGCCGGCAACGATGGTAATCA TCGACGAATGAACTGACCAAACGGTTGACGACGCCGTGAAGTAGCCCGCGT CGTCGCCGTCGGCAAGGCGCTCCACCCATTCCGGCCGTGACTCTTCCTGGCC GGTGAAGGTGCTCTTCAACTCGGCCTGCCAACGACGCAGCGGATTAGCCAT

A continuación le añadiremos los sitios de corte, cortaremos con la enzima para poder insertarlo en el plásmido:

AGCTTAGGGCGTGACGGGCTCATTGCGTGGCTTGATCGTTCAGACTCAGGACCTGACCACA GGCGAACAGCACTAATTATTTCAAATCCTGCCCCGATATTGGACGGAGCCGCCAAAATTTC AGCGGCTCCGTCCAATATCGGGGCATTTTGCTGTCGGTTCACGGTTCTTGCTGAAGCCGCGC AATCCTCCGCAACGCAGCTTGTTGGCTGGGTCCCACTTTGCCCAGCCCCAGATGAACAATG CCGAGCACTGTTTTGACGCTCCAACGAGTTAGCCAGGGAAATCTTGACCGTTGCAGGCCGA GTAGCTGCCGATACTTCAGGGTCCAACGAGTCCACCGCAGCGGCGAAAATTACCCGATACC CACCACGTTGTGACGGCGGTAGCGGCGGGTTGCGAATGAACGCCACCACCTCGGCTACTAG ATCATCAGCGCGAAGATCGCCGTCGTCGAACCATTGACCCAGTTCCGCGCGCATCTGCGCC TCGGTTAGCGGGGCATCGGCAACGCCCATCAGCTGTCCGGCTTGGGCCCACTCGCGCACAT AGGTGTCGCCGTTGACGCGTCGACCATAGCGCTGATTTGCGGTCAAGAAGGCGTCCATGAA GGCGATGTGCACCCAGCGCAGTAGCTCAGGGTCGGCGGCTGAATAGCGGCGGCTAACACC ATGCCCGTCAACAAAATCGCCGCGCACAGTTTGATGAAGGCGTAGGACCCAATTGGAGGCG CCCTGGGCGGTAGCGGTTGATCCGTAGCTGACGCTGAAGATCCACCGGATGGTCCCGGCTA GTCGACCCAGGGGATCTTCGCGGAAGCGCGAGTGGTCCCAGACGCCAGCCAGCGCGCCA GGGTGCAGTGCCTGCATTAGTAACGCGCGCACGCCGGCAACGATGGTAATCATCGACGAAT GAACTGACCAAACGGTTGACGACGCCGTGAAGTAGCCCGCGTCGTCGCCGTCGGCAAGGC GCTCCACCCATTCCGGCCGTGACTCTTCCTGGCCGGTGAAGGTGCTCTTCAACTCGGCCTGC CAACGACGCAGCGGATTAGCCATG

Añadimos todo el inserto y comprobamos que se han recuperado los sitios de corte. Necesitamos comprobar que se mantiene la estructura del plásmido, que se ha insertado nuestra proteína y que nuestra proteína se ha fusionado a una cola de histidinas.

La secuencia actual del plásmido se muestra a continuación:



Después de haber introducido la secuencia de la proteína, gracias al programa [|NEB cutter 2.0], podemos comprobar que nuestra proteína se ha insertado correctamente y se haya añadido la cola de histidinas. El nuevo mapa del plásmido seria el siguiente:

Podemos observar que nuestra proteina, marcada como ha se ha introducido entre los dos cortes de EcoR1 y Hind III.

Al final nos quedaría una proteína de 364 aminoácidos cuya secuencia es:

MANPLRRWQA ELKSTFTGQE ESRPEWVERL ADGDDAGYFT ASSTVWSVHS SMITIVAGVR ALLMQALHPG ALAGVWDHSR FREDPLGRLA GTIRWIFSVS YGSTATAQGA SNWVLRLHQT VRGDFVDGHG VSRRYSAADP ELLRWVHIAF MDAFLTANQR YGRRVNGDTY VREWAQAGQL MGVADAPLTE AQMRAELGQW FDDGDLRADD LVAEVVAFIR NPPLPPSQRG GYRVIFAAAV DSLDPEVSAA TRPATVKISL ANSLERQNSA RHCSSGAGQS GTQPTSCVAE DCAASARTVN RQQNAPILDG AAEILAAPSN IGAGFEIISA VRLWSGPESE RSSHAMSPSR PKLAAALEHH HHHH

Por lo tanto, ahora podremos purificarla mediante técnicas de inmunodetección basadas en la utilización de anticuerpos.

=**__ RESULTADOS __**=

En este apartado, resumiremos todos los resultados obtenidos mediante los métodos descritos anteriormente.

Del microorganismo //Renibacterium salmoninarum// ATCC 33209 escogemos una hipotética proteína, en nuestro caso RSal33209_0145. Se trata de una proteína de 351 aminoácidos, cuya secuencia posee un 61% de GC, y un 39% de AT. Presenta un dominio conservado perteneciente a la superfamilia DUF2236. Este es un dominio conservado en varias proteínas con función desconocida de 145 especies diferentes, tanto eucariotas como procariota Entre las principales características podemos destacar que posee un peso molecular de 38030.4 kDal y un punto isoeléctrico teórico de 5.93. La estimación de su vida media se corresponde con: 30 horas para cultivos in vito; más de 20 horas para cultivos in vivo en lebaduras y mas de 10 horas in vivo en //Escherichia coli//. Posee una inestabilidad de tipo II, cuyo índice se estima en 45.22, por lo que se clasifica como proteína inestable.Además, podemos deducir que no se trata de una proteína coiled coil; es una proteína que se encuentra en el exterior de la bacteria pero que no posee péptido líder. De ser una proteína que se excretael sitio en el que existe una mayor más probabilidad de poseer el péptido señal está situado entre la posición 26 y 27 de la secuencia de nucleótidos del gen de la proteína. Además si lo analizamos con TMHMM result comprobamos que la proteína se encuentra en el exterior de la bacteria.

Del resto de procesos, podemos deducir su importancia para la célula, si es un gen imprescindible para la supervivencia,... Hemos podido purificarla y analizar su estructura.

= = =**__ TABLAS Y GRÁFICAS __**=


 * Se ha utilizado un código de una letra para los aminoácidos.




 * Las distintas proteínas utilizadas para realizar el alineamiento entre las proteínas pertenecientes a la misma familia que la seleccionada son:

// - Renibacterium salmoninarum ATCC 33209// MANPLRRWQAELKSTFTGQEESRPEWVERLADGDDAGYFTASSTVWSVHSSMITIVAGVRALLMQALHPGALAGVWDHSRFREDPLGRLAGTIRWIFSVSYGSTATAQGASNWVLRLHQ TVRGDFVDGHGVSRRYSAADPELLRWVHIAFMDAFLTANQRYGRRVNGDTYVREWAQAGQLMGVADAPLTEAQMRAELGQWFDDGDLRADDLVAEVVAFIRNPPLPPSQRGGYRVIFA AAVDSLDPEVSAATRPATVKISLANSLERQNSARHCSSGAGQSGTQPTSCVAEDCAASARTVNRQQNAPILDGAAEILAAPSNIGAGFEIISAVRLWSGPESERSSHAMSPSRP

// - Arthrobacter aurescens TC1// MGFMRNYLAEYRHELQRTFTGTSGTPPEWVPRLAEGNDAGYHLPGSAVWAVHGHVATIVAGIRVLLMQALHPGALAGVYEHSGFQKDPLGRLANTVRWIFTVTYGSTEAAEAATARVRKIHER VRGTYVDGNGVTREYAANDPELLRWVHVTYADSFITANRIWGRPIPGGPDAYVREWAAAGRLMGVENPPLTEVQVHQELEQWYASGILRADERLAETVSFIRYPPLSPLLKPGYSILFAAAVASLEP RYREMLGIRRAGLGPLPLPVITAARAVLGM VRFALGSHGPSEQAARRRLQRLGYAA

// - Arthrobacter sp. FB24// MPGWVPLLEEGDDAGYHLPGSAVWAVHGSMTTIVAGIRALLMQALHPGALAGVHDHSRFRDDPLGRLAGTIRWIFTVSYGSTSAARAASGWVLRLHESVRGEYVDAHGVKRSYAANDPELLRWVH IAFTDAFLSAHKIWGRPIPGGPDAYVREWAQAGLLMGVDSPPLSEAEMRQQLDRWYDDGDLRTDERVAEIVAFIRNPPLHPSLRPGYRMLFAAAVSSLEPKYRDMLGLRPPRLGPLPLPVRFGTKVTLA VVQLALGGGGRGRRVGPSEQAARRRLRRLGFAA

// - Arthrobacter chlorophenolicus A6// MRSFLRKWQGEIRRTFTGRSDAPPDWAVRLEEGDDAGYHHPGSAVWAVHGSMSPIVAGIRTLLMQSLHPGALTGVHEHSNFREDPLGRLAHTIRWIFTVTYGSREAAEEASGRVRRMHVPVHGTYDD NDGQARSYSANDPHLAGWIHIAFTDAFLASHKIWGGPVPGGPDAYVREWAQAGRLMGVERPPMTEGEMRAELDRWYESGQLRSDHRVAETVEFIRKAPLHPMLRPGYRVLFAGAVYSLEPRYREMLG LSVPRLGPFPLPVRLATKAVLGVVRLTLGPRGPSEIAARARLLRLGMAAPDA

// - Clavibacter michiganensis subsp. sepedonicus// MDVSRFADRWKSHILETFSADAQGRPQWIQDLEDGDDAGWFGPGSAVWAVHGGMPTLVAGIRALLMQTLHPGAMAGVHDWSRYREDPLGRLAGTVRWVITTSFGDRDTAVDVSRRVRGYHRKVQ GTFVDGHGVERPYSANDPDLLSWVHIVFTDAFLSTHMQWGPSIPGGPDRYVAEWAKAGELMGVEAPPRSHAELHAQIDAFHDQGLLRADERTRETISFLREPPLRPSMLPAYRVLFAGAVASLEPRYRELLG LDKASFGPFPLPALASTRVMLGVAGRVMGEQSTSHEAALKRIARLQGGTGASSSGAPAGTCPGRGDDAGHRAQPAA

// - Clavibacter michiganensis subsp. michiganensis// MDVSRFADRWKSHILETFSADSEGRPQWIQDLEDGDDAGWFGPGSAVWAVHGGMPTLVAGIRALLMQTLHPGAMAGVHDWSRYREDPLGRLAGTVRWVITTSFGDRDTAVDVSRRVRGYHRKVQG TYVDGHGVERPYSANDPDLLAWVHMVFTDAFLSTHMQWGPPIPGGPDRYVAEWAKAGELMGVEAPPRSHAELHAQIDAFHDQGLLRADERTRETISFLREPPLRASMLPAYRVLFAGAVASLEPRYRQLL GLDRASFGPFPLPALASTRVMLGVAGRVMGEQSTSHEAALKRIARLEGGSSASAPDGAAEPCPGRGDDTGHRAQPAA // - Sanguibacter keddieii DSM 10542// MTDTWRSHLLTTFSGDDAGKPAWVEKMAEGDDAGYFGPGSAAWAVHGGTATLIAGIRALLLQTLHPGAMAGVHDWSRYQEDPLGRLSGTIRWLLTVTFGDTTQARTESNRVGRYHHRVVGTYVDATGT ERPYTAGDPELLAWVHVVFTDAFLTCDQIWGGDIPGGADQYVREWATAGELVGVEDPPRSQAELTAAFAAFRPAMKSDERVAEAVRFIRNPPLRRSMMPAYRVLFAGAVASIPADQRRMLGLRRPWWP AITANRAVLWGVGLILGKSSTSEDAARSRIDRLHRAAADEPS


 * La secuencia del gen que codifica la proteína fluorescente verde es la siguiente :



La flecha indica el sentido de lectura, el marco de lectura en el cual se produce la GFP. Por lo tanto si hacemos la reversa y la complementaria :




 * Además podemos analizar la estructura de los plásmidos utilizados en el trabajo.



También podemos analizar la secuencia de dichos mapas.

= = =**__ REFERENCIAS __**=