Veronica+Giacintucci

Verónica Trabajo de Ingenieria Genetica de Microorganismos Secuencia #9

Trabajo poco elaborado, bibliografía escasa y no citada en el texto. Los nombres de especies se escriben en cursiva, el nombre específico en minusculas. Con la informacion suminstrada no puedo ver si la secuencia ha sido bien anotada.No le considero la ortografía por motivos obvios.

**__RESUMEN__** En este trabajo tenemos una sequencia de 17.000 nt. Despues de una analisis de esta secuencia en BLAST vemos su apartenencia a Rhodococcus Opacus B4 y tambien similaridades con Rhodococcus erythropolis PR4Esplicaremos entonces la funciòn y algunas caracteristicas de una proteina en la secuencia de nucleotidos data.La secuencia proviene de Rhodococcus Opacus B4, una bacteria gram + de altro contenido en G+C (65%), pertenecen a el orden Actinomycetales, suborden Corynebacterineae y familia Nocardiaceae.Rhodococcus opacus B4 es aislado como una bacteria de la gasolina. Los membros de Rhodococcus estan presentes en varios ambientes como el suelo al mar y tambien presentan una grande versatilidad metabolica. Caracteristica de Rhodococcus es la capacidad de degradar una gran variedad de compuestos de carbono. Rhodococcus opacus utiiza varios hydrocarburos aromaticos como el benzene, el toluene, xylene, ethylbenzene, propylbenzene y otros. El cromosoma de Rhodococcus opacus es linear, presenta dos plasmidos lineares y tres circulares, el genoma codifica para genes implicados en la degradacion de varios compuestos organicos como el paphtalene, indene, nicotina, thiocyanato.  Los ORFs que encontramos en la secuencia analizada mediante el programa ARTEMIS son relativos a las siguientes proteinas o proteinas hypoteticas: CDS 1795-3747 proteina hypotetica ROP 38750 (Rhodococcus Opacus), CDS 3858-4394 proteina hypotetica SACE_0358, CDS 5181-5747 proteina hypotetica ROP_38670, CDS 5748-7355 mooxygeanasa flavin-containing, CDS 7356-8024 hypotetica proteina RER_01370, CDS 14777-15688 hypotetica proteina RER_ (elenco proteine)La proteina che56360, CDS 14418-15050 proteina heme-binding, CDS 157-903 proteina hypotetica RER_01310, CDS 4441-5331 3-hydroxiacyl-CoA dehydrogenasa,CDS 1195-12543 proteina hypotetica RER_54480, CDS 12544-13206NArI family two-component responde regulator, CDS 16552-16998 probable amidasa, CDS 854-1831 hypotetica proteina de membrana, CDS 10232-10612 proteina hypotetica RER_40260, CDS 10613-11182 hypotetica proteina conservada, CDS 1401-2246 proteina hypotetica RER_01330, CDS 13161-15143 two component hystidina quinasa.
 * __INTRODUCCION__**

La proteina que vamos a analizar es la //__3-hidroxiacyl-coA dehidrogenasa__// de //Rhodococcus Opacus//. Esta proteina està implicada en la ruta del metabolismo de los lipidos y es una oxidoretuctasa.Principalmente cataliza el tercero paso de la beta ossidacion, la ossidacion de L-3-hydroxyacyl CoA by NAD+ por la cual un grupo hydroxil es convertito en un grupo quetonico. La beta-ossidacion es una ruta metabolica que permite la degradacion de los acidos grasos con producion de acetil CoA. Està formada por una serie de cuatros reaciones y al final de estas es liberada una molecula a dos atomos de carbono acetil CoA+ 1 acil-CoA sin dos atomos de carbono. El acil-CoA luego es reintroducido en el ciclo, por cada ciclo hay formacion de 1FADH2 + 1NADH. La β-ossidaccion se para cuando el acil es todo convertido en acetil-CoA. En el caso de nuestra proteina, esta se encuentra en la tercera reaccion y reduce el NAD+ a NADH+H+, el sustrato es el producto de la reaccion que esta antes (beta hydroxiacil-CoA) de esta y se forma el beta-quetocetil-CoA.



//**__Dominios conservados__**// Los dominios conservados de esta proteina son 3HCDH C-terminal domain y NADB-Rossmann-gold NAD(P)(+)-binding protein, es una larga familia que contiene el dominio Rossmann. Este dominio se encuentra en dehydrogenasas de vias metabolicas como por ejemplo la glucolisis. Este dominio es caracterizado por puentes de H y enlaces Wan der Waals.Usualmente las proteinas de esta familia contienen un segundo dominio que se anade al dominio NADB que es responsable de enlaces especificos y cataliza una especifica reacciòn enzimatica. (dominio de Rossmann)

code Ala: 4.000  Arg:  6.000  Asn:  2.000  Asp:  2.000  Cys:  1.000  Gln:  2.000 Glu: 2.000  Gly:  4.000  His:  2.000  Ile:  3.000  Leu:  6.000  Lys:  2.000 Met: 1.000  Phe:  2.000  Pro:  4.000  Ser:  6.000  Thr:  4.000  Trp:  1.000 Tyr: 2.000  Val:  4.000  :  2.000  :  2.000  :  3.000 code MIN: 2.444 MAX: 4.778 //**__Dominios Transmembrana__ # Sequence Length: 282 **// code Sequence   TMHMM2.0    outside         1   282 code
 * //__Utilizo codones__//**
 * 1) Sequence Number of predicted TMHs:  0
 * 2) Sequence Exp number of AAs in TMHs: 1.19571
 * 3) Sequence Exp number, first 60 AAs:  0.36396
 * 4) Sequence Total prob of N-in:        0.02536

//__**Caracteristicas**__// __El numero de aminoacidos__ en esta proteina es 891, el peso molecular es 73262.3 y el teoretico pI es 4.99.El porcentaje de la presencia de los diferentes aminoacidos es:Ala (A) 158 17.7%Arg (R) 0 0.0%Asn (N) 0 0.0%Asp (D) 0 0.0%Cys (C) 334 37.5%Gln (Q) 0 0.0%Glu (E) 0 0.0%Gly (G) 290 32.5%His (H) 0 0.0%Ile (I) 0 0.0%Leu (L) 0<span class="EC_EC_EC_EC_EC_Apple-tab-span" style="white-space: pre;"> 0.0%Lys (K) 0<span class="EC_EC_EC_EC_EC_Apple-tab-span" style="white-space: pre;"> 0.0%Met (M) 0<span class="EC_EC_EC_EC_EC_Apple-tab-span" style="white-space: pre;"> 0.0%Phe (F) 0<span class="EC_EC_EC_EC_EC_Apple-tab-span" style="white-space: pre;"> 0.0%Pro (P) 0<span class="EC_EC_EC_EC_EC_Apple-tab-span" style="white-space: pre;"> 0.0%Ser (S) 0<span class="EC_EC_EC_EC_EC_Apple-tab-span" style="white-space: pre;"> 0.0%Thr (T) 109<span class="EC_EC_EC_EC_EC_Apple-tab-span" style="white-space: pre;"> 12.2%Trp (W) 0<span class="EC_EC_EC_EC_EC_Apple-tab-span" style="white-space: pre;"> 0.0%Tyr (Y) 0<span class="EC_EC_EC_EC_EC_Apple-tab-span" style="white-space: pre;"> 0.0%Val (V) 0<span class="EC_EC_EC_EC_EC_Apple-tab-span" style="white-space: pre;"> 0.0%Pyl (O) 0<span class="EC_EC_EC_EC_EC_Apple-tab-span" style="white-space: pre;"> 0.0%Sec (U) 0<span class="EC_EC_EC_EC_EC_Apple-tab-span" style="white-space: pre;"> 0.0% (B) 0<span class="EC_EC_EC_EC_EC_Apple-tab-span" style="white-space: pre;"> 0.0% (Z) 0<span class="EC_EC_EC_EC_EC_Apple-tab-span" style="white-space: pre;"> 0.0% (X) 0<span class="EC_EC_EC_EC_EC_Apple-tab-span" style="white-space: pre;"> 0.0% __La composicion atomica__ es:Carbon C<span class="EC_EC_EC_EC_EC_Apple-tab-span" style="white-space: pre;"> 2492Hydrogen H<span class="EC_EC_EC_EC_EC_Apple-tab-span" style="white-space: pre;"> 4095Nitrogen N<span class="EC_EC_EC_EC_EC_Apple-tab-span" style="white-space: pre;"> 891Oxygen O<span class="EC_EC_EC_EC_EC_Apple-tab-span" style="white-space: pre;"> 1001Sulfur S<span class="EC_EC_EC_EC_EC_Apple-tab-span" style="white-space: pre;"> 334 __Formula__: C2492H4095N891O1001S334Numero total de atomos : 8813 __El coeficiente de estincion__ medido en agua es 20875 y las unidades son M-1 cm-1.Abs 0.1% (=1 g/l) 0.285, assumiendo que todos los residuos de Cys aparezcan coomo medias (half) cys.

Ext. coefficient 0Abs 0.1% (=1 g/l) 0.000, assumiendo que los residuos NO Cys aparezcan como cysteinas a midad. La secuencia N-terminal es considerada como una Cys.La vida media es de 1.2 horas por mammalian reticulocytes in vitro y >20 horas in levaduras in vitro.


 * __//Primers for PCR//__**

Usando aparatos por PCR hacemos una amplificacion de la secuencia y vemos antes los primers forward y reverse y los mas validos y eficientes. Hay 40 forward primers validos para el contenido en GC. Hay 66 reverse primers validos para el contenido en GC. Hay 24 forward primers validos para el range de Tm.Hay 17 reverse primers validos para el range de Tm.Hay 24 forward primers validos para los valores de anillamiento.Hay 17 reverse primers validos para los valores de anillamiento. Hay 17 primers reverse con valores valido para el proprio anillamiento. Algunos primers no fueron evaluados.

__FORWARD-Primer__ AGATGAGGTATTGAAGCAGG __REVERSE-Primer__ CACTACTACTTTACCCTTCC Longitud: 20 % GC: 45% Tm: 48 Tm: 42 Proprio anillamiento: 10 Proprio anillamiento: 6 Anillamiento terminal : 4 Anillamiento terminal : 0 Offset: 16 Offset: 74 Pair-anillamiento: 12 Pair-End-Anneal: 10 Total de pares de primers validos: 250 Estos primers van a amplificar un fragmento de 59 pares de bases, la secuencia de DNA que serà amplificada por estos primers es:1 AGATGAGGTA TTGAAGCAGG AGGTTGTAAA ATTGGTAAAG GAAGGGTAAA51 GTAGTAGTG

Hay 40 primers forward validos en el range de contenido en GC. Hay 66 primers reverse validos en el range de contenido en GC y 40 forward primers nel range valido de contenido en GC. Hay 24 forward primers en el valido range de Tm. Hay 40 primers reverse en el valido range de Tm. Hay 24 primers forward con valores validos de anillamiento. Hay 40 primers reverse con valores validos de proprio anillamiento. Hay 24 primers forward con valores validos de proprio anillamiento. Hay 40 primers reverse con validos valores de proprio anillamiento terminal. Algunos primers no fueron evaluados.
 * //__Primers Internos para PCR__//**

Forward-Primer GATGAGGTATTGAAGCAGG Reverse-Primer ACCCTTCCTTTACCAATCC

Longitud: 19 Longitud: 19 %GC: 47 % GC: 47 Tm: 46 Tm: 49 Proprio-anillamiento: 10 Proprio anillamiento : 8 Anillamiento terminal: 4 Anillamiento terminal : 2 Offset: 17 Offset: 55 Pair-Anneal: 18Pair-End-Anneal: 10 Total de los pares de primers validos: 250 Estos primers van a amplificar fragmenstos de 39 pares de bases. La secuencia de DNA serà amplificada por parte de estos primers GATGAGGTAT TGAAGCAGGA GGATTGGTAA AGGAAGGGT


 * __PROMOTORES__**

Longitud de secuencia- 80 Threshold para promotores - 0.20 Numero de posibles promoters - 1 Promotor Pos: 61 LDF- 80.17 -10 box pos. 40 Score 14 -35 box pos. 21 ãª Score 21 Oligonucleotidos de sitios TF binding conocidos: Para promotor en 61: rpoH2: TTTTTTTT posiccion 1 Score - 16 rpoH2: TTTTTTTT posiccion 2 Score - 16 rpoH2: TTTTTTTT posiccion 3 Score - 16 rpoH2: TTTTTTTT posiccion 4 Score - 16 rpoH2: TTTTTTTT posiccion 5 Score - 16 rpoH2: TTTTTTTT posiccion 6 Score - 16 rpoH2: TTTTTTTT posiccion 7 Score - 16 rpoH2: TTTTTTTT posiccion 8 Score - 16 rpoH2: TTTTTTTT posiccion 9 Score - 16 rpoH2: TTTTTTTT posiccion 10 Score - 16 rpoH2: TTTTTTTT posiccion 11 Score - 16 rpoH2: TTTTTTTT posiccion 12 Score - 16 rpoH2: TTTTTTTT posiccion 13 Score - 16 rpoH2: TTTTTTTT posiccion 14 Score - 16 rpoH2: TTTTTTTT posiccion 15 Score - 16 rpoH2: TTTTTTTT posiccion 16 Score - 16 rpoH2: TTTTTTTT posiccion 17 Score - 16 rpoH2: TTTTTTTT posiccion 18 Score - 16 rpoH2: TTTTTTTT posiccion 19 Score - 16 rpoH2: TTTTTTTT posiccion 20 Score - 16 rpoH2: TTTTTTTT posiccion 21 Score - 16 rpoH2: TTTTTTTT posiccion 22 Score - 16 rpoH2: TTTTTTTT posiccion 23 Score - 16 rpoH2: TTTTTTTT posiccion 24 Score - 16 rpoH2: TTTTTTTT posiccion 25 Score - 16 rpoH2: TTTTTTTT posiccion 26 Score - 16 rpoH2: TTTTTTTT posiccion 27 Score - 16 rpoH2: TTTTTTTT posiccion 28 Score - 16 rpoH2: TTTTTTTT posiccion 29 Score - 16 rpoH2: TTTTTTTT posiccion 30 Score - 16 rpoH2: TTTTTTTT posiccion 31 Score - 16 rpoH2: TTTTTTTT posiccion 32 Score - 16 rpoH2: TTTTTTTT posiccion 33 Score - 16 rpoH2: TTTTTTTT posiccion 34 Score - 16 rpoH2: TTTTTTTT posiccion 35 Score - 16 rpoH2: TTTTTTTT posiccion 36 Score - 16 rpoH2: TTTTTTTT posiccion 37 Score - 16 rpoH2: TTTTTTTT posiccion 38 Score - 16 rpoH2: TTTTTTTT posiccion 39 Score - 16 rpoH2: TTTTTTTT posiccion 40 Score - 16 rpoH2: TTTTTTTT posiccion 41 Score - 16 rpoH2: TTTTTTTT posiccion 42 Score - 16 rpoH2: TTTTTTTT posiccion 43 Score - 16 rpoH2: TTTTTTTT posiccion 44 Score - 16 rpoH2: TTTTTTTT posiccion 45 Score - 16 rpoH2: TTTTTTTT posiccion 46 Score - 16 rpoH2: TTTTTTTT posiccion 47 Score - 16 rpoH2: TTTTTTTT posiccion 48 Score - 16 rpoH2: TTTTTTTT posiccion 49 Score - 16 rpoH2: TTTTTTTT posiccion 50 Score - 16 rpoH2: TTTTTTTT posiccion 51 Score - 16 rpoH2: TTTTTTTT posiccion 52 Score - 16 rpoH2: TTTTTTTT posiccion 53 Score - 16 rpoH2: TTTTTTTT posiccion 54 Score - 16 rpoH2: TTTTTTTT posiccion 55 Score - 16 rpoH2: TTTTTTTT posiccion 56 Score - 16 rpoH2: TTTTTTTT posiccion 57 Score - 16 rpoH2: TTTTTTTT posiccion 58 Score - 16 rpoH2: TTTTTTTT posiccion 59 Score - 16 rpoH2: TTTTTTTT posiccion 60 Score - 16 rpoH2: TTTTTTTT posiccion 61 Score - 16 rpoH2: TTTTTTTT posiccion 62 Score - 16 rpoH2: TTTTTTTT posiccion 63 Score - 16 rpoH2: TTTTTTTT posiccion 64 Score - 16 rpoH2: TTTTTTTT posiccion 65 Score - 16 rpoH2: TTTTTTTT posiccion 66 Score - 16 rpoH2: TTTTTTTT posiccion 67 Score - 16 rpoH2: TTTTTTTT posiccion 68 Score - 16 rpoH2: TTTTTTTT posiccion 69 Score - 16 rpoH2: TTTTTTTT posiccion 70 Score - 16 rpoH2: TTTTTTTT posiccion 71 Score - 16 rpoH2: TTTTTTTT posiccion 72 Score - 16 rpoH2: TTTTTTTT posiccion 73 Score - 16

__**CONCLUSION**__

En este trabajo hemos encontrado que la proteina en cuestion es una proteina fundamental para este microrganismo y esto tambien lo demonstra la similaridad con otras proteinas de Rhodococcus erutropoli y, Rhodococcus Jostii. Esto nos hace pensar que la 3-hydroxiacyl-CoA deshidrogenasa es una proteina conservada importante especialmente por lo que trata la ruta del metabolismo de los acidos grasos.


 * __AGRADECIMIENTOS__

Agradezco la Universidad de Leòn para la oportunidad de hacer este trabajo y tambien todos los profesores que nos han dato el ayuda necesaria para hacerlo y la disponibilidad para el utilizo de el laboratorio y los ordinadores con los programas bioinformaticos necesarios. Tambien agradezco la Universidad de Teramo que en el mismo tiempo ha permitido esta colaboracion.

**__**BIBLIOGRAFIA**__

-Takarada,H., Sekine,M., Hosoyama,A., Yamada,R., Fujisawa,T.Omata,S., Shimizu,A., Tsukatani,N., Tanikawa,S., Fujita,N. andHarayama,S."Comparison of the complete genome sequences of Rhodococcus erythropolis PR4 and Rhodococcus opacus B4" - Pig heart short chain L-3-hydroxyacyl-CoA dehydrogenase revisited: sequence analysis and crystal structure determination.Protein Sci. 1999 Oct; 8(10):2010-2018 - Cloning, mapping, and expression of genes involved in the fatty acid-degradative multienzyme complex of Escherichia coli.J. Bacteriol. 1984 May; 158(2):535-542 - Structure of L-3-hydroxyacyl-coenzyme A dehydrogenase: preliminary chain tracing at 2.8-A resolution.Proc. Natl. Acad. Sci. U.S.A. 1987 Dec; 84(23):8262-8266