Sara+Tagarro

Sara

Trabajo enviado como doc y metido en la Wiki Sara Tagarro Jáñez Trabajo poco elaborado, con tres referencias puestas al final pero sin mencionarlas en el texto . El análisis de Artemis no correcto. La proteína empieza en MILG.... o sea que la mayoría de las construcciones no son correctas La proteína empieza en MILG.... o sea que la mayoría de las construcciones no son correctas 1. // Rhodococcus // El nombre del género //Rhodococcus// fue propuesto Goodfellow y Alderson en un estudio de clasificación por taxonomía numérica. Estas bacterias exhiben un amplio rango de actividades metabólicas. Algunas de ellas tienen la habilidad de degradar una variedad de compuestos orgánicos, incluyendo xenobióticos como bifenilos policlorinados, mientras otras son capaces de degradar numerosos hidrocarburos alifáticos, alifáticos ramificados y aromáticos. Están presentes en suelos patagónicos contaminados con hidrocarburos provenientes del petróleo, y están sometidos a condiciones de estrés térmico y osmótico. Se sabe que cumplen un rol importante en la biorremediación. Taxonómicamente se clasifica de la siguiente manera: Bacteria · Actinobacteria Actinobacteria (clase) Actinobacteridae Actinomycetales Corynebacterineae Nocardiaceae //Rhodococcus// Es una bacteria Gram positiva, inmóvil y no esporulada. Dentro de la secuencia dada de 17000 nucleótidos, obtenemos mediante el programa informático Artemis la siguiente distribución de marcos de lectura que pueden ser posibles codificadores de proteínas: Entre estas, he seleccionado la proteína Arabinosiltransferasa para llevar a cabo un estudio más exhaustivo. ARABINOSIL TRANSFERASA Esta proteína, de carácter enzimático, tiene el ORF situado entre las bases 7404 y 9338 de la secuencia dada. La función que puede desempeñar en la bacteria es la síntesis de componentes de la pared celular. Referencia o explicación. Está Ud. segura? La secuencia en bases de la proteína es la siguiente: GCTCGGGCCGTGTCGCAATCAGGTGCAGCCCCCCTCGCAACGTCGCGAGTCGCCCCTGCC 10 20 30 40 50 60 CGACTGGCCGGTGGAACCGCTGTCGAGATGATCCTCGGGGCCTTCGTGGCCGCGATCGTC 70 80 90 100 110 120 GCCGCGGTGGGACTGTTCGCCTTCGGTCGGGTGTCGTGGCCGGCGTTTCCGTCGTCGAAC 130 140 150 160 170 180 GTCACACAGGCCGTCACGACGGTGGGGCAGGTCGTCACGATCGCCGTTCTCGCGCTGTGT 190 200 210 220 230 240 GTCGCCCTCTTCCGCGCCCGACGGTGGACCCGCGCGGCGACCCTACTGTCGTGGGCCGGG 250 260 270 280 290 300 CTGTCCGGCTTCGTGACGGTGACGCTCGGCATGCCGCTGAGCGCCACGAAGCTGTACCTG 310 320 330 340 350 360 CACGGCGTTTCGGTCGACCAGGAGTTCCGCACCGAATACCTCACGCGCCTCACCGATTCC 370 380 390 400 410 420 GCAGCGCTGCACGACATGACGTACGCGGATCTGCCGCCGTACTACCCGGCCGGGTGGTTC 430 440 450 460 470 480 TGGATCGGCGGCCGTGTCGCGAATCTGCTCGGCATGGACGGCTGGGAGACCTTCAAGCCG 490 500 510 520 530 540 TACGCGATCGGTTCGATCGCCGTAGCCGCCGTCGTCGCGCTGGTGTTGTGGACCAAGCTG 550 560 570 580 590 600 ATTCGCACCGACCGCGCGATCGTGGTCGCGCTGGCAACCGCCGCGCTGACAGTCGCGTAC 610 620 630 640 650 660 GCCTCGTCCGAGCCGTACGGCGCCGTGATCGCCGTCCTGATTCCACCGGTCCTCGTGCTG 670 680 690 700 710 720 GCGTGGGGCGGACTGCACCGTCCGGATCGGACCGGCCGCGGAGGATGGGGCGCCGTTGTC 730 740 750 760 770 780 GGCACCGGCATCTTCCTCGGTGTCGCCGCCGCGTTCTACACGCTGTACCTCGGACTCTCG 790 800 810 820 830 840 GCATTCGCCATCACGCTCATGGCCCTGGTCGCGGCGGGTCTCGCCGTCCGGGCGCAAGGC 850 860 870 880 890 900 TCGTGGCGCGGAGCGGTCGCCCCCTTGGTTCGGTTGGCCGTCATCGCCGCGATCGCGATC 910 920 930 940 950 960 GCGATCGCGCTTACCGTTTGGCTGCCCTACCTGCTCGAGGCGCTGCACGGTGTGCCCGCC 970 980 990 1000 1010 1020 GGTAGCGGCACCGCCACGCACTACCTCCCCGACGCCGGTGCGCGCCTGCCGCTTCCGATG 1030 1040 1050 1060 1070 1080 CTCCAGCTCTCGCTCTCCGGGGCGCTGTGTCTGCTCGGCACGATCTGGCTGGTATTCCGG 1090 1100 1110 1120 1130 1140 GTGACCTCGTCACGTCGAGCCCAAGCGCTCGGCATCGGCGTGGTGGCGATCTACCTGTGG 1150 1160 1170 1180 1190 1200 TCGCTGATGTCGATGGCGTTCACCGCGGTGGGTGGCACGTTGCTGTCCTTCCGCCTCGAA 1210 1220 1230 1240 1250 1260 CCGGTGCTCATCCTGCTGCTCGGGGCCGCCGGCGTGTTCGGTTTCTTCGACTTCGCGCGC 1270 1280 1290 1300 1310 1320 TGGCTCGTCCTGGCGACAAGCGATAATCCACGAGTGAAGGCGTCCGTCGTCGTGATCGGA 1330 1340 1350 1360 1370 1380 CTCGTGGGTCTGATCGCCTTCGCGCAGAACATCCCCCAGGTGCTGTCGAACGACATCACC 1390 1400 1410 1420 1430 1440 GTCGCGTACACCGACACGGACGGCGACGGTGCCCGCGGCGACCAGCGCCCGCCCGGCGCG 1450 1460 1470 1480 1490 1500 GCCTCCTACTACGGCGACATCGACCGGACGATCCTCGAGCGGCGCCCCGGCGAGCGCCAC 1510 1520 1530 1540 1550 1560 GACACGGTGGTGCTCACGTCGGACACCAGCTTCCTCAGCTTCTACCCGTACTACGGATTC 1570 1580 1590 1600 1610 1620 CAGGCGCTGACGTCGCACTACGCGAATCCTTTGGCGCAGTTCCGCGAGCGCTCGGAGGCG 1630 1640 1650 1660 1670 1680 ATCGAGAGCTGGACGGAGTTCGAGACGCCGGACGAGCTCGTCGCTGCGCTCGACGAATTG 1690 1700 1710 1720 1730 1740 CCCTGGCGCGCACCGGACGTGTTCGTCTTCCGCAAGAGCGCCGACGGCTACACCCTGCGC 1750 1760 1770 1780 1790 1800 CTGGCCGAGGACGTCTACCCGAACAATCCGAACGTCCGCCGCTACAGCGTCTCCTTCCCG 1810 1820 1830 1840 1850 1860 AAATCGCTGTTCGACGACCCGCGCTTCACCGTCAACGAGGTGGGACCGTTCGCGATCGTG 1870 1880 1890 1900 1910 1920 ACGCGCGTCGGCTGA 1930 Y la secuencia en aminoácidos quedaría de la siguiente forma: La proteína empieza en MILG.... o sea que la mayoría de las construcciones no son correctas ARAVSQSGAAPLATSRVAPARLAGGTAVE MILGAFVAAIVAAV GLFAFGRVSWPAFPSSN 10 20 30 40 50 60 VTQAVTTVGQVVTIAVLALCVALFRARRWTRAATLLSWAGLSGFVTVTLGMPLSATKLYL 70 80 90 100 110 120 HGVSVDQEFRTEYLTRLTDSAALHDMTYADLPPYYPAGWFWIGGRVANLLGMDGWETFKP 130 140 150 160 170 180 YAIGSIAVAAVVALVLWTKLIRTDRAIVVALATAALTVAYASSEPYGAVIAVLIPPVLVL 190 200 210 220 230 240 AWGGLHRPDRTGRGGWGAVVGTGIFLGVAAAFYTLYLGLSAFAITLMALVAAGLAVRAQG 250 260 270 280 290 300 SWRGAVAPLVRLAVIAAIAIAIALTVWLPYLLEALHGVPAGSGTATHYLPDAGARLPLPM 310 320 330 340 350 360 LQLSLSGALCLLGTIWLVFRVTSSRRAQALGIGVVAIYLWSLMSMAFTAVGGTLLSFRLE 370 380 390 400 410 420 PVLILLLGAAGVFGFFDFARWLVLATSDNPRVKASVVVIGLVGLIAFAQNIPQVLSNDIT 430 440 450 460 470 480 VAYTDTDGDGARGDQRPPGAASYYGDIDRTILERRPGERHDTVVLTSDTSFLSFYPYYGF 490 500 510 520 530 540 QALTSHYANPLAQFRERSEAIESWTEFETPDELVAALDELPWRAPDVFVFRKSADGYTLR 550 560 570 580 590 600 LAEDVYPNNPNVRRYSVSFPKSLFDDPRFTVNEVGPFAIVTRVG 610 620 630 640 Para amplificar la proteína escogida por PCR podemos escoger el siguiente los siguientes primers izquierdo y derecho: code OLIGO                    [|start] [| len] [|     tm] [|    gc%] [|  any]  [|  3'] [|seq] code code LEFT PRIMER      1190   20   59.86   55.00  3.00  0.00 TCTACCTGTGGTCGCTGATG code RIGHT PRIMER 1362 20 60.10 50.00 4.00 3.00 CGCCTTCACTCGTGGATTAT A parte de este, podemos utilizar como oligonucleótidos adicionales los siguientes: code [|start] [| len] [|    tm] [|    gc%] [|  any]  [|  3'] [|seq] code code code code 1 LEFT PRIMER      1584   20   59.75   55.00  4.00  1.00 CACCAGCTTCCTCAGCTTCT code code RIGHT PRIMER     1833   20   59.93   50.00  3.00  0.00 GTTCGGATTGTTCGGGTAGA code code PRODUCT SIZE: 250, PAIR ANY COMPL: 3.00, PAIR 3' COMPL: 3.00 code code code code 2 LEFT PRIMER      1584   20   59.75   55.00  4.00  1.00 CACCAGCTTCCTCAGCTTCT code code RIGHT PRIMER     1832   20   59.93   50.00  3.00  2.00 TTCGGATTGTTCGGGTAGAC code code PRODUCT SIZE: 249, PAIR ANY COMPL: 3.00, PAIR 3' COMPL: 2.00 code code code code 3 LEFT PRIMER      1192   20   59.71   55.00  3.00  2.00 TACCTGTGGTCGCTGATGTC code code RIGHT PRIMER     1362   20   60.10   50.00  4.00  3.00 CGCCTTCACTCGTGGATTAT code code PRODUCT SIZE: 171, PAIR ANY COMPL: 3.00, PAIR 3' COMPL: 1.00 code code code code 4 LEFT PRIMER      1583   20   59.60   55.00  4.00  0.00 ACACCAGCTTCCTCAGCTTC code code RIGHT PRIMER     1832   20   59.93   50.00  3.00  2.00 TTCGGATTGTTCGGGTAGAC code code PRODUCT SIZE: 250, PAIR ANY COMPL: 3.00, PAIR 3' COMPL: 1.00 code code code code code code ·         ** Diseño de primers para amplificación de segmentos internos. ** code code Para amplificar fragmentos internos de la secuencia podemos utilizar los siguientes primers: code code code code OLIGO           [|start] [| len] [|     tm] [|    gc%] [|  any]  [|  3'] [|seq] code code INTERNAL_OLIGO   1814   20   59.93   50.00  3.00  0.00 TCTACCCGAACAATCCGAAC code code SEQUENCE SIZE: 1935 code code INCLUDED REGION SIZE: 1935 code code
 * ESTUDIO SOBRE LA PROTEÍNA ARABINOSILTRANSFERASA AftA DE //Rhodococcus// **
 * ** Primers para amplificación por PCR **

code code ADDITIONAL OLIGOS code code [|start] [| len] [|    tm] [|    gc%] [|  any]  [|  3'] [|seq] code code 1 INTERNAL_OLIGO   1813   20   59.93   50.00  3.00  2.00 GTCTACCCGAACAATCCGAA code code 2 INTERNAL_OLIGO   1343   20   60.10   50.00  4.00  2.00 ATAATCCACGAGTGAAGGCG code code 3 INTERNAL_OLIGO   1807   20   60.11   55.00  6.00  0.00 GAGGACGTCTACCCGAACAA code code 4 INTERNAL_OLIGO   1190   20   59.86   55.00  3.00  0.00 TCTACCTGTGGTCGCTGATG code code

code code code code code code ·         ** Análisis de los aminoácidos de la proteína. ** code code La proteína está compuesta por 1935 aminoácidos, y tiene un peso molecular de 161701.4. code code Los aminoácidos que la componen aparecen en los siguientes porcentajes: code Arg (R) 0 0.0% Asn (N) 0 0.0% Asp (D) 0 0.0% Cys (C) 691 35.7% Gln (Q) 0 0.0% Glu (E) 0 0.0% Gly (G) 635 32.8% His (H) 0 0.0% Ile (I) 0 0.0% Leu (L) 0 0.0% Lys (K) 0 0.0% Met (M) 0 0.0% Phe (F) 0 0.0% Pro (P) 0 0.0% Ser (S) 0 0.0% Thr (T) 363 18.8% Trp (W) 0 0.0% Tyr (Y) 0 0.0% Val (V) 0 0.0% Pyl (O) 0 0.0% Sec (U) 0 0.0% La composición molecular es: Carbon C 5533 Hydrogen H 9133 Nitrogen N 1935 Oxygen O 2299 Sulfur S 691 El índice de inestabilidad obtenido para la proteína es de 51’39, lo que hace que se le clasifique como inestable. Para la identificación de péptidos líder se ha obtenido el siguiente resultado utilizando el programa bioinformático SignalP: code code code
 * SignalP-NN result:**

code code

code code code code >Sequence             length = 70 code code code code max. C   21       0.197   0.52   NO code code max. Y   24       0.210   0.32   NO code code max. S   18       0.956   0.97   NO code code mean S    1-23    0.594   0.51   YES code code D    1-23    0.402   0.45   NO code code code code code code
 * 1) [|data]
 * 1) Measure  Position  Value  Cutoff  signal peptide?
 * 1) Most likely cleavage site between pos. 23 and 24: RLA-GG
 * SignalP-HMM result:**

code code

code code

code code >Sequence code code Prediction: Non-secretory protein code code Signal peptide probability: 0.096 code code Max cleavage site probability: 0.058 between pos. 64 and 65 code También se ha analizado la presencia de dominios transmembrana, mediante TMHMM, y los resultados son de una alta probabilidad de presencia de este tipo de dominios: Sequence TMHMM2.0 inside 1 26 Sequence TMHMM2.0 TMhelix 27 49 Sequence TMHMM2.0 outside 50 63 Sequence TMHMM2.0 TMhelix 64 86 Sequence TMHMM2.0 inside 87 92 Sequence TMHMM2.0 TMhelix 93 115 Sequence TMHMM2.0 outside 116 180 Sequence TMHMM2.0 TMhelix 181 198 Sequence TMHMM2.0 inside 199 204 Sequence TMHMM2.0 TMhelix 205 222 Sequence TMHMM2.0 outside 223 225 Sequence TMHMM2.0 TMhelix 226 245 Sequence TMHMM2.0 inside 246 251 Sequence TMHMM2.0 TMhelix 252 274 Sequence TMHMM2.0 outside 275 278 Sequence TMHMM2.0 TMhelix 279 296 Sequence TMHMM2.0 inside 297 308 Sequence TMHMM2.0 TMhelix 309 331 Sequence TMHMM2.0 outside 332 355 Sequence TMHMM2.0 TMhelix 356 378 Sequence TMHMM2.0 inside 379 389 Sequence TMHMM2.0 TMhelix 390 412 Sequence TMHMM2.0 outside 413 421 Sequence TMHMM2.0 TMhelix 422 444 Sequence TMHMM2.0 inside 445 455 Sequence TMHMM2.0 TMhelix 456 475 Sequence TMHMM2.0 outside 476 644 code code code
 * 1) [|data]
 * 1) Sequence Length: 644
 * 2) Sequence Number of predicted TMHs: 13
 * 3) Sequence Exp number of AAs in TMHs: 271.195
 * 4) Sequence Exp number, first 60 AAs: 22.29902
 * 5) Sequence Total prob of N-in: 0.99956
 * 6) Sequence POSSIBLE N-term signal sequence

code code

code code

code code code code code code code code code code code code code code REFERENCIAS code code code · ** [|Influence of extracellular polymeric substances (EPS) on deposition kinetics of bacteria.] ** Long G, Zhu P, Shen Y, Tong M.  Environ Sci Technol. 2009 Apr 1;43(7):2308-14. · ** [|Biodegradation aspects of Polycyclic Aromatic Hydrocarbons (PAHs): A review.] ** Haritash AK, Kaushik CP. J Hazard Mater. 2009 Apr 7. · ** [|Synthesis of oligosaccharides as potential inhibitors of mycobacterial arabinosyltransferases. Di- and trisaccharides containing C-5 modified arabinofuranosyl residues.] ** Cociorva OM, Lowary TL. Carbohydr Res. 2004 Mar 15;339(4):853-65. code

code code

code code

code