Francisco+Arcilla

=ANÁLISIS BIOINFORMÁTICO DE UNA SECUENCIA NO ANOTADA (Secuencia # 3)= ARCILLA ALLER, FRANCISCO Dpto. Microbiología, Universidad León


 * ====__**Origen de la secuencia, primeros análisis:**__ ====

Microorganismo en cuestión: una especie del género //Rhodococcus, comenzamos una primera aproximación con el programa Nebcutter 2.0 y obtenemos marcos de lectura(ORF):

// Tenemos que es //Rhodococcus erythropolis//, con seguridad de que no fallo de 4x10-84. No es esa especie code format="genbank" LOCUS      YP_002764705             250 aa            linear   BCT 07-MAY-2009 DEFINITION IclR family transcriptional regulator [Rhodococcus erythropolis PR4]. ACCESSION  YP_002764705 VERSION    YP_002764705.1  GI:226304747 DBLINK     Project:[|20395] DBSOURCE   REFSEQ: accession [|NC_012490.1] KEYWORDS. SOURCE     Rhodococcus erythropolis PR4 ORGANISM [|Rhodococcus erythropolis PR4] Bacteria; Actinobacteria; Actinobacteridae; Actinomycetales; Corynebacterineae; Nocardiaceae; Rhodococcus.

code
 * __Taxonomía del microorganismo__:

Reino: Bacteria Phylum: __Actinobacteria__ Clase: __Actinobacteria__ Subclase: __Actinobacteridae__ Orden: __Actinomycetales__ Suborden: __Corynebacterineae__ Familia: __Nocardiaceae__ Géneros: //Rhodococcus//


 * ==__**Análisis informático de la secuencia con el programa Artemis:**__ ==

Artemis Overview of: Mi secuencia.txt ORFS_100+ Número de bases: 17000 Genes (CDS features without a /pseudo qualifier): non-spliced: count: 84 bases: 67477 density: 4.941 genes per kb (202 bases per gene) average length: 803 average length (including introns): 803 coding percentage: 396.9 coding percentage (including introns): 396.9

Composición de las secuencias génicas: A content: 10487 (15.54%) C content: 23412 (34.69%) G content: 23227 (34.42%) T content: 10351 (15.34%) (no ambiguous bases) Overall sequence composition: A content: 2606 (15.32%) C content: 5718 (33.63%) G content: 5970 (35.11%) T content: 2706 (15.91%) (no ambiguous bases) GC percentage: 68.75 Summary of the active entries: CDS: 84
 * __% G+C: 69.12__**

De los 84 ORFs los siguientes corresponden a secuencias conocidas: Hemos elegido la __Glutamato sintasa__
 * Dirección 5'-3' ||  |||| Cadena complementaria ||
 * **CDS posición** || **Proteína** || 3760-4293 || Inhibidor de inicio de traducción ||
 * 1046-1450 || Proteína hipotética || 4642-6882 || Regulador transcripcional IclR ||
 * 2496-3158 || Regulador transcripcional (TetR) || 11908-14151 || Oxidorreductasa ||
 * 4026-4637 || Regulador transcripcional || 1499-2731 || Esterasa-lipasa ||
 * 7006-8688 || Oxidasa de L-aminoácidos || 3240-3977 || Proteína hipotética ||
 * 8108-9592 || Translocasa de proteínas || 5385-7049 || Transportador de aminoácidos ||
 * 8646-9392 || Endoribonucleasa L-PSP ||  ||   ||
 * 10273-11733 || Transportador MFS ||  ||   ||
 * 11923-14076 || Proteína hipotética conservada ||  ||   ||
 * 14286-17000 || Sub grande de Glu Sintasa ||  ||   ||


 * ===**__Análisis del gen que codifica para la proteína.__** ===

Usando el programa __FramePlot__: ( para qué usa ahora este programa?????)

Este programa se emplea únicamente con microorganismos de alto contenido de G+C, como es el caso y no da información acerca de la capacidad codificadora, en este caso se trata de un buen marco de lectura (línea 1).


 * __**Diseño de primers para la amplificación del gen/es por PCR**:__

Los oligos apropiados para la amplificación del gen serían los siguientes, según el programa Primer3 (v. 4.0) son los siguientes:

Oligo izquierdo: Tamaño secuencia: 2715 Tamaño producto: 235 (la proteína tiene 905 aa, y Ud. está amplificando 235???????)
 * Oligo || comienzo || longitud || Tm || % GC || 3' sec ||  ||
 * Izquierdo || 604 || 20 || 60.43 || 50.00 || 2.00 || ACGTTCCGTCAGGTGTTCAT ||
 * Derecho || 838 || 20 || 60.01 || 60.00 || 2.00 || CCTGCAGGTCGAGGTAGAAG ||

Además nos proporciona algunos oligos adiccionales: code ADDITIONAL OLIGOS [|start] [| len] [|    tm] [|    gc%] [|  any]  [|  3'] [|seq]

1 LEFT PRIMER      2168   20   59.58   60.00  4.00  1.00 GTACCAAGGTCGGTCTCGTC RIGHT PRIMER     2388   20   59.98   50.00  4.00  1.00 CTTCGACATCACCTTCAGCA PRODUCT SIZE: 221, PAIR ANY COMPL: 6.00, PAIR 3' COMPL: 2.00

2 LEFT PRIMER       748   20   59.73   60.00  4.00  1.00 GTGTACTTCCCGAGCCTGTC RIGHT PRIMER      897   20   59.70   55.00  2.00  2.00 GAAGGTGTTGGTGGAGAAGC PRODUCT SIZE: 150, PAIR ANY COMPL: 4.00, PAIR 3' COMPL: 3.00

3 LEFT PRIMER      2168   20   59.58   60.00  4.00  1.00 GTACCAAGGTCGGTCTCGTC RIGHT PRIMER     2387   20   59.84   50.00  4.00  0.00 TTCGACATCACCTTCAGCAC PRODUCT SIZE: 220, PAIR ANY COMPL: 6.00, PAIR 3' COMPL: 3.00

4 LEFT PRIMER       604   20   60.43   50.00  4.00  2.00 ACGTTCCGTCAGGTGTTCAT RIGHT PRIMER      837   20   60.16   60.00  6.00  2.00 CTGCAGGTCGAGGTAGAAGC PRODUCT SIZE: 234, PAIR ANY COMPL: 3.00, PAIR 3' COMPL: 1.00

code


 * **Diseño de primers para amplificar fragmentos internos del gen/es y comprobar si dicho gen/es son esenciales o no para el microorganismo.**

Empleamos también Primer3plus: code OLIGO           [|start] [| len] [|     tm] [|    gc%] [|  any]  [|  3'] [|seq] INTERNAL_OLIGO    819   20   60.01   60.00  8.00  8.00 CTTCTACCTCGACCTGCAGG

code Otros oligos: code [|start] [| len] [|    tm] [|    gc%] [|  any]  [|  3'] [|seq] 1 INTERNAL_OLIGO   2369   20   59.98   50.00  4.00  0.00 TGCTGAAGGTGATGTCGAAG 2 INTERNAL_OLIGO   2380   20   60.04   50.00  8.00  6.00 ATGTCGAAGATGGGCATCTC 3 INTERNAL_OLIGO   2379   20   60.04   50.00  8.00  8.00 GATGTCGAAGATGGGCATCT 4 INTERNAL_OLIGO     58   20   59.95   55.00  4.00  3.00 CTCAACGAGGAGCCATTCTC

code Para comprobar si se trata de un gen esencial para el microorganismo se puede realizar un experimento de interrupción génica dentro de esa secuencia.(Hágalo....)


 * A continuación obtuvimos el **__péptido líde__r**, empleando el programa SignalP 3.0 Server de la Universidad Técnica de Dinamarca:

La predicción está basada en el modelo HMM (Hidden Markov Models) para Gram+: code code >CDS Prediction: Signal peptide Signal peptide probability: 0.672 Max cleavage site probability: 0.532 between pos. 22 and 23

code
 * __**Diseño de primers para amplificar los genes que codifican para la/s proteína/s de interés con colas de histidina para su rápida purificación**__

Empleamos un vector pET-28a de Novagen que lleva incorporadas colas de His, empleamos para introducirlo en el microorganismo una enzima de restricción presente en el vector y que corte en un sitio cercano al gen para luego clonarlo. Los primers serán los mismos que para clonar por PCR.

Las enzimas de restricción que cortan en esta secuencia, a partir del programa Nebcutter son: (para que???)




 * __**Realización de una mutagénesis in vitro del gen Glut Sintasa (porqué ha elegido esta mutación?????) **__

Los primers elegidos son:

Oligo izquierdo: ACGTTCCGTGT GGTGTTCAT

Oligo derecho: CCTGCAGGTTG AGGTAGAAG


 * __**ANÁLISIS DE LA PROTEÍNA GLUTAMATO SINTASA:**__

En primer lugar hallamos la familia de proteínas a las que pertenece:

__Programa Pfam__
Secuencia de la proteína:

PSETPQSNVAGADVSPVPRLNEEPFSVGAAQCRAGTCSAVVWPSALLVVGASTHTKAVGMKHLPGPQGLYHPA NEHDACGVAFVVDMHGRRSRDIVEKAITALVNLEHRGAAGSEPNTGDGAGILLQVPDRFLRAVVDFELPAAGA YATGIAFLPQGDAAADEAAAGVEKIVAEEGLTVLGWREVPTDDSSLGTLARAAMPTFRQVFIGSAGDSVTDMD LERRAYVIRKRVEHELGESGAGEDGPGRESVYFPSLSGQTFVYKGMLTTPQLKGFYLDLQDDRVESALGLVHS RFSTNTFPSWPLAHPFRRVAHNGEINTVSGNENWMRAREALIKSDVFGDGALEKIFPICTPGASDTARFDEVL ELLHLGGRSLPHAVLMMIPEAWERHESMDPARKAFYEYHSALMEPWDGPASVCFTDGTVVGAVLDRNGLRPSR VWVTDDGLVVMASEVGVLDIAPEKIVRRMRMQPGRMFLVDTAQGRIISDDEIKSELAAEHPYQQWIDEGLVQI DDLPESKYTYMTHDRVVLRQQIFGFTNEEVNLLVKPMAVTGGEALGSMGTDTPIAVLSARPRMLFDYFQQLFA QVTNPPLDAIREEIVTSLGGTIGPEADLLTPSAASCRQIVLPQPILHNDDLSKLIHLNDNAKFPHFRSVVVRG VYPVAQGGEGLRKALDTVRDKVSEAIAGGARIIVLSDRESNEKYAPIPSLLLTAAVHHHLVREKTRTKVGLVV ESGDAREVHHMAALLGFGASAVNPYMAFETIDELLQSNQLAGLSLDKAVTNYIKAAGKGVLKVMSKMGISTLA SYTGAQLFQVIGLSQELVDEYFTGLQSNLDGIGLDEIAADVAARHANAYLDRPELRAHRELEVGGEYQWRREG EYHLFNPDTVFKLQHSTKTGQYEVFKEYT

Se obtienen dos resultados significativos según los cuales esta proteína contiene un dominio GATasa 2 y otro Glu sintasa central:



Se completa información con el __KEGG__ (Kyoto Encyclopedia of Genes and Genomes):
 * ~ Start ||~ End ||~ From ||~ To ||
 * 0 || [|GATase_2] || Glutamine amidotransferases class-II || Domain || 79 || 453 || 1 || 385 || 760.3 || 5.9e-235 || fs || n/a ||  ||
 * 5 || [|Glu_syn_central] || Glutamate synthase central domain || Domain || 528 || 818 || 1 || 301 || 599.2 || 4.4e-177 || ls || n/a ||  ||
 * 5 || [|Glu_syn_central] || Glutamate synthase central domain || Domain || 528 || 818 || 1 || 301 || 599.2 || 4.4e-177 || ls || n/a ||  ||

Familia de las Oxidoreductasas; Actúan en el grupo donador CH-NH2 y utilizan NAD+ o NADP+ como aceptor.


 * **Localización más probable de la proteína**; empleando el programa __PSORTb version 2.0.4__ obtenemos lo siguiente:

Cytoplasmic 8.87 CytoplasmicMembrane 0.39 Cellwall 0.01 Extracellular 0.73 Final Prediction:
 * Cytoplasmic 8.87 Así pues, se trata de una proteína citoplasmática, como era de esperar.**

__Ruta metabólica en la que participa:__




 * **Corte con peptidasas**, con __ExPasy Peptide Cutter__ se obtienen los siguiente sitios de corte:


 * ~ Nombre de la enzima ||~ No. de cortes ||~ Positions of cleavage sites ||
 * [|Arg-C proteinase] || 55 || 19 33 90 91 93 109 131 134 183 197 204 222 223 228 230 247 282 293 309 310 328 330 360 373 389 397 431 435 438 465 466 468 473 483 526 530 571 573 595 621 651 656 669 676 688 695 719 723 736 847 855 859 862 873 874 ||
 * [|Asp-N endopeptidase] || 55 || 12 76 85 93 119 129 137 157 161 187 188 212 216 218 242 276 279 280 336 340 356 361 393 411 420 429 442 443 456 477 486 487 504 511 512 524 561 576 591 610 632 633 642 672 676 693 733 761 775 821 832 837 842 853 883 ||
 * [|Asp-N endopeptidase + N-terminal Glu] || 119 || 2 12 21 22 74 76 85 93 96 106 114 119 129 137 139 157 161 162 168 173 174 183 187 188 212 216 218 220 231 233 236 241 242 247 276 279 280 283 315 323 330 336 340 344 356 361 362 365 384 387 390 393 401 408 411 420 429 442 443 451 456 460 477 486 487 488 492 496 504 505 511 512 515 524 538 539 553 561 576 591 595 596 608 610 632 633 642 665 672 676 680 693 695 698 719 730 733 736 758 761 762 775 818 821 822 832 837 838 842 853 856 862 864 868 874 876 883 898 902 ||
 * [|BNPS-Skatole] || 9 || 42 182 302 326 387 411 440 503 872 ||
 * [|CNBr] || 22 || 60 87 200 218 265 327 381 382 393 408 449 467 469 474 522 548 559 574 741 756 794 797 ||
 * [|Chymotrypsin-high specificity (C-term to [FYW, not before P)]] || 57 || 25 70 83 132 139 147 153 182 203 207 225 251 260 262 274 275 294 308 339 361 387 400 401 403 411 419 440 475 500 503 519 521 534 536 576 578 579 583 650 701 747 755 758 782 805 811 824 825 852 870 872 878 881 887 898 901 904 ||
 * [|Chymotrypsin-low specificity (C-term to [FYWML, not before P)]] || 181 || 20 25 46 47 54 60 62 69 70 83 87 88 103 106 108 125 126 132 133 139 147 153 177 180 182 192 195 203 207 218 220 225 233 235 251 255 260 262 265 266 271 274 275 276 278 287 289 291 294 304 308 313 327 333 339 344 361 365 367 368 369 370 377 380 381 382 387 390 393 400 401 403 404 407 408 411 419 429 434 440 446 449 456 467 469 474 475 476 494 500 503 508 519 521 522 529 534 536 543 544 548 556 559 568 574 575 576 578 579 582 583 591 602 612 613 630 631 635 638 640 641 649 650 668 672 692 701 707 708 709 714 715 716 717 728 739 741 744 745 747 755 756 758 764 765 770 773 775 782 791 794 797 802 805 810 811 816 820 824 825 828 832 837 848 852 853 858 861 864 870 872 878 879 880 881 887 889 891 898 901 904 ||
 * [|Clostripain] || 55 || 19 33 90 91 93 109 131 134 183 197 204 222 223 228 230 247 282 293 309 310 328 330 360 373 389 397 431 435 438 465 466 468 473 483 526 530 571 573 595 621 651 656 669 676 688 695 719 723 736 847 855 859 862 873 874 ||
 * [|Formic acid] || 55 || 13 77 86 94 120 130 138 158 162 188 189 213 217 219 243 277 280 281 337 341 357 362 394 412 421 430 443 444 457 478 487 488 505 512 513 525 562 577 592 611 633 634 643 673 677 694 734 762 776 822 833 838 843 854 884 ||
 * [|Glutamyl endopeptidase] || 64 || 3 22 23 75 97 107 115 140 163 169 174 175 184 221 232 234 237 242 248 284 316 324 331 345 363 366 385 388 391 402 409 452 461 489 493 497 506 516 539 540 554 596 597 609 666 681 696 699 720 731 737 759 763 819 823 839 857 863 865 869 875 877 899 903 ||
 * [|Hydroxylamine] || 2 || 314 432 ||
 * [|Iodosobenzoic acid] || 9 || 42 182 302 326 387 411 440 503 872 ||
 * [|LysC] || 29 || 56 61 98 170 229 263 272 335 346 398 462 491 518 546 637 646 670 678 700 721 725 777 784 788 792 796 888 894 902 ||
 * [|LysN] || 29 || 55 60 97 169 228 262 271 334 345 397 461 490 517 545 636 645 669 677 699 720 724 776 783 787 791 795 887 893 901 ||
 * [|NTCB (2-nitro-5-thiocyanobenzoic acid)] || 6 || 31 36 78 350 417 619 ||
 * [|Pepsin (pH1.3)] || 230 || 20 24 42 45 46 46 47 68 69 69 82 83 102 103 105 106 124 125 125 126 132 132 138 139 141 146 147 152 154 176 177 179 180 181 182 191 192 194 195 203 207 219 220 234 250 252 255 259 260 261 262 266 271 273 275 275 276 277 278 286 287 288 289 294 299 302 303 307 325 326 333 338 339 343 344 361 364 365 366 367 367 368 369 370 380 386 387 401 402 403 407 410 418 419 428 429 439 445 446 455 456 474 476 494 499 502 503 507 508 514 518 519 521 529 533 534 535 536 542 543 543 544 555 556 567 568 574 576 577 578 578 579 581 582 582 583 601 602 611 612 612 625 630 634 635 637 638 640 641 647 650 659 667 668 691 692 700 707 707 708 708 709 728 743 744 744 745 746 747 754 757 758 763 764 764 765 769 770 772 773 774 775 781 782 791 801 802 804 805 809 810 810 811 815 816 819 820 823 824 824 825 827 828 831 832 836 837 851 852 852 853 858 869 870 871 872 877 878 879 880 880 886 887 888 889 897 898 900 901 903 ||
 * [|Pepsin (pH>2)] || 182 || 20 24 45 46 46 47 68 69 82 83 102 103 105 106 124 125 125 126 132 132 138 139 141 152 154 176 177 179 180 191 192 194 195 203 207 219 220 234 252 255 259 260 266 271 273 275 276 277 278 286 287 288 289 294 299 303 307 333 338 339 343 344 361 364 365 366 367 367 368 369 370 380 407 418 419 428 429 445 446 455 456 474 476 494 507 508 514 529 533 534 535 536 542 543 543 544 555 556 567 568 574 576 578 579 581 582 582 583 601 602 611 612 612 625 630 634 635 637 638 640 641 647 650 667 668 691 692 707 707 708 708 709 728 743 744 744 745 746 747 757 758 763 764 764 765 769 770 772 773 774 775 791 801 802 809 810 810 811 815 816 819 820 824 825 827 828 831 832 836 837 852 853 858 879 880 880 886 887 888 889 900 901 ||
 * [|Proline-endopeptidase] [|[*]] || 7 || 72 307 436 499 547 572 856 ||
 * [|Proteinase K] || 409 || 4 9 10 12 14 17 20 25 27 29 30 34 36 39 40 41 42 45 46 47 48 49 51 53 55 57 58 63 69 70 73 78 81 82 83 84 85 95 96 99 100 101 102 103 104 106 111 112 118 122 124 125 126 128 132 133 135 136 137 139 141 143 144 146 147 148 149 151 152 153 154 159 160 161 164 165 166 168 171 172 173 177 178 179 180 182 185 187 192 194 195 196 198 199 202 203 206 207 208 211 215 216 220 224 225 226 227 231 235 240 250 251 252 255 259 260 261 262 266 267 268 271 274 275 276 278 283 286 287 289 290 294 296 298 299 302 304 305 308 311 312 317 319 320 326 329 332 333 334 338 339 343 344 347 348 350 352 355 358 359 361 364 365 367 368 370 375 378 379 380 383 386 387 396 399 400 401 403 406 407 411 415 417 419 420 423 424 425 427 428 429 434 439 440 441 442 446 447 448 450 453 455 456 458 459 463 464 475 476 477 479 480 484 485 490 494 495 496 500 503 504 508 509 511 514 519 520 521 523 527 528 529 533 534 536 537 541 543 544 545 549 550 551 555 556 561 563 565 566 567 568 570 575 576 578 579 582 583 584 586 587 591 593 594 598 599 600 602 605 606 610 612 613 614 617 618 623 624 625 629 630 635 638 639 641 645 647 650 653 654 655 658 659 661 662 668 671 672 674 675 679 682 683 684 687 689 690 691 692 701 702 704 707 708 709 710 711 712 713 717 718 722 724 726 728 729 730 735 738 742 743 744 745 747 749 751 752 755 757 758 760 761 764 765 770 771 773 775 778 779 780 782 783 785 786 790 791 793 799 801 802 803 805 806 808 810 811 813 814 816 820 821 824 825 826 828 832 835 837 840 841 842 844 845 846 849 851 852 853 858 860 864 866 870 872 878 880 881 885 886 887 889 893 895 898 900 901 904 905 ||
 * [|Staphylococcal peptidase I] || 60 || 3 22 75 97 107 115 140 163 169 174 184 221 232 234 237 242 248 284 316 324 331 345 363 366 385 388 391 402 409 452 461 489 493 497 506 516 539 554 596 609 666 681 696 699 720 731 737 759 763 819 823 839 857 863 865 869 875 877 899 903 ||
 * [|Thermolysin] || 295 || 8 9 11 19 24 26 28 29 33 38 39 40 44 45 46 47 48 50 56 57 59 68 72 80 81 82 83 84 95 98 99 101 102 103 105 110 111 121 123 124 125 131 132 134 135 136 142 143 145 147 150 151 152 159 160 164 165 167 170 171 172 176 178 179 191 194 195 197 198 202 205 206 207 210 214 223 225 226 230 239 249 254 259 260 264 265 270 273 275 282 285 286 288 289 293 303 304 307 310 311 319 326 328 332 333 338 342 343 346 349 354 358 360 364 367 369 377 378 379 380 381 392 395 398 399 405 406 407 414 416 418 423 424 426 427 428 433 438 440 445 446 447 448 449 454 455 462 463 466 468 473 474 475 476 479 483 484 494 495 503 507 508 510 521 526 527 528 532 533 535 542 543 544 547 548 549 555 558 564 565 566 567 569 573 574 575 578 581 582 583 585 590 593 598 601 605 612 616 617 622 623 628 629 637 638 640 644 649 652 653 654 657 660 661 667 670 671 674 678 682 683 686 688 689 690 691 706 707 708 710 711 712 716 717 725 727 728 729 740 741 742 743 744 746 748 750 751 755 756 757 760 764 769 770 772 774 777 778 782 784 785 789 790 792 793 796 798 801 802 807 809 810 812 813 815 820 824 827 831 834 836 840 841 844 845 848 850 852 859 879 880 885 886 888 900 ||
 * [|Trypsin] || 80 || 19 33 56 61 90 91 93 98 109 131 134 170 183 197 204 222 223 228 229 230 247 263 272 282 293 309 310 328 330 335 346 360 373 389 397 398 431 438 462 465 466 468 473 483 491 518 526 530 573 595 621 637 646 651 656 669 670 676 678 688 695 700 719 721 723 725 736 777 784 788 792 796 847 859 862 873 874 888 894 902 ||


 * **__Propiedades fisico-químicas de la proteína (ExPaSy ProtParam tool):__**

code
 * Número de aminoácidos:** 905


 * Peso molecular:** 98552.6


 * pI teórico:** 5.27

code Ala (A) 93 10.3% Arg (R) 55 6.1% Asn (N) 24 2.7% Asp (D) 55 6.1% Cys (C) 6 0.7% Gln (Q) 31 3.4% Glu (E) 64 7.1% Gly (G) 79 8.7% His (H) 28 3.1% Ile (I) 37 4.1% Leu (L) 87 9.6% Lys (K) 29 3.2% Met (M) 22 2.4% Phe (F) 33 3.6% Pro (P) 49 5.4% Ser (S) 54 6.0% Thr (T) 47 5.2% Trp (W) 9 1.0% Tyr (Y) 23 2.5% Val (V) 80 8.8% Pyl (O) 0 0.0% Sec (U) 0 0.0%
 * Composition de aminoácidos:**


 * Total de residuos cargados negativamente (Asp + Glu):** 119
 * Total de residuos cargados positivamente (Arg + Lys):** 84


 * Composición atómica:**

Carbon C 4370 Hydrogen H 6871 Nitrogen N 1219 Oxygen O 1323 Sulfur S 28


 * Formula:** C4370H6871N1219O1323S28
 * Total de átomos:** 13811


 * Índice de estabilidad:** 33.71; la proteína es estable.


 * Índice alifático:** 89.35


 * Hidrofobicidad (GRAVY):** -0.148


 * Aparecen algunos __dominios coiled-coil: (no son dominios coiled-coils) __


 * ==Análisis filogenético. (donde está su secuencia??? el arbol no se entiende si no pone los nombres de las especies...) ==


 * Con el programa ClustalW y Mega 4.1 obtuvimos un dendrograma Neighbour-joining de la proteína comparada con otras similares:

**


 * __//**Informe final:<span style="background-color: rgb(255, 255, 0);"> muy pobre y sin bibliografía) **//__

Se ha realizado un estudio bioinformático de parte de una secuencia de un microorganismo que ha resultado ser del género rhodococcus. De esta secuencia de 17000pb hemos obtenido mediante el programa Artemis los ORFs, todos los cuales (de un mínimo de 100pb) hemos verificado la proteína para la cual codifican, de los 84 obtenidos inicialmente únicamente 15 codificaban para alguna proteína (al menos con la información de la bate de datos actual (BLAST). De dichas proteínas hemos centrado el estudio en la Glutamato Sintasa (subunidad grande), proteína que interviene en la siguiente reacción:

2 L-glutamate + NADP+ = L-glutamine + 2-oxoglutarate + NADPH + H+ <span style="background-color: rgb(255, 255, 0);">(porqué no define los números C00025, c0005....)

Se trata de una proteína perteneciente a la familia de las oxidorreductasas y contiene un dominio GATasa 2 y otro Glu sintasa central (Pfam, Sanger Institute y KEGG). Es una flavoproteína Hierro-Azufre, en la reacción inversa puede actuar el amonio en lugar de la glutamina pero más lentamente. Interviene en el metabolismo del Glutamato, Nitrógeno y en otras vías metabólicas.

Se confirmó que en efecto se trata de una proteína citoplasmática <span style="font-family: Arial,Helvetica,sans-serif;">**[PSORTb v.2.0:** J.L. Gardy, M.R. Laird, F. Chen, S. Rey, C.J. Walsh, M. Ester, and F.S.L. Brinkman (2005)]. Es además una proteína hidrófila con mayor contenido de cargas negativas. En el análisis de la secuencia proteica se obtuvo que es cortado con un gran número de peptidasas y contiene algún dominio coiled-coil [ COILS, Lupas, A., Van Dyke, M., and Stock, J. (1991)]. Asimismo se obtuvo un %G+C en la secuencia de 67.8 [FramePlot 2.3.2].


 * Bibliografía:**

Applied and Environmental Microbiology, April 2001, p. 1412-1417, Vol. 67, No. 4 Muscatello, G., Gilkerson, J. R., Browning, G. F. (2009). Detection of Virulent Rhodococcus equi in Exhaled Air Samples from Naturally Infected Foals. //J. Clin. Microbiol.// 47: 734-737


 * Agradecimientos**:

Al departamento de Microbiología de la Universidad de León y al Dr. J. Antonio Gil