Informations

Différence de variance de Cys dans les séquences protéiques

Différence de variance de Cys dans les séquences protéiques



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Supposons que j'ai deux ensembles de protéines (séquences d'acides aminés). Dans un ensemble, je trouve que la variance de la concentration en pourcentage de la Cys est bien supérieure (65,34) à la variance de la Cys dans l'autre groupe (0,456). Cela signifie-t-il quelque chose ? Cela a-t-il une quelconque implication biologique ?

La concentration a été calculée en divisant le nombre total de Cys trouvé par la taille de la séquence protéique.


Non, car il est extrêmement probable que vos ensembles ne soient pas un échantillon représentatif de la vraie distribution des protéines.

Votre biais peut être causé par un effet sur la fonctionnalité de la protéine, mais il peut aussi s'agir d'un biais dans lequel les organismes sont séquencés ou de quelque chose causé par l'alignement ou la façon dont vous recherchez vos ensembles.


Protéine doigt de zinc 746

<p>Le score d'annotation fournit une mesure heuristique du contenu d'annotation d'une entrée UniProtKB ou d'un protéome. Ce score <strong>ne peut pas</strong> être utilisé comme mesure de l'exactitude de l'annotation car nous ne pouvons pas définir la « bonne annotation » pour une protéine donnée.<p><a href='/help/annotation_score' target='_top'> Suite. </a></p> - Preuve expérimentale au niveau de la protéine i <p>Ceci indique le type de preuve qui soutient l'existence de la protéine. Notez que la preuve « existence de protéines » ne donne pas d'informations sur l'exactitude ou l'exactitude de la ou des séquences affichées.<p><a href='/help/protein_existence' target='_top'>Plus. </a></p>

Sélectionnez une section sur la gauche pour voir le contenu.


Différence de variance de Cys dans les séquences protéiques - Biologie

Plus de matériel

Conseils sur les modèles

Laboratoire d'analyse des séquences d'acides aminés

Séquences d'acides aminés et relations évolutives

Une technique utilisée pour déterminer les relations évolutives consiste à étudier la similitude biochimique des organismes. Bien que les moisissures, les oryctéropes et les humains semblent avoir peu de points communs physiquement, une étude de leurs protéines révèle certaines similitudes. Les biologistes ont mis au point des techniques pour déterminer la séquence des acides aminés dans les protéines. En comparant les séquences d'acides aminés dans les protéines homologues d'organismes similaires et d'organismes divers, des relations évolutives qui pourraient autrement passer inaperçues peuvent être déterminées.

Les biologistes pensent que plus la similitude entre les séquences d'acides aminés de deux organismes est grande, plus leur relation est étroite. Inversement, plus les différences sont grandes, plus la relation est distante. De plus, les biologistes ont découvert que de telles preuves biochimiques se comparent favorablement à d'autres sources de preuves des relations évolutives.

Dans cet exercice, vous comparerez des séquences d'acides aminés (AA) dans des protéines de plusieurs vertébrés. Vous étudierez également les différences d'acides aminés et déduirez les relations évolutives entre certains organismes divers.

Partie A : Comparaison des séquences d'acides aminés

1. Examinez la figure 1 , qui compare des portions correspondantes de molécules d'hémoglobine chez l'homme et cinq autres animaux vertébrés. L'hémoglobine, une protéine composée de plusieurs longues chaînes d'acides aminés, est la molécule transportant l'oxygène dans les globules rouges. La séquence représentée n'est qu'une portion d'une chaîne constituée de 146 acides aminés. Les chiffres de la figure 1 indiquent la position d'un acide aminé particulier dans la chaîne.


1. INTRODUCTION

1.1 Variantes associées à la maladie

Les variantes génétiques peuvent avoir des impacts allant de bénins à mortels, avec une multitude de maladies de gravité variable entre les deux. Les variants associés à la maladie peuvent apparaître non seulement dans les régions codantes, mais aussi dans les régions régulatrices, les introns, les régions non codantes, les sites d'épissage, etc. La source la plus connue de ces variantes est peut-être ClinVar, 1, 2 qui relie les variantes d'ADN d'échantillons de patients aux phénotypes associés et à leur signification clinique, c'est-à-dire bénigne ou pathogène. Il contient actuellement (juin 2019) plus de 440 000 variantes. D'autres sources de données sur les variantes comprennent HGMD (la base de données de mutation génétique humaine) 3 qui rassemble les données publiées sur les variantes génétiques responsables de maladies héréditaires humaines. Sa version « professionnelle » contient plus de 256 000 variantes, tandis que sa version publique en compte plus de 170 000. La base de données Online Mendelian Inheritance in Man (OMIM) 4, qui compile de la même manière les troubles génétiques de la littérature, se concentre sur les gènes humains et les phénotypes génétiques, et contient plus de 25 000 variantes. UniProt 5 stocke les variantes de la maladie qui affectent les protéines humaines, en cartographiant les variantes sur l'isoforme canonique de chacune. Les données sont compilées à partir d'OMIM et de ClinVar et sont disponibles sous forme de fichier téléchargeable, appelé humsavar.txt, de plus de 30 000 variantes.

1.2 Variantes naturelles

Les variantes qui ne causent pas de maladie, mais qui sont présentes dans la population générale, fournissent une mesure de base de la variabilité naturelle du génome humain à laquelle les variantes de la maladie peuvent être comparées. La plus grande source de ces variantes est la base de données gnomAD 6 qui contient des données provenant de diverses études génétiques spécifiques à la maladie et de la population de plus de 140 000 individus. Actuellement, il contient plus de 15 millions de variantes.

1.3 Impact des variantes

La gravité d'une nouvelle variante, ou d'une variante d'intérêt clinique, peut être évaluée à l'aide de l'un des nombreux classificateurs. Leurs prédictions sont basées sur une variété de facteurs, y compris la conservation, les mutations pathogènes connues et les annotations au niveau des protéines. Les plus connues sont probablement SIFT (tri des intolérants des tolérants), 7 PolyPhen, 8 et CADD (déplétion dépendante des annotations combinées), 9 bien que des méthodes plus récentes puissent donner des résultats plus fiables. 10 Divers serveurs fournissent des prédictions sur des variantes spécifiques : MutPred2, 11 MutFunc, 12 et autres. En effet, il existe plus de 100 outils et ressources pour prédire l'impact des variantes génétiques, utilement compilés dans la base de données Variant Impact Predictor (VIPdb). 13

1.4 Bases de données

Un certain nombre de bases de données fournissent différents niveaux d'annotation pour les variantes causant la maladie. 13 L'une d'entre elles est la base de données DECIPHER 14, qui contient un vaste référentiel de variantes génétiques et de phénotypes associés, provenant d'un consortium international de plus de 200 centres cliniques universitaires de médecine génétique, ainsi que de plus de 1 600 généticiens cliniques et scientifiques de laboratoire de diagnostic. Bien que principalement axée sur les variantes au niveau de l'ADN, la base de données fournit également des informations structurelles sur les protéines, où la structure humaine est disponible, et une visionneuse 3D montrant les emplacements des variantes dans la structure 3D.

La base de données eDGAR 15 contient des associations gène/maladie compilées à partir d'OMIM, Humsavar et ClinVar. Ses annotations proviennent de nombreuses ressources, dont la Protein Data Bank (PDB), 16 BIOGRID, 17 STRING, 18 KEGG, 19 REACTOME, 20 NET-GE, 21 et TRRUST. 22

HuVarBase 23 contient des données au niveau des protéines pour les variantes causant des maladies et comprend des vues 3D de la protéine, lorsqu'une structure de la protéine humaine est disponible.

PhyreRisk 24 résout le problème des structures manquantes des protéines humaines en générant des modèles d'homologie à partir des structures de protéines apparentées dans d'autres organismes. Les modèles d'homologie sont construits par le programme Phyre2 25. La page des protéines comprend un navigateur de séquences interactif avec les variantes mappées sur les résidus pertinents, une vue 3D interactive de la structure de la protéine dans le visualiseur moléculaire JSmol, 26 mettant en évidence les emplacements des variantes, une image graphique indiquant la quantité de protéine pouvant être mappé sur une structure 3D, une liste des différentes isoformes de la protéine dans UniProt et une liste des variantes elles-mêmes. Des variantes spécifiques peuvent être analysées plus avant à l'aide de son serveur frère, Missense3D. 27 Cela montre une évaluation de l'impact probable du variant sur la structure 3D de la protéine. Il évalue le variant dans son contexte structurel et identifie les manières possibles dont il pourrait affecter la protéine en question : par exemple, si la charge d'un résidu enfoui est modifiée, ou si une liaison disulfure est rompue, ou si la structure secondaire est altérée , etc.

1.5 VarSite

Nous décrivons ici VarSite, un serveur qui regroupe une grande partie des mêmes informations que dans les serveurs qui viennent d'être décrits, mais ajoute quelques fonctionnalités nouvelles et vise à être plus facile à utiliser par le non-spécialiste. Il a deux « vues » principales des données des variants : la vue sur les protéines et le rapport sur les résidus. Dans le premier cas, les variantes associées à la maladie d'une protéine sont présentées dans le contexte de la protéine dans son ensemble, à la fois en termes de séquence et de ses diverses propriétés (c'est-à-dire domaines Pfam, conservation des résidus, variantes naturelles, annotations structurelles, etc.) , et les régions où au moins une structure 3D est disponible. Les informations structurelles proviennent de toutes les protéines étroitement apparentées de la PDB, à la fois humaines et non humaines. Cela fournit une couverture beaucoup plus grande et plus d'informations que celles fournies par de nombreux autres serveurs qui ne correspondent qu'à une structure de la protéine humaine exacte elle-même. La deuxième vue principale est le rapport de résidus qui analyse en détail une variante donnée. Cette information peut aider à évaluer la pathogénicité potentielle. L'analyse prend en compte l'ampleur du changement dans les propriétés des acides aminés, la propension à la maladie du changement et son contexte structurel. Une nouvelle caractéristique est l'analyse de VarSite par domaine (Pfam ou CATH), dans laquelle elle agrège les variants extraits de protéines humaines contenant le domaine donné et fournit une indication si le domaine peut contenir des « points chauds » pour les variants associés à la maladie. Une autre nouveauté est l'utilisation de l'ontologie de la maladie pour cartographier les parties du corps affectées par la maladie spécifique.

Ainsi, VarSite agrège et étend les annotations de diverses ressources, fournit diverses « vues » sur les données, et propose de nouvelles fonctionnalités afin de faciliter davantage l'interprétation des variantes,


<p>Cette section fournit toutes les informations utiles sur la protéine, principalement des connaissances biologiques.<p><a href='/help/function_section' target='_top'>Plus. </a></p> Fonction i

Fonctionne comme un capteur de leucine intracellulaire qui régule négativement la voie de signalisation TORC1 via le complexe GATOR. En l'absence de leucine, se lie au sous-complexe GATOR GATOR2 et empêche la signalisation TORC1 (PubMed : 18692468, PubMed : 25263562, PubMed : 25457612, PubMed : 26449471, PubMed : 26612684, PubMed : 26586190).

La liaison de la leucine à SESN2 perturbe son interaction avec GATOR2, activant ainsi la voie de signalisation TORC1 (PubMed:26449471, PubMed:26586190).

Ce régulateur métabolique inductible par le stress joue également un rôle de protection contre les stress oxydatifs et génotoxiques. Peut réguler négativement la traduction des protéines en réponse au stress du réticulum endoplasmique, via TORC1 (PubMed: 24947615).

Peut réguler positivement la transcription par NFE2L2 des gènes impliqués dans la réponse au stress oxydatif en facilitant la dégradation autophagique médiée par SQSTM1 de KEAP1 (PubMed:23274085).

Peut également médier l'inhibition par TP53 de la signalisation TORC1 lors d'un stress génotoxique (PubMed : 18692468).

Possède une activité alkylhydroperoxyde réductase née par le domaine N-terminal de la protéine (PubMed:26612684).

A été initialement rapporté pour contribuer à la résistance au stress oxydatif en réduisant PRDX1 (PubMed:15105503).

Cependant, cela n'a pas pu être confirmé (PubMed:19113821).

<p>Informations organisées manuellement pour lesquelles il existe des preuves expérimentales publiées.</p> <p><a href="/manual/evidences#ECO:0000269">Plus. </a></p> Assertion manuelle basée sur l'expérience dans i


Résumé

Le taux et le mécanisme d'évolution des séquences protéiques sont des questions centrales en biologie évolutive depuis les années 1960. Bien que le taux d'évolution de la séquence protéique dépend principalement du niveau de contrainte fonctionnelle, ce qui détermine exactement la contrainte fonctionnelle n'est pas clair. La disponibilité croissante des données génomiques a permis des examens empiriques indispensables sur la nature de la contrainte fonctionnelle. Ces études ont révélé que le taux d'évolution d'une protéine est principalement influencé par son niveau d'expression plutôt que par son importance fonctionnelle. Une combinaison d'analyses théoriques et empiriques a identifié plusieurs mécanismes derrière ces observations et a démontré un rôle de premier plan dans l'évolution de la sélection des protéines contre les erreurs dans les processus moléculaires et cellulaires.


Chapitre 18 : Mutation et réparation de l'ADN

- Mutation silencieuse : change un codon en un codon synonyme qui spécifie ce même acide aminé, en modifiant la séquence d'ADN sans changer la séquence d'acides aminés :
* il existe certains effets phénotypiques, notamment :
- les ARNt sont utilisés pour différents codons synonymes (affecte le taux de synthèse des protéines)
- les jonctions exon-intron qui affectent l'épissage
- la liaison des miARN à la séquence complémentaire de l'ARNm, qui détermine si l'ARNm est traduit
- Mutation neutre : une mutation manquante qui modifie la séquence d'acides aminés de la protéine mais ne modifie pas de manière significative sa fonction

- Acide nitreux : désamine la cytosine, créant de l'uracile
- Mutation de transition

3 codons absurdes : UGA UAA & UAG

GGA (pour Gly) serait muté en un codon non-sens substituant un U à un G
GGA>> UGA

b) Si une seule transversion se produit dans un codon qui spécifie Phe, quels acides aminés
peut être spécifié par la séquence mutée ?

c) Si une seule transition se produit dans un codon qui spécifie Leu, quels acides aminés peuvent
être spécifié par la séquence mutée ?

UUU : CUU(Leu) UCU(Ser) UUC(Phe)
UUC : CUC(Ser) UCC(Ser) UUU(Phe)

b) UUU : AUU (Ile), UAU (Tyr), UUA (Leu), GUU (Val), UGU (Cys), UUG (Leu)

UUC : AUC (Ile), UAC (Tyr), UUA (Leu), GUC (Val), UGC (Cys),
UUG (Leu)

c)CUU : UUU (Phe), CCU (Pro), CUC (Leu)
CUC : UUC (Phe), CCC (Pro), CUG (Leu)
AUC : UUA (Leu), CCA (Pro), CUU (Leu)
CUG : UUG (Leu), CCG (Pro), CUA (Leu)
UUG : CUG (Leu), UCG (Ser), UUA (Ser)
UUA : CUA (Leu), UCA (Ser), UUG (Leu)

d)UUA : AUA (Met), UAA (Stop), UUU (Phe), GUA (Val), UGA
(Arrêt), UUC (Phe)

UUG : AUG (Met), UAG (Stop), UUU (Phe), GUG (Val), UGG (Trp), UUC (Phe)

CUU : GUU (Val), CGU (Arg), CUG (Leu), AUU (Ile)
CUC : AUC (Ile), CAC (His), CUA (Leu), GUC (Val), CGC (Arg), CUG (Leu)

CUA : AUA (Ile), CAA (Gln), CUC (Leu), GUA (Val), CGA (Arg), CUG (Leu)

Séquence de matrice d'ADN : 3'-TAC TGG CCG TTA GTT GAT ATA ACT-5'
Nombre de nucléotides : 24 nucléotides (1 @ T 3' et 24 à T 5')

Séquence originale : 3'-TAC TGG CCG TTA GTT GAT ATA ACT-5'
Séquence d'ARNm : 5'-AUG ACC GGC AAU CAA CUA UAU UGA-3'

Séquence d'acides aminés : Amino-Met Thr Gly Asn Gln Leu Tyr Stop-Carboxyl

Séquence originale : 3'-TAC TGG CCG TTA GTT GAT ATA ACT-5'
Séquence mutée : 3'-TAC TGG CCG TCA GTT GAT ATA ACT-5'
Séquence d'ARNm : 5'-AUG ACC GGC AGU CAA CUA UAU UGA-3'

Acides aminés : Amino-Met Thr Gly Ser Gln Leu Tyr-Carboxyl

b) La transition entraîne la formation d'un codon non-sens UAA.

Séquence originale : 3'-TAC TGG CCG TTA GTT GAT ATA ACT-5'
Séquence mutée : 3'-TAC TGG CCG TTA ATT GAT ATA ACT-5'
Séquence d'ARNm : 5'-AUG ACC GGC AAU UAA CUA UAU UGA-3'

Séquence d'acides aminés : Amino-Met Thr Gly Asn-Carboxyl

c) La délétion d'un nucléotide entraîne une mutation de décalage du cadre de lecture.

Séquence originale : 3'-TAC TGG CCG TTA GTT GAT ATA ACT-5'
Séquence mutée : 3'-TAC TGG CGT TAG TTG ATA TAA CT-5'
Séquence d'ARNm : 5'-AUG ACC GCA GUC AAC UAU AUU GA-3'

Acides aminés : Amino-Met Thr Ala Ile Asn Tyr Ile -Carboxyl

d) La transversion entraîne la substitution de His pour Gln dans la protéine.

Séquence originale : 3'-TAC TGG CCG TTA GTT GAT ATA ACT-5'
Séquence mutée : 3'-TAC TGG CCG TTA GTA GAT ATA ACT-5'
Séquence d'ARNm : 5'-AUG ACC GGC AAU CAU CUA UAU UGA-3'
Acides aminés : Amino-Met Thr Gly Asn His Leu Tyr-Carboxyl

Séquence mutée : 3'-TAC TGG CCG TTA GTG GAT ATA ACT-5'
Séquence d'ARNm : 5'-AUG ACC GGC AAU CAC CUA UAU UGA-3'
Acides aminés : Amino-Met Thr Gly Asn His Leu Tyr-Carboxyl

e) L'ajout des trois nucléotides entraîne l'ajout de Thr à l'amino
séquence acide de la protéine, et est une insertion dans le cadre.

Séquence originale : 3'-TAC TGG CCG TTA GTT GAT ATA ACT-5'
Séquence mutée : 3'-TAC TGG TGG CCG TTA GTT GAT ATA ACT-5'
Séquence d'ARNm : 5'-AUG ACC ACC GGC AAU CAA CUA UAU UGA-3'

Acides aminés : Amino-Met Thr Thr Gly Asn Gln Leu Tyr-Carboxyl

f) La protéine conserve la séquence d'acides aminés d'origine.

Séquence originale : 3'-TAC TGG CCG TTA GTT GAT ATA ACT-5'
Séquence mutée : 3'-TAC TGG CCA TTA GTT GAT ATA ACT-5'
Séquence d'ARNm : 5'-AUG ACC GGU AAU CAA CUA UAU UGA -3'


Les références

Voir DK, Kephart V, Blake K : Mapping genes controling variation in orge grain protein concentration. Culture Sci. 2002, 42 : 680-685. 10.2135/cropsci2002.0680.

Clancy JA, Han F, Ullrich SE : Cartographie comparative des QTL d'activité d'amylase parmi trois croisements d'orge. Projet nord-américain du génome de l'orge. Culture Sci. 2003, 43 : 1043-1052. 10.2135/cropsci2003.1043.

Ullrich SE : Génétique et sélection des attributs de qualité fourragère de l'orge. Science de l'orge : avancées récentes de la biologie moléculaire à l'agronomie du rendement et de la qualité. Edité par : Slafer GA, Molina-Cano JL, Savin R, Araus JL, Romagosa I. Food Products Press : Food Products Press 2002 : 115-142.

Emebiria LC, Moodya DB, Horsleyb R, Panozzoa J, Read BJ: Le contrôle génétique de la variation de la teneur en protéines du grain dans une population haploïde doublée dérivée d'un croisement entre des lignées d'orge à deux rangs australienne et nord-américaine. J Cereal Sci. 2005, 41 : 107-114. 10.1016/j.jcs.2004.08.012.

Polanda JA, Bradbury PJ, Buckler ES, Nelson RJ : cartographie d'associations nichées à l'échelle du génome de la résistance quantitative à la brûlure des feuilles du nord chez le maïs. Proc Natl Acad Sci USA. 2010, 108 : 6893-6899.

Hu VW, Addington A, Hyman A: De nouvelles variantes génétiques dépendantes du sous-type d'autisme sont révélées par des analyses d'association de traits quantitatifs et de sous-phénotypes des données GWAS publiées. PLoS One. 2011, 6 (4) : e19067. 10.1371/journal.pone.0019067.

Beattie AD, Edney MJ, Scoles GJ, Rossnagel BG: Association Mapping of Malting Quality Data from Western Canadian Two-row Barley Cooperative Trials. Culture Sci. 2010, 50 : 1649-1663. 10.2135/cropsci2009.06.0334.

Pasam RK, Sharma R, Malosetti M, Van Eeuwijk FA, Haseneyer G, Kilian B, Graner A : études d'association à l'échelle du génome pour les caractères agronomiques dans une collection mondiale d'orge de printemps. BMC Végétal Biol. 2012, 12 : 16. 10.1186/1471-2229-12-16.

Stracke S, Haseneyer G, Veyrieras JB, Geiger HH, Sauer S, Graner A, Piepho HP : La cartographie des associations révèle l'action des gènes et les interactions dans la détermination de la période de floraison de l'orge. Théor Appl Genet. 2009, 118 : 259-273. 10.1007/s00122-008-0896-y.

Glémin S, Bataillon TA : Vue comparée de l'évolution des graminées sous domestication. Nouveau Phytol. 2009, 183 : 273-290. 10.1111/j.1469-8137.2009.02884.x.

Nevo E : Origine, évolution, génétique des populations et ressources pour l'amélioration de l'orge sauvage, Hordeum spontanéum, dans le Croissant Fertile. Orge : Génétique. Edité par : Shewry PR. Biologie moléculaire et biotechnologie, CAB International, Wallingford : Biochimie 1992 : 19-43.

Jin XL, Cai SG, Han Y, Wang J, Wei K, Zhang GP : variantes génétiques de HvGlb1 dans l'orge sauvage annuelle tibétaine et l'orge cultivée et leur corrélation avec la qualité du malt. J Cereal Sci. 2011, 53 : 59-64. 10.1016/j.jcs.2010.09.06.

Qiu L, Wu DZ, Ali S, Cai SG, Dai F, Jin XL, Wu FB, Zhang GP : évaluation de la tolérance à la salinité et analyse de la fonction allélique de HvHKT1 et HvHKT2 dans l'orge sauvage tibétaine. Théor Appl Genet. 2011, 122 : 695-703. 10.1007/s00122-010-1479-2.

Uauy C, Distelfeld A, Fahima T, Blechl A, Ubcovsky J : Un gène NAC régulant la sénescence améliore la teneur en protéines du grain, en zinc et en fer dans le blé. Science. 2006, 314 : 1298-1301. 10.1126/science.1133649.

Jamar C, Loffet F, Frettinger P, Ramsay L, Fauconnier M-L, Jardin P : NAM-1 polymorphisme des gènes et teneur en protéines des grains chez Hordeum. J Plante Physiol. 2010, 167 : 497-501. 10.1016/j.jplph.2009.10.014.

Distelfeld A, Korol A, Dubcovsky J, Uauy C, Blake T, Fahima T : Colinéarité entre le QTL de la teneur en protéines des grains d'orge (GPC) sur le bras chromosomique 6HS et la région Gpc-B1 du blé. Elevage de Mol. 2008, 22 : 25-38. 10.1007/s11032-007-9153-3.

Kjeldahl JZ : Une nouvelle méthode pour la détermination de l'azote dans la matière organique. Anal Chem. 1983, 22 : 366-382.

Uzunova M, Ecke W, WeiBleder K, Röbbelen G : Cartographie du génome du colza (Brassica napus L.). I. Construction d'une carte de liaison RFLP et localisation des QTL pour la teneur en glucosinolate des graines. Théor Appl Genet. 1995, 90 : 194-204.

Wenzl P, Carling K, Kudrna D, Jaccoud D, Huttner E, Kleinhofs A, Kilian A : Diversity Arrays Technology (DArT) pour le profilage du génome entier de l'orge. Proc Natl Acad Sci USA. 2004, 101 : 9915-9920. 10.1073/pnas.0401076101.

Primer3 sur le WWW pour les utilisateurs généraux et pour les programmeurs biologistes. Méthodes et protocoles bioinformatiques : méthodes en biologie moléculaire. Edité par : Rozen S, Skaletsky HJ, Krawetz S, Misener S. Totowa : Humana Press 2000 : 365-386.

Thompson JD, Higgins DG, Gibson TJ : CLUSTAL W : amélioration de la sensibilité de l'alignement progressif de séquences multiples grâce à la pondération des séquences, aux pénalités d'écart spécifiques à la position et au choix de la matrice de pondération. Nucl Acid Res. 1994, 22 : 4673-4680. 10.1093/nar/22.22.4673.

Hubisz MJ, Falush D, Stephens M, Pritchard JK : Déduire une structure de population faible à l'aide d'informations sur les groupes d'échantillons. Mol Ecol Resour. 2009, 9 : 1322-1332. 10.1111/j.1755-0998.2009.02591.x.

Pritchard JK, Stephens M, Donnelly P : Inférence de la structure de la population à l'aide de données de génotype multilocus. La génétique. 2000, 155 : 945-959.

Liu RH, Meng JL : MapDraw : une macro Microsoft Excel pour dessiner des cartes de liaison génétique basées sur des données de liaison génétique données. Heraditas (Pékin). 2003, 25 : 317-321.

Knowler WC, Williams RC, Pettitt DJ, Steinberg AG : Gm3–5, 13, 14 et diabète sucré de type 2 : une association chez les Indiens d'Amérique avec un mélange génétique. Suis J Hum Genet. 1988, 43 : 520-526.

Sharbel TF, Haubold B, Mitchell-Olds T : Isolement génétique par distance chez Arabidopsis thaliana : biogéographie et colonisation postglaciaire de l'Europe. Mol Ecol. 2000, 9 : 2109-2118. 10.1046/j.1365-294X.2000.01122.x.

Ge YC, Dudoit S, Speed ​​TP : tests multiples basés sur le rééchantillonnage pour les puces à ADN. L'analyse des données. Sociedad de Estadistica e Investigaci6n Operativa Test. 2003, 12 (1) : 1-77.

Chan EK, Rowe HC, Hansen BG, Kliebenstein DJ : L'architecture génétique complexe du métabolome. PLoS Genet. 2010, 6 : e1001198. 10.1371/journal.pgen.1001198.

Manolio TA, Collins FS, Cox NJ, Goldstein DB, Hindorff LA: Trouver l'héritabilité manquante des maladies complexes. La nature. 2009, 461 : 747-753. 10.1038/nature08494.

Liu YJ, Papasian CJ, Liu JF, Hamilton J, Deng HW : La réplication est-elle l'étalon-or pour valider les découvertes d'association à l'échelle du génome ?. PLoS One. 2008, 3 : e4037. 10.1371/journal.pone.0004037.

Jukanti AK, Fischer AM : Un locus à haute teneur en protéines sur l'orge (Hordeum vulgare) le chromosome 6 est associé à une augmentation de la protéolyse de la feuille étendard et de la remobilisation de l'azote. Plante Physiol. 2008, 132 : 426-439. 10.1111/j.1399-3054.2007.01044.x.

Smith DB : Protéine de graine d'orge et ses effets sur la qualité maltée et brassicole. Graine de variété végétale. 1990, 3 : 63-80.

Wang JM, Zhang GP, Chen JX, Ding SR, Zhou TY : Variation des qualités de grain et de malt de l'orge en fonction des cultivars et des environnements. Agr Sci en Chine. 2003, 2 : 699-705.

Jin XL, Wei K, Zhang GP: Une analyse d'association à l'échelle du génome des loci de caractères quantitatifs pour la teneur en fractions protéiques dans l'orge sauvage tibétaine. Biotechnol Lett. 2012, 34 : 159-165. 10.1007/s10529-011-0736-z.

Yan JB, Kandianis CB, Harjes CE, Bai L, Kim EH, Yang XH, Skinner DJ, Fu ZY, Mitchell S, Li Q, Fernandez MGS, Zaharieva M, Babu R, Fu Y, Palacios N, Li JS, Penna D , Brutnell T, Buckler ES, Warburton ML, Rocheford T : Variation génétique rare à Zea mays crtRB1 augmente le β-carotène dans le grain de maïs. Nat Genet. 2010, 42 : 322-327. 10.1038/ng.551.

Wang N, Qian W, Suppanz D, Wei LJ, Mao BZ, Long Y, Meng JL, Müller AE, Jung C : Variation du temps de floraison du colza (Brassica napus L.) est associée à une variation allélique dans l'homologue FRIGIDA BnaA. FRI.a. J Exp Bot. 2011, 62 (15) : 5641-5658. 10.1093/jxb/err249.


Afficher les options

Nous réalisons une gamme d'alignements pour chaque famille Pfam-A. Vous pouvez voir une description de chacun ci-dessus. Vous pouvez afficher ces alignements de différentes manières, mais veuillez noter que certains types d'alignement ne sont jamais générés tandis que d'autres peuvent ne pas être disponibles pour toutes les familles, le plus souvent parce que les alignements sont trop volumineux pour être traités.

La graine
(24)
Complet
(3503)
Protéomes représentatifs UniProt
(6449)
RP15
(297)
RP35
(1069)
RP55
(2938)
RP75
(3849)
Jalview Vue Vue Vue Vue Vue Vue Vue
HTML Vue Vue
PP/carte thermique 1 Vue

1 Impossible de générer des alignements PP/Heatmap pour les graines aucune donnée PP disponible

Clé: disponible, non généré, &mdash pas disponible.


Informations sur l'auteur

Affiliations

Département de statistique, Université nationale de Séoul, Séoul, Corée du Sud

Jongsu Jun, Yongkang Kim et le parc Taesung

École supérieure de santé publique, Université nationale de Séoul, Séoul, Corée du Sud

Département de génie biomédical, Seoul National University College of Medicine, Séoul, Corée du Sud

Hyunsoo Kim, Injun Yeo, Jiyoung Park et Youngsoo Kim

Institut de génie médical et biologique, Centre de recherche médicale, Collège de médecine de l'Université nationale de Séoul, Séoul, Corée du Sud

Hyunsoo Kim et Youngsoo Kim

Département de médecine interne et Institut de recherche sur le foie, Université nationale de Séoul, Séoul, Corée du Sud

Su Jong Yu, Jeong-Ju Yoo, Young Youn Cho, Dong Hyeon Lee, Eun Ju Cho, Jeong-Hoon Lee, Yoon Jun Kim et Jung-Hwan Yoon

Département de mathématiques et de statistiques, Université Sejong, Séoul, Corée du Sud

Programme interdisciplinaire en bioinformatique, Université nationale de Séoul, Séoul, Corée du Sud


Voir la vidéo: La variance et lécart type données groupées par classes - Résolution de problème commentée (Août 2022).