Informations

Existe-t-il une portion minimale connue d'ADN qui puisse distinguer deux personnes dans le monde ?

Existe-t-il une portion minimale connue d'ADN qui puisse distinguer deux personnes dans le monde ?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

J'imagine que cela pourrait être utilisé comme identifiant universel.


Voici ce que disent les données. Le gouvernement britannique a dû disposer de preuves scientifiques lorsqu'il a choisi 10 sections de génome de longueur variable pour sa base de données, SGM+. Dans l'une de ces sections variables, certaines personnes ont 10 répétitions de CTTT, d'autres en ont 11, d'autres en ont 12, etc. Le plus grand de ces fragments, à sa longueur maximale, compte environ 350 paires de bases. Le gouvernement américain utilise 13 de ces séquences de longueur variable pour sa base de données de la CIA, appelée CODIS. Des deux côtés de l'Atlantique, environ 3 à 4 000 paires de bases ont été jugées suffisantes, avec une certaine marge de sécurité, par les généticiens les plus avancés au monde, travaillant sur de l'argent public.

Le hic, c'est que ces séquences de longueur variable sont disjointes, vous finissez donc par nécessiter bien plus de 4 000 pb. Si vous avez besoin de ces marqueurs sur le même brin d'ADN (chromosome), vous devez les espacer de 50 centimorgans, distance à laquelle ils se recombinent indépendamment. Mais selon http://www.sciencemag.org/site/feature/data/genomes/265-5181-2094.pdf , le chromosome le plus long n'a que 350-400 centimorgan. Cela signifie que vous ne pouvez pas obtenir 10 séquences d'ADN indépendantes sur un chromosome humain, même le plus long.

Je prédis qu'il n'y a pas d'étirement continu de l'ADN, qui distinguerait deux non-jumeaux. Puisqu'il est bien préférable d'utiliser plusieurs chromosomes dans les empreintes génétiques, je doute que vous trouviez des données expérimentales plus pertinentes.


Lors de la conception des amorces PCR, nous utilisons généralement une longueur minimale de 20 bases, car la probabilité qu'une séquence de N bases apparaisse au hasard est de $frac{1}{4^N}$ et $frac{1}{4^ {20}}$ est d'environ 9x10$^{-13}$, soit environ 1 sur un billion. Le génome humain ayant un peu plus de 3 milliards de bases de long, une séquence de 20 bases ne devrait apparaître qu'une seule fois. Cependant, la plupart de l'ADN d'un individu n'est pas aléatoire, il est hérité de ses parents, et il tient le sien de ses parents, etc. Pour faire court, il n'y a pas beaucoup d'ADN unique chez une personne donnée. L'unicité n'est visible qu'à grande échelle, vous avez la moitié de votre ADN de votre père, et l'autre moitié de votre mère. Tout comme vos frères et sœurs, mais l'ADN spécifique qu'ils ont obtenu de chaque parent serait différent du vôtre.

Je pense que nous pouvons calculer les chances d'obtenir un ensemble spécifique de chromosomes d'un parent. S'il y a 23 paires de chromosomes, alors la probabilité d'obtenir un ensemble donné devrait être de $frac{1}{2^{23}}$, puisque nous avons 2 parents, les chances d'obtenir votre ensemble spécifique d'ADN sont de $ (frac{1}{2^{23}})^2$, soit environ 1 sur 70 000 milliards. Donc, les chances que vous ayez un jumeau non identique qui a le même ADN que vous est très faible. Mais toute séquence de 20 bases donnée devrait avoir une probabilité de 50 % d'apparaître chez vous et le frère ou la sœur.

Mais si nous regardons 2 séquences d'ADN de 20 bases chez vous et votre frère, et que chacune a 50 % de chances d'apparaître, alors la probabilité que les deux séquences apparaissent chez vous est de 25 %. Si on en ajoute un tiers, ça passe à 12,5 %, et ainsi de suite. S'il y a 7 milliards d'humains sur terre, nous avons besoin d'une probabilité inférieure à 1 sur 7 milliards, et 2^{33}$ est d'environ 8,6 milliards, donc si vous regardez 33 sites différents sur le génome, il devrait être capable de différencier vous de tous les humains sur la planète

Au fait, ai-je bien fait le calcul ? Je ne suis pas mathématicien et j'aurais pu me tromper dans mes calculs de probabilité. J'ai également supposé que le taux de mutation spontanée et les taux de croisement sont suffisamment bas pour être ignorés, mais les deux serviraient à rendre votre ADN un peu plus unique.


Cliquez ici pour commander notre dernier livre, A Handy Guide to Ancestry and Relationship DNA Tests

Comment fonctionne un test de paternité ?

-Un adulte curieux de Californie

Ai-je trouvé mon vrai père ? Est-ce vraiment mon fils ? Michael Jackson a-t-il vraiment engendré l'enfant de Billie Jean ? Des questions comme celles-ci étaient très difficiles à répondre. Dans le passé, les gens utilisaient un test sanguin. Cela pourrait exclure que vous étiez le père, mais ne pouvait pas prouver que vous l'étiez.

De nos jours, la technologie de l'ADN est utilisée pour déterminer qui est le père d'un enfant. Le test ADN de paternité permet de déterminer le père biologique d'un enfant avec un degré de certitude très élevé.

Tout le monde, à l'exception des jumeaux identiques, possède un ensemble unique d'ADN. L'ADN est composé de 4 bases ou lettres, A, C, G et T. Ces 4 lettres forment le code écrit qui constitue la séquence d'ADN.

Maintenant, quand quelqu'un dit que l'ADN de chacun est unique, cela veut dire que parfois une de ces lettres est différente pour différentes personnes. En moyenne, deux personnes au hasard ont une base différente toutes les mille bases environ. C'est de là que vient la statistique qui dit que l'ADN de tout le monde est à 99,9% le même.

Puisque vous obtenez la moitié de votre ADN de votre père et l'autre moitié de votre mère, votre ADN est à plus de 99,9% le même que celui de vos parents. Votre ADN est également plus similaire à celui de vos grands-parents ou cousins ​​qu'à celui d'un inconnu au hasard. Les tests de paternité utilisent cette plus grande similitude pour déterminer qui sont les parents.

Alors, comment savoir que l'ADN de quelqu'un est plus similaire à celui d'un autre ? Il existe de nombreuses façons, mais nous allons nous concentrer sur la plus simple, l'analyse de restriction ADN ou les empreintes génétiques. Les empreintes génétiques utilisent des protéines spéciales appelées enzymes de restriction. Les enzymes de restriction coupent l'ADN, mais seulement à une certaine combinaison de A, G, T et C. Différentes enzymes de restriction coupent l'ADN à différents endroits - chacune a une séquence unique qu'elle reconnaît. Par exemple, l'enzyme de restriction EcoRI coupe l'ADN à la séquence GAATTC et ne coupera qu'à cette séquence. Il ne sera pas, par exemple, coupé au GACTTC.

OK, donc ce que fait l'empreinte ADN, c'est qu'elle recherche des différences dans l'ADN qui changent là où ces enzymes de restriction peuvent couper l'ADN. Le schéma des fragments d'ADN est ensuite comparé et si l'ADN de l'enfant ressemble à une combinaison de l'ADN des deux parents, alors l'enfant est le leur.

Regardons un exemple de la façon dont cela pourrait être fait. Supposons que nous ayons trois personnes : Bob, Larry et Mary. Si nous prenons le même tronçon d'ADN des trois d'entre eux, de petites différences pourraient signifier qu'EcoRI les coupera différemment (voir Figure 1). Dans Bob, la séquence GAATTC apparaît une fois dans ce tronçon d'ADN. C'est-à-dire que dans cette portion d'ADN, Bob a un site EcoR I. Supposons maintenant que Mary n'ait pas de sites EcoR I et que Larry ait deux sites EcoR I dans cette portion d'ADN. Vous pouvez voir qu'EcoR I coupera ce tronçon d'ADN de Bob en deux fragments, celui de Larry en trois fragments et celui de Mary ne le coupera pas.

Lorsque nous coupons l'ADN avec EcoR I et séparons les fragments coupés sur un gel d'agarose, le gel peut ressembler à la figure 2. Dans un gel d'agarose, les fragments plus petits s'exécutent plus rapidement, de sorte que vous obtenez une séparation basée sur la taille - les fragments les plus gros sont près du haut, les plus petits sont près du bas.

Maintenant, supposons que Mary ait un enfant et qu'elle veuille déterminer lequel des deux hommes, Bob ou Larry, est le père biologique de son enfant. Elle consulte un expert en tests de paternité. L'expert recueille une certaine étendue d'ADN de Mary, Bob, Larry et de l'enfant, et coupe l'ADN avec EcoR I. Lorsque l'expert sépare les fragments d'ADN coupés sur un gel d'agarose, le motif ressemble à celui de la figure 3. L'ADN de l'enfant doit être une combinaison de l'ADN de Mary et de l'ADN de l'homme. Le gel d'agarose indique que l'ADN de l'enfant est une combinaison de l'ADN de Mary (bande supérieure) et de l'ADN de Larry (trois bandes inférieures). Ainsi, Larry est le père biologique de l'enfant.

Que se passe-t-il si Larry et Bob ont la même séquence dans cette portion d'ADN ? La réponse est que vous ne seriez pas en mesure de distinguer, en examinant les différences dans cette portion d'ADN, entre les deux hommes. Donc que fais-tu? Vous recherchez simplement d'autres segments d'ADN dans lesquels il existe une différence entre ces deux hommes. C'est pourquoi dans la vraie vie, de multiples segments d'ADN doivent être examinés pour s'assurer que les résultats sont statistiquement significatifs.


9 Résistance au VIH


Toutes sortes de choses pourraient anéantir la race humaine et les frappes de mdashastéroïdes, l'annihilation nucléaire et le changement climatique extrême, pour n'en nommer que quelques-uns. La menace la plus effrayante est peut-être un certain type de virus super virulent. Si une maladie ravage la population, seules les rares personnes immunisées auraient une chance de survie. Heureusement, nous savons que certaines personnes sont effectivement résistantes à des maladies particulières.

Prenez le VIH, par exemple. Certaines personnes ont une mutation génétique qui désactive leur copie de la protéine CCR5. Le VIH utilise cette protéine comme porte d'entrée dans les cellules humaines. Ainsi, si une personne est dépourvue de CCR5, le VIH peut pénétrer dans ses cellules et il est extrêmement peu probable qu'elle soit infectée par la maladie.

Cela étant dit, les scientifiques disent que les personnes atteintes de cette mutation sont résistantes plutôt qu'immunisées contre le VIH. Quelques individus sans cette protéine ont contracté et sont même morts du SIDA. Apparemment, certains types inhabituels de VIH ont découvert comment utiliser des protéines autres que CCR5 pour envahir les cellules. Ce type de débrouillardise est la raison pour laquelle les virus sont si effrayants.

Les personnes ayant deux copies du gène défectueux sont les plus résistantes au VIH. Actuellement, cela ne comprend qu'environ 1% des Caucasiens et est encore plus rare dans d'autres ethnies.


Parabon ® Instantané ®

Snapshot est un service d'analyse ADN médico-légale de pointe qui fournit une variété d'outils pour résoudre rapidement les cas difficiles :

Snapshot est idéal pour générer des pistes d'enquête, réduire les listes de suspects et résoudre les cas de restes humains, sans perdre de temps et d'argent à rechercher de fausses pistes.

Commencer

Snapshot est idéal pour générer des pistes d'enquête, réduire les listes de suspects et résoudre les cas de restes humains, sans perdre de temps et d'argent à rechercher de fausses pistes.

Commencer

Généalogie Génétique Instantanée

La généalogie génétique (GG) est la combinaison de l'analyse génétique avec la recherche historique et généalogique traditionnelle pour étudier l'histoire familiale. Pour les enquêtes médico-légales, il peut être utilisé pour identifier les restes en liant l'ADN à une famille avec une personne disparue ou pour indiquer l'identité probable d'un agresseur.

En comparant un échantillon d'ADN à une base de données d'ADN provenant de participants volontaires, il est possible de déterminer s'il y a des parents de l'échantillon d'ADN dans la base de données et à quel point ils sont étroitement liés (voir Inférence de parenté instantanée pour plus de détails). Ces informations peuvent ensuite être recoupées avec d'autres sources de données utilisées dans la recherche généalogique traditionnelle, telles que les registres de recensement, les registres d'état civil, les nécrologies et les archives de journaux.

Pourquoi utiliser la généalogie génétique ?

La généalogie génétique vous offre un nouvel outil puissant pour générer des pistes sur des sujets inconnus. Lorsqu'une recherche de généalogie génétique produit des correspondances utiles avec un échantillon d'ADN inconnu, elle peut réduire une liste de suspects à une région, une famille ou même un individu. Associé au phénotypage ADN instantané pour réduire davantage la liste des correspondances possibles, il n'y a pas de méthode d'identification plus puissante qu'une comparaison directe de l'ADN. L'identité peut alors être confirmé en utilisant l'analyse STR traditionnelle.

En quoi cette technique diffère-t-elle des recherches familiales dans la base de données CODIS ?

Notre service de généalogie génétique ressemble un peu à la recherche familiale, mais il diffère de trois manières très importantes : (1) nous ne recherchons que les bases de données publiques de généalogie génétique, pas les bases de données criminelles appartenant au gouvernement (profil STR), telles que CODIS (2) parce que l'ADN Les profils SNP que nous générons contiennent beaucoup plus d'informations que les profils STR traditionnels, la parenté génétique peut être détectée à une distance beaucoup plus grande (voir Snapshot Kinship Inference) et (3) parce que les correspondances de généalogie génétique peuvent être référencées par nom avec des sources de généalogie traditionnelles, telles que comme Ancestry.com, les arbres généalogiques existants peuvent être utilisés pour accélérer la création d'arbres et la résolution de cas. Cette technologie et nos techniques innovantes se combinent pour créer un système révolutionnaire d'identification humaine médico-légale.

Comment fonctionne la généalogie génétique

La généalogie génétique utilise des polymorphismes mononucléotidiques (SNP) de l'ADN autosomique (ADNat) pour déterminer à quel point deux individus sont étroitement liés. Contrairement à d'autres marqueurs génétiques, tels que l'ADN mitochondrial ou l'ADN du chromosome Y, l'ADN-at est hérité de toutes les lignées ancestrales et transmis à la fois par les hommes et les femmes et peut donc être utilisé pour comparer deux individus, quelle que soit leur parenté. Cependant, les SNP atDNA sont plus difficiles à obtenir à partir d'échantillons médico-légaux, c'est pourquoi Parabon a créé un protocole de laboratoire optimisé pour garantir des résultats de haute qualité même à partir de petits échantillons d'ADN dégradés.

La métrique atDNA standard utilisée par les généalogistes génétiques est la quantité d'ADN que deux personnes sont susceptibles d'avoir héritées d'un ancêtre commun récent. Cela peut être estimé en recherchant de longues étendues d'ADN identiques. Alors que les allèles peuvent facilement être partagés par hasard dans un ou plusieurs SNP, il est très peu probable que deux personnes non apparentées partagent une longue étendue d'ADN. Par conséquent, seuls les segments au-dessus d'une certaine longueur sont comptés. La longueur de ces segments partagés est mesurée en centimorgans (cM), une mesure de la distance génétique, et le nombre total de cM partagés sur tous les chromosomes peut être utilisé pour déterminer approximativement à quel point deux personnes sont étroitement liées. La figure ci-dessous montre comment les segments partagés d'ADN sur un seul chromosome sont brisés à chaque génération, ce qui conduit à des segments partagés plus courts pour les parents plus éloignés. À l'aide d'une base de données publique de généalogie génétique, l'ADN d'une personne inconnue peut être comparé à environ 1 million d'autres personnes pour voir si l'une d'entre elles est liée.

Les correspondances de la base de données ADN servent d'indices sur lesquels les méthodes de généalogie traditionnelles peuvent s'appuyer, à commencer par la construction des arbres généalogiques des correspondances en utilisant une grande variété de sources d'informations. Au cours du processus de construction de l'arbre, le généalogiste génétique a recherché des ancêtres communs qui apparaissent dans plusieurs arbres généalogiques des correspondances. Idéalement, les mariages entre les descendants des ancêtres communs identifiés sont découverts. Ensuite, la recherche de descendance est utilisée pour rechercher des descendants à l'intersection de ces ancêtres communs qui sont nés à une époque qui correspond à la tranche d'âge estimée du sujet. Le but de cette recherche est de réduire les individus possibles à un ensemble de noms, une famille, voire un individu.

Selon la quantité d'informations disponibles sur les matchs, la généalogie génétique peut produire un large éventail de pistes. Dans tous les cas qui procèdent à l'analyse, la généalogie génétique réduira considérablement la portée des identités possibles pour la personne d'intérêt. Dans certains cas, l'identité sera réduite aux descendants d'un ancêtre particulier ou d'une région particulière. Dans d'autres, nos analystes peuvent produire le nom et l'adresse de la personne d'intérêt. Dans tous les cas, l'identité doit être confirmée par une correspondance ADN médico-légale traditionnelle.

Cas d'utilisation de la généalogie génétique

La généalogie génétique a traditionnellement été utilisée pour découvrir de nouveaux parents et construire un arbre généalogique complet. Cependant, il peut également être utilisé pour découvrir l'identité d'un individu inconnu en utilisant l'ADN pour identifier des parents, puis en utilisant la recherche généalogique pour construire des arbres généalogiques et en déduire qui pourrait être l'individu inconnu. Ces techniques ont principalement été utilisées pour découvrir les antécédents familiaux des personnes adoptées, mais elles s'appliquent également aux applications médico-légales. La généalogie génétique a été utilisée pour identifier les restes des victimes, ainsi que les suspects, dans un certain nombre de cas très médiatisés.

Étant donné que la généalogie génétique utilise le même type de données générées pour le phénotypage d'ADN instantané et la parenté d'instantané, l'analyse peut être effectuée rapidement sur des cas existants, et les nouveaux cas ont un large éventail d'options pour générer de nouvelles pistes à partir d'un seul échantillon d'ADN.

Instantané présenté dans
National Geographic
Couverture de magazine
[METTRE À JOUR: Résolu]

Regarder NBC Nightly News
Mettez l'instantané à l'épreuve

Regarder l'instantané
Vidéo de flux de travail

Le service de phénotypage d'ADN instantané

Le phénotypage de l'ADN est la prédiction de l'apparence physique à partir de l'ADN. Il peut être utilisé pour générer des pistes dans les cas où il n'y a pas de suspects ou d'accès à la base de données, pour réduire les listes de suspects et pour aider à résoudre les cas de restes humains.

L'ADN porte l'ensemble d'instructions génétiques pour les caractéristiques physiques d'un individu, produisant le large éventail d'apparences parmi les gens. En déterminant comment l'information génétique se traduit par l'apparence physique, il est possible de « rétro-concevoir » l'ADN en un profil physique. Snapshot lit des dizaines de milliers de variantes génétiques (« génotypes ») à partir d'un échantillon d'ADN et utilise ces informations pour prédire à quoi ressemble une personne inconnue.

Au cours des quatre dernières années, en utilisant l'exploration de données en profondeur et des algorithmes avancés d'apprentissage automatique dans un pipeline bioinformatique spécialisé, Parabon &mdash avec le soutien financier du département américain de la Défense (DoD) &mdash a développé le système de phénotypage d'ADN médico-légale Snapshot, qui avec précision prédit l'ascendance génétique, la couleur des yeux, la couleur des cheveux, la couleur de la peau, les taches de rousseur et la forme du visage chez des individus de toute origine ethnique, même des individus d'ascendance mixte.

Étant donné que certains traits sont partiellement déterminés par des facteurs environnementaux et non par l'ADN seul, les prédictions de traits instantanés sont présentées avec une mesure de confiance correspondante, qui reflète le degré d'influence de ces facteurs sur chaque trait particulier. Des traits, tels que la couleur des yeux, qui sont très héréditaire (c'est-à-dire qu'elles ne sont pas grandement affectées par les facteurs environnementaux) sont prédites avec une précision et une confiance plus élevées que celles qui ont une héritabilité inférieure. Ces différences sont indiquées dans les mesures de confiance qui accompagnent chaque prédiction de trait d'instantané.

Comment fonctionne le phénotypage de l'ADN

Alors que la criminalistique ADN traditionnelle fait correspondre les STR d'un échantillon à un suspect connu ou à une base de données, le phénotypage ADN peut générer de nouvelles pistes sur un individu, même s'ils n'ont pas été identifiés auparavant dans une base de données. Le phénotypage de l'ADN tire parti de la technologie SNP moderne pour lire les parties du génome qui codent réellement pour les différences entre les personnes.

Le système de phénotypage d'ADN instantané traduit les informations SNP d'un échantillon d'ADN d'un individu inconnu en prédictions d'ascendance et de traits d'apparence physique, tels que la couleur de la peau, la couleur des cheveux, la couleur des yeux, les taches de rousseur et même la morphologie du visage. Chaque prédiction de phénotype est faite avec une mesure de confiance, y compris celles qui peuvent être exclu avec une grande confiance.

Technologie SNP

Les progrès récents de la technologie génomique ont rendu pratique et abordable la lecture de la séquence de millions de morceaux d'ADN à partir d'une petite quantité d'échantillon. Ces données capturent une grande partie de la variation génomique entre les personnes et contiennent donc une grande partie du modèle génétique qui différencie l'apparence des personnes. Ces SNP génotypes peut alors être associé à phénotypes à partir de milliers de sujets pour créer un ensemble de données de génotype et de phénotype (GaP) à analyser.

À l'aide de données génomiques provenant de grandes populations de sujets aux phénotypes connus, les scientifiques en bio-informatique de Parabon ont construit des modèles statistiques pour les traits médico-légaux, qui peuvent être utilisés pour prédire l'apparence physique d'individus inconnus à partir de l'ADN.

Exploration de données

En commençant par de grands ensembles de données GaP contenant des informations génétiques et des mesures de phénotype pour des milliers de sujets, l'équipe de bioinformatique de Parabon effectue une analyse statistique à grande échelle sur des centaines de milliers de SNP individuels et des milliards de combinaisons de SNP pour identifier les marqueurs génétiques associés à un trait. Cette exploitation minière Le processus peut prendre des semaines de temps de calcul sur des centaines, voire des milliers d'ordinateurs. En fin de compte, les SNP ayant la plus grande probabilité de contribuer biologiquement à la variation du trait sont sélectionnés pour une utilisation potentielle dans des modèles prédictifs.

La modélisation des données

Dans le la modélisation phase, les scientifiques de Parabon utilisent des algorithmes d'apprentissage automatique pour combiner l'ensemble sélectionné de SNP dans une équation mathématique complexe pour l'architecture génétique du trait. Les données SNP d'un nouvel individu inconnu peuvent ensuite être connectées à cette équation pour produire une prédiction du trait chez cet individu.

La précision du modèle est évaluée en faisant des prédictions sur de nouveaux sujets avec des phénotypes connus ("prédictions hors échantillon"). En comparant les phénotypes prédits et réels, les scientifiques de Parabon sont en mesure de calculer des déclarations de confiance sur les nouvelles prédictions et, plus important encore, d'exclure des traits hautement improbables. Par exemple, si 99 % des personnes aux yeux bruns ont une valeur de prédiction de la couleur des yeux supérieure à 2, nous pouvons avoir une très grande confiance qu'une prédiction de 1,5 ne provient très probablement pas d'une personne aux yeux bruns.

Les modèles finaux sont calibrés avec toutes les données disponibles avant d'être installés dans le service de production Snapshot qui est utilisé pour générer des prédictions de phénotype pour les enquêteurs.

Histoires de réussite instantanées

Snapshot a été utilisé par des centaines d'organismes chargés de l'application des lois dans le monde pour aider à générer des pistes, à réduire leurs pools de suspects et à résoudre des cas de restes humains, dans le cadre d'enquêtes actives et vieilles de plusieurs décennies.

Résumés de cas en vedette: Lisez les descriptions détaillées des cas, y compris comment Snapshot a aidé à résoudre les cas suivants :

Résumé du cas
Albuquerque, Nouveau-Mexique
2008 Agression aggravée

Juste avant midi le 11 septembre 2008, Diane Marcell est retournée chez elle à Albuquerque, Nouveau-Mexique, pour rencontrer sa fille, Brittani Marcell, pour le déjeuner. Brittani, alors âgée de 17 ans, était rentrée chez elle en voiture depuis son lycée voisin. En entrant chez elle, Diane a trouvé Brittani allongée sur le sol, couverte de sang. Un sujet masculin, inconnu de Diane, se tenait près de Brittani tenant une pelle.

Surpris, il laissa tomber la pelle, se heurta. Suite

Résumé du cas
Lac Brownwood, Texas
2016 Agression sexuelle et meurtre

Le vendredi 13 mai 2016, le bureau du shérif du comté de Brown au Texas (BCSO) a reçu un rapport de personne disparue pour Rhonda Chantay Blankinship, 25 ans. Des membres de la famille ont déclaré que Blankinship avait été vue pour la dernière fois vendredi soir, marchant près de son domicile dans la région de Tamarack Mountain / Thunderbird Bay du lac Brownwood. Des amis, des membres de sa famille et des bénévoles ont commencé à la rechercher pendant que les députés suivaient les pistes possibles de sa disparition.

Le corps de Blankinship a été retrouvé. Suite

Résumé du cas
Tacoma, WA
1986 Viol et meurtre d'une fillette de 12 ans

Le mercredi 26 mars 1986, Michella Welch, une petite fille de 12 ans aux longs cheveux blonds et aux lunettes, a disparu. Elle avait emmené ses deux jeunes sœurs à Puget Park à Tacoma, dans l'État de Washington, vers 10 heures du matin, puis était rentrée chez elle à vélo vers 11 heures du matin pour leur préparer le déjeuner. À son retour, elle a enchaîné son vélo à côté des vélos de sa sœur, a posé les déjeuners sur la table et est partie à la recherche de ses frères et sœurs, qui s'étaient rendus dans une entreprise voisine pour utiliser les toilettes.

Un camarade de classe de 13 ans a déclaré plus tard aux détectives qu'il avait vu un homme dans le parc ce jour-là sous le pont Proctor qui. Suite

Résumé du cas
Comté de Rockingham, Caroline du Nord
2012 Double Homicide

Aux premières heures du 4 février 2012, Troy et LaDonna French ont été abattus dans leur maison de Reidsville, en Caroline du Nord. Le couple s'est réveillé aux cris de leur fille de 19 ans, Whitley, qui avait détecté la présence d'un intrus dans sa chambre au deuxième étage. Alors qu'ils se précipitaient hors de leur chambre au rez-de-chaussée pour aider leur fille, l'intrus a tenté de faire taire la fille avec des menaces sous la menace d'un couteau. A défaut, il relâcha Whitley et dévala les escaliers.

Après avoir troqué son couteau contre l'arme de poing dans sa poche. Suite

Résumé du cas
Comté d'Anne Arundel, MD
2017 Restes non identifiés

Le mercredi 14 juin 2017, des membres du service de police du comté d'Anne Arundel ont répondu à un appel signalant qu'un corps avait été retrouvé dans la zone d'East Ordnance Road et d'East Avenue à Glen Burnie, dans le Maryland. À leur arrivée, les agents ont localisé des restes de squelettes humains mal décomposés qui avaient été recouverts d'une bâche. Le Bureau du médecin légiste en chef a déterminé plus tard que la défunte était une femme d'environ 20 ans et qu'un acte criminel était suspecté dans sa mort.

À l'automne 2017, après que les premiers efforts d'enquête n'ont pas permis de révéler l'identité de la victime. Suite

Témoignages: Pour découvrir comment Snapshot a aidé nos clients dans leurs enquêtes, voir :

Enquêtes publiées: Pour savoir comment Snapshot est utilisé par d'autres organismes chargés de l'application de la loi &mdash et pour en savoir plus sur d'autres cas résolus &mdash, veuillez visiter la page d'enquête policière publiée à l'adresse :

Évaluations à l'aveugle: Snapshot a été conçu par Parabon NanoLabs pour les communautés de la défense, de la sécurité, de la justice et du renseignement avec un financement de la Defense Threat Reduction Agency des États-Unis. Dans le cadre du processus de développement et de validation, Snapshot a été testé sur des milliers de génotypes hors échantillon et s'est avéré extrêmement précis.

Pour voir des exemples de prédictions d'instantanés à partir d'études d'évaluation à l'aveugle, visitez :

Exemple d'utilisation de l'instantané: Pour savoir comment utiliser l'instantané pour restreindre un groupe de suspects, regardez :

Instantané présenté dans
National Geographic
Couverture de magazine
[METTRE À JOUR: Résolu]

Regarder NBC Nightly News
Mettez l'instantané à l'épreuve

Regarder l'instantané
Vidéo de flux de travail

Prédire l'ascendance génétique avec un instantané

L'analyse scientifique des génomes humains de différentes parties du monde a montré qu'à l'échelle mondiale, les humains modernes se divisent génétiquement en sept populations continentales : africaine, moyen-orientale, européenne, centrale/sud-asiatique, est-asiatique, océanienne et amérindienne 1 . Ces divisions génétiques découlent simplement du fait que ces groupes ont été isolés les uns des autres pendant de nombreuses générations, et donc chaque groupe a une signature génétique unique qui peut être utilisée pour l'identification. Afin de déterminer l'ascendance génétique d'un nouveau sujet, Parabon Snapshot analyse des dizaines de milliers de SNP à partir d'un échantillon d'ADN pour déterminer le pourcentage d'appartenance d'une personne à chacune de ces populations mondiales. D'autres approches d'ascendance médico-légale supposent que chaque individu provient d'une seule population, de sorte qu'ils peuvent facilement être confondus par des individus mélangés, mais Snapshot permet les contributions de plusieurs populations, de sorte qu'il peut détecter des niveaux de mélange même faibles (<5%).

Carte d'ascendance mondiale montrant principalement l'ascendance est-asiatique et amérindienne / sud-américaine, avec quelques ascendances européennes également.

Une fois l'ascendance mondiale déterminée, l'algorithme d'ascendance de Snapshot étudie de quelles sous-populations (par exemple, Nord-Ouest vs Europe du Nord-Est) un individu vient. Cette analyse est robuste au mélange, de sorte que chaque morceau d'ascendance continentale peut être précisément localisé dans ce continent. Par exemple, l'exemple mixte d'Asie de l'Est et d'Amérique latine de la carte mondiale ci-dessus a été déterminé comme ayant une ascendance spécifiquement japonaise, d'Amérique centrale et d'Europe du Sud-Ouest, comme le montre la carte ci-dessous.

Carte d'ascendance régionale montrant principalement l'ascendance japonaise, d'Europe du Sud-Ouest et d'Amérique centrale.

En utilisant toutes ces informations, Snapshot crée un profil précis de l'ascendance ethnique d'un individu en utilisant uniquement son ADN.

Comment fonctionne la détermination de l'ascendance génétique

Parabon a construit un système puissant pour déterminer l'ascendance ethnique à partir de l'ADN. La plupart des autres systèmes d'ascendance médico-légale n'utilisent qu'un petit nombre de SNP et sont donc limités à des populations très grossières et ne peuvent pas détecter le mélange entre les populations. Snapshot utilise des dizaines de milliers de SNP à travers le génome pour obtenir des estimations très précises de l'ascendance, même pour des individus mélangés. Les scientifiques de Parabon ont collecté des données à partir de nombreux articles scientifiques publiés, totalisant plus de 9 000 individus avec des ancêtres clairement définis de plus de 150 populations à travers le monde, comme le montre la carte ci-dessous.

Chaque point représente une population à partir de laquelle nous avons obtenu des données de base sur l'ascendance. Des efforts sont en cours pour accroître la représentation des populations amérindiennes.

Des recherches universitaires utilisant des centaines de milliers de SNP de tout le génome ont montré que les groupes humains se divisent généralement en sept populations continentales, qui ont été établies au cours des 50 000 dernières années lors de la migration hors d'Afrique. Les 150 populations collectées comme fond d'ascendance peuvent ainsi être réparties en ces sept groupes continentaux selon leur origine.

Snapshot s'appuie sur cette recherche en cartographiant le génome d'une nouvelle personne sur ces populations établies. Notre algorithme calcule à quel point l'ADN du nouvel individu est similaire à chacune des populations de base, déterminant de quelle(s) population(s) la personne vient. Cela permet des contributions de plusieurs groupes, de sorte que même de petites quantités de mélange (<5%) peuvent être détectées.

Snapshot adopte une approche similaire pour identifier l'ascendance intra-continentale (régionale), bien que les populations locales aient été identifiées grâce à une analyse empirique réalisée par notre équipe de bioinformatique. Chaque pièce d'ascendance continentale est divisée en fonction de son ascendance régionale (par exemple, si un individu est à 50 % européen et à 50 % est-asiatique, l'origine précise de chacune de ces pièces sera déterminée). Le génome de la personne est également tracé par rapport à tous les individus connus dans chaque région pour montrer visuellement où il tombe.

Vous trouverez ci-dessous un exemple de tracé pour une personne qui a été déterminée à 50 % d'Asie de l'Est et à 50 % de Latino. L'ascendance latino est un mélange d'ascendance européenne et amérindienne, donc ces groupes sont également indiqués.

Diagramme de regroupement d'ascendance cet individu est à moitié japonais et à moitié latino.

Cas d'utilisation de la détermination de l'ascendance

L'ascendance ethnique est l'un des traits les plus informatifs qui peuvent être prédits à partir de l'ADN. Dans une analyse d'ascendance, Snapshot déterminera les origines génétiques précises d'un individu, ainsi que s'il existe des preuves de mélange (contribution de plusieurs populations). Ces informations peuvent être utilisées pour aider à identifier les restes ou pour concentrer de manière significative une enquête en excluant un large éventail de suspects possibles ou même en désignant un très petit groupe.

Instantané présenté dans
National Geographic
Couverture de magazine
[METTRE À JOUR: Résolu]

Regarder NBC Nightly News
Mettez l'instantané à l'épreuve

Regarder l'instantané
Vidéo de flux de travail

Instantané Inférence de parenté et commerce

Snapshot Kinship Inference fournit des inférences très précises sur la relation familiale entre deux personnes en fonction de leur ADN, même si elles sont éloignées. Contrairement aux méthodes d'ADN médico-légales traditionnelles, qui sont extrêmement limitées dans leur capacité à déterminer la parenté (voir la région bronzée dans la figure ci-dessous), Snapshot peut détecter la parenté avec Parents au 9e degré (cousins ​​au quatrième degré). Ce puissant outil d'analyse médico-légale fournit aux enquêteurs des informations précieuses, auparavant impossibles à obtenir, sur les échantillons d'ADN trouvés sur une scène de crime et des informations qui peuvent économiser du temps et de l'argent et conduire à des cas plus résolus.

Grâce à la quantité massive d'informations contenues dans les données SNP à l'échelle du génome, en utilisant l'ADN extrait de deux échantillons biologiques, il est possible de calculer avec précision le degré de parenté entre les contributeurs, même si la relation est très éloignée.

Construit avec des algorithmes avancés d'apprentissage automatique, le modèle de parenté Snapshot peut distinguer jusqu'à des parents au 9e degré (cousins ​​au quatrième degré) des paires non apparentées.

L'analyse de parenté traditionnelle basée sur les STR se limite à distinguer les relations parent/enfant, donnant souvent des résultats non concluants pour les frères et sœurs ou d'autres parents au deuxième degré. Le modèle de parenté de Snapshot, en revanche, utilise des centaines de milliers de SNP pour détecter les relations avec les relations au 9e degré, par exemple les cousins ​​au quatrième degré. De plus, le degré précis de la relation peut être déterminé jusqu'aux parents au 6e degré (les cousins ​​germains une fois retirés) tout en minimisant les faux positifs, c'est-à-dire les paires non apparentées déduites à tort d'être apparentées.

Comment fonctionne l'inférence de parenté d'instantané

L'analyse de parenté autosomique traditionnelle utilise moins de 20 loci de répétition en tandem courte (STR), qui n'ont pas la résolution d'établir une parenté au-delà du parent-enfant ou des frères et sœurs, et est facilement confondue par une mutation ou un test erroné d'un proche parent du vrai parent. 1 D'autres analyses médico-légales utilisent des morceaux d'ADN qui sont directement transmis par les lignées maternelle (ADN mitochondrial) ou paternelle (chromosome Y). Cependant, ces approches sont limitées à un petit sous-ensemble de relations et ont une très faible résolution. Par exemple,

7% des Européens non apparentés partagent le même haplotype mitochondrial, ce qui signifie qu'ils ne peuvent pas être attribués à une famille spécifique. L'ADNmt et les Y-STR ne peuvent que suggérer que deux individus peuvent être liés, mais ne peuvent pas dire si cette relation est proche ou très éloignée.

Insatisfaits de ces limitations, les scientifiques de Parabon ont entrepris de développer un nouvel algorithme qui tire parti de la quantité massive de données autosomiques rendues disponibles par le typage SNP à l'échelle du génome pour comparer deux génomes et déterminer le degré précis de parenté entre les deux individus. Le résultat est un nouveau test révolutionnaire qui redéfinit l'état de l'art en matière d'analyse de la parenté.

L'algorithme de parenté de Parabon analyse la similitude entre deux génomes et utilise un modèle d'apprentissage automatique pour prédire le degré de parenté des deux individus. Dans des milliers de prédictions hors échantillon, cette méthode s'est avérée très précise tout en maintenant un très faible taux de faux positifs (c'est-à-dire que les paires non liées ne sont presque jamais déduites à tort d'être liées). Cela est vrai pour tous les sujets d'origines ethniques variées, y compris les paires apparentées d'origines ethniques différentes. La précision absolue est de >90 % par rapport aux parents au 3e degré (cousins ​​germains), et l'instantané peut distinguer les parents au 6e degré (par exemple, les cousins ​​germains une fois retirés) des paires non apparentées avec une précision supérieure à 98 %.

Précision de parenté instantanée, mesurée comme la fréquence des prédictions correctes du degré exact de parenté (précision absolue) et la fréquence des prédictions à un degré de parenté réelle (n = 3 654 relations).

Comme le montre la figure ci-dessus, même lorsque Snapshot déduit à tort le degré de parenté entre deux individus, il est presque toujours correct à un degré près. Par exemple, Snapshot peut parfois à tort prédire qu'une relation de 4e degré est une relation de 5e degré, mais il commet rarement l'erreur de prédire qu'une relation de 4e degré est une relation de 6e degré. Avec ce niveau de précision, vous pouvez être sûr que les inférences fournies par Snapshot sont fiables et exploitables.

[1] Chakraborty, R., et al. (1999). L'utilité des loci de répétition en tandem courts au-delà de l'identification humaine : implications pour le développement de nouveaux systèmes de typage de l'ADN. Électrophorèse, 1682&ndash1696.

Comment l'inférence de parenté d'instantané est utilisée

L'inférence de parenté instantanée peut être utilisée pour établir des relations familiales entre un échantillon d'ADN et des échantillons d'ADN précédemment collectés ou parmi un ensemble de nouveaux échantillons, par exemple :

  • S'il y a une chance que l'auteur d'un crime soit lié à la victime, Snapshot peut comparer l'ADN de la victime à un échantillon d'ADN sur la scène du crime pour déterminer s'ils sont liés. Avec un seul test, les enquêteurs incluent ou excluent toute la famille biologique élargie de la victime.
  • Si l'ADN d'un suspect ne peut pas être obtenu, mais qu'un membre de la famille consentant est prêt à fournir un échantillon, Snapshot peut établir si ce membre de la famille est lié à un échantillon d'ADN sur la scène de crime.
  • Si l'identité de restes non identifiés est suspectée, mais que seuls des parents éloignés sont disponibles, Snapshot peut comparer l'ADN des restes (même des os) à celui d'un parent pour déterminer s'ils sont apparentés.

Selon le Bureau of Justice Statistics du ministère de la Justice des États-Unis (DOJ), plus de 60 % de tous les crimes violents en 2016 [la dernière période pour laquelle des données sont disponibles] ont été commis par des personnes connues de la victime. 1

La connaissance de ces relations peut être utilisée pour valider des allégations de parenté éloignée, établir des réseaux de relations au sein de groupes d'intérêt ou identifier des restes lorsque des parents proches ne sont pas disponibles, tels que des cas froids, des catastrophes de masse ou des victimes de conflits passés.

[1] Morgan R. et Kena G., Criminal Victimization, 2016, US Department of Justice, Office of Justice Programs, Bureau of Justice Statistics, NCJ 251150, décembre 2017. https://www.bjs.gov/content/pub /pdf/cv16.pdf. Récupéré: 19 février 2018.

Instantané présenté dans
National Geographic
Couverture de magazine
[METTRE À JOUR: Résolu]

Regarder NBC Nightly News
Mettez l'instantané à l'épreuve

Regarder l'instantané
Vidéo de flux de travail

Amélioration de l'art médico-légal

Alors que l'ADN peut révéler beaucoup de choses sur l'apparence d'un sujet, les informations sur des caractéristiques telles que l'âge, l'indice de masse corporelle (IMC) ou la présence de poils sur le visage ne sont pas disponibles dans le code génétique d'un individu. Les services d'art médico-légal d'instantanés offrent un moyen d'incorporer de telles informations dans un composite d'instantanés lorsqu'elles sont disponibles à partir de sources autres que l'ADN.

Exemples de progression d'âge et d'accessoirisation avec Snapshot Forensic Art Services. Par défaut, Snapshot produit des composites à partir d'ADN à 25 ans (A). Composite (A) montré après progression vers l'âge de 50 ans (B) avec l'ajout d'une barbe claire (C) après progression vers l'âge de 75 ans avec des lunettes de lecture (D) et avec une barbe complète (E)

Notre département d'art médico-légal &mdash sous la direction de Thom Shaw, qui est certifié par l'Association internationale pour l'identification (IAI) dans la discipline de l'art médico-légal &mdash propose des services de progression de l'âge, de modification de l'IMC et d'accessoires, qui peuvent inclure l'ajout de poils sur le visage , lunettes, piercings, etc. Nous pouvons également créer des croquis composites à partir de témoignages oculaires et les combiner de cette manière avec des composites instantanés traditionnels, corroborant le témoignage ou ajoutant des informations de phénotype objectives pour aider à produire le composite le plus précis possible.

Composite (A) montré après progression de l'âge jusqu'à 50 ans, y compris une barbe (B) par rapport au sujet réel (C)

Dans les cas impliquant des restes non identifiés où un crâne ou un crâne partiel est disponible, nos artistes médico-légaux sont également formés pour effectuer une reconstruction faciale numérique, en utilisant la structure osseuse pour améliorer ou nuancer un composite Snapshot.

Prédictions instantanées pour Yolanda McClary, enquêteur pour la télévision "Cold Justice",
montré à l'âge de 25 ans et l'âge a progressé jusqu'à 49 ans

Collectivement, ces services d'art médico-légal complètent parfaitement ce que Snapshot peut fournir à partir de l'ADN seul et, ensemble, ils représentent une révolution dans la façon dont l'ADN peut être utilisé dans une enquête.

Comment fonctionne l'amélioration de l'art médico-légal

Les artistes médico-légaux sont des artistes ayant reçu une formation spéciale pour relever les défis médico-légaux. Ils ont une connaissance approfondie du visage humain et de la façon dont les effets du vieillissement et de l'indice de masse corporelle (IMC) changent l'apparence. Les personnes formées à la reconstruction faciale apprennent à déduire la répartition la plus probable des muscles et des tissus mous d'un crâne. Les artistes médico-légaux qui créent des croquis composites à partir de témoignages oculaires sont formés pour mener des entretiens cognitifs, afin d'obtenir la représentation la plus précise de la mémoire d'un témoin.

Comme de nombreux domaines, les artistes médico-légaux commencent à s'appuyer fortement sur des applications logicielles modernes pour faciliter leur travail. Les croquis réalisés auparavant au crayon et au tampon peuvent désormais être dessinés numériquement. De plus, les reconstructions faciales une fois réalisées avec la sculpture en argile peuvent également être sculptées numériquement. Entre de bonnes mains, les logiciels graphiques peuvent faciliter la tâche d'ajouter ou de soustraire des cheveux, des cicatrices et d'autres accessoires. Dans tous les cas, une grande habileté et une formation spécialisée sont encore nécessaires, mais le travail peut être plus efficace et réaliste grâce à ces outils.

Cas d'utilisation d'amélioration de l'art médico-légal

Progression ou régression d'âge

L'âge n'étant pas génétiquement codé, Snapshot prédit par défaut les sujets à 25 ans. Lorsque les enquêteurs ont des raisons de croire qu'une personne d'intérêt est plus jeune ou plus âgée, nos artistes peuvent ajuster un composite en conséquence, en fonction des principes de vieillissement standard.

Exemples de progression d'âge avec Snapshot Forensic Art Services : le composite prédit à 25 ans (A) montré après progression d'âge jusqu'à 50 ans (B) et après une nouvelle progression d'âge jusqu'à 75 ans

Composites basés sur le compte de témoins oculaires

Nos artistes médico-légaux sont formés pour mener des entretiens cognitifs et produire des composites uniquement à partir d'un témoignage oculaire. L'interview et la production composite sont réalisées en ligne avec une technologie de partage d'écran, afin que les témoins oculaires n'aient pas à se déplacer. Lorsque l'ADN est disponible pour la même personne d'intérêt telle que vue par le témoin oculaire, Snapshot peut fournir un composite correspondant du point de vue du « témoin génétique ». Nos artistes peuvent combiner un composite à partir d'un témoignage oculaire avec un produit par Snapshot pour produire un rendu unique et très précis qui contient le meilleur que les deux sources d'informations peuvent offrir.

Accessoirisation

Dans certains cas, des informations descriptives sur les accessoires ou les caractéristiques distinctives d'un sujet sont disponibles et peuvent être utilisées pour améliorer un instantané composite. Par exemple, une image de caméra de surveillance peut être trop granuleuse pour être identifiée, mais néanmoins suggérer qu'un suspect a des poils sur le visage. De même, un témoin oculaire peut se souvenir d'un tatouage ou d'une cicatrice, même s'il était trop traumatisé pour se souvenir de grand-chose d'autre. Dans de tels cas, nos artistes médico-légaux peuvent accessoiriser un composite d'instantanés pour inclure toutes les informations descriptives disponibles sur un sujet.

Exemples d'accessoirisation avec Snapshot Forensic Art Services : le composite prédit à 25 ans (A) montré après la progression de l'âge jusqu'à 50 ans, avec l'ajout d'une barbe légère (B) et après une nouvelle progression vers l'âge de 75 ans avec des lunettes de lecture et une barbe pleine (C)

Altération de l'indice de masse corporelle (IMC)

Outre les effets du vieillissement, les modifications de l'IMC ont parmi les plus grands effets sur l'apparence. Par défaut, Snapshot produit des composites en supposant que le sujet a un IMC de 22, ce qui est considéré comme moyen. Lorsque des informations sont disponibles suggérant qu'un sujet a un IMC inférieur ou supérieur à la moyenne, les artistes médico-légaux peuvent modifier de manière appropriée l'IMC d'un composite d'instantanés.

Exemples extrêmes d'altération de l'indice de masse corporelle (IMC) : la prédiction originale (A) montrée avec une masse corporelle significativement inférieure (B) et à nouveau avec une masse corporelle significativement plus importante (C)

Restes non identifiés

Lorsque des restes humains non identifiés incluent un crâne, nos artistes médico-légaux peuvent effectuer une reconstruction faciale, construisant littéralement le visage correspondant en utilisant la connaissance de la musculature faciale et des tissus mous. Bien que les traits du visage ne puissent pas être parfaitement déduits d'un crâne, la structure osseuse peut être extrêmement informative sur la forme du visage d'un individu. Snapshot prédit la morphologie du visage extérieur, mais lorsqu'un crâne est disponible, un artiste médico-légal peut l'utiliser pour confirmer ou améliorer un composite Snapshot basé sur la reconstruction faciale.

Instantané présenté dans
National Geographic
Couverture de magazine
[METTRE À JOUR: Résolu]


Remarques

[note 2] TATT signifie une chaîne spécifique de bases nucléotidiques, thymine-adéninethymine-thymine. La thymine et l'adénine sont deux des quatre bases fréquemment trouvées dans l'ADN. Les deux autres sont la cytosine (C) et la guanine (G).

[note 3] Norrgard, K., « Forensics, DNA Fingerprinting, and CODIS » (consulté le 7 juillet 2010) Éducation à la nature 1(1) (2008).

[note 4] Hanson, E. et J. Ballantyne, « Un système hautement discriminant à 21 locus Y-STR 'Megaplex' conçu pour augmenter les loci d'haplotype minimal pour les cas médico-légaux » Journal des sciences judiciaires 49 (janvier 2004) : 1-12.


Existe-t-il une portion minimale connue d'ADN qui puisse distinguer deux personnes dans le monde ? - La biologie

"ADN mitochondrial et évolution humaine," Nature, 325 (1987), 31-6.

Département de biochimie, Université de Californie, Berkeley, Californie 94720, États-Unis Page 31 Les ADN mitochondriaux de 147 personnes, provenant de cinq populations géographiques, ont été analysés par cartographie de restriction. Tous ces ADN mitochondriaux proviennent d'une femme qui aurait vécu il y a environ 200 000 ans, probablement en Afrique. Toutes les populations examinées à l'exception de la population africaine ont des origines multiples, ce qui implique que chaque zone a été colonisée à plusieurs reprises.

La biologie MOLÉCULAIRE est aujourd'hui une source majeure d'informations quantitatives et objectives sur l'histoire évolutive de l'espèce humaine. Il a fourni de nouvelles informations sur notre divergence génétique des singes 1-8 et sur la façon dont les humains sont liés génétiquement les uns aux autres 9-14. Notre image de l'évolution génétique au sein de l'espèce humaine est cependant obscurcie, car elle repose principalement sur des comparaisons de gènes dans le noyau. Les mutations s'accumulent lentement dans les gènes nucléaires. De plus, les gènes nucléaires sont hérités des deux parents et se mélangent à chaque génération. Ce mélange obscurcit l'histoire des individus et permet la recombinaison. La recombinaison rend difficile de retracer l'histoire de segments particuliers d'ADN à moins que les sites étroitement liés à l'intérieur de ceux-ci ne soient pris en compte.

Notre étude mondiale de l'ADN mitochondrial (ADNmt) enrichit la connaissance de l'histoire du pool génétique humain de trois manières. Premièrement, l'ADNmt donne une vue agrandie de la diversité présente dans le pool génétique humain, car les mutations s'accumulent dans cet ADN plusieurs fois plus rapidement que dans le noyau 15 . Deuxièmement, parce que l'ADNmt est hérité de la mère et ne se recombine pas 16 , c'est un outil pour relier les individus les uns aux autres. Troisièmement, il existe environ 1016 molécules d'ADNmt chez un humain typique et elles sont généralement identiques les unes aux autres 17-19. Mammaire typique Page 32

les femelles maliennes se comportent par conséquent comme des haploïdes, en raison d'un goulot d'étranglement dans la taille génétiquement efficace de la population de molécules d'ADNmt au sein de chaque ovocyte 20 . Cet héritage maternel et haploïde signifie que l'ADNmt est plus sensible que l'ADN nucléaire à des réductions sévères du nombre d'individus dans une population d'organismes". qui sont tous transmissibles à la progéniture.L'évolution rapide et le mode particulier d'hérédité de l'ADNmt offrent de nouvelles perspectives sur comment, où et quand le pool génétique humain est apparu et s'est développé.

L'ADNmt a été hautement purifié à partir de 145 placentas et de deux lignées cellulaires, HeLa et GM 3043, dérivées respectivement d'un Noir américain et d'un Sud-Africain aborigène (!Kung). La plupart des placentas (98) ont été obtenus dans des hôpitaux américains, le reste provenant d'Australie et de Nouvelle-Guinée. Dans l'échantillon, il y avait des représentants de 5 régions géographiques : 20 Africains (représentant la région subsaharienne), 34 Asiatiques (originaires de Chine, Vietnam, Laos, Philippines, Indonésie et Tonga), 46 Caucasiens (originaires d'Europe, Afrique et Moyen-Orient), 21 Australiens aborigènes et 26 Néo-Guinéens aborigènes. Seuls deux des 20 Africains de notre échantillon, ceux porteurs d'ADNmt de types I et 81 (voir ci-dessous) sont nés en Afrique subsaharienne. Les 18 autres personnes de cet échantillon sont des Noirs américains, qui portent de nombreux gènes nucléaires non africains probablement apportés principalement par des compagnons caucasiens. On ne s'attendrait pas à ce que ces mâles aient introduit de l'ADNmt dans la population noire américaine. Conformément à notre opinion selon laquelle la plupart des

ces 18 personnes sont une source fiable d'ADNmt africain, nous avons constaté que 12 d'entre elles portent des marqueurs de sites de restriction connus 21 pour se produire exclusivement ou principalement chez les Africains subsahariens indigènes (mais pas chez les Européens, les Asiatiques ou les Indiens d'Amérique ni, en effet, dans tous les tels Africains). Les types d'ADNmt chez ces 12 personnes sont 2-7, 37-41 et 82 (voir ci-dessous). Les méthodes utilisées pour purifier l'ADNmt et des informations ethnographiques plus détaillées sur les quatre premiers groupes sont telles que décrites 17,22 les Néo-Guinéens viennent principalement des Eastern Highlands de Papouasie-Nouvelle-Guinée

Chaque ADNmt purifié a été soumis à une carte haute résolution Ping 22-24 avec 12 enzymes de restriction (Hpal, Avall, FnuDII, Hhal, Hpall, Mbol, TaqI, Rsal, Hinfl, Haelll, Alul et DdeI). Les sites de restriction ont été cartographiés en comparant les motifs de fragments observés à ceux attendus de la séquence d'ADNmt humain connue 25 . Nous avons ainsi identifié 467 sites indépendants, dont 195 polymorphes (c'est-à-dire absents chez au moins un individu). En moyenne, 370 sites de restriction par individu ont été étudiés, représentant environ 9 % des 16 569 paires de bases du génome d'ADNmt humain.

Les 147 ADNmt cartographiés étaient divisibles en 133 types distincts. Sept de ces types ont été trouvés chez plus d'un individu, aucun individu ne contenait plus d'un type. Aucun des sept types communs ne s'est produit dans plus d'une des cinq régions géographiques. Un type, par exemple, a été trouvé chez deux Australiens. Parmi les Caucasiens, un autre type s'est produit trois fois et deux autres types se sont produits deux fois. En Nouvelle-Guinée, deux types supplémentaires ont été trouvés à trois reprises et le septième cas concernait un type trouvé chez six individus.

Un histogramme montrant le nombre de différences de sites de restriction entre des paires d'individus est donné sur la figure 1, le nombre moyen de différences observées entre deux humains quelconques est de 9,5. La distribution est approximativement normale, avec un excès de comparaisons par paires impliquant un grand nombre de différences. A partir du nombre de différences de sites de restriction, nous avons estimé l'étendue de la divergence des séquences nucléotidiques 26 pour chaque paire d'individus. Ces estimations allaient de zéro à 1,3 substitutions pour 100 paires de bases, avec une divergence de séquence moyenne de 0,32 %, ce qui concorde avec celle de Brown 17 , qui n'a examiné que 21 humains.

Le tableau I donne trois mesures de la divergence des séquences à l'intérieur et entre chacune des cinq populations examinées. Ces mesures sont liées entre elles par l'équation (1) :

où est la divergence moyenne par paires (en pourcentage) entre les individus d'une même population (X), est la valeur correspondante pour une autre population (Y), est la divergence moyenne par paires entre les individus appartenant à deux populations différentes (X et Y), et est une mesure de la divergence interpopulation corrigée de la divergence intrapopulation. Les Africains en tant que groupe sont plus variables ( = 0,47) que les autres groupes. En effet, la variation au sein de la population africaine est aussi importante qu'entre les Africains et tout autre groupe ( = 0,40-0,45). La variation intra-groupe des Asiatiques ( = 0,35) est également comparable à celle qui existe entre les groupes. Pour les Australiens, les Caucasiens et les Néo-Guinéens, qui présentent des quantités presque identiques de variation intra-groupe ( = 0,23-0,25), la variation entre les groupes dépasse légèrement celle à l'intérieur des groupes.

Lorsque les distances interpopulations ( ) sont corrigées de la variation intrapopulation (tableau 1), elles deviennent très petites ( = 0,01-0,06). La valeur moyenne de la distance corrigée entre les populations ( = 0,04) est inférieure à un septième de la distance moyenne entre les individus au sein d'une population (0,30). La majeure partie de la variation de l'ADNmt dans l'espèce humaine est donc partagée entre les populations. Une analyse plus détaillée appuie cette opinion 27 .

La figure 2 montre la divergence de séquence ( ) calculée pour chaque population dans sept régions fonctionnellement distinctes du génome de l'ADNmt 14,11,11. Comme cela a été découvert auparavant, la région la plus variable est la boucle de déplacement (k = 1,3), la principale partie non codante de la molécule d'ADNmt, et la région la moins variable est le gène d'ARN ribosomique 16S (5x = 0,2). En général, les Africains sont les plus divers et les Asiatiques les suivants, dans toutes les régions fonctionnelles.

Un arbre reliant les 133 types d'ADNmt humain et la séquence de référence (Fig. 3) a été construit par la méthode de la parcimonie. Pour interpréter cet arbre, nous faisons deux hypothèses, qui ont toutes deux un large soutien empirique : (1) un mode strictement maternel de transmission de l'ADNmt (de sorte que toute variante apparaissant dans un groupe de lignées doit être due à une mutation se produisant dans la lignée ancestrale et non recombinaison entre les génomes maternels et paternels) et (2) chaque individu est homogène pour ses multiples génomes d'ADNmt. On peut donc considérer l'arbre comme une généalogie reliant les lignées maternelles des populations humaines modernes à une femelle ancestrale commune (porteuse d'ADNmt de type a).

De nombreux arbres de longueur minimale ou presque minimale peuvent être fabriqués à partir des données. Tous les arbres que nous avons examinés partagent les caractéristiques suivantes avec la figure 3. (1) deux branches principales, l'une composée entièrement d'Africains, l'autre comprenant les 5 de les populations étudiées et (2) chaque population provient de plusieurs lignées connectées à l'arbre à des positions largement dispersées. Depuis la soumission de ce manuscrit, Horai et al. 29 ont construit un arbre pour nos échantillons de populations africaines et caucasiennes et leur échantillon d'une population japonaise par une autre méthode, leur arbre partage ces deux caractéristiques.

Parmi les arbres étudiés, il y en avait un composé de cinq branches primaires, chaque branche menant exclusivement à l'une des cinq populations. Cet arbre, que nous appelons l'arbre spécifique à une population, nécessite 51 mutations ponctuelles de plus que l'arbre de longueur minimale de la figure 3. L'arbre de longueur minimale nécessite moins de changements au niveau de 22 des 93 sites de restriction phylogénétiquement informatifs que le arbre spécifique à une population, tandis que ce dernier arbre a nécessité moins de changements sur quatre sites, les deux arbres nécessitent le même nombre de changements sur les 67 sites restants. L'arbre de longueur minimale est ainsi favorisé par un score de 22 à 4. L'hypothèse que les deux arbres sont également compatibles avec les données est statistiquement rejetée, puisque 22:4 est significativement différent du 13:13 attendu. L'arbre de longueur minimale est donc significativement plus parcimonieux que l'arbre spécifique à la population.

Nous déduisons de l'arbre de longueur minimale (Fig. 3) que l'Afrique est une source probable du pool génétique mitochondrial humain. Cette inférence vient de l'observation qu'une des deux branches primaires mène exclusivement aux ADNmt africains (types 1-7, Fig. 3) tandis que la deuxième branche primaire mène également aux ADNmt africains (types 37-41, 45, 46, 70, 72, 81, 82, 111 et 113). En postulant que l'ADNmt ancestral commun (type a sur la figure 3) était africain, nous minimisons le nombre de migrations intercontinentales nécessaires pour tenir compte de la distribution géographique des types d'ADNmt. Il s'ensuit que b est un ancêtre commun probable de tous les ADNmt non africains et de nombreux ADNmt africains (types 8-134 sur la figure 3).

Plusieurs lignées par race

La seconde implication de l'arbre (Fig. 3) - que chaque population non africaine a des origines multiples - peut être illustrée plus simplement avec les Néo-Guinéens. Prenons par exemple l'ADNmt de type 49, une lignée dont le plus proche parent n'est pas en Nouvelle-Guinée, mais en Asie (type 50). La lignée asiatique 50 est plus proche généalogiquement de cette lignée de Nouvelle-Guinée que d'autres lignées asiatiques d'ADNmt. Six autres lignées conduisent exclusivement à des ADNmt de Nouvelle-Guinée, chacune provenant d'un endroit différent de l'arbre (types 12, 13, 26-29, 65, 95 et 127-134 sur la figure 3). Cette petite région de Nouvelle-Guinée (principalement l'Eastern Highlands Province) semble ainsi avoir été colonisée par au moins sept lignées maternelles (tableaux 2 et 3).

De la même manière, nous calculons le nombre minimum de lignées féminines qui ont colonisé l'Australie, l'Asie et l'Europe (tableaux 2 et 3). Chaque estimation est basée sur le nombre de grappes spécifiques à une région dans l'arbre (Fig. 3, Tableaux 2 et 3). Ces nombres, allant de 15 à 36 (tableaux 2 et 3), augmenteront probablement à mesure que de nouveaux types d'ADNmt humain seront découverts.

Une échelle de temps peut être apposée sur l'arbre de la figure 3 en supposant que la divergence de séquence d'ADNmt s'accumule à un taux constant chez l'homme. Une façon d'estimer ce taux est de considérer l'étendue de la différenciation au sein des clusters spécifiques à la Nouvelle-Guinée (tableau 2 voir aussi réfs 23 et 30), l'Australie 30 et le Nouveau Monde 31 . Les gens ont colonisé ces régions relativement récemment : il y a au moins 30 000 ans pour la Nouvelle-Guinée 32, il y a 40 000 ans pour l'Australie 33 , et il y a 12 000 ans pour le Nouveau Monde 34 . Ces temps nous permettent de calculer que le taux moyen de divergence de l'ADNmt chez l'homme se situe entre deux et quatre pour cent par million d'années, un compte rendu détaillé de ce calcul apparaît.

ailleurs 30. Ce taux est similaire aux estimations précédentes d'animaux aussi disparates que les singes, les singes, les chevaux, les rhinocéros, les souris, les rats, les oiseaux et les poissons". Nous considérons donc que l'estimation ci-dessus de 2 à 4 % est raisonnable pour les humains, bien qu'un travail comparatif supplémentaire soit nécessaire pour obtenir un étalonnage plus précis.

Comme le montre la figure 3, l'ADNmt ancestral commun (type a) relie les types d'ADNmt qui ont divergé en moyenne de près de 0,57 %. En supposant un taux de 2 à 4 % par million d'années, cela implique que l'ancêtre commun de tous les types d'ADNmt survivants existait il y a 140 000 à 290 000 ans. De même, les types ancestraux b-j peuvent avoir existé il y a 62 000 à 225 000 ans (tableau 3).

Quand ont eu lieu les migrations d'Afrique ? Le plus ancien des groupes de types d'ADNmt à ne contenir aucun membre africain provient de l'ancêtre c et comprenait les types 11-29 (Fig. 3). L'âge apparent de cet amas (calculé dans le tableau 3) est de 90 000 à 180 000 ans. Ses fondateurs ont peut-être quitté l'Afrique à peu près à cette époque.Cependant, il est également possible que l'exode se soit produit il y a 23 à 105 000 ans (tableau 2). Les résultats de l'ADNmt ne peuvent pas nous dire exactement quand ces migrations ont eu lieu.

Deux études antérieures sur l'ADNmt humain ont inclus des individus africains 21,28, les deux soutiennent une origine africaine pour le pool génétique de l'ADNmt humain. Johnson et al 21 ont étudié 40 sites de restriction dans chacun des 200 ADNmt d'Afrique, d'Asie, d'Europe et du Nouveau Monde, et ont trouvé 35 types d'ADNmt. Ce nombre beaucoup plus petit de types d'ADNmt reflète probablement l'incapacité de leurs méthodes à distinguer les ADNmt qui diffèrent de moins de 0,3% et peut expliquer le plus grand regroupement d'ADNmt.

types selon l'origine géographique qu'ils ont observées. (En revanche, nos méthodes distinguent les ADNmt qui diffèrent de 0,03%.) Bien que Johnson et al aient favorisé une origine asiatique, ils ont également constaté que les Africains possèdent la plus grande variabilité de l'ADNmt et qu'un enracinement médian de leur arbre conduit à une origine africaine. .

Greenberg et al 28 ont séquencé la grande région non codante, qui comprend la boucle de déplacement (boucle D), de quatre Caucasiens et trois Noirs américains. Un arbre de parcimonie pour ces sept séquences de boucle D, enraciné par la méthode du point médian, apparaît sur la figure 4. Cet arbre indique (1) un taux d'évolution élevé pour la boucle D (au moins cinq fois plus rapide que les autres régions d'ADNmt), ( 2) une plus grande diversité parmi les séquences de boucle D noires américaines, et (3) que l'ancêtre commun était africain.

Les estimations de la distance génétique basées sur des études comparatives des gènes nucléaires et de leurs produits diffèrent en nature des estimations de l'ADNmt. Ces derniers sont basés sur le nombre réel de différences mutationnelles. entre les génomes de l'ADNmt, tandis que les premiers reposent sur les différences de fréquences des variantes moléculaires mesurées entre et au sein des populations. Les fréquences des gènes peuvent être influencées par la recombinaison, la dérive génétique, la sélection et la migration, de sorte que la relation directe trouvée entre le temps et la distance mutationnelle pour l'ADNmt ne serait pas attendue pour les distances génétiques basées sur l'ADN nucléaire. Mais des études basées sur des groupes sanguins polymorphes, des enzymes érythrocytaires et des protéines sériques montrent que (1) les différences entre les groupes raciaux sont plus petites que celles au sein de ces groupes et (2) les plus grandes différences de fréquence des gènes se situent entre les Africains et les autres populations, suggérant une Origine africaine pour le pool génétique nucléaire humain 11,12,35. Des études plus récentes sur les polymorphismes des sites de restriction dans l'ADN nucléaire 14,36-42 appuient ces conclusions.

Relation avec les archives fossiles

Notre interprétation provisoire de l'arbre (Fig. 3) et de l'échelle de temps associée (Tableau 3) correspond à une vue des archives fossiles : que la transformation des formes archaïques en formes anatomiquement modernes d'Homo sapiens s'est produite d'abord en Afrique 43-45, environ Il y a 100 000 à 140 000 ans, et que tous les humains d'aujourd'hui sont des descendants de cette population africaine. Les archéologues ont observé que les lames étaient d'usage courant en Afrique il y a 80 à 90 000 ans, bien avant qu'elles ne remplacent les outils à éclats en Asie ou en Europe 46,47 .

Mais l'accord entre notre point de vue moléculaire et les preuves de la paléoanthropologie et de l'archéologie doit être traité avec prudence pour deux raisons. Premièrement, il existe une grande incertitude quant à l'âge de ces restes. Deuxièmement, notre placement de l'ancêtre commun de toute la diversité de l'ADNmt humain en Afrique il y a 140 000 à 280 000 ans n'implique pas nécessairement que la transformation en Homo sapiens anatomiquement moderne s'est produite en Afrique à cette époque. Les données de l'ADNmt ne nous disent rien des contributions à cette transformation par les traits génétiques et culturels des hommes et des femmes dont l'ADNmt s'est éteint.

Une autre vision de l'évolution humaine repose sur la preuve que Homo est présent en Asie ainsi qu'en Afrique depuis au moins un million d'années 48 et soutient que la transformation des humains archaïques en humains anatomiquement modernes s'est produite en parallèle dans différentes parties de l'Ancien Monde 33 ,49 . Cette hypothèse nous amène à nous attendre à des différences génétiques de grande antiquité au sein de parties largement séparées du pool moderne d'ADNmt. Il est difficile de concilier les résultats de l'ADNmt avec cette hypothèse. Les plus grandes divergences au sein d'amas spécifiques aux régions non africaines du monde correspondent à des périodes de 90 000 à 180 000 ans seulement. Cela pourrait impliquer que les premiers Homo asiatiques (comme l'homme de Java et l'homme de Pékin) n'ont contribué à aucune lignée survivante d'ADNmt dans le pool génétique de notre espèce. En accord avec cette implication sont des caractéristiques, trouvées récemment dans les squelettes des anciennes formes asiatiques, qui rendent improbable que l'érectus asiatique soit l'ancêtre de l'Homo sapiens 50-52. Peut-être que la population erectus non africaine a été remplacée par des migrants sapiens d'Afrique. 45,53 .

S'il y avait une hybridation entre les formes archaïques résidentes en Asie et les formes anatomiquement modernes émergeant d'Afrique, nous devrions nous attendre à trouver des types d'ADNmt extrêmement divergents chez les Asiatiques d'aujourd'hui, plus divergents que n'importe quel ADNmt trouvé en Afrique. Il n'y a aucune preuve de ces types d'ADNmt chez les Asiatiques étudiés 21,54-16. Bien que de tels types archaïques d'ADNmt aient pu être perdus de la population qui s'hybride, la probabilité que les lignées d'ADNmt s'éteignent dans une population en expansion est faible 57 . Ainsi, nous proposons que Homo

erectus en Asie a été remplacé sans trop de mélange avec l'invasion d'Homo sapiens d'Afrique.

Conclusions et perspectives

Les études sur l'ADNmt suggèrent une vision de comment, où et quand les humains modernes sont apparus qui correspondent à une interprétation des preuves provenant d'anciens ossements et outils humains. Des comparaisons moléculaires plus approfondies sont nécessaires pour améliorer notre enracinement de l'arbre ADNmt et l'étalonnage du taux de divergence de l'ADNmt au sein de l'espèce humaine. Cela peut fournir une échelle de temps plus fiable pour la propagation des populations humaines et de meilleures estimations du nombre de lignées maternelles impliquées dans la fondation des populations non africaines.

Il est également important d'obtenir des estimations plus quantitatives de l'étendue globale de la diversité de l'ADN nucléaire dans les populations humaines et africaines de grands singes. En comparant les diversités d'ADN nucléaire et mitochondrial, il peut être possible de savoir si un goulot d'étranglement transitoire ou prolongé dans la taille de la population a accompagné l'origine de notre espèce 15 . Ensuite, une interaction plus complète entre la paléoanthropologie, l'archéologie et la biologie moléculaire permettra une analyse plus approfondie de la façon dont notre espèce est apparue.

Nous remercions la Fondation pour la recherche sur l'origine de l'homme, la National Science Foundation et le NIH pour leur soutien. Nous remercions également P. Andrews, K. Bhatia, F. C. Howell, W. W. Howells, R. L. Kirk, E. Mayr, E. M. Prager, V. M. Sarich, C. Stringer et T. White pour la discussion et l'aide à l'obtention de placentas.


Le génome synthétique 3.0 de Craig Venter évoque des expériences classiques

J. Craig Venter et ses collègues de Synthetic Genomics Inc mettent à jour leurs efforts pour créer un &ldquohypothétique génome minimal&rdquo cette semaine&rsquos Science.

&ldquoJCVI-syn3.0,&rdquo ou syn3.0 en abrégé, est d'environ 531 000 paires de bases organisées en 473 gènes, transplantés en série dans des cellules du minuscule et à réplication rapide Mycoplasme mycoïde et M. capricolum. La première itération du plus petit génome synthétique, JCVI-syn1.0, compte un peu plus d'un million de paires de bases, et JCVI-syn2.0 en compte 576.000. ADN Science les a couverts ici.

La création de syn3.0 inspirera les futurs efforts de biologie synthétique, mais me rappelle deux de mes expériences préférées de tous les temps, d'il y a plus d'un demi-siècle.

Ingram et la mutation falciforme

Les chercheurs ont créé syn3.0 par étapes qu'ils appellent &ldquodesign-build-test&rdquo. Ils ont d'abord synthétisé 8 morceaux de génome sur la base d'une analyse documentaire approfondie des gènes considérés comme essentiels, et ont produit en masse les morceaux dans des cellules de levure. Ensuite, ils ont placé les pièces, un type à la fois, dans M. mycoides portant les sept huitièmes restants de syn1.0. Ils ont transféré ce génome reconstitué dans M. capricolum, une étape qui jette le génome de l'hôte, puis déploie des éléments génétiques mobiles naturels (transposons) pour s'insérer dans, et ainsi détruire, un seul gène à la fois.

Si une cellule peut survivre avec un gène spécifique harponné, alors ce gène est considéré comme essentiel au départ. Les gènes sont classés comme essentiels, non essentiels ou quasi essentiels, ces derniers étant nécessaires pour que l'organisme se développe suffisamment bien pour étudier, mais pas pour vivre.

La stratégie &ldquodesign-build-test&rdquo me rappelle le célèbre raccourci de Vernon Ingram&rsquo pour découvrir les bases moléculaires de la drépanocytose. Plutôt que de déterminer minutieusement la séquence des 146 acides aminés qui composent la bêta-globine en 1958, il a découpé la protéine en peptides, puis a passé les morceaux dans un champ électrique (électrophorèse). Un peptide déplacé vers une position différente chez les personnes porteuses de la drépanocytose avait des fragments correspondants qui ont migré vers la position de la maladie ainsi que vers la position normale. Ingram a ensuite déduit quelle pièce comprenait la mutation à base unique qui cause la maladie et il n'a eu qu'à déchiffrer les 8 acides aminés de ce fragment. C'était un peu comme chercher dans une phrase une erreur plutôt que de vérifier un document entier.

Se débarrasser des licenciements

Syn3.0 est essentiellement syn1.0 moins 42 gènes. Une partie de la réduction est venue de l'élimination des gènes syn1.0 qui sont initialement classés comme essentiels mais sont en fait redondants - ils ne sont pas nécessaires si un autre gène est également présent, mais cela n'était pas évident jusqu'à ce que leurs partenaires soient supprimés. Le Dr Venter, lors d'une téléconférence hier, a attribué une analogie à son collègue Hamilton Smith : &ldquoSi vous ne connaissez rien aux avions et regardez un 757 et trouvez les fonctions des pièces en enlevant un moteur de l'aile droite, l'avion peut toujours voler et terre, donc vous dites que le deuxième moteur n'est pas essentiel et ne découvrez pas l'essentialité jusqu'à ce que vous supprimiez le second. divers projets sur le génome.

Le résultat du rognage, syn3.0, est "une approximation de travail d'une cellule minimale". comme agent pathogène des chèvres. Dans le monde réel, avec des contraintes et des défis environnementaux, les génomes sont plus grands que le minimum hypothétique. En effet, les chercheurs ont choisi Mycoplasme parce que leurs hôtes fournissent presque tous les nutriments, leur permettant de survivre naturellement avec un minimum de génomes. A expliqué le Dr Venter, « chaque génome est spécifique au contexte. Cela dépend de ce qui est dans l'environnement à sa disposition. Il n'y a pas de véritable génome minimal sans définir le contexte et le phénotype.&rdquo

Alors, quels gènes syn3.0 utilise-t-il ? Près de la moitié s'occupent de la synthèse des protéines (transcription et traduction) ou de la &ldquopréservation des informations du génome&rdquo (réplication de l'ADN, topologie, réparation, métabolisme et division cellulaire). Les autres sont impliqués dans la structure et la fonction de la membrane cellulaire et contrôlent la composition du cytoplasme. Le plus important était que les fonctions de 31,5% des gènes - 149 sur 473 - ne sont pas connues. Beaucoup, cependant, sont hautement conservés (trouvés dans d'autres organismes), ce qui suggère qu'ils sont essentiels. Le Dr Venter, habituellement imperturbable, avait l'air étonné. &ldquoSavoir qu'il nous manque un tiers de nos connaissances fondamentales est une découverte clé même si syn3.0 n'a pas d'autres utilités&rdquo, a-t-il déclaré.

Pourquoi concevoir-construire-tester des génomes synthétiques ? La stratégie peut être utilisée un jour pour concevoir des médicaments ou des produits chimiques industriels. Mais je ne pense pas que l'habituel « pourquoi diable est-ce utile ? » ? qu'est-ce qu'un organisme vivant exactement ?

Merci, maman, d'avoir encouragé un jeune biologiste.

D'aussi loin que je me souvienne, je me suis demandé ce qu'est la vie et en quoi elle diffère, disons, d'un rocher. Cette fascination m'a amené à ramener à la maison toutes sortes de créatures, mortes et vivantes, de mes aventures dans la nature sauvage de Brooklyn. Je n'oublie jamais ma mère qui a fait irruption dans le bureau d'un paléontologue du Muséum américain d'histoire naturelle pour lui demander d'identifier les précieux fossiles que j'ai gardés dans une boîte à chaussures et que j'ai toujours. Que je devienne biologiste semblait évident dès la plus tendre enfance, une trajectoire qui s'est réduite à la génétique une fois que j'ai appris que l'ADN dirige tout.

Au collège, mon intérêt est passé de la collecte, de la comparaison et de l'observation à l'expérimentation. Au laboratoire de biologie cellulaire, nous avons recréé l'expérience classique de Miller de 1953, et j'étais accro.

Stanley Miller était un étudiant diplômé de 23 ans en biochimie lorsqu'il a combiné des composants d'une éventuelle atmosphère prébiotique et a ajouté du méthane, de l'ammoniac, de l'hydrogène et de l'eau dans un récipient en verre et a ajouté une étincelle. Le résultat, après de nombreuses variations sur le thème primordial de la soupe : les acides aminés. He&rsquod a brassé une molécule organique de vie à partir de simples composés chimiques présents dans l'environnement, à partir d'un sursaut d'énergie. Le conseiller de Miller, Harold Urey, a retiré son nom du document qu'ils ont soumis à Science afin que le jeune homme reçoive le crédit.

Les gros titres proclamaient que M. Miller avait créé la vie, comme je le soupçonne à propos de syn3.0. &ldquoLes gens ont fait des blagues. Ils m'ont suggéré d'y faire pousser un rat ou une souris ! », m'a-t-il dit. (Mon mari a en fait enfoncé une grenouille dans la reconstitution de l'expérience Miller d'un ami dans une classe de laboratoire.) Le Dr Miller est décédé en 2007. Je l'ai interviewé pour un livre peu connu publié en 2001 intitulé Discovery : Windows on the Life Sciences. (Amazon a même mal le titre et je pense que je possède les 8 exemplaires vendus.) Il est étrange que le travail de Miller ait été effectué l'année même où Watson et Crick ont ​​décrit l'ADN.

Peu de temps après mes études supérieures, mon cheminement de carrière s'est orienté de manière inattendue vers l'écriture de manuels. Mon préféré, sur la génétique humaine, a relaté la quête de 20 ans du Dr Venter pour recréer un génome précoce. Ainsi, alors que de nouveaux sites Web, blogs et magazines en ligne consacrés à la génomique semblent faire leurs débuts quotidiennement, avec des nouvelles de l'ADN se répercutant sur Internet et des dizaines de versions des mêmes histoires apparaissant simultanément partout, j'ai l'histoire assise ici sur mon étagère archaïque de manuels. . Car JCVI-syn3 n'est pas sorti de nulle part. J'étais ravi quand, lors de la téléconférence, le Dr Venter a commencé par la même histoire, de l'effort de 20 ans, que j'ai relaté dans mes éditions de manuels scolaires, notant même son « ancien temps libre » pour séquencer le premier génome humain !

Mycoplasme génital, l'organisme vivant en liberté avec le plus petit génome connu.

Lorsque la première édition de mon manuel a été publiée en 1994, le séquençage du génome humain commençait tout juste. Un tableau répertorie les tailles de génome, la plus petite, E. coli, à environ 4,8 millions de paires de bases. Par l'édition 2 en 1997, le tableau comprenait Haemophilus influenzae à l'extrémité inférieure, avec 1,8 million de paires de bases. L'édition 3, de 1999, a commencé avec Mycoplasme génital, &ldquotle plus petit génome connu de tous les organismes vivants&rdquo. Son génome simplifié de 582 970 paires de bases inspirerait le Dr Venter à commencer à dériver le premier génome synthétique une décennie plus tard.

L'édition 4, publiée en 2001, est arrivée peu de temps après les débuts officiels de la première ébauche de séquence du génome humain, annoncée en grande pompe à la Maison Blanche. J'ai appris les nouvelles soigneusement orchestrées des mois plus tôt, tout en faisant les derniers montages. Mais parce qu'avoir une ou deux séquences du génome humain ornant les couvertures de Science et La nature ne voulait-il pas comprendre quoi que ce soit à propos de ce qui dans ces génomes, mon manuel avait encore de la place pour les non-humains. J'ai élargi la table des génomes.

J'ai écrit une nouvelle section intitulée &ldquoL'ensemble minimal de gènes requis pour la vie&rdquo donnant Mycoplasme génital son propre tableau. Sur les 480 gènes, le Dr Venter a estimé que 265 à 350 étaient essentiels à la vie. Ensuite, dans l'édition 5, j'ai donné au génome minimal son propre traitement de lecture en boîte. Au milieu de toutes les nouvelles du génome humain, je suis resté plus intéressé par les ensembles d'instructions génétiques les plus simples, car c'est là que réside la compréhension.

Au fur et à mesure que de nouvelles séquences du génome humain arrivaient &ndash James Watson, Craig Venter, puis une série de &ldquofirsts&rdquo ethniques suivis par des célébrités, des chercheurs curieux et des journalistes &ndash mon manuel, car il a &ldquohuman&rdquo dans le titre, a réduit la couverture des autres espèces. Comme la sélection naturelle, les instructeurs dictent ce qui reste et ce qui va dans un manuel. Mais j'ai gardé le plus petit génome, en ajoutant dans l'édition 6, (2005) &ldquoTaking cues from the minuscule Mycoplasme génome, le groupe de recherche actuel de Venter&rsquos tente de construire un génome synthétique &hellip&rdquo

Enfin en 2010, l'édition 10, est venue Mycoplasme mycoïde JCVI-syn1.0 : &ldquoCréation d'une cellule bactérienne contrôlée par un génome chimiquement synthétisé.&rdquo Les chercheurs ont même cousu leurs noms comme des filigranes dans le génome reconstitué de 1 077 947 paires de bases en utilisant un lexique de triplets d'ADN correspondant aux lettres de l'alphabet, pour distinguer les la vie de l'ancien genre.

Voici le Dr Venter&rsquos prendre en charge la gestation de son homonyme. &ldquoMon co-auteur Ham Smith, qui a 85 ans et a été impliqué dans ce travail 20 ans après la retraite de la plupart des gens, et Clyde Hutchison III (premier auteur) et moi discutions philosophiquement des différences entre les génomes et de la seule façon de répondre questions fondamentales sur la vie est d'arriver à un génome minimal, et la seule façon d'y arriver serait de synthétiser un génome minimal. Cela a commencé notre quête de 20 ans. Nous avons été brièvement interrompus par Ham et moi qui avons pris du temps pour séquencer le premier génome humain, mais nous sommes revenus pour de bon en 2002.»

J'écris maintenant la douzième édition de mon manuel et je suis heureux d'inclure JCVI-syn3.0 et tout ce qui suit avant ma date limite. Bien sûr, sans machine à remonter le temps, nous ne pouvons jamais vraiment savoir comment la vie sur Terre a commencé, et c'est pourquoi le Dr Venter a souligné l'importance du mot « ldquoa » avant « ldquominimal génome bactérien » dans le titre de l'article.

La vie peut avoir commencé de plusieurs manières, à plusieurs reprises, lorsque des collections complexes de produits chimiques auto-réplicables et modifiables se sont fusionnées et polymérisées, utilisant peut-être des argiles ou des minéraux comme modèles, puis se tricotant des couvertures protectrices grasses. Quelque part entre les simulations prébiotiques et la création de génomes synthétiques se trouvent les réponses.Et c'est pourquoi entrevoir ne serait-ce qu'un seul scénario possible pour un premier génome reste, pour moi, le type d'expérience le plus passionnant en biologie.


Différence entre l'homme et l'homme de Néandertal

Humain contre Néandertal

La différence entre les humains et les Néandertaliens réside dans leur taille, leur taille et leurs caractéristiques morphologiques. Les Néandertaliens, comparés aux humains, étaient plus petits et plus petits. Les humains ont des corps plus gros que les Néandertaliens, et ont une différence significative de forme et de structure, en particulier dans leurs crânes et leurs dents.

Une autre différence significative entre l'homme et l'homme de Néandertal est leur ADN. Les preuves fossiles et archéologiques prouvent une séparation nette entre les Néandertaliens et les Homo sapiens modernes. Les Néandertaliens étaient une espèce différente des humains. Le cerveau d'un Néandertal avait un larynx surélevé et était également plus gros que celui de l'Homo sapiens.

Il existe des différences physiques notables entre les humains et les Néandertaliens, tels que le Néandertal a des os plus épais, des membres plus courts, un humérus asymétrique, une poitrine en tonneau et des métacarpiens plus épais.

Les différences de développement de Néandertal par rapport aux humains sont le développement craniodentaire. Les visages néandertaliens et humains et les différences dentaires commencent dès la pré-naissance. L'occurrence humaine et néandertalienne dans le temps signifie également une différence entre les deux espèces. Les Néandertaliens, comparés aux humains, étaient beaucoup plus forts et vivaient dans le climat froid de l'Europe.

Les Néandertaliens étaient des espèces homogènes et ne sont pas des ancêtres humains. Cependant, la différence entre les humains et les Néandertaliens par rapport aux singes est faible. Les Néandertaliens avaient une petite population dans un passé relativement récent et n'ont aucun lien génétique ou évolutif avec les humains. Les Néandertaliens présentaient une diversité génétique limitée en raison du manque d'hybrides clairs dans les archives fossiles et du manque de caractéristiques néandertaliennes chez les humains modernes. Leur diversité génétique limitée suggère qu'ils se sont éteints, ne laissant aucun descendant. Leur développement d'Homo erectus est également plus similaire à celui des singes qu'à celui de l'homme moderne. Le taux de croissance de l'enfant humain est plus lent que celui de l'enfant de Néandertal, car ils grandissaient rapidement de nourrisson à adulte.

Les humains partagent des similitudes avec d'autres animaux, tels que les aspects anatomiques, physiologiques et biochimiques. Comme les humains sont fabriqués à partir de matériaux préexistants, comme le dit la Bible, les humains ont beaucoup de similitudes dans leur plan corporel de base, la façon dont cela fonctionne et la voie chimique sous-jacente et les machines dans le corps. Ils sont presque les mêmes que d'autres mammifères tels que les Néandertaliens et d'autres primates. Certaines des différences significatives entre l'homme et l'homme de Néandertal sont les tailles distinctives de leur cerveau, la bipédie, la taille réduite des dents du fond et la culture avancée.

1. Les cerveaux et les structures corporelles humains et néandertaliens présentent des différences majeures de taille et de taille.

2. Les Néandertaliens ne sont pas des ancêtres de l'homme, mais une espèce homogène.

3. Les humains ont développé une meilleure vue, ouïe ou odorat que les Néandertaliens en raison des adaptations squelettiques.

4. Les Néandertaliens et les humains ont de nombreuses différences dans leur ADN.

5. Les humains et les Néandertaliens ne semblent pas avoir de différences majeures dans leur comportement et leurs capacités culturelles, mais les cerveaux fossiles des Néandertaliens diffèrent du cerveau humain moderne.


Le modèle d'ADN pourrait expliquer les changements évolutifs

Les réarrangements de toutes tailles dans les génomes, les gènes et les exons peuvent résulter d'un problème de copie de l'ADN qui se produit lorsque le processus s'arrête à un point critique, puis passe à un modèle génétique différent, dupliquant et même triplant des gènes ou tout simplement en mélangeant ou en supprimant une partie du code en leur sein, ont déclaré des chercheurs du Baylor College of Medicine dans un récent rapport publié dans la revue Génétique de la nature.

Le rapport a en outre élucidé l'effet du blocage des fourches et du mécanisme de changement de modèle impliqué dans certaines formes de variation du nombre de copies.

"Je pense que cela va amener les gens à réfléchir très sérieusement à la variation du nombre de copies en ce qui concerne l'évolution du génome, l'évolution des gènes et le brassage des exons", a déclaré le Dr James R. Lupski, vice-président de la génétique moléculaire et humaine au BCM et auteur principal de le rapport.

Le mécanisme représente non seulement une méthode nouvellement découverte par laquelle le génome génère une variation du nombre de copies entre les gènes, mais il démontre également que la variation du nombre de copies peut se produire à un moment différent de la vie d'une cellule. La réplication de l'ADN a lieu au fur et à mesure que la cellule se divise et se divise en deux, un processus connu sous le nom de mitose.

La variation du nombre de copies implique des changements structurels dans le génome humain qui entraînent la suppression de gènes ou de parties de ceux-ci ou de copies supplémentaires de gènes. Souvent, ce processus est associé à la maladie ou à l'évolution du génome lui-même.

L'ADN (acide désoxyribonucléique) existe sous forme de deux brins complémentaires qui restent ensemble en raison de l'attraction entre les nucléotides. A, ou adénine, est toujours attiré par T, ou thymine. C, ou cytosine, est toujours attiré par G, ou guanine.

Lorsqu'une cellule se divise, elle doit reproduire son ADN pour que chaque cellule issue de la division ait le même code génétique. Cela signifie qu'il doit reproduire son ADN. Au cours de ce processus, une enzyme appelée hélicase sépare les deux brins, brisant les liaisons hydrogène entre les paires de bases A &ndash T et G &ndash C. Les deux brins de séparation deviennent la fourche de réplication. Sur un brin, une enzyme appelée ADN polymérase lit le matériel génétique dans le brin comme une matrice et crée un brin d'ADN complémentaire pour s'y apparier. Encore une fois, le code est A à T et C à G. Ce processus est continu. Sur le brin retardé, le brin complémentaire est constitué de segments courts et séparés par un processus impliquant de l'ARN et une série d'enzymes.

Jusqu'aux années 1990, les chercheurs qui étudiaient les raisons des mutations ou des changements génétiques examinaient les « typos » moléculaires dans ce processus, de minuscules changements dans les As, T, C ou G appelés polymorphisme nucléotidique unique (SNP). Ils ont changé le message du gène. Cependant, au début des années 1990, Lupski était l'un des premiers champions d'un mécanisme nouvellement découvert dans lequel la structure de l'ADN lui-même était grossièrement dupliquée ou supprimée pour modifier le nombre de copies d'un gène présentes dans le matériel génétique. Cette « variation du nombre de copies » a écrit un nouveau chapitre dans la compréhension de la variation génétique humaine.

Dans un rapport précédent, Lupski et ses collègues ont décrit comment le processus qui copie l'ADN pendant la division cellulaire s'arrête lorsqu'il y a un problème avec le matériel génétique. Dans certains cas, le processus recherche un modèle différent, copiant souvent une autre étendue d'ADN similaire mais significativement différente avant de revenir à la zone appropriée.

Dans ce nouveau rapport, Lupski et ses collègues décrivent comment ce processus - appelé fork stalling and template switching (FoSTeS) chez l'homme ou réplication induite par rupture induite par microhomologie (MMBIR) dans des modèles plus simples - a généré des réarrangements génomiques allant de plusieurs mégabases à un quelques centaines de paires de bases au cours de la division cellulaire normale, entraînant la duplication voire la triplication de gènes individuels ou les réarrangements d'exons uniques (la région codante des gènes).

"Ce phénomène se produit dans tout le génome", a déclaré le Dr Feng Zhang, associé postdoctoral au laboratoire de Lupski et premier auteur du rapport.

Dans des études sur des sujets présentant des anomalies dans le gène associé au type 1A de Charcot-MarieTooth (PMP22), les chercheurs ont découvert que le décrochage de la fourche, le phénomène de commutation de modèle expliquait les changements, de ceux qui impliquaient la triplication d'un gène à d'autres qui résultaient du brassage au sein de un exon.

Des études portant sur une famille, deux enfants et une mère, ont démontré que l'événement s'est produit pendant la mitose ou la division cellulaire, une découverte importante qui confirme davantage l'importance de l'événement.

Les chercheurs ont noté que la découverte de ce réarrangement mitotique du gène chez la mère, qui n'avait pas la maladie, de deux enfants atteints de neuropathie suggère que le mécanisme pourrait être pris en compte dans le conseil génétique sur le risque d'avoir un autre enfant atteint de la maladie.

Les scientifiques ont écrit : « Nous proposons que FoSTeS/MMBIR puisse être un mécanisme clé pour générer une variation structurelle, en particulier une CNV non récurrente (variation du nombre de copies), du génome humain. »

L'observation d'un mosaïcisme pour un réarrangement complexe PMP22 apparemment généré par la mitose et médié par FoSTeS/MMBIR chez la mère non affectée de deux enfants atteints de neuropathie suggère que ce mécanisme peut avoir des implications pour le conseil génétique concernant le risque de récidive.

Parmi les autres personnes qui ont participé à cette recherche figurent Mehrdad Khajavi de BCM, Anne M Connolly de la Washington University School of Medicine à St. Louis, Missouri, et Charles F Towne et Sat Dev Batish d'Athena Diagnostics à Worcester, Mass.

Le financement de ce travail est venu de la Charcot Marie Tooth Association et du National Institute of Neurological Disorders and Stroke.

Source de l'histoire :

Matériel fourni par Collège de médecine Baylor. Remarque : Le contenu peut être modifié pour le style et la longueur.


Existe-t-il une portion minimale connue d'ADN qui puisse distinguer deux personnes dans le monde ? - La biologie

Prochaine conférence, nous parlerons de spéciation. Nous devons donc aborder ici des sujets sur la la nature des espèces, et discuter en quoi et si la spéciation est différente de la microévolution (évolution au sein des espèces) ?

- Quelles sont les espèces ?
- En quoi les espèces diffèrent-elles les unes des autres ?
- Combien d'espèces y a-t-il? Nous allons brièvement couvrir la biodiversité au niveau des espèces .


Espèces "concepts" - Quelles sont les espèces ?

Darwin en 1859 a prouvé au monde (la partie raisonnable, de toute façon !) que les espèces ont évolué, plutôt que d'avoir été créées. Mais cela créait une difficulté. Tout d'un coup, les espèces n'étaient plus des espèces créées, avec un aristotélicien essence, comme on le pensait auparavant. Il est alors devenu difficile de savoir en quoi les espèces différaient, voire pas du tout, des autres catégories. Les espèces évoluent à partir des non-espèces, alors où est la ligne de démarcation ? Darwin a eu du mal avec celui-ci, car si les espèces n'existaient pas, il pourrait difficilement écrire un livre sur leur origine, n'est-ce pas ?!

La résolution de cette énigme par Darwin a été d'utiliser une définition pragmatique des espèces - parfois appelée avec dédain le concept d'espèce morphologique, dans laquelle les espèces se distinguaient des races et des formes polymorphes en traçant une ligne de démarcation appropriée dans le continuum réel entre les espèces et les races ou formes.

Ce serait bien de dire que l'histoire s'arrête là. Malheureusement, ce n'est pas le cas. Les concepts d'espèces ont été au cours des 10 à 20 dernières années un champ de bataille majeur pour les systématiciens, les philosophes de la biologie et les évolutionnistes. Mon propre point de vue est que Darwin pensait plus clairement que beaucoup de concurrents modernes, même si sa théorie de la génétique était manifestement fausse. Mais pas beaucoup d'accord avec moi (encore!). Je vais donc tenter de vous donner un bilan assez nuancé.

Voici donc juste certains des principaux "concepts d'espèces", ainsi que leurs forces et leurs faiblesses.

1) Le concept d'espèce morphologique ( concept d'espèce phénétiqueégalement compris)

Selon Darwin, les espèces peuvent simplement être diagnostiquées par lacunes morphologiques dans la variation entre les individus (voir schéma ci-dessus, où la ligne sépare deux groupes morphologiques d'individus). Par exemple, Darwin considérait Primula veris (la primevère) et Primula elatior (le coucou) comme des variétés de la même espèce car de nombreux intermédiaires ou hybrides se trouvent entre elles. Il a soutenu de la même manière que les nombreuses races d'humains étaient membres de la même espèce. Dans ces cas, il n'est pas facile de trouver un endroit judicieux pour mettre une ligne de démarcation, même s'il existe de nettes différences entre les formes. Les idées de Darwin ont été ravivées par taxonomistes numériques dans les années 1960, qui a introduit une version statistique multivariée de l'idée, connue aujourd'hui sous le nom de concept d'espèce phénétique.

Cependant, les idées de Darwin conduisent à certaines problèmes:

a) Variante dans espèce conduit parfois à des lacunes morphologiques. Par exemple, nous avons vu que les courses, sous-espèce, populations et même morphes au sein des populations sont souvent discrètes (c'est-à-dire que la variation est discontinue, il y a des lacunes). De nos jours, nous serions certainement ne pas classer la forme mélanique du papillon poivré comme une espèce différente simplement parce que la variation n'est pas continue.

b) Absence de différences entre espèce: Il y a souvent espèces jumelles qui (a) sont morphologiquement plus ou moins identiques, bien que génétiquement différents, (b) évoluent plus ou moins séparément, (c) ont peu ou pas d'hybridation ou de flux de gènes entre eux. Quelques exemples sont:

  • Willow Warbler et chiff-chaff au Royaume-Uni - chantent différentes chansons
  • Drosophile les mouches des fruits: D. pseudoobscura et D. persimilis, qui diffèrent chromosomiquement
  • Anophèle les moustiques, qui diffèrent par leur habitat, leur propension à piquer et s'ils sont porteurs du paludisme

2) Le concept d'espèce biologique

Les difficultés avec le concept de Darwin ont tenté un certain nombre de personnes d'essayer de redéfinir les espèces au moyen du métissage. Ces idées ont d'abord été clairement avancées par un entomologiste, E.B. Poulton en 1903. Plus tard, Dobzhansky (1937) et, surtout, Mayr (1940, 1942, 1954, 1963, 1970, etc.) ont poursuivi et popularisé cette tradition. ", essayant ainsi injustement de prendre la haute moralité parce que le concept d'espèce de n'importe qui d'autre était par la suite, bien sûr, " non biologique " !

Le concept d'espèce biologique permet un flux de gènes abondant au sein de chaque espèce, mais un manque d'hybridation ou de flux de gènes entre les espèces. Le manque de flux génétique est causé par mécanismes d'isolement , un terme inventé par Dobzhansky, mais à nouveau popularisé par Mayr. Parce qu'ils ne sont pas forcément des " mécanismes " en aucun sens, je préfère le terme " isolement reproductif " :

Types d'isolement reproductif
UNE) Isolement avant l'accouplement < ou isolement pré-zygotique>
a) Isolement écologique ou saisonnier - les partenaires ne se rencontrent pas
b) Isolement comportemental (biochimique) - les individus se rencontrent mais ne tentent pas de s'accoupler
c) Isolation mécanique - les tentatives d'accouplement ne fonctionnent pas !

B) Post-accouplement < oupost-zygotique> isolation
d) Incompatibilité gamétique - les gamètes meurent avant la fécondation > (remarque : c'est après l'accouplement mais pré-zygotique)
e) Inviabilité hybride - les hybrides ont une viabilité réduite en tant que zygote ou plus tard dans le développement. Cela peut être causé par des facteurs internes (facteurs génomiques) ou parce que les hybrides ne sont pas adaptés à la survie pour des raisons écologiques. Les hybrides peuvent également avoir une propension à l'accouplement réduite ou être défavorisés en tant que partenaires.
f) Stérilité hybride - les hybrides survivent et s'accouplent normalement, mais sont partiellement ou complètement stériles.
g) Sélection sexuelle contre les hybrides (étudiée par Russ Naisbit, doctorant dans mon laboratoire) - les hybrides sont sains et fertiles, mais défavorisés lors de l'accouplement.

Problèmes avec le concept d'espèce biologique
une) Ne s'applique pas en allopatrie. Strictement, le concept d'espèce biologique ne fonctionne qu'en sympatrie et parapatrie, car comment savoir si deux espèces se croiseraient si elles sont allopatriques ? On peut les assembler pour voir s'ils se croisent, mais de nombreuses espèces sympatriques de canards, Drosophile, même les tigres et les lions se croisent en captivité, bien qu'ils le fassent rarement, voire jamais, dans la nature.

Ainsi, lorsque deux espèces sont allopatriques, il faut deviner à partir de leurs traits - morphologie, comportement, génétique - et de leur comportement en captivité, si possible, si elles aurait se croisent s'ils étaient en sympatrie. Pas très scientifique ? (C'est un problème avec toutes les définitions d'espèces qui proposent une seule essence fondamentale d'espèce. Étant donné que les espèces proviennent de l'évolution, l'identité des espèces est vouée à être plus douteuse plus elles ont divergé. Ainsi, les espèces sont vouées à devenir moins réel et plus difficile à classer avec des durées croissantes d'espace (en géographie) ou de temps (dans les archives fossiles).

b) Hybridation naturelle et le flux de gènes entre les espèces existe.

Environ 10% des espèces d'oiseaux et de papillons produisent des hybrides dans la nature, bien que chaque espèce le fasse généralement très rarement (peut-être 1/1000 ou moins). Les canards [VOIR OVERHEAD] et autres oiseaux de paradis semblent particulièrement sujets à l'hybridation (> 50% des espèces) dans la nature, même si la plupart du temps ils semblent être de "bonnes" espèces. Moins de mammifères s'hybrident probablement en Europe, seulement environ 6% des espèces sont connues pour former des hybrides dans la nature. Cependant, l'un d'entre eux est le plus grand animal du monde (qui bat les dinosaures haut la main) : la baleine bleue a été enregistrée en train de s'hybrider avec son proche parent, le rorqual commun. Non seulement cela, un hybride femelle entre ces deux espèces a été trouvé avec un fœtus sain, génétiquement un rétrocroisement. Les plantes sont particulièrement bien connues pour leur tendance à s'hybrider (probablement bien au-delà de 20 %), et l'hybridation est même une source majeure de spéciation par allopolyploïdie dans ce groupe (voir ci-dessous). Pour cette raison, le concept d'espèce biologique n'a jamais vraiment fait son chemin chez les botanistes.

L'hybridation n'aurait pas d'importance si les gènes ne passaient pas entre les espèces via l'hybridation. Mais nous savons maintenant que les gènes passent d'une espèce à l'autre et que de nombreuses espèces ont reçu des gènes ou des génomes mitochondriaux entiers d'autres espèces. Dans certains cas, les plantes à fleurs ont même adopté des gènes de bactéries symbiotiques. Le séquençage de l'ADN a maintenant révélé de très nombreux exemples de ce type de transfert horizontal de gènes entre les espèces. L'hybridation et le transfert de gènes sont aujourd'hui des sujets très importants en conservation et en biologie économique.

Bien que le concept d'espèce biologique soit depuis longtemps accepté par de nombreux biologistes évolutionnistes (en particulier les zoologistes) comme le meilleur concept d'espèce, ce genre de problèmes a conduit à des attaques croissantes. Plusieurs solutions possibles ont été proposées.

3) Notion d'espèces écologiques

Leigh Van Valen, dans les années 1970, a suggéré que les espèces étaient mieux définies par les types de sélection ils ont subi, ou par leur niche écologique . Réel les espèces, a soutenu Van Valen, sont écologiquement différentes.

a) Il est au moins théoriquement possible que certains types de espèces jumelles pourraient avoir exactement les mêmes niches. À terme, cela conduirait à une perte probable d'une des espèces par compétition, ce problème est donc peut-être plus théorique que réel.

b) Le pire problème pour cette idée est que les espèces ont souvent des morphes écologiques au sein de l'espèce. Le poisson cichlidé Cichlasome de Cuatro Cienagas, au Mexique, a plusieurs morphs qui font des choses différentes :

  • l'un vit sur le fond, a des dents molariformes qui grincent et se nourrit de mollusques
  • un autre est pélagique, a des dents pointues et se nourrit de poissons
  • un troisième a des dents arrondies et se nourrit d'algues et de détritus

4) Concepts d'espèces cladistiques et phylogénétiques

Récemment, la plupart des systématiciens ont privilégié la systématique phylogénétique, dans laquelle classifications cladistiques. Le mouvement cladistique a été fondé par Willi Hennig dans les années 1950. Si les taxons supérieurs sont définis au moyen de la phylogénie, il en va de même pour les espèces, raisonnées cladistes. Cela a conduit à une pléthore de concepts d'espèces cladistiques et phylogénétiques. Une idée, basée sur la propre idée de Willi Hennig, et soutenue par Ridley entre autres, est un concept d'espèce cladistique :

Selon Hennig et Ridley, les espèces sont des branches d'une lignée. Lorsque la lignée se ramifie, deux nouvelles espèces émergent de l'ancienne, comme ci-dessus, où 5 espèces résultent d'une phylogénie avec deux événements de ramification (spéciation). Bien qu'il existe une discontinuité morphologique dans l'histoire de espèce 2, cela ne signifie pas que les parties supérieure et inférieure de l'espèce 2 sont des espèces différentes, à moins qu'une nouvelle branche (en gris) n'apparaisse à cet endroit. La vertu de cette idée pour ses partisans est qu'elle devrait s'appliquer dans l'histoire, aux fossiles, ainsi qu'aux espèces modernes.

Malheureusement, il y a Problèmes :

a) En pratique, les phylogénies sont des hypothèses instables plutôt que des faits. Le modèle de ramification doit être connu afin de définir les espèces. Les espèces cladistiques peuvent donc être quelque peu arbitraires. En supposant que la branche grise était inconnue, elle a été soudainement découverte dans une petite population moderne. Maintenant, soudainement, l'espèce fossile 2 doit être reclassée en deux espèces distinctes, même si un enregistrement continu de ces formes était auparavant bien connu. Pire encore, si la lignée grise n'a aucun enregistrement fossile, nous ne savons pas où l'espèce 2 doit être divisée.

b) De nombreuses populations insulaires peuvent être des branches latérales cladistiques d'espèces continentales, mais leur établissement ne modifie généralement pas les espèces continentales de quelque manière que ce soit. En fait, cela peut être vrai pour toute population isolée géographiquement depuis quelques générations. Les concepts d'espèces cladistiques pourraient conduire à de nombreuses nouvelles espèces qui ne sont que faiblement reconnaissables.

c) L'hybridation, si elle se produit entre les branches, aura tendance à conduire à un manque de ramification claire entre les paires d'espèces apparentées au niveau de certains gènes. La phylogénie des espèces peut être dénuée de sens dans de telles conditions au contraire, la phylogénie devient une masse de "généalogies" à des gènes parfois contradictoires. Bien sûr, on pourrait utiliser une sorte de phylogénie moyenne (parfois appelée phylogénie "consensuelle") comme la "vraie" phylogénie des espèces, mais ce type de moyenne est certainement très différent de l'idée que les espèces que nous examinons ont un seul vrai phylogénie.

Il existe de nombreuses alternatives évolutionnisteet phylogénétique concepts d'espèces qui tentent de répondre à ces problèmes. Par exemple, divers types de concepts phylogénétiques ont tenté d'incorporer la possibilité d'un flux de gènes entre les espèces. Par exemple, Cracraft suggère que les espèces ont des différences fixes au niveau des « caractères » (morphologiques), mais les critiques ont fait valoir que cela conduirait à la reconnaissance de nombreuses populations locales avec des différences génétiques insignifiantes en tant qu'espèces distinctes. On ne sait pas non plus ce que l'on entend par différences « fixes » lorsque le flux de gènes empêchera une fixation complète. Nous n'avons pas le temps de passer en revue tous les concepts d'espèces de ce type ici, mais vous pouvez les trouver dans de nombreux livres (certains de mes propres efforts, des entrées d'encyclopédie avec des références générales, sont disponibles sur ma page d'accueil).

5) Taxonomie sans rang et abandon total des espèces !

Récemment, un certain nombre de systématiciens phylogénétiques de premier plan ont proposé une taxonomie « sans rang », dans laquelle les espèces n'occupent plus une position unique dans la hiérarchie taxonomique. Les partisans de ce point de vue soutiennent que la difficulté d'attribuer un rang d'espèce existe parce que les espèces manquent de réalité en tant que taxons spéciaux. Au lieu de cela, soutiennent-ils, nous devrions développer une taxonomie complètement nouvelle basée uniquement sur des principes phylogénétiques, et supprimer la tradition du binôme linnéen (c'est-à-dire deux noms latins : genre + espèce). La première révision d'un groupe taxonomique sans désignations d'espèces a récemment été publiée dans la revue "Systematic Biology" (2000). Il est difficile de dire si cette idée fera son chemin. Si c'est le cas, cela pourrait provoquer le chaos dans la nomenclature biologique à un moment où nous avons grand besoin de taxonomistes pour les études sur la biodiversité et la conservation. Il y a une très forte résistance à cette idée parmi les taxonomistes traditionnels, et aussi au sein même des systématiciens phylogénétiques.

Mon propre point de vue est que l'hybridation et le flux de gènes anéantiront l'idée d'une taxonomie sans rang parfaitement hiérarchique, en particulier près du niveau (actuel) de l'espèce, et que les espèces resteront un dispositif de nommage pratique pour classer les animaux et les plantes. Il doit y avoir une certaine validité aux espèces, ou vos guides d'oiseaux ou de plantes ne seraient pas très utiles. Dans certains taxons asexués, comme les ronces et les pissenlits, il peut être quelque peu difficile de distinguer les "espèces" des "variétés", mais la plupart du temps, même les taxons asexués sont faciles à diviser en fonction des espèces. En revanche, je suis plutôt d'accord pour dire que la supposée "réalité" des espèces au-delà des autres taxons supérieurs (genres, familles) ou inférieurs (sous-espèces, variétés) a été largement surestimée.

Pourquoi y a-t-il tant de concepts d'espèces ?

Que devraient faire les généticiens évolutionnistes praticiens comme vous, face à une telle diversité d'opinions ?

  • De nombreux biologistes évolutionnistes, à condition qu'ils ne travaillent PAS sur les plantes, pensent que le concept d'espèce biologique est le meilleur.
  • De nombreux taxonomistes et systématiciens pensent qu'une certaine forme de concept d'espèce phylogénétique est la meilleure, tandis que certains prétendent se débarrasser complètement des espèces au motif que la véritable taxonomie phylogénétique devrait être purement hiérarchique et sans rang.
  • Les écologistes supposent et utilisent souvent le concept d'espèce écologique.

J'ai ma propre façon de donner du sens à ce débat, avec laquelle vous pouvez être d'accord ou pas. Je soutiens que vous pouvez mettre à jour l'idée de Darwin sur les espèces sans trop de difficulté, mais en tenant compte des connaissances modernes de la génétique, et ainsi résoudre en même temps certains des problèmes inhérents aux autres concepts d'espèces.

Les espèces au sein d'une région sont des populations génétiquement différenciées potentiellement connectées par le flux de gènes. Ce flux de gènes peut être très faible (comme dans le concept d'espèce biologique), mais cela ne doit pas être négligeable. L'important est que le flux de gènes soit suffisamment faible et que la sélection perturbatrice séparant les populations soit suffisamment forte pour que les différences génétiques entre les espèces soient maintenues. Si les deux populations s'effondrent ensemble, parce que le flux génétique l'emporte sur la sélection, alors il n'y aura qu'une seule espèce.

Les espèces sont alors des groupes de génotypes avec des discontinuités ou des écarts entre eux (une version génétique de Darwin’s notion morphologique ). Faibles niveaux de flux de gènes (un manque de Mayr’s isolement avant l'accouplement ) pourrait briser les différences génotypiques et phénotypiques. Cependant, ce flux de gènes, s'il existe, peut être équilibré par une sélection perturbatrice, qui peut être intrinsèque (due aux interactions entre les gènes au sein des hybrides, comme dans Mayr’s mécanismes d'isolement après l'accouplement ) ou extrinsèque (en raison de l'environnement, comme dans Van Valen’s concept écologique ) . Le concept morphologique de Darwin peut ainsi être rapproché des concepts écologique et biologique : les concepts biologique et écologique sont explications de la situation morphologique/génotypique de deux clusters séparés par des lacunes. Les phylogénies ont évidemment quelque chose à voir avec l'ensemble du processus. Au fur et à mesure que les espèces divergent de plus en plus, l'hybridation sera réduite et une branche distincte dans la phylogénie émerge de la réticulation causée par l'hybridation et devient progressivement mieux définie.

Phew! Maintenant que c'est terminé, passons à la discussion sur le choses intéressantes sur les espèces.

Différences génétiques entre les espèces

Pour étudier la spéciation, nous devons savoir comment les espèces diffèrent les unes des autres génétiquement. En général, où que nous regardions, les espèces diffèrent de manière similaire à celles des populations ou des races géographiques (voir ÉVOLUTION DANS L'ESPACE ET LE TEMPS), mais plus encore. Voici quelques-unes des différences entre les espèces :

une) Différences morphologiques (voir la définition de Darwin, ci-dessus). La morphologie diffère également entre les races et les populations, bien sûr, comme déjà mentionné.

b) Différences enzymatiques et moléculaires . Francisco Ayala a fait des enquêtes détaillées avec des allozymes sur Drosophile [VOIR APERÇU]. Les espèces diffèrent à plusieurs loci d'allozymes, les sous-espèces à un peu moins de loci, et ainsi de suite jusqu'aux populations. Nous avons vu que de nombreuses zones hybrides séparent des formes sous-spécifiques qui diffèrent également à plusieurs loci génétiques, et ce travail et celui d'Ayala montrent clairement que les races et les espèces diffèrent génétiquement en degré plutôt qu'en nature. Ceci est aussi vrai pour l'ADNmt et d'autres marqueurs d'ADN que pour les allozymes (voir également (g) ci-dessous). Parce que les différences multilocus sont communes même entre les populations et les races que personne ne voudrait appeler des espèces, il est presque certain que la spéciation implique également l'évolution de plusieurs locus, et même plus !

c) Différences chromosomiques . Nous avons déjà mentionné les différences entre les humains et les chimpanzés (voir Évolution chromosomique) et à quel point cela est courant chez d'autres espèces étudiées. Encore une fois, nous pouvons signaler des sous-espèces et des races qui diffèrent également sur le plan chromosomique, mais moins. Sur le plan chromosomique, les espèces sont continues avec les races, mais diffèrent généralement davantage.

Polyploïdie est cependant une exception à cette différenciation progressive. La polyploïdie est une caractéristique très courante des différences entre les espèces végétales et ne peut être considérée que rarement comme polymorphe au sein des espèces en raison de la stérilité presque universelle de la progéniture diploïde X polyploïde, qui est triploïde.

ré) Signaux utilisés dans l'accouplement . Les couleurs sexuellement sélectionnées, la longueur de la queue chez les oiseaux, les phéromones chez les papillons de nuit, d'autres insectes et même les mammifères sont également impliqués dans la reconnaissance des espèces. Chez de nombreux grillons et sauterelles, ainsi que chez les grenouilles, des sons spécifiques aux espèces sont nécessaires chez les lucioles, les espèces se reconnaissent au moyen de flashs codés [VOIR OVERHEAD].

Encore une fois, ces différences de types sont assez facilement dérivées des différences de choix du partenaire au sein des espèces, peut-être causées par la sélection sexuelle ou pour des raisons écologiques d'efficacité. Les différences entre les races et les espèces sont à nouveau de degré plutôt que de nature. Il existe une controverse quant à savoir si le choix du partenaire lui-même peut évoluer pour "protéger les espèces" du flux génétique. Ce serait un véritable "mécanisme" d'isolement. Voir la prochaine conférence.

e) Inviabilité et stérilité hybrides - incompatibilité génomique . La stérilité et l'inviabilité sont très courantes chez les hybrides. Nous avons déjà mentionné des exemples produits par des différences chromosomiques. Les mules (hybrides âne x cheval, qui sont stériles) sont un autre exemple.

Nous savons d'après les études des clines et des zones hybrides que l'inviabilité des hybrides multilocus peut se produire au sein des espèces ainsi qu'entre elles. D'un autre côté, certaines espèces ne s'accouplent presque jamais ensemble, mais si elles le font, les hybrides semblent non seulement viables mais fertiles. Les espèces apparentées de pinsons et de canards de Darwin en sont un exemple. Encore une fois, les espèces ne diffèrent des races que par le degré d'inviabilité et de stérilité hybrides, pas absolument par la nature.

Un type de différence particulièrement bien connu est connu sous le nom de La règle d'Haldane après son découvreur, J.B.S. Haldane. La règle de Haldane stipule que lorsqu'un seul sexe de l'hybride F1 entre espèces est affecté par l'inviabilité ou la stérilité, ce sexe est généralement le hétérogamétique (XY) le sexe, plutôt que le homogamétique (XX) sexe. La règle fonctionne chez les mammifères et les diptères (mouches) dans lesquels la détermination du sexe est généralement mâle - XY, femelle - XX ainsi que chez les oiseaux et les papillons, dans lesquels les femelles sont XY et les mâles sont XX. La raison est probablement principalement due aux effets récessifs des gènes provoquant une incompatibilité sur le chromosome X. Ces gènes doivent être épistatiques, voyez-vous pourquoi ?

Dans d'autres cas, l'hybride F1 entre deux espèces peut convenir, mais les rétrocroisements ou les croisements F2 produisent l'inviabilité ou la stérilité. Ceci est connu comme panne hybride , et peut être causée par des gènes d'incompatibilité récessifs (également épistatiques) devenant homozygotes au cours de ces croisements ultérieurs.

F) Différences écologiques . Peut-être que les meilleurs exemples que nous ayons de différences écologiques entre des espèces étroitement apparentées sont radiation adaptatives sur les îles. Les pinsons de Darwin sont bien connus. Les lianes hawaïennes [VOIR OVERHEAD] sont encore plus extraordinaires. D'ancêtres ressemblant à des pinsons, ils ont produit des formes nectarivores, insectivores, frugivores et granivores.

Mais nous avons déjà discuté, sous le concept d'espèce écologique, de la manière dont les différences écologiques se trouvent entre les clines soumis à une sélection extrinsèque à travers un gradient environnemental. Encore une fois, il n'y a pas de ligne de démarcation claire entre les races et les espèces dans le degré de différenciation écologique.

g) Différences généalogiques . Comme nous l'avons vu, lorsque des espèces divergent, leur ADN, comme l'ADN mitochondrial, diverge également. Lorsqu'une généalogie (la phylogénie d'un seul gène ou d'un segment d'ADN) est estimée, on constate généralement que les espèces, et parfois même les races, appartiennent à différentes branches de la généalogie. Un exemple est donné par le Héliconius papillons, sur lesquels travaille son propre groupe, dans la figure ci-dessous.

Heliconius cydno et H. melpomène sont des espèces étroitement apparentées qui s'hybrident aussi occasionnellement. Ils relèvent clairement de branches distinctes de cette généalogie des gènes CO1 et CO2 de l'ADNmt. Cependant, il est également vrai que le melpomène de Guyane française tombe sur une branche distincte de la généalogie des membres de la même espèce du Panama, et il existe un modèle de ramification profonde similaire même au sein du Panama cydno. Ainsi, une généalogie distincte n'est pas un bon guide pour le statut d'espèce distincte. D'autres races géographiques de Heliconius melpomene ont des généalogies d'ADNmt qui se mélangent avec le H. melpomene panaméen, donc toutes les populations géographiques n'ont pas de généalogies distinctes.

Cependant, dans certains cas, comme dans le Drosophile (melanogaster, simulant, sechellie, et mauritienne) généalogies [OVERHEAD], les généalogies génétiques d'espèces distinctes bien reconnues s'entremêlent. Dans ce cas, deux possibilités existent : (1) polymorphismes ancestraux -- la spéciation s'est produite assez récemment pour que les polymorphismes des gènes au sein de chaque espèce soient conservés. (2) transfert de gène interspécifique -- le transfert horizontal de gènes depuis l'origine de l'espèce a conduit plus récemment à un brassage des généalogies. Ces deux sont difficiles à distinguer.

En tout cas, même au niveau généalogique, nous voyons s'entremêler aussi bien au-dessus du niveau de l'espèce qu'en dessous. Des branches généalogiques distinctes ont évolué au sein de certaines espèces, ainsi qu'entre de nombreuses, peut-être la plupart des espèces. Les généalogies des espèces peuvent être plus séparées que celles des races et des populations au sein des espèces, mais il y a beaucoup de chevauchements.

Différences génétiques entre les espèces , puis sont généralement hérités à plusieurs loci, et sont en moyenne plus grands que et impliquent plus de gènes que (bien que se chevauchent et se fondent dans) les types de différences que nous voyons entre les races géographiques, ou même les morphes dans les populations polymorphes. Il n'y a rien de magique au niveau de l'espèce en termes de génétique, et donc il semblerait plus logique et parcimonieux (le plus simple) d'utiliser les mêmes forces microévolutives - sélection, dérive, mutation - couplées à plus de temps, pour expliquer l'évolution des espèces, ainsi que les autres types d'évolution sous-spécifique dont nous avons déjà parlé.

Strictement, biodiversité désigne la somme totale de la diversité à tous les niveaux de la hiérarchie évolutive, de la diversité génétique au sein des populations, entre les populations, entre les races, les espèces, les genres, etc., jusqu'aux écosystèmes et aux biomes. Dans la pratique, l'espèce est traditionnellement considérée comme l'un des plus importants niveaux de biodiversité. Au vu de la difficulté de définir les espèces (ci-dessus), ce n'est peut-être pas valable ?