Informations

Distance des gènes et fréquence de recombinaison : mécanisme

Distance des gènes et fréquence de recombinaison : mécanisme


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Pourquoi la fréquence de recombinaison est-elle plus élevée si les gènes sont plus éloignés les uns des autres ?


Le phénomène génétique appelé recombinaison reflète le processus de croisement qui se produit lors de la méiose. Le croisement crée un échange d'informations génétiques entre les chromosomes homologues. En première approximation, les événements se déroulent à des positions aléatoires le long des chromosomes alignés. Par conséquent, plus les deux loci sont éloignés l'un de l'autre, plus il est probable qu'il y aura un événement de croisement entre eux. Ainsi, la fréquence de recombinaison peut être utilisée pour mesurer la distance entre deux loci génétiques (ou gènes).

Supplément ajouté en réponse au commentaire de l'OP

Une analogie

Imaginez un morceau de ficelle. Il comporte 6 repères (1-6 sur le schéma) qui le divisent en 7 intervalles (A-G). Nous allons couper la ficelle à l'une des marques. Nous lançons un dé pour décider quelle position couper.

Quelle est la probabilité que notre coupe sépare A et G ? C'est 100% puisque toutes les coupes simples le feront.

Quelle est la probabilité que notre coupe sépare A et D ? C'est 50% puisque des coupes simples à 1,2 ou 3 feront cela.

Quelle est la probabilité que notre coupe sépare A et B ? C'est 16,7% (1/6) puisque seule une coupe en position 1 le fera et la probabilité de lancer un 1 sur notre dé est de 1/6.

Considérez les intervalles (A-G) comme des gènes et les sites coupés (1-6) comme des croisements possibles d'événements. Si deux chromosomes homologues vont subir un seul croisement quelque part au hasard, alors plus les gènes (intervalles) sont rapprochés, moins il est probable que le croisement (coupure) ait lieu entre eux. Cela suppose bien entendu que le lieu de croisement soit choisi au hasard.

Dans le modèle présenté ici, si l'ordre des lettres était brouillé et que l'on ne savait pas de quoi il s'agissait mais que l'on nous disait les fréquences d'occurrence de la séparation des intervalles avec découpage aléatoire on pouvait en déduire l'ordre des lettres.


Distance des gènes et fréquence de recombinaison : Mécanisme - Biologie

La recombinaison est très pertinente pour générer une variabilité génétique dans les populations virales.

La recombinaison virale a des conséquences importantes pour différents domaines de recherche. Ceux-ci incluent la biologie moléculaire, la virologie et la biologie évolutive. Elle a également un impact sur la pratique quotidienne des cliniciens et des responsables de la santé publique.

Nous passons ici en revue trois aspects importants de la recombinaison virale : (i) les mécanismes moléculaires des virus à ADN et à ARN modèles, (ii) les méthodes de détection, de caractérisation et de quantification dans les populations virales, (iii) son impact sur l'analyse évolutive des populations virales. .


Biotechnologies agricoles et apparentées

4.12.3.1 Marqueurs et cartographie

La cartographie génétique dans sa définition la plus simple consiste à « mettre des marqueurs en ordre, indiquant les distances génétiques relatives entre eux ». 23 Le concept de création d'une carte génétique n'est pas nouveau, l'objectif étant généralement de permettre une meilleure compréhension du comportement génétique et la sélection (efficace) de génotypes supérieurs.

Les marqueurs basés sur la PCR sont devenus de plus en plus populaires dans la cartographie génétique en raison de la facilité avec laquelle ils peuvent être produits à partir même de petites quantités d'ADN. Au cours de la dernière décennie, la technique AFLP a été largement utilisée dans la cartographie génétique des plantes en raison de sa grande efficacité à générer un grand nombre de marqueurs moléculaires. Les SSR sont devenus le marqueur de choix car ils se sont produits à des fréquences élevées dans les génomes des plantes, présentaient des taux de mutation élevés, avaient une bonne résolution analytique et étaient facilement automatisés. Cependant, les développements récents de la technologie SNP, combinés à la disponibilité de données de séquences complètes du génome, rendent probable qu'à terme ils deviendront le marqueur de choix en particulier pour les cultures d'importance économique majeure.


Résultats

Les domaines de régulation des gènes définis à l'aide de loci de traits quantitatifs d'expression et de méthylation montrent une vallée du taux de recombinaison

Nous avons examiné la relation entre le taux de recombinaison humaine et les domaines régulateurs, définis comme la région génomique couverte par un gène et les régions régulatrices liées à son élément promoteur dans le même chromosome. Les taux de recombinaison ont été estimés à l'aide de la carte génétique des 1000 génomes [4], puis liés aux domaines de régulation des gènes à l'aide de quatre types de liens.

Nous avons d'abord utilisé des liens génétiques basés sur des loci de traits quantitatifs d'expression (eQTL) et des loci de traits quantitatifs de méthylation (meQTL). Ceux-ci consistent en 248 856 liens eQTL entre les régions régulatrices et les sites de début de transcription (TSS) des gènes cibles, définis dans le sang total à l'aide de 168 individus profilés par le Gene-Tissue Expression (GTEx) Consortium [15], et 809 577 liens meQTL entre les régions régulatrices et Méthylation des CpG mesurée dans le cerveau humain, principalement dans les régions promotrices, dans la cohorte ROS/MAP de 575 individus [16].

Nous avons constaté que les intervalles entre les eQTL et leurs gènes cibles, et entre les meQTL et leurs sondes de méthylation cibles, montraient des diminutions substantielles du taux de recombinaison (Fig. 1a, b). Nous avons évalué les intervalles à trois plages de distance, comprenant des distances courtes (1 à 10 ko), intermédiaires (10 à 100 ko) et longues (100 ko à 1 Mo). L'effet était le plus prononcé pour les liaisons de distances intermédiaires et longues, qui présentaient des taux de recombinaison systématiquement plus faibles par rapport aux intervalles aléatoires, un phénomène que nous appelons une « vallée du taux de recombinaison » (Fig. 1e, f Fichier supplémentaire 1 : Figure S1a, b). Dans de courts intervalles, la précision de l'estimation du taux de recombinaison est affectée par la densité variable de SNP dans différentes régions génomiques et cartes génétiques. Par conséquent, nous n'avons pas observé de vallées de taux de recombinaison cohérentes dans des intervalles à courte distance. Pour évaluer la signification statistique des vallées de taux de recombinaison observées, nous avons échantillonné le même nombre de régions génomiques aléatoires avec la même longueur physique dans le même chromosome (détails dans « Méthodes »). Comme comparateur supplémentaire, nous avons échantillonné le même nombre de paires aléatoires SNP-TSS/SNP-CpG (détails dans « Méthodes »). Nous avons trouvé des diminutions significatives du taux de recombinaison aux distances intermédiaires et longues pour les liaisons eQTL et meQTL (Fig. 1i, j) dans les deux cas (test Mann-Whitney U bidirectionnel apparié avec des intervalles aléatoires appariés et test de permutation avec des combinaisons aléatoires de SNP-TSS/SNP-CpG, p < 1e -4 ).

Vallées de recombinaison au sein de liens génétiques, physiques et d'activité. Exemples de régions génomiques pour montrer l'enrichissement de une paires meQTL (rouge), b Paires eQTL (Orange), c top 10 % des paires Hi-C (observées/attendues (O/E), pas de motif CTCF, bleu), Paires DNase-TSS (pas de motif CTCF, violet) dans les régions à faible taux de recombinaison. Chaque pixel représente un segment de 10 Ko (pour Hi-C, un segment de 1 Ko) et une couleur plus foncée indique un taux de recombinaison plus élevé entre deux segments. Points colorés à chaque pixel indiquent les liens génétiques ou physiques qui existent entre deux segments génomiques. Le taux de recombinaison moyen au sein e paires meQTL (rouge), F Paires eQTL (Orange), g top 10% des paires Hi-C (O/E, pas de motif CTCF, bleu), h Paires DNase-TSS (pas de motif CTCF, violet) sont significativement inférieurs aux intervalles aléatoires appariés. Lignes colorées représentent le taux de recombinaison moyen à chaque distance d'intervalle entre les caractéristiques génomiques, tandis que liens noirs représentent la valeur moyenne dans des intervalles aléatoires appariés. Les régions ombrées représentent l'intervalle de confiance à 95 % (moyenne ± écart-type × 1,96/10). Taux de recombinaison dans trois échelles génomiques différentes en je paires meQTL, j paires eQTL, k top 10% des paires Hi-C (O/E, pas de motif CTCF), je Paires DNase-TSS (pas de motif CTCF). Comparaisons avec p < 1e −4 (test Mann-Whitney U bidirectionnel apparié) sont marqués d'un astérisque

Nous avons ensuite confirmé que notre observation dans les liens génétiques n'est pas un artefact de déséquilibre de liaison (LD), ce qui est une possibilité car davantage de liens génétiques sont trouvés dans les régions avec un LD plus fort. Premièrement, nous n'avons gardé que l'eQTL/meQTL avec le plus p valeur pour chaque gène/CpG. Nous avons en outre élagué ces « meilleurs » liens eQTL/meQTL en excluant plusieurs dénombrements de la même région génomique (détails dans le fichier supplémentaire 2 : méthode supplémentaire 1). Figure S2a–c, f–h, k–m). Deuxièmement, nous avons effectué un petit décalage aléatoire autour des meilleurs liens génétiques et avons trouvé un taux de recombinaison légèrement mais significativement plus élevé (Fichier supplémentaire 1 : Figure S3 Fichier supplémentaire 2 : Méthode supplémentaire 2). Ces observations suggèrent que les liens génétiques causals montrent des taux de recombinaison inférieurs au sein de la LD.

Nous avons en outre évalué si notre observation tenait dans des ensembles de données indépendants et avec des paramètres analytiques variables. Tout d'abord, nous avons répété l'analyse en utilisant 16 tissus et lignées cellulaires supplémentaires du GTEx Consortium [15], du Multiple Tissue Human Expression Resource (MuTHER) Consortium [17] et du Genetic European Variation in Health and Disease (gEUVADIS) Consortium [18] et à nouveau trouvé systématiquement une vallée de taux de recombinaison significative dans les régions définies par des liens génétiques (Fichier supplémentaire 1 : Figure S4). Deuxièmement, nous avons répété l'analyse en variant les seuils pour le taux de fausse découverte (FDR) des eQTL et meQTL, et avons systématiquement trouvé des vallées de taux de recombinaison. La réduction la plus forte du taux de recombinaison a été trouvée aux seuils FDR les plus stricts pour la découverte eQTL et meQTL, indiquant qu'avec des seuils de confiance de liaison plus élevés, le signal devient plus fort (Fichier supplémentaire 1 : Figure S5a, b, e, f, i, j ). Troisièmement, nous avons répété l'analyse sur des cartes génétiques estimées par le projet HapMap [19] et par deCODE Genetics [2, 3] et avons trouvé les résultats en grande partie inchangés (Fichier supplémentaire 1 : Figure S6a, b, e, f, i, l) . Pour tenir compte des biais de séquence, nous avons utilisé une approche d'échantillonnage de rejet pour générer des intervalles aléatoires appariés, avec une teneur en GC, une densité CpG, une densité SNP et une densité de motifs PRDM9 égales. Nous avons trouvé les résultats robustes à cet appariement plus strict (Fichier supplémentaire 1 : Figure S7a, b, e, f, i, j, m, n, q, r). Comme il est très coûteux en calcul de générer des contrôles appariés aléatoires par une approche d'échantillonnage de rejet dans un espace de grande dimension, nous avons implémenté une structure de données arborescente kd pour organiser tous les intervalles aléatoires possibles de 1 Ko à 1 Mo dans le génome et recherché avec encore plus de rigueur critères de correspondance, y compris des caractéristiques supplémentaires de densité de gènes et de distance au TSS (détails dans « Méthodes » Fichier supplémentaire 1 : Figure S7u, v, y, z, ac–af). Pour tenir compte de la diminution du taux de recombinaison dans les régions transcrites, nous avons exclu les intervalles à moins de 2 kb des annotations génétiques dans GENCODE v19 et avons toujours trouvé des vallées de taux de recombinaison dans les liens intergéniques meQTL/eQTL par rapport aux intervalles aléatoires générés avec nos critères d'appariement rigoureux. La conclusion n'a pas changé lorsque nous avons fait la moyenne du taux de recombinaison à partir de bases non codantes uniquement (Fichier supplémentaire 1 : Figure S8a, b, e, f, i, j, m–p).

Les domaines de régulation des gènes par conformation chromosomique montrent une vallée de recombinaison

En plus des liens génétiques, nous avons utilisé 458 132 liens entre régions génomiques très proches lorsqu'elles sont repliées dans le noyau tridimensionnel, sur la base d'une capture de conformation chromosomique à haut débit (Hi-C) mesurée dans la lignée cellulaire GM12878 [20]. Nous avons constaté que le taux de recombinaison dans les domaines de régulation définis par Hi-C était également significativement plus faible (test Mann-Whitney U apparié à deux voies et test de permutation, p < 1e −4 ) aux distances intermédiaires et longues par rapport à deux ensembles différents d'intervalles aléatoires (Fig. 1c, g, k Fichier supplémentaire 1 : Figure S1c). Cette propriété est détenue spécifiquement pour les liaisons Hi-C non interrompues par des motifs CTCF [21], cohérente avec le rôle des boucles CTCF comme définissant les limites des domaines régulateurs [20] (Fig. 1g, k Additional file 1 : Figure S11o, p). Nous avons également exclu les motifs CTCF des intervalles appariés au hasard et avons toujours trouvé des déplétions significatives (Fichier supplémentaire 1 : Figure S12a, b).

Pour éviter le biais introduit par relativement plus de liens Hi-C à partir des domaines avec un taux de recombinaison inférieur, nous avons généré les intervalles aléatoires appariés uniquement dans les mêmes boucles détectées par la recherche de pics sans biais de calcul Hi-C (boucles HiCCUPS) et nous avons toujours trouvé des vallées de taux de recombinaison (Fichier supplémentaire 1 : Figure S9). Nous avons également élagué les liens Hi-C en excluant plusieurs comptes de chaque région génomique et avons systématiquement trouvé des vallées de taux de recombinaison (Fichier supplémentaire 1 : Figure S2d, i, n Fichier supplémentaire 2 : Méthode supplémentaire 1). Nous avons ensuite modifié le seuil des liens Hi-C (pas de motif CTCF) inclus dans l'analyse et avons continué à observer des vallées de taux de recombinaison (Fichier supplémentaire 1 : Figure S5c, g). Nous avons également répété l'analyse dans différentes cartes génétiques (Fichier supplémentaire 1 : Figure S6c, g) et comparé cela avec des intervalles aléatoires appariés plus stricts dans l'ensemble du génome par deux méthodes (Fichier supplémentaire 1 : Figure S7c, g, k, o, s , w, aa) et dans les régions non codantes et intergéniques (Fichier supplémentaire 1 : Figure S8c, g, k). Nous avons combiné les preuves Hi-C et eQTL disponibles dans le même type cellulaire (lignées cellulaires lymphoblastoïdes (LCL), y compris GM12878) [17, 20] et avons constaté que l'épuisement du taux de recombinaison devenait encore plus prononcé (Fichier supplémentaire 1 : Figure S10 test Mann-Whitney U bidirectionnel apparié, p < 1e -4 ). Cela indique que les liens de régulation des gènes avec une confiance accrue montrent une vallée du taux de recombinaison encore plus prononcée.

Nous avons répété cette analyse à l'aide d'interactions chromosomiques physiques définies par l'analyse des interactions de la chromatine à l'aide du séquençage d'étiquettes appariées (ChIA-PET), une technique complémentaire qui définit les interactions en boucle à longue portée dans le contexte d'un régulateur spécifique [22]. Nous avons utilisé des domaines de régulation basés sur ChIA-PET pour la polymérase (Pol)II et le CTCF tels que définis par le consortium ENCODE. Nous avons constaté que le taux de recombinaison dans les régions liées ChIA-PET PolII était également significativement épuisé, mais pas dans les régions liées ChIA-PET CTCF, qui ne sont pas des domaines de régulation des gènes (Fichier supplémentaire 1 : Figure S11k–n).

Ces résultats indiquent que la vallée du taux de recombinaison est une propriété générale des domaines de régulation des gènes définis à l'aide d'interactions physiques d'ADN à longue distance non isolées par CTCF.

Les domaines de régulation des gènes définis à l'aide de la corrélation d'activité montrent une vallée de recombinaison

Nous avons ensuite évalué la relation entre le taux de recombinaison et les liens de régulation des gènes définis entre les régions amplificatrices et leurs gènes cibles, comme prédit à l'aide de la modification des histones, de l'accessibilité de la DNase et des données d'expression génique de l'ENCODE [23] et Roadmap Epigenomics Consortia [24]. Nous avons utilisé 29 557 079 liens uniques basés sur la corrélation prédits entre les pics de DNase-seq et l'expression génique des transcrits cibles putatifs (détails dans le fichier supplémentaire 2 : méthode supplémentaire 10). Compte tenu du rôle des motifs CTCF dans le guidage des boucles de chromatine [20], nous nous sommes concentrés sur 164 409 liens uniques qui n'étaient pas interrompus par des motifs CTCF et donc plus susceptibles de se trouver dans les mêmes boucles de chromatine. Nous avons trouvé un taux de recombinaison significativement réduit pour les régions au sein de ces domaines amplificateur-TSS par rapport aux paires aléatoires (test Mann-Whitney U bidirectionnel et test de permutation, p < 1e −4 Fig. 1d, h, l Fichier supplémentaire 1 : Figure S1d Fichier supplémentaire 1 : Figure S11i, j).

Pour éviter plusieurs comptages de la même région génomique, nous avons élagué les liens DNase-TSS en utilisant une approche similaire à celle des liens Hi-C (Fichier supplémentaire 2 : Méthode supplémentaire 1) et avons trouvé des résultats similaires (Fichier supplémentaire 1 : Figure S2e, j , o). Nous avons ensuite répété l'analyse en utilisant différents seuils pour les liens DNase-TSS (Fichier supplémentaire 1 : Figure S5d-h), différentes cartes génétiques (Fichier supplémentaire 1 : Figure S6d-h) et des intervalles aléatoires appariés plus stricts dans le génome entier (Fichier supplémentaire 1 : Figure S7d, h, l, p, t, x, ab), bases non codantes et régions intergéniques (Fichier supplémentaire 1 : Figure S8d, h, l), et a systématiquement trouvé des vallées de taux de recombinaison significatives au sein de la DNase-TSS liens.

Nous avons effectué une analyse supplémentaire avec 1 427 744 liens uniques amplificateur-TSS prédits à l'aide d'une version modifiée d'une stratégie publiée précédemment [23] basée sur des affectations d'état de chromatine spécifiques au type de cellule et sur la corrélation entre plusieurs modifications d'histones et les niveaux d'expression génique à travers les types de cellules [24] (détails dans Fiche complémentaire 2 : Méthodes complémentaires 11). Nous avons constaté que les 139 043 domaines de régulation génique résultants sans motifs CTCF continuaient à montrer un épuisement significatif du taux de recombinaison à la fois sur des distances intermédiaires et longues (Fichier supplémentaire 1 : Figure S11a–d).

Nous avons répété cette analyse à l'aide de 302 538 liens uniques prédits à l'aide d'une approche de lien d'allocation de Dirichlet latente conjointe basée sur un module (Wang et al., en préparation, les liens de données et de code sont disponibles dans le fichier supplémentaire 3 : tableau S1) qui ne dépend pas de la corrélation et peut prédire les liens spécifiques au type de cellule. Malgré ces différences dans la prédiction des liens amplificateur-TSS, nous avons trouvé un épuisement similaire du taux de recombinaison dans les domaines de régulation des gènes par rapport aux contrôles aléatoires (Fichier supplémentaire 1 : Figure S11e–h).

Ensemble, ces résultats indiquent que les domaines de régulation des gènes définis sur la base de la génomique fonctionnelle et des informations épigénomiques sont associés à une vallée du taux de recombinaison, indiquant que les gènes ont tendance à être co-hérités avec leurs éléments de régulation des gènes.

Les domaines constitutifs et développementaux montrent un épuisement plus important du taux de recombinaison

Nous avons ensuite évalué comment la force de la vallée du taux de recombinaison varie pour différentes classes de gènes. Nous avons constaté que la vallée du taux de recombinaison dans les liens physiques et d'activité était plus prononcée pour les gènes domestiques [25] que pour les gènes non domestiques (Fig. 2a–c Fichier supplémentaire 1 : Figure S13). Elle était également plus prononcée pour les gènes qui agissent aux stades précoces du développement embryonnaire [26, 27], en particulier pour les gènes au stade ovocytaire et les gènes responsables de la méiose dans la cellule germinale primordiale (PGC), mais pas pour la plupart des autres types cellulaires. -groupes de gènes spécifiques [28] (Fig. 2d Fichier supplémentaire 1 : Figure S14). Pour exclure la possibilité que le signal dans les gènes d'entretien soit dû à la contribution de gènes activement exprimés dans l'ovocyte et au stade précoce du développement et donc non susceptibles de recombinaison, nous avons divisé les gènes d'entretien en trois catégories : ceux fortement exprimés dans les premiers stades de développement (haut 10 % des niveaux d'expression), ceux qui ne font pas partie des 10 % supérieurs et ceux qui ne figurent pas dans les 50 % supérieurs. Des vallées de taux de recombinaison ont été observées quels que soient les niveaux d'expression (Fichier supplémentaire 1 : Figure S15).

Les vallées de taux de recombinaison sont les plus importantes au niveau des liens fonctionnels associés aux gènes de ménage et aux liens constitutifs. une Taux de recombinaison moyen dans les 10 % supérieurs des paires Hi-C (observé/attendu (O/E), pas de CTCF), associé à des gènes de ménage (bleu) et non associé à des gènes de ménage (doré). b Taux de recombinaison moyen dans les paires DNase-TSS sans motifs CTCF intermédiaires, associés à des gènes de ménage (violet) et non associé à des gènes de ménage (doré). c Taux de recombinaison moyen dans les paires amplificateur-TSS appelées par la méthode LDA sans motifs CTCF intermédiaires, associés à des gènes de ménage (vert) et non associé à des gènes de ménage (doré). Taux de recombinaison moyen dans les liaisons ChIA-PET PolII au niveau des gènes du développement embryonnaire précoce et d'autres gènes spécifiques au type cellulaire dans les cellules K562. Les barres d'erreur indiquent l'écart type. e La vallée du taux de recombinaison est beaucoup plus importante aux liaisons eQTL constitutives (Orange) que celle des liens eQTL spécifiques au tissu (magenta). F Taux de recombinaison au sein des liaisons amplificateur-TSS (région de 10 à 100 kb) appelé par la méthode LDA conjointe dans différents nombres de types de cellules. Les barres d'erreur indiquent l'écart type

Nous avons également évalué comment la force de la vallée du taux de recombinaison varie pour différentes classes d'éléments régulateurs. Nous avons évalué la déplétion du taux de recombinaison en utilisant 43 236 eQTL constitutifs et 18 879 liens eQTL spécifiques à la thyroïde du projet GTEx [15]. Nous avons constaté que les liens eQTL constitutifs montraient des écarts systématiquement plus importants dans les taux de recombinaison que les liens spécifiques aux tissus, chacun par rapport à des contrôles aléatoires appariés (Fig. 2e Fichier supplémentaire 1 : Figure S16). De même, nous avons constaté que les domaines de régulation des gènes récupérés indépendamment dans plusieurs types de cellules présentaient une vallée du taux de recombinaison plus prononcée que les domaines de régulation des gènes spécifiques aux tissus (Fig. 2f).

Ainsi, la vallée du taux de recombinaison est plus prononcée dans les domaines de régulation génique des gènes exprimés de manière constitutive, les gènes avec des rôles développementaux et les éléments régulateurs avec une activité constitutive, qui partagent tous la caractéristique qu'ils sont soumis à une contrainte évolutive plus forte [29]. Cela suggère qu'un taux de recombinaison réduit entre les éléments régulateurs et leurs gènes cibles peut être avantageux pour les gènes et les éléments régulateurs sous une sélection plus forte dans la lignée germinale, éventuellement en facilitant le maintien du gène apparié et de ses éléments régulateurs dans chaque allèle, qui sont importants au début du développement, en tant qu'unité héréditaire unique.

Vallées des taux de recombinaison chez la souris

Nous avons estimé que si la vallée du taux de recombinaison est une caractéristique sélectionnée des domaines de régulation des gènes chez l'homme, elle devrait être une caractéristique conservée au cours de l'évolution chez d'autres mammifères. Pour tester cette hypothèse, nous avons répété notre analyse dans le génome de la souris.

Nous avons quantifié les taux de recombinaison à travers le génome de la souris en utilisant le Mus musculus carte génétique [30]. Nous avons défini des domaines de régulation des gènes en utilisant à la fois des interactions génétiques et physiques. Pour les interactions génétiques, nous avons utilisé 2659 eQTL basés sur 100 souches dans le foie murin [31] et 1035 eQTL basés sur 39 souches dans deux types de cellules immunologiques murines [32]. Pour les interactions physiques, nous avons utilisé 271 236 liaisons Hi-C (pas de CTCF) [20] appelées dans une lignée cellulaire lymphoblastoïde murine.

En évaluant le taux de recombinaison des domaines de régulation des gènes, nous avons trouvé un épuisement significatif du taux de recombinaison par rapport aux paires aléatoires pour les interactions génétiques longues et les interactions physiques (test Mann-Whitney U bidirectionnel et test de permutation, p < 1e −4 Fig. 3 Fichier supplémentaire 1 : Figure S17). Nous n'avons pas observé de vallées de taux de recombinaison dans des intervalles de gamme intermédiaire dans les liens génétiques, probablement en raison de la structure LD plus longue et des cartes génétiques à résolution beaucoup plus faible chez la souris. Cela suggère que la vallée du taux de recombinaison n'est pas une caractéristique uniquement du génome humain, mais peut représenter une propriété mammifère plus générale, peut-être en tant que mécanisme conservé au cours de l'évolution pour préserver d'importants domaines de régulation.

Vallées de taux de recombinaison dans les domaines de régulation de la souris. une Taux de recombinaison moyen dans les 10 % supérieurs des liaisons Hi-C (observé/attendu (O/E)) sans pics CTCF intermédiaires dans les cellules CH-12. b Taux de recombinaison dans les 10 % supérieurs des liaisons Hi-C (O/E) sans pics CTCF intermédiaires dans les cellules CH-12. Les astérisques représentent qu'il est statistiquement significatif différent entre deux groupes (test Mann-Whitney U bidirectionnel apparié, p < 1e−4)

Rôles potentiels de la méthylation de l'ADN et des cassures double brin dans les vallées des taux de recombinaison

Nous avons ensuite cherché à comprendre les processus mécanistes potentiels qui pourraient conduire aux vallées de taux de recombinaison observées. Nous avons constaté qu'une rareté des points chauds de recombinaison est associée à des vallées de taux de recombinaison (Fig. 4a Fichier supplémentaire 1 : Figure S18a). Cependant, la moitié des liens n'ont pas de points chauds de recombinaison, et donc leur variation de taux de recombinaison doit être expliquée en utilisant d'autres mécanismes.

Les vallées des taux de recombinaison sont corrélées avec la densité des points chauds et la méthylation de l'ADN. une La relation entre log10 (taux de recombinaison) et la densité de points chauds de recombinaison (par kb) à chaque intervalle eQTL. Couleurs chaudes représentent la densité de points. Densité de points chauds de recombinaison inférieure à 0,005/ko (rectangle rouge) a été extrait pour l'analyse dans b. b La relation entre le taux de recombinaison moyen et les quantiles de méthylation de l'ADN au stade ovocytaire GV dans les intervalles eQTL. Barres d'erreur indiquer l'écart type

Compte tenu des rôles précédemment proposés de la méthylation de l'ADN dans le taux de recombinaison [11], nous avons étudié la relation entre la méthylation de l'ADN et les vallées des taux de recombinaison. Nous avons utilisé des profils de méthylation à l'échelle du génome à résolution nucléotidique dans les cellules germinales primordiales humaines (PGC) [27] et les ovocytes [33], représentant l'état du méthylome des cellules humaines avant et pendant l'arrêt méiotique (Fichier supplémentaire 1 : Figure S19a), dans dont la recombinaison se produit via des événements de croisement.

Nous avons utilisé des fenêtres non chevauchantes de 500 ko pour analyser le génome et avons trouvé une forte corrélation négative globale entre les niveaux de méthylation dans les PGC et le taux de recombinaison (Fichier supplémentaire 1 : Figure S19b Fichier supplémentaire 1 : Figure S20a), indiquant que les niveaux de méthylation de l'ADN immédiatement avant aux événements de recombinaison sont hautement prédictifs des vallées de recombinaison. En revanche, nous n'avons pas trouvé d'anti-corrélation globale aussi forte dans les ovocytes (Fichier supplémentaire 1 : Figure S19b) cependant, le niveau de méthylation au sein des liens génétiques tels que les liens eQTL a montré une corrélation négative avec le taux de recombinaison dans les ovocytes (Fig. 4b Fichier supplémentaire 1 : Figure S18b Fichier additionnel 1 : Figure S19c Fichier additionnel 1 : Figure S20b–d). Ces résultats suggèrent que la méthylation de l'ADN peut jouer un rôle dans la réduction de la fréquence des événements de recombinaison méiotique qui altèrent les liens régulateurs fonctionnels paternels et maternels. Nous n'avons pas trouvé de fortes corrélations négatives globales ou locales entre la méthylation et le taux de recombinaison dans d'autres types de cellules à plusieurs stades de développement (Fichier supplémentaire 1 : Figure S19c Fichier supplémentaire 1 : Figure S20b–d).

Les événements de recombinaison sont initiés par des cassures double brin, qui sont suggérées comme étant associées à la méthylation de l'ADN [34]. Ainsi, la méthylation de l'ADN dans de grands domaines régulateurs peut expliquer le taux de recombinaison réduit. Pour évaluer ce modèle, nous avons examiné la corrélation entre les niveaux de méthylation de l'ADN et la fréquence d'initiation de la rupture double brin (DSB), tous deux profilés dans les spermatozoïdes. Nous avons constaté que la méthylation de l'ADN montrait une corrélation négative significative avec la fréquence d'initiation du DSB (Pearson -0,11, p valeur = 1,71e −16 Fichier supplémentaire 1 : Figure S21a). Pour étudier plus avant la relation entre la méthylation de l'ADN et les DSB d'ADN, nous avons corrélé les niveaux de méthylation de l'ADN profilés dans LCL avec des preuves ChIP-Seq pour gamma-H2A.X, marqueurs de la réparation des cassures double brin et forme active de H2A.X, profilés dans CD4 + cellules T [35, 36], et ont trouvé une corrélation positive significative avec des preuves de réparation de l'ADN (Pearson 0,36 avec gamma-H2A.X, p valeur < 10 −100 , Fichier supplémentaire 1 : Figure S21b). Nous avons trouvé une corrélation négative de la méthylation de l'ADN avec H2A.X (Pearson -0,211, p valeur = 7.92e -59 ), excluant la possibilité que l'association entre la méthylation de l'ADN et gamma-H2A.X soit due au niveau de fond H2A.X (Fichier supplémentaire 1 : Figure S21c). Ces résultats suggèrent que le niveau accru de méthylation de l'ADN dans les vallées de taux de recombinaison peut réduire la fréquence d'initiation du DSB et augmenter le taux de réparation du DSB, contribuant ainsi à un taux de recombinaison réduit (Fichier supplémentaire 1 : Figure S19d).

Pour quantifier la variation du taux de recombinaison due aux niveaux de méthylation de l'ADN et aux domaines de régulation définis par des liens génétiques, physiques et d'activité, nous avons construit un modèle de régression de forêt aléatoire qui utilise la méthylation de l'ADN et les liens de régulation comme caractéristiques pour prédire le taux de recombinaison dans un système génomique. intervalle. Le modèle comprenait des ajustements pour le taux de recombinaison variable de différents chromosomes et à différentes distances génomiques (Fichier supplémentaire 2 : Méthodes supplémentaires 12 et 13).

Nous avons constaté que les types de liens individuels varient considérablement en termes de pouvoir prédictif, les meQTL présentant le pouvoir prédictif le plus élevé pour les liens à moyenne et longue portée. La combinaison du nombre de chromosomes, de la distance physique, des liens réglementaires et du niveau de méthylation de l'ADN a entraîné une concordance élevée entre le taux de recombinaison prévu et observé (coefficient de corrélation de Pearson 0,622, p valeur < 10 -100 ). Fait intéressant, le prédicteur le plus précis utilisait une combinaison des quatre types de liaison et de la méthylation de l'ADN (Fig. 5). De plus, un prédicteur combiné utilisant des points chauds de recombinaison et la méthylation de l'ADN conjointement pourrait récapituler jusqu'à 92 % de la différence de taux de recombinaison observée à longue distance et 80 % à moyenne distance au sein de chaque type de lien fonctionnel (Fichier supplémentaire 1 : Figure S22).

Prédictions de taux de recombinaison dans des intervalles aléatoires. une Taux de recombinaison prédit par rapport au taux de recombinaison observé dans des intervalles aléatoires (région de 100 kb à 1 Mb, en utilisant le chromosome, la distance génomique, la fraction chevauchante avec tous les liens fonctionnels et le niveau de méthylation de l'ADN). Les Ligne mauve représente la relation linéaire ajustée entre les deux variables. b Coefficient de corrélation de Pearson moyen entre le taux de recombinaison prévu et le taux de recombinaison observé dans les régions de distance moyenne (10–100 kb) et longue (100 kb–1 Mb). c Erreur quadratique moyenne moyenne entre le taux de recombinaison prévu et le taux de recombinaison observé dans les régions de distance moyenne (10–100 kb) et longue (100–1 Mb)


Effet de la distance et de l'orientation du marqueur sur la formation de recombinaisons dans les cellules infectées par le poxvirus.

On sait peu de choses sur le mécanisme de recombinaison des poxvirus, même si la construction de virus recombinants par des méthodes dépendantes de la recombinaison est une technique largement adoptée. Nous avons montré précédemment que les ADN transfectés sont efficacement recombinés tout en se répliquant dans des cellules infectées par le virus du fibrome de Shope. Étant donné que l'ADN recombinant peut être récupéré à partir de cellules infectées sous forme de concatémère tête-à-queue de haut poids moléculaire, il a été possible de transfecter des ADN lambda génétiquement marqués dans des cellules infectées et de doser des recombinants sous forme de particules de bactériophage après conditionnement in vitro. Cette approche a été utilisée dans cette étude pour examiner comment la distance et l'orientation des marqueurs influencent la recombinaison dans les cellules infectées par le virus du fibrome de Shope. Des croisements simples à deux facteurs ont été facilement modélisés à l'aide d'une fonction de cartographie dérivée d'études de phages classiques et ont montré une faible interférence négative (I = -2,8 +/- 0,5) dans les croisements impliquant des marqueurs distants de plus de 100 pb. Des croisements plus complexes à quatre et cinq facteurs ont montré que la fréquence de recombinaison par unité de distance n'était pas constante (augmentant à mesure que la séparation des marqueurs était réduite de 100 à 1 pb) et que les croisements effectués dans des cellules infectées par le poxvirus sont soumis à une interférence négative élevée. Une conséquence est que l'orientation du marqueur n'influence pas considérablement le résultat de la plupart des croisements catalysés par le virus du fibrome de Shope, contrairement à ce qui est observé dans les cellules infectées par l'adénovirus ou le virus simien 40. Ces résultats peuvent être interprétés pour indiquer que des contraintes statistiques et physiques similaires influencent à la fois la recombinaison virale et phagique et suggèrent que les hétéroduplex peuvent être des intermédiaires importants dans le processus de recombinaison des poxvirus.


Remerciements

Nous regrettons qu'en raison de l'espace limité, une grande partie des travaux pertinents n'aient pas pu être cités. Nous sommes redevables à R. Kanaar pour la lecture critique du manuscrit et pour ses commentaires précieux et détaillés. We also thank the three anonymous reviewers for their constructive criticism of the manuscript. This work was partially supported by the INSERM (Institut National de la Santé et de la Recherche Médicale), France, and the Erasmus University Medical Center, Rotterdam, The Netherlands.


Transformation of genetic recombination in bacteria

Defination of recombination :
Bacterial recombination is characterized by DNA Transfer from one organism called donor to another organism as recipient.

Genetic recombination process in Bacteria occurs in 3 main ways -
1) Transformation,
2) Conjugation,
3) Transduction.

Bacteria (Prokaryotes) do transfert horizontal de gènes at the time of recombination.
Gene transfer has 2 machanism
1) Horizontal gene transfer - in this machanism gene transfer between two indépendant organismes. Par exemple. conjugation, transduction and transformation.
2) Vertical gene transfer - in this machanism gene transfers parent à progéniture. Par exemple. sexual reproduction by Binary Fission in Prokaryotes.

The fragment of DNA that is Transferred during horizontal gene transfer from donor to recipient is referred as Exogenote.
The recipient bacterial cell's own genetic material is called Endogenote.

A bacterial cell that has received an exogenote is initially deploid for part of its genome is called merozygote(partially diploid).

Recombination generally requires that the two DNA molecules be homologue (very similar/ not identical). If they are non homologous due to origin from different species than recombination is unlikely.

Exogenote are often degraded rapidly so that there is a race between degradation of exogenote and recombination.

Transformation :

Transformation is the process of uptake a naked ADN molecule or fragment from the medium by a cell and it's incorporation into chromosome of recipient.

Introduction :

Compétence -
- The ability of recipient bacterium to take up free DNA and become transformed is called competence. It is an inheritable characteristic.
- Competent bacteria that take up DNA from environment at high frequency encode proteins called competence factor.
- Competence factor facilitate binding of DNA fragment to cell surface and uptake of DNA in cytoplasm. par exemple. competent bacteria produces competent proteinwhich binds to foreign DNA on cell surface and then uptake by cytoplasm.

Process of Transformation :

Transduction in bacteria

2). Once DNA comes in contact with competent bacteria, linear ADNdb converts to single stranded DNA and one strand is degraded.
3). Single stranded DNA (exogenote) is unstable and degraded unless they are integrated into endogenote by homologous recombination.

Genetic analysis of transformation :
- Transformation is used for gene mapping.
- Genetic analysis of Transfer together is they are near enough to be carried on same DNA fragment.
- La fréquence of transformation is inversely proportional to the distance between two genes.


Gene distance and Recombination Frequency: Mechanism - Biology

In his autobiography, Darwin mused with regret at his failure to learn more mathematics, observing that those with an understanding of the “great leading principles of mathematics” “seem to have an extra sense”. This extra sense is beautifully exemplified in a subject that was near to Darwin’s heart, namely, the origins of heredity, the study of which gave rise to modern genetics. Gregor Mendel was intrigued by the same question that has perplexed naturalists as well as parents for countless generations, namely, what are the rules governing the similarities and differences of parents and their offspring? His approach required the painstaking and meticulous act of counting frequencies of various traits such as pea shape from carefully constructed plant crosses, where he found that out of a total of 7,324 garden peas, 5,474 of them were round and 1,850 were wrinkled. The subsequent analysis of the data showed for this case a ratio of these traits in the second generation of crosses of 2.96 to 1, providing a critical clue permitting Mendel to posit the existence of the abstract particles of inheritance we now call genes.

Figure 1: Schematic of the first genetic map of the X chromosome of Drosophila redrawn with modern symbols. Sturtevant’s map included five genes on the X chromosome of Drosophila. Adapted from: http://www.nature.com/scitable/topicpage/thomas-hunt-morgan-genetic-recombination-and-gene-496. Locations updated from Green & Piergentili, PNAS 2000. Based on: Pierce, Benjamin. Genetics: A Conceptual Approach, 2nd ed. (New York: W. H. Freeman and Company), 161. From:

To cause a sea change in biological research required going beyond phenomenological observations to a situation where genetic manipulations could be more easily performed and more detailed predictions made. This came about when Morgan, head of a lab already overflowing with studies of pigeons and starfish, undertook with his students an object of study with minimal space requirements and faster generation times. So came to the scene one of the great protagonists of modern genetics, the fruit fly Drosophila Melanogaster. As Morgan’s lab transformed to what became known as the “fly room” (first at Columbia University, then at Caltech), it harbored flies with several distinct morphological properties akin to Mendel’s mottled and different colored peas. Systematic crosses of these mutant flies showed deviations from the predictions of Mendelian genetics on the relative fractions of different progeny. An inquisitive Columbia University undergraduate student in Morgan’s lab decided to analyze the frequencies of linkage, that is of pairs of co-inherited traits. During a long night that was supposed to be devoted to homework for his undergrad studies, the young Alfred Sturtevant instead made a conceptual leap that was to become textbook material and a cherished story from the history of science. He found that the tendency of the traits they studied to be inherited together such as white eyes instead of red eyes or a more yellow body color could be quantitatively explained if one assumes that the genes for these traits are ordered along a line (chromosome) and the tendency not to be inherited together is then reasonably predicted as increasing linearly with their distance. Using this logic, that night Sturtevant created the first genetic map reproduced in Figure 1.

Table 1: Recombination rates in various mammals and marsupials of similar genome sizes. Genetic map length is the sum of genetic map lengths summing in units of cM over all chromosomes in each genome. The right most column, recombination events per chromosome, is calculated by dividing the genetic map length (cM/100) by the number of chromosomes. Note how this genetic map length per chromosome is close to one over the range of organisms. (BNID 107023, adapted from Dumont BL, Payseur BA. Evolution of the genomic rate of recombination in mammals. Evolution. 62:276, 2008. Choromosme numbers are from: http://www.genomesize.com.)

The mechanism explaining the frequency with which characteristics are inherited together is that of recombination. This is an act of two chromosomes of similar composition coming together and performing a molecular crossover, thereby exchanging genetic content. Two genes on the chromosome that have a 1% chance of crossover per generation are defined to be at a distance of one centimorgan, or cM for short. In humans, the average rate of recombination is about 1cM per 1Mbp (BNID 107023), that is, for every million base pairs there is a one in a hundred chance of crossover on average per generation. The variation in the rate of recombination is shown in Table 1. It tends to scale inversely with genomic length. This interesting scaling property can be simply understood by noting that in most species there are one to two crossover events per chromosome per replication. This results in an organism-wide rule of thumb of one recombination event per chromosome as demonstrated in the right-most column of Table 1, or equivalently as 100 cM (i.e. one Morgan or one crossover) per chromosome per replication. Beyond general rules of thumb, we now also know that some locations along chromosomes are hotspots that are more labile for crossovers. Finally, human females have ≈50% higher recombination rates than males (42 versus 28 on average in one recent study, BNID 109268). So even though you tend to get more of your single base mutations from your father as discussed in the vignette on “How many chromosome replications occur per generation?”, your crossovers are mostly thanks to your mother.

Figure 2: Detection of recombination events based on sequencing of a single sperm cell. The two columns in each chromosome represent the two homologous chromosomes carried by the subject. The source of the sperm single chromosome copy can be traced to one or the other homologous chromosome based on single nucleotide polymorphisms that appear in one chromosome but not the other. Blue lines show the association of the sperm sequence to the two chromosome sets based on those single nucleotide polymorphisms. Each switch (haplotype block) indicates a recombination event. (Adapted from J. Wang, et al., Cell 150:402,2012.)

Recent breakthroughs in genotyping have made it possible to perform a single-cell analysis of recombination activity. Single nucleotide polymorphisms (SNPs) are locations in the human genome where there is variation between people such that say more than 1% of the population has a nucleotide different than the majority of the population. For the human population there are on the order of 10 6 such locations on the genome. Here is how this can be used to infer the number and location of recombination events. The chromosomes of a male were separated in a microfluidic device (arbitrarily marked as left and right for each of the 22 pairs) and then each chromosome was separately analyzed for the variant of nucleotide it carries by a microarray technology. The same process was repeated for a sperm cell leading to maps such as that shown in Figure 2. At the locations where it is known that there is polymorphism in the genome it was checked if the variant in the sperm cells is the one that appears in one chromosome but not the other, and if so its location was marked as a blue stripe on the relevant chromosome. The events of recombination are clearly seen as switches of those polymorphism locations from one arm to the other. On average, 23 recombination events were found for a human sperm cell (BNID 108035). Short stretches consisting of a single SNP switching chromosome, as highlighted in chromosome 8, are cases of what has been termed gene conversion where one allele (gene copy) has performed homologous recombination that makes it replace the other copy (its heterozygous allele). Such analysis at the single-cell level, in contrast to inference at the population level or from studying progeny in a family, makes it possible to see the rates of events such as recombination and mutation in the gametes including for those gametes that will not lead to viable progeny. This is relevant as the human monthly fecundity rate, that is the chance of a menstrual cycle leading to pregnancy, is only about 25% (BNID 108080) even at the peak ages of 20-30. Aberrations in the genome content are often detected naturally early in development, within the first few weeks following conception, and lead to natural termination of the pregnancy even before the woman is aware she is pregnant.

Today recombination also serves researchers as a key tool in genetic engineering for creating designer genomes. Homologous recombination enables incorporation of a DNA sequence at a prescribed location within the genome. Its use has transformed our ability to tag genes of interest and resulted in genome-wide libraries enabling high-throughput analysis of key cellular properties ranging from localization of proteins to different cellular locations to genome-wide assessments of protein levels and variability. Though recombineering, as it is called, is incredibly powerful, unfortunately it can only be used in some organisms and not others, giving those lucky organisms a strong selective pressure in labs around the world as attractive model systems. Outstanding examples are the budding yeast and the moss physcomitrella patens. The method of homologous recombination requires a sequence of homology flanking the integrated sequence. The length of this sequence varies depending on the organism, the gene of interest and the specific technique and protocol employed. Some characteristic values are ≈30-50 bp in budding yeast (BNID 101986) whereas in mouse it is ≈3-5 kbp (BNID 101987). With the longer stretches also comes a much lower efficiency of performing the act of homologous recombination complicating the lives of molecular biologists, though modern CRISPR techniques have effected a new revolution in genome editing that may largely supersede recombineering methods.


Notes on the Process and Mechanism of Crossing Over

Janssens (1909) was the first person to discover chiasma formation and related process of crossing over (Chiasma type hypothesis). Morgan (1910) found the phenomena of linkage and recombination.

Image Courtesy : online.santarosa.edu/homepage/cgalt/BIO10-Stuff/Ch09-Genetics/Crossing-Over.jpg

The recombination or new combination of genes is possible only due to exchange of genetic material between homologous chromosomes (Breakage and Reunion Theory, Darlington 1937). Linkage is incomplete in such cases.

Définition:

(i) Crossing over is a recombination of genes due to exchange of genetic material between two homologous chromosomes,

(ii) It is the mutual exchange of segments of genetic material between non-sister chromatids of two homologous chromosomes, so as to produce re-combinations or new combinations of genes.

The non-sister chromatids in which exchange of segments have occurred are called recombinants or cross-overs while the other chromatids in which crossing over has not taken place are known as parental chromatids or non cross-overs.

C.B. Hutchinson (1922) crossed a pure breeding coloured and smooth grained (CS/CS) Maize variety with pure breeding colourless and shrunken grained (cs/cs) Maize variety. Plants of F1 generation possessed coloured and smooth grains showing that both the expressions are dominant. F1 plants were obviously heterozygous for the two traits (CS/cs). F1 plants were then test crossed with double recessive parents (cs/cs). It resulted in four types of offspring in the ratio of 27: 1 : 1 : 27 instead of 1 : 1 : 1 : 1 ratio expected for independent assortment (Table 5.3).

Table 5.3. Test cross between heterozygous coloured and smooth grained (CS/cs) Maize plants with double recessive parents having colourless and shrunken grains (cs/cs):

The above ratio is possible when the genes of the two traits do not show independent assortment. Apparently the two genes are linked in the same chromosome but 1.8% non-sister chromatids of the homologous chromosomes show crossing over in between the two genes by exchanging segments.

Recombination and Crossing Over:

A new grouping of genes or a new combination of characters which is different from the parental types is called recombination or recombinant type. It is produced due to crossing over that occurs during meiosis prior to gamete formation. The frequency of recombination is directly related to the frequency of crossing over.

However, sometimes two or even more crossing overs may occur simultaneously in the same non sister chromatids of the homologous chromosomes without altering the frequency of re-combinations. Therefore, frequency of crossing over may be higher than the frequency of observed re-combinations. The frequency of recombination (cross over value, COV) is calculated using the formula

This COV of 10.7% between genes of red eye and normal wings means that these genes are located 10.7 units apart on the same chromosome.

Parental and Recombinant Types:

An individual contains two homologous chromosomes of each type. The two chromo­somes are obtained from the two different parents, father and mother. Therefore, these chromosomes are also called paternal and maternal chromosomes. Suppose these two chro­mosomes possess two linked genes, AB (dominant) in one and ab (recessive) in the other. Each chromosome further possesses two chromatids of similar type (AB, AB ab, ab).

If there is no crossing over at the time of gamete formation or meiosis, only two types of gametes are produced, one carrying the paternal (AB) and other maternal (ab) linkage. In case crossing over occurs at one place, one chromatid of each homologous chromosome gets involved in the exchange of segment while the other chromatid remains unaltered.

Thus four types of chromatids will be produced after one crossing over— AB, Ab, aB, ab. Two of them are parental (AB, ab) and two recombinant (Ab, aB). After meiosis the four types of chromatids segregate and pass on to four different gametes, 2 parental and 2 recombinant (Fig. 5.20).

In case the distance between two linked genes is such that one cross occurs regularly between them at each meiosis, they will produce two parental and two recombinant types in the ratio of 25%: 25%: 25%: 25%. This is similar to independent assortment. Mendel was lucky that three of the seven traits used by him in his famous experiments exhibited regular crossing over.

Therefore, independent assortment can occur in two circumstances,

(a) Genes occur in different non-homologous chromosomes,

(b) Genes lying in the same chromosome but showing regular crossing over (50% recombinants or cross-overs).

Factors Influencing Crossing Over (and Linkage):

The physical distance between two genes determines both the strength of the linkage and the frequency of the crossing over between two genes. The strength of the linkage increases with the closeness of the two genes. On the other hand the frequency of crossing over increases with the increase in the physical distance between the two genes.

Increase in age decreases the degree of crossing over in most of the cases.

Male Drosophila shows little crossing over. The phenomenon of crossing over is quite common in the female fly. Negligible crossing over is also reported in one sex of some other heterogametic organisms.

Exposure to X-rays increases the incidence of crossing over. Whittinghill produced a number of cross-overs in male Drosophila with the help of X-rays.

Variations in temperature increase the frequency of crossing over.

Presence of centromere and heterochromatic areas (e.g., near telomere) decrease the rate of crossing over.

A number of chemicals present in the food have been found to change the degree of crossing over in animals.

One cross-over reduces the occurrence of another crossing over in its vicinity. The phenomenon is called interference. Coincidence is the ratio of observed double cross over in relation to expected double cross-over on the basis of non-interference or independent occurrence. Coincidence is small when interference is high.

Importance:

1. Crossing over is a means of introducing new combinations of genes and hence traits.

2. It increases variability which is useful for natural selection under changed environment.

3. Since the frequency of crossing over depends upon the distance between the two genes, the phenomenon is used for preparing linkage chromosome maps.

4. It has proved that genes lie in a linear fashion in the chromosome.

5. Breeders have to select small or large population for obtaining the required cross­overs. For obtaining cross-overs between closely linked genes, a very large population is required.

6. Useful re-combinations produced by crossing over are picked up by breeders to develop useful new varieties of crop plants and animals. Green revolution has been achieved in India due to this selective picking up of useful re-combinations. Operation flood or white revolution is also being carried out on the similar lines.

Types of Crossing Over:

Crossing over can be single, double or multiple,

(i) Single Crossing Over:

Crossing over occurs at one point between two non-sister chromatids of a homologous chromosome pair. There are two parental types and two recombinants,

(ii) Double Crossing Over:

Crossing over occurs at two points in a homologous pair of chromosomes,

(a) Reciprocal Double Crossing Over:

Two points of crossing over occur between the same non-sister chromatids,

(b) Complementary Crossing Over:

The two crossing overs involve three or all the four chromatids so that the number of cross overs is three or four with occurrence
of one or no parental type,

(iii) Multiple Crossing Over:

Three or more points of crossing over occur in the same homologous chromosome. Double cross-overs and parental types may or may not occur.

Mechanism of Crossing Over:

Chromosomes get replicated in S-phase of interphase. Therefore, leptotene chromo­somes are double stranded though the two strands are not visible due to presence of nucleoprotein complex in between the chromatids.

(i) Synapsis:

Replicated but apparently single homologous chromosomes come to lie side by side with similar gene loci of the two chromosomes exactly opposite. It occurs in the zygotene stage of prophase I. The phe­nomenon is called synapsis. The synapsed pairs of homologous chromosomes are called bivalents. The small amount of unreplicated chromosome (0.3%), if present, also under­goes replication (Stem and Hotta, 1973). The two homologous chromosomes are held to­gether by a synaptinemal complex.

(ii) Crossing Over:

It occurs in the pachytene stage, at four strand stage with the help of enzymes (endonuclease, exo-nuclease, R-protein or recombinase Stern and Hotta, 1969, 1978). There is breakage of chromatid segments, exchange of nonsister chromatid segments and later their fusion in new places.

(iii) Tetrad Stage:

Synaptinemal complex begins to dissolve except in the region of crossing over. Therefore, chromosomes separate and chromatids become distinct at most of the places. As a bivalent appears to have four chromatids now, it is called tetrad stage. It occurs in the diplotene stage of prophase I. The synaptinemal attachment points between the homologous chromosomes are called chiasmata. In later stages the chiasmata tend to shift to the sides. The phenomenon is called terminalisation. Many of them disappear prior to metaphase I.


Using Cross Over Frequencies to Map Genes

Alfred H. Sturtevant hypothesized that the frequency at which linked genes become unlinked (recombination frequencies calculated from experiments similar to the one in this figure) could be used to determine the distances between genes on a chromosome. He predicted that the farther apart two genes were on a particular chromosome, the higher the probability that crossing over would occur between them, and subsequently, a higher recombination frequency would be observed.


Chiffre. Calculating Recombination Frequencies. (Cliquez sur l'image pour l'agrandir)

By considering a chromosome a linear sequence of genes, Sturtevant assigned each gene he was studying in fruit fly crosses a position on the chromosome using recombination frequencies. This figure illustrates one of Sturtevant's genetic maps, where three genes that are linked to each other (body color (b), wing size (vg) and an eye color gene called cinnabar (cn)) are positioned based on recombination frequencies observed in test crosses. This type of genetic map is called a linkage map because it portrays the sequence of genes along a chromosome, but it does not give the precise location of the genes. To determine the distance between two genes, Sturtevant divided the number of gametes with recombinant chromosomes by the total number of gametes observed. In the figure above, the recombination frequency between cn and b is 9%, and the recombination frequency between cn and vg is 9.5%. Therefore, crossovers between cn and b, and between cn and vg, are about half as frequent as crossovers between b and vg (17%). A map that places cn between b and vg (approximately half-way) is consistent with these observations. Sturtevant expressed the distance between genes in map units. By definition, one map unit (1 m.u.) is equivalent to a 1% recombination frequency. In honor of Morgan, one map unit, or a 1% frequency, is also called one centimorgan (cM).


Chiffre. (Cliquez sur l'image pour l'agrandir)

Thus, using crossover data, Sturtevant and his coworkers mapped other Drosophile genes in linear arrays at particular genetic locations. This figure depicts an abbreviated genetic map of chromosome II in Drosophile.

As with many rules, there are exceptions. If genes on the same chromosome are far apart, crossovers between them can occur frequently and these genes can have a maximum recombination frequency of 50%. These genes would appear to assort independently and may mistakenly be thought to exist on different chromosomes because they are so far apart on their chromosome that linkage is not observed in genetic crosses. These genes are mapped by adding the recombination frequencies from crosses involving intermediate genes, and by determining the approximate distance of each gene from the intermediates.


Chiffre. Genetic Map of Chromosome II in Drosophila. (Cliquez sur l'image pour l'agrandir)