Informations

2.13 : Nucléotides - Biologie

2.13 : Nucléotides - Biologie


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Acides nucléiques sont des polymères linéaires non ramifiés de nucléotides. Les nucléotides se composent de trois parties.

Un sucre à cinq carbones (d'où un pentose). On en trouve deux sortes :

  • désoxyribose, qui a un atome d'hydrogène attaché à son atome de carbone #2 (désigné 2'), et
  • ribose, qui contient un groupe hydroxyle.

Les nucléotides contenant du désoxyribose, le désoxyribonucléotides, sont les monomères des acides désoxyribonucléiques (ADN). Les nucléotides contenant du ribose, le ribonucléotides, sont les monomères des acides ribonucléiques (ARN).

Les Purines Les Pyrimidines

Une structure cyclique contenant de l'azote appelée nucléobase (ou simplement une base). La nucléobase est attachée à l'atome de carbone 1' du pentose. Dans ADN, on trouve quatre nucléobases différentes :

  • deux purines, appelé adénine (UNE) et guanine (g)
  • deux pyrimidines, appelé thymine (T) et cytosine (C)

ARN contient :

  • Les mêmes purines, adénine (UNE) et guanine (g).
  • L'ARN utilise également la pyrimidine cytosine (C), mais au lieu de la thymine, il utilise la pyrimidine uracile (U).

Nucléoside

La combinaison d'une nucléobase et d'un pentose est appelée un nucléoside.

Un (comme indiqué sur la première figure), deux ou trois phosphate groupes. Ceux-ci sont attachés à l'atome de carbone 5' du pentose. Le produit dans chaque cas est appelé un nucléotide. L'ADN et l'ARN sont assemblés à partir de nucléosides triphosphates.

  • Pour ADN, ceux-ci sont dATP, dGTP, dCTP, et dTTP.
  • Pour ARN, ceux-ci sont ATP, GTP, CTP, et UTP.

Dans les deux cas, à mesure que chaque nucléotide est attaché, les deuxième et troisième phosphates sont éliminés.

Tableau 2.13.1 : Les nucléosides et leurs mono-, di- et triphosphates
NucléobaseNucléosideNucléotides
ADNAdénine (A)DésoxyadénosinehumidedADPdATP
Guanine (G)DésoxyguanosinedGMPdPIBdGTP
Cytosine (C)DésoxycytidinedCMPdCDPdCTP
Thym (T)DésoxythymidinedTMPdTDPdTTP
ARNAdénine (A)AdénosineCHAADPATP
Guanine (G)GuanosineBPFPIBGTP
Cytosine (C)CytidineCMPCDPCTP
Uracile (U)UridineUMPUDPUTP

3.4 Acides nucléiques

Les acides nucléiques sont les molécules qui forment l'acide désoxyribonucléique (ADN) et l'acide ribonucléique (ARN). Les molécules d'ADN et d'ARN transportent des informations d'un endroit à l'autre au sein d'un organisme et de génération en génération. En bref, l'ADN et l'ARN sont des molécules contenant des informations qui sont le modèle de toute vie.

Graphique 3.8 Un nucléotide est composé d'un phosphate, d'un sucre et d'une base.

Les structures de l'ADN et de l'ARN consistent en une alternance de molécules de sucres et de phosphates (un atome de phosphore entouré de 4 atomes d'oxygène) le long de la « colonne vertébrale » de la molécule. Attachée à chaque sucre se trouve une structure cyclique contenant de l'azote appelée base. Un phosphate, un sucre et une base liés ensemble forment un nucléotide. Ces nucléotides se rejoignent pour créer le long tronçon d'acide nucléique qui forme l'ADN ou l'ARN.

Graphique 3.9 Les quatre bases de l'ADN sont l'adénine, la guanine, la cytosine et la thymine.

Dans l'ADN, il y a quatre bases : la guanine (G), l'adénine (A), la thymine (T) et la cytosine (C). L'ADN existe sous la forme d'une molécule double brin, avec deux de ces brins d'acide nucléique appariés par des interactions entre les bases. Dans l'ADN, la paire de A avec les T et les paires de C avec les G.

Graphique 3.10 Image d'une molécule d'ADN montrant sa structure en échelle

Ainsi, la molécule d'ADN peut être considérée comme une échelle tordue avec les rails latéraux de l'échelle comme squelette sucre-phosphate et les barreaux de l'échelle comme bases d'interaction.

Si tout l'ADN d'une seule cellule humaine était étiré, il ferait environ 6 pieds de long ! Cependant, l'ADN dans une cellule humaine est emballé en 46 brins séparés, ou chromosomes. Ces chromosomes passent la plupart de leur temps dans la cellule dans un arrangement désordonné (pensez à une assiette de spaghetti).

L'ADN est la molécule héréditaire pour la plupart des organismes biologiques (il existe certains virus qui utilisent l'ARN à la place). Votre ADN partagé avec les membres de votre famille a beaucoup à voir avec les caractéristiques communes que vous pouvez avoir avec vos proches biologiques.

Graphique 3.11 Un autre dessin de la molécule d'ADN montrant sa structure en double hélice (ou échelle torsadée). Encore une fois, les côtés de l'échelle sont les liaisons sucre-phosphate et les barreaux de l'échelle sont les bases azotées.

Les molécules d'ARN sont synthétisées à partir d'une matrice d'ADN. La molécule d'ARN est très similaire à l'ADN en ce qu'elle a un squelette sucre-phosphate (sauf dans ce cas, le sucre est le ribose), et chaque sucre est lié à une base. Cependant, dans l'ARN, il n'y a pas de thymine (T) à la place, l'ARN utilise l'uracile de base associé (U) à sa place. De plus, l'ARN existe en un seul brin.

Voir la vidéo ci-dessous pour une comparaison de l'ADN et de l'ARN :

L'ARN est important pour plusieurs fonctions liées à la liaison d'une autre classe de biomolécules, acides aminés, dans une structure appelée protéine.

Graphique 3.12 ARN contre brins d'ADN


Le rôle de la transglutaminase-2 et de ses substrats dans les maladies humaines

La fonction enzymatique la plus caractéristique de la classe d'enzymes appelées transglutaminases (TG, EC 2.3.2.13) est la formation de liaisons covalentes entre les groupes epsilon-amino des amines primaires (issus des lysines ou autres) et le groupe gamma-carboxamine des résidus glutamine de protéines. Au cours des dernières années, un nombre croissant de preuves indiquent que le membre le plus intéressant de la famille des TG, à savoir la TG tissulaire (tTG, également appelée transglutaminase de type 2, TG2), possède plus d'une fonction catalytique. En fait, TG2 est capable de catalyser une réaction de réticulation, une réaction de désamidation et présente également des activités de liaison/hydrolyse de GTP et d'isopeptidase. Par conséquent, il peut agir sur plusieurs classes de substrats, allant des protéines aux peptides, en passant par les petites molécules réactives comme les mono- et polyamines et les nucléotides. Compte tenu du large spectre d'activités potentiellement différentes, élucider le rôle de la TG2 et de ses substrats dans les fonctions cellulaires et les maladies humaines est une tâche difficile. Dans cette étude, nous concentrons notre attention sur les substrats de TG2 et rapportons un certain nombre de considérations intéressantes sur leur interaction possible dans les processus biologiques et leur implication dans les maladies humaines, y compris les troubles génétiques. Une amélioration significative dans la compréhension de ce scénario complexe peut provenir d'une approche « multi-interfaces », en exploitant différents outils bioinformatiques. En partant d'une base de données de substrats connus de TG2 et en utilisant des recherches croisées bioinformatiques parmi d'autres bases de données, nous avons généré des tables relationnelles à partir desquelles une implication de TG2 dans plusieurs troubles génétiques peut être hypothétique. Le développement de nouveaux outils et stratégies bioinformatiques pour étudier le rôle de la TG2 dans les mécanismes moléculaires sous-jacents aux maladies humaines apportera un nouvel éclairage à ce domaine de recherche fascinant.


2.3 Molécules biologiques

Les grosses molécules nécessaires à la vie qui sont construites à partir de molécules organiques plus petites sont appelées macromolécules biologiques. Il existe quatre grandes classes de macromolécules biologiques (glucides, lipides, protéines et acides nucléiques), et chacune est un composant important de la cellule et remplit un large éventail de fonctions. Combinées, ces molécules constituent la majorité de la masse d'une cellule. Les macromolécules biologiques sont organiques, ce qui signifie qu'elles contiennent du carbone (à quelques exceptions près, comme le dioxyde de carbone). De plus, ils peuvent contenir de l'hydrogène, de l'oxygène, de l'azote, du phosphore, du soufre et d'autres éléments mineurs.

Carbone

On dit souvent que la vie est « à base de carbone ». Cela signifie que les atomes de carbone, liés à d'autres atomes de carbone ou à d'autres éléments, forment les composants fondamentaux de nombreuses, sinon de la plupart, des molécules que l'on trouve uniquement dans les êtres vivants. D'autres éléments jouent un rôle important dans les molécules biologiques, mais le carbone est certainement considéré comme l'élément «fondateur» des molécules dans les êtres vivants. Ce sont les propriétés de liaison des atomes de carbone qui sont responsables de son rôle important.

Liaison carbone

Le carbone contient quatre électrons dans sa couche externe. Par conséquent, il peut former quatre liaisons covalentes avec d'autres atomes ou molécules. La molécule de carbone organique la plus simple est le méthane (CH4), dans laquelle quatre atomes d'hydrogène se lient à un atome de carbone (figure 2.13).

Cependant, les structures plus complexes sont réalisées en carbone. N'importe lequel des atomes d'hydrogène peut être remplacé par un autre atome de carbone lié de manière covalente au premier atome de carbone. De cette manière, des chaînes longues et ramifiées de composés carbonés peuvent être formées (Figure 2.14une). Les atomes de carbone peuvent se lier à des atomes d'autres éléments, tels que l'azote, l'oxygène et le phosphore (Figure 2.14b). Les molécules peuvent également former des anneaux, qui eux-mêmes peuvent se lier à d'autres anneaux (Figure 2.14c). Cette diversité de formes moléculaires rend compte de la diversité des fonctions des macromolécules biologiques et repose en grande partie sur la capacité du carbone à former des liaisons multiples avec lui-même et avec d'autres atomes.

Les glucides

Les glucides sont des macromolécules avec lesquelles la plupart des consommateurs sont quelque peu familiers. Pour perdre du poids, certaines personnes adhèrent à des régimes « faibles en glucides ». Les athlètes, en revanche, "se chargent souvent en glucides" avant les compétitions importantes pour s'assurer qu'ils ont suffisamment d'énergie pour concourir à un niveau élevé. Les glucides sont, en fait, une partie essentielle de notre alimentation. Les céréales, les fruits et les légumes sont tous des sources naturelles de glucides. Les glucides fournissent de l'énergie à l'organisme, notamment grâce au glucose, un sucre simple. Les glucides ont également d'autres fonctions importantes chez les humains, les animaux et les plantes.

Les glucides peuvent être représentés par la formule (CH2O)m, où m est le nombre d'atomes de carbone dans la molécule. En d'autres termes, le rapport carbone/hydrogène/oxygène est de 1:2:1 dans les molécules de glucides. Les glucides sont classés en trois sous-types : les monosaccharides, les disaccharides et les polysaccharides.

Les monosaccharides (mono- = "un" sacchar- = "sucré") sont des sucres simples, dont le plus courant est le glucose. Dans les monosaccharides, le nombre d'atomes de carbone varie généralement de trois à six. La plupart des noms de monosaccharides se terminent par le suffixe -ose. Selon le nombre d'atomes de carbone dans le sucre, ils peuvent être appelés trioses (trois atomes de carbone), pentoses (cinq atomes de carbone) et hexoses (six atomes de carbone).

Les monosaccharides peuvent exister sous forme de chaîne linéaire ou de molécules en forme d'anneau dans des solutions aqueuses, ils se trouvent généralement sous forme d'anneau.

La formule chimique du glucose est C6H12O6. Chez la plupart des espèces vivantes, le glucose est une importante source d'énergie. Pendant la respiration cellulaire, l'énergie est libérée à partir du glucose, et cette énergie est utilisée pour aider à fabriquer l'adénosine triphosphate (ATP). Les plantes synthétisent du glucose en utilisant du dioxyde de carbone et de l'eau par le processus de photosynthèse, et le glucose, à son tour, est utilisé pour les besoins énergétiques de la plante. L'excès de glucose synthétisé est souvent stocké sous forme d'amidon qui est décomposé par d'autres organismes qui se nourrissent de plantes.

Le galactose (partie du lactose ou du sucre du lait) et le fructose (présent dans les fruits) sont d'autres monosaccharides courants. Bien que le glucose, le galactose et le fructose aient tous la même formule chimique (C6H12O6), ils diffèrent structurellement et chimiquement (et sont appelés isomères) en raison des arrangements différents des atomes dans la chaîne carbonée (figure 2.15).

Les disaccharides (di- = « deux ») se forment lorsque deux monosaccharides subissent une réaction de déshydratation (une réaction dans laquelle l'élimination d'une molécule d'eau se produit). Au cours de ce processus, le groupe hydroxyle (-OH) d'un monosaccharide se combine avec un atome d'hydrogène d'un autre monosaccharide, libérant une molécule d'eau (H2O) et formant une liaison covalente entre les atomes des deux molécules de sucre.

Les disaccharides courants comprennent le lactose, le maltose et le saccharose. Le lactose est un disaccharide constitué des monomères glucose et galactose. On le trouve naturellement dans le lait. Le maltose, ou sucre de malt, est un disaccharide formé à partir d'une réaction de déshydratation entre deux molécules de glucose. Le disaccharide le plus courant est le saccharose, ou sucre de table, qui est composé des monomères glucose et fructose.

Une longue chaîne de monosaccharides liés par des liaisons covalentes est connue sous le nom de polysaccharide (poly- = « beaucoup »). La chaîne peut être ramifiée ou non ramifiée, et elle peut contenir différents types de monosaccharides. Les polysaccharides peuvent être de très grosses molécules. L'amidon, le glycogène, la cellulose et la chitine sont des exemples de polysaccharides.

L'amidon est la forme stockée des sucres dans les plantes et est composé d'amylose et d'amylopectine (deux polymères du glucose). Les plantes sont capables de synthétiser du glucose, et l'excès de glucose est stocké sous forme d'amidon dans différentes parties de la plante, y compris les racines et les graines. L'amidon qui est consommé par les animaux est décomposé en molécules plus petites, telles que le glucose. Les cellules peuvent alors absorber le glucose.

Le glycogène est la forme de stockage du glucose chez l'homme et d'autres vertébrés, et est composé de monomères de glucose. Le glycogène est l'équivalent animal de l'amidon et est une molécule hautement ramifiée généralement stockée dans les cellules du foie et des muscles. Chaque fois que les niveaux de glucose diminuent, le glycogène est décomposé pour libérer du glucose.

La cellulose est l'un des biopolymères naturels les plus abondants. Les parois cellulaires des plantes sont principalement constituées de cellulose, qui fournit un support structurel à la cellule. Le bois et le papier sont principalement de nature cellulosique. La cellulose est composée de monomères de glucose qui sont liés par des liaisons entre des atomes de carbone particuliers dans la molécule de glucose.

Tous les autres monomères de glucose dans la cellulose sont retournés et emballés étroitement sous forme de longues chaînes étendues. Cela donne à la cellulose sa rigidité et sa haute résistance à la traction, ce qui est si important pour les cellules végétales. La cellulose qui traverse notre système digestif est appelée fibre alimentaire. Alors que les liaisons glucose-glucose dans la cellulose ne peuvent pas être décomposées par les enzymes digestives humaines, les herbivores tels que les vaches, les buffles et les chevaux sont capables de digérer l'herbe riche en cellulose et de l'utiliser comme source de nourriture. Chez ces animaux, certaines espèces de bactéries résident dans le système digestif des herbivores et sécrètent l'enzyme cellulase. L'appendice contient également des bactéries qui décomposent la cellulose, lui conférant un rôle important dans le système digestif de certains ruminants. Les cellulases peuvent décomposer la cellulose en monomères de glucose qui peuvent être utilisés comme source d'énergie par l'animal.

Les glucides remplissent d'autres fonctions chez différents animaux. Les arthropodes, tels que les insectes, les araignées et les crabes, ont un squelette externe, appelé exosquelette, qui protège les parties internes de leur corps. Cet exosquelette est composé de la macromolécule biologique chitine, qui est un glucide azoté. Il est composé d'unités répétitives d'un sucre modifié contenant de l'azote.

Ainsi, grâce à des différences de structure moléculaire, les glucides sont capables de remplir les fonctions très différentes de stockage d'énergie (amidon et glycogène) et de soutien structurel et de protection (cellulose et chitine) (figure 2.16).

Connexion carrière

Diététiste

L'obésité est un problème de santé mondial et de nombreuses maladies, telles que le diabète et les maladies cardiaques, sont de plus en plus répandues en raison de l'obésité. C'est l'une des raisons pour lesquelles les diététistes sont de plus en plus sollicités pour obtenir des conseils. Les diététistes professionnelles aident à planifier des programmes d'alimentation et de nutrition pour les personnes dans divers contextes. Ils travaillent souvent avec des patients dans des établissements de santé, concevant des plans de nutrition pour prévenir et traiter les maladies. Par exemple, les diététistes peuvent enseigner à un patient diabétique comment gérer sa glycémie en consommant les bons types et quantités de glucides. Les diététistes peuvent également travailler dans des maisons de soins infirmiers, des écoles et des cabinets privés.

Pour devenir diététiste, il faut obtenir au moins un baccalauréat en diététique, nutrition, technologie alimentaire ou dans un domaine connexe. De plus, les diététistes doivent suivre un programme de stage supervisé et réussir un examen national. Ceux qui poursuivent une carrière en diététique suivent des cours de nutrition, de chimie, de biochimie, de biologie, de microbiologie et de physiologie humaine. Les diététistes doivent devenir des experts de la chimie et des fonctions des aliments (protéines, glucides et lipides).

Lipides

Les lipides comprennent un groupe diversifié de composés qui sont unis par une caractéristique commune. Les lipides sont hydrophobes (« craignant l'eau »), ou insolubles dans l'eau, car ce sont des molécules non polaires. En effet, ce sont des hydrocarbures qui ne contiennent que des liaisons non polaires carbone-carbone ou carbone-hydrogène. Les lipides remplissent de nombreuses fonctions différentes dans une cellule. Les cellules stockent de l'énergie pour une utilisation à long terme sous forme de lipides appelés graisses. Les lipides fournissent également une isolation de l'environnement pour les plantes et les animaux (figure 2.17). Par exemple, ils aident à garder les oiseaux aquatiques et les mammifères au sec en raison de leur nature hydrofuge. Les lipides sont également les éléments constitutifs de nombreuses hormones et sont un constituant important de la membrane plasmique. Les lipides comprennent les graisses, les huiles, les cires, les phospholipides et les stéroïdes.

Une molécule de graisse, comme un triglycéride, se compose de deux composants principaux : le glycérol et les acides gras. Le glycérol est un composé organique avec trois atomes de carbone, cinq atomes d'hydrogène et trois groupes hydroxyle (-OH). Les acides gras ont une longue chaîne d'hydrocarbures auxquels un groupe carboxyle acide est attaché, d'où le nom « acide gras ». Le nombre de carbones dans l'acide gras peut aller de 4 à 36, les plus courants sont ceux contenant 12 à 18 carbones. Dans une molécule de graisse, un acide gras est attaché à chacun des trois atomes d'oxygène dans les groupes -OH de la molécule de glycérol par une liaison covalente (figure 2.18).

Au cours de cette formation de liaison covalente, trois molécules d'eau sont libérées. Les trois acides gras contenus dans la graisse peuvent être similaires ou différents. Ces graisses sont également appelées triglycérides car elles contiennent trois acides gras. Certains acides gras ont des noms communs qui précisent leur origine. Par exemple, l'acide palmitique, un acide gras saturé, est dérivé du palmier. L'acide arachidique est dérivé de Arachis hypogée, le nom scientifique des arachides.

Les acides gras peuvent être saturés ou insaturés. Dans une chaîne d'acide gras, s'il n'y a que des liaisons simples entre les carbones voisins de la chaîne hydrocarbonée, l'acide gras est saturé. Les acides gras saturés sont saturés d'hydrogène, c'est-à-dire que le nombre d'atomes d'hydrogène attachés au squelette carboné est maximisé.

Lorsque la chaîne hydrocarbonée contient une double liaison, l'acide gras est un acide gras insaturé.

La plupart des graisses insaturées sont liquides à température ambiante et sont appelées huiles. S'il y a une double liaison dans la molécule, alors elle est connue comme une graisse monoinsaturée (par exemple, l'huile d'olive), et s'il y a plus d'une double liaison, alors elle est connue comme une graisse polyinsaturée (par exemple, l'huile de canola).

Les graisses saturées ont tendance à se tasser étroitement et sont solides à température ambiante. Les graisses animales contenant de l'acide stéarique et de l'acide palmitique contenus dans la viande et la graisse contenant de l'acide butyrique contenue dans le beurre sont des exemples de graisses saturées. Les mammifères stockent les graisses dans des cellules spécialisées appelées adipocytes, où les globules de graisse occupent la majeure partie de la cellule. Chez les plantes, la graisse ou l'huile est stockée dans les graines et est utilisée comme source d'énergie pendant le développement embryonnaire.

Les graisses ou huiles insaturées sont généralement d'origine végétale et contiennent des acides gras insaturés. La double liaison provoque une courbure ou un « pli » qui empêche les acides gras de se tasser étroitement, les gardant liquides à température ambiante. L'huile d'olive, l'huile de maïs, l'huile de canola et l'huile de foie de morue sont des exemples de graisses insaturées. Les graisses insaturées contribuent à améliorer le taux de cholestérol sanguin, tandis que les graisses saturées contribuent à la formation de plaque dans les artères, ce qui augmente le risque de crise cardiaque.

Dans l'industrie alimentaire, les huiles sont artificiellement hydrogénées pour les rendre semi-solides, ce qui réduit la détérioration et augmente la durée de conservation. En termes simples, l'hydrogène gazeux est mis à barboter à travers les huiles pour les solidifier. Au cours de ce processus d'hydrogénation, les doubles liaisons du cis-la conformation dans la chaîne hydrocarbonée peut être convertie en doubles liaisons dans le trans-conformation. Cela forme un trans-graisse d'un cis-gros. L'orientation des doubles liaisons affecte les propriétés chimiques de la graisse (figure 2.19).

La margarine, certains types de beurre d'arachide et le shortening sont des exemples de trans-les graisses. Des études récentes ont montré qu'une augmentation de trans-les graisses dans l'alimentation humaine peuvent entraîner une augmentation des taux de lipoprotéines de basse densité (LDL), ou «mauvais» cholestérol, qui, à leur tour, peuvent entraîner un dépôt de plaque dans les artères, entraînant une maladie cardiaque. De nombreux restaurants de restauration rapide ont récemment éliminé l'utilisation de trans-les matières grasses, et les étiquettes des aliments aux États-Unis sont désormais tenues de répertorier leurs trans-Teneur en matières grasses.

Les acides gras essentiels sont des acides gras nécessaires mais non synthétisés par le corps humain. Par conséquent, ils doivent être complétés par l'alimentation. Les acides gras oméga-3 entrent dans cette catégorie et sont l'un des deux seuls acides gras essentiels connus pour l'homme (l'autre étant les acides gras oméga-6). Ils sont un type de graisse polyinsaturée et sont appelés acides gras oméga-3 car le troisième carbone de la fin de l'acide gras participe à une double liaison.

Le saumon, la truite et le thon sont de bonnes sources d'acides gras oméga-3. Les acides gras oméga-3 sont importants dans le fonctionnement du cerveau et dans la croissance et le développement normaux. Ils peuvent également prévenir les maladies cardiaques et réduire le risque de cancer.

Comme les glucides, les graisses ont reçu beaucoup de mauvaise publicité. Il est vrai que manger un excès d'aliments frits et autres aliments « gras » entraîne une prise de poids. Cependant, les graisses ont des fonctions importantes. Les graisses servent de stockage d'énergie à long terme. Ils assurent également l'isolation du corps. Par conséquent, des graisses insaturées « saines » en quantités modérées doivent être consommées régulièrement.

Les phospholipides sont le constituant majeur de la membrane plasmique. Comme les graisses, elles sont composées de chaînes d'acides gras attachées à un glycérol ou à un squelette similaire. Au lieu de trois acides gras attachés, cependant, il y a deux acides gras et le troisième carbone du squelette du glycérol est lié à un groupe phosphate. Le groupe phosphate est modifié par l'ajout d'un alcool.

Un phospholipide possède à la fois des régions hydrophobes et hydrophiles. Les chaînes d'acides gras sont hydrophobes et s'excluent de l'eau, alors que le phosphate est hydrophile et interagit avec l'eau.

Les cellules sont entourées d'une membrane, qui a une bicouche de phospholipides. Les acides gras des phospholipides sont tournés vers l'intérieur, à l'opposé de l'eau, tandis que le groupement phosphate peut être tourné soit vers l'extérieur, soit vers l'intérieur de la cellule, tous deux aqueux.

Stéroïdes et cires

Contrairement aux phospholipides et aux graisses évoqués précédemment, les stéroïdes ont une structure en anneau. Bien qu'ils ne ressemblent pas aux autres lipides, ils sont regroupés avec eux car ils sont également hydrophobes. Tous les stéroïdes ont quatre anneaux de carbone liés et plusieurs d'entre eux, comme le cholestérol, ont une queue courte.

Le cholestérol est un stéroïde. Le cholestérol est principalement synthétisé dans le foie et est le précurseur de nombreuses hormones stéroïdes, telles que la testostérone et l'estradiol. C'est également le précurseur des vitamines E et K. Le cholestérol est le précurseur des sels biliaires, qui contribuent à la dégradation des graisses et à leur absorption ultérieure par les cellules. Bien que le cholestérol soit souvent évoqué en termes négatifs, il est nécessaire au bon fonctionnement de l'organisme. C'est un composant clé des membranes plasmiques des cellules animales.

Les cires sont constituées d'une chaîne hydrocarbonée avec un groupe alcool (-OH) et un acide gras. Des exemples de cires animales comprennent la cire d'abeille et la lanoline. Les plantes ont également des cires, telles que le revêtement sur leurs feuilles, qui les empêchent de se dessécher.

Concepts en action

Pour une perspective supplémentaire sur les lipides, explorez « Biomolécules : les lipides » à travers cette animation interactive.

Protéines

Les protéines sont l'une des molécules organiques les plus abondantes dans les systèmes vivants et ont la gamme de fonctions la plus diversifiée de toutes les macromolécules. Les protéines peuvent être structurelles, régulatrices, contractiles ou protectrices, elles peuvent servir au transport, au stockage ou aux membranes ou elles peuvent être des toxines ou des enzymes. Chaque cellule d'un système vivant peut contenir des milliers de protéines différentes, chacune ayant une fonction unique. Leurs structures, comme leurs fonctions, varient considérablement. Ce sont tous, cependant, des polymères d'acides aminés, disposés en séquence linéaire.

Les fonctions des protéines sont très diverses car il existe 20 acides aminés différents chimiquement distincts qui forment de longues chaînes, et les acides aminés peuvent être dans n'importe quel ordre. Par exemple, les protéines peuvent fonctionner comme des enzymes ou des hormones. Les enzymes, qui sont produites par les cellules vivantes, sont des catalyseurs de réactions biochimiques (comme la digestion) et sont généralement des protéines. Chaque enzyme est spécifique du substrat (un réactif qui se lie à une enzyme) sur lequel elle agit. Les enzymes peuvent fonctionner pour rompre les liaisons moléculaires, pour réarranger des liaisons ou pour former de nouvelles liaisons. Un exemple d'enzyme est l'amylase salivaire, qui décompose l'amylose, un composant de l'amidon.

Les hormones sont des molécules de signalisation chimiques, généralement des protéines ou des stéroïdes, sécrétées par une glande endocrine ou un groupe de cellules endocrines qui agissent pour contrôler ou réguler des processus physiologiques spécifiques, notamment la croissance, le développement, le métabolisme et la reproduction. Par exemple, l'insuline est une hormone protéique qui maintient la glycémie.

Les protéines ont des formes et des poids moléculaires différents, certaines protéines sont de forme globulaire tandis que d'autres sont de nature fibreuse. Par exemple, l'hémoglobine est une protéine globulaire, mais le collagène, présent dans notre peau, est une protéine fibreuse. La forme des protéines est essentielle à sa fonction. Les changements de température, de pH et d'exposition à des produits chimiques peuvent entraîner des modifications permanentes de la forme de la protéine, entraînant une perte de fonction ou une dénaturation (cela sera discuté plus en détail plus tard). Toutes les protéines sont constituées d'arrangements différents des mêmes 20 types d'acides aminés.

Les acides aminés sont les monomères qui composent les protéines. Chaque acide aminé a la même structure fondamentale, qui consiste en un atome de carbone central lié à un groupe aminé (-NH2), un groupe carboxyle (-COOH) et un atome d'hydrogène. Chaque acide aminé a également un autre atome variable ou groupe d'atomes lié à l'atome de carbone central connu sous le nom de groupe R. Le groupe R est la seule différence de structure entre les 20 acides aminés sinon, les acides aminés sont identiques (Figure 2.20).

La nature chimique du groupe R détermine la nature chimique de l'acide aminé dans sa protéine (c'est-à-dire s'il est acide, basique, polaire ou non polaire).

La séquence et le nombre d'acides aminés déterminent en fin de compte la forme, la taille et la fonction d'une protéine. Chaque acide aminé est lié à un autre acide aminé par une liaison covalente, appelée liaison peptidique, qui est formée par une réaction de déshydratation. Le groupe carboxyle d'un acide aminé et le groupe aminé d'un deuxième acide aminé se combinent, libérant une molécule d'eau. La liaison résultante est la liaison peptidique.

Les produits formés par une telle liaison sont appelés polypeptides. Alors que les termes polypeptide et protéine sont parfois utilisés de manière interchangeable, un polypeptide est techniquement un polymère d'acides aminés, alors que le terme protéine est utilisé pour un ou plusieurs polypeptides qui se sont combinés, ont une forme distincte et ont une fonction unique.

Connexion Évolution

L'importance évolutive du cytochrome c

Le cytochrome c est un composant important de la machinerie moléculaire qui récupère l'énergie du glucose. Parce que le rôle de cette protéine dans la production d'énergie cellulaire est crucial, elle a très peu changé au cours des millions d'années. Le séquençage des protéines a montré qu'il existe une quantité considérable de similitudes de séquences entre les molécules du cytochrome c de différentes espèces. Les relations évolutives peuvent être évaluées en mesurant les similitudes ou les différences entre les séquences de protéines de diverses espèces.

Par exemple, les scientifiques ont déterminé que le cytochrome c humain contient 104 acides aminés. Pour chaque molécule de cytochrome c qui a été séquencée à ce jour à partir d'organismes différents, 37 de ces acides aminés apparaissent à la même position dans chaque cytochrome c. Cela indique que tous ces organismes descendent d'un ancêtre commun. En comparant les séquences des protéines humaines et de chimpanzé, aucune différence de séquence n'a été trouvée. Lorsque les séquences de l'homme et du singe rhésus ont été comparées, une seule différence a été trouvée dans un acide aminé. En revanche, les comparaisons homme-levure montrent une différence dans 44 acides aminés, suggérant que les humains et les chimpanzés ont un ancêtre commun plus récent que les humains et le singe rhésus, ou les humains et la levure.

Structure des protéines

Comme indiqué précédemment, la forme d'une protéine est essentielle à sa fonction. Pour comprendre comment la protéine obtient sa forme ou sa conformation finale, nous devons comprendre les quatre niveaux de structure de la protéine : primaire, secondaire, tertiaire et quaternaire (Figure 2.21).

La séquence et le nombre uniques d'acides aminés dans une chaîne polypeptidique constituent sa structure primaire. La séquence unique de chaque protéine est finalement déterminée par le gène qui code la protéine. Tout changement dans la séquence du gène peut entraîner l'ajout d'un acide aminé différent à la chaîne polypeptidique, provoquant un changement dans la structure et la fonction de la protéine. Dans l'anémie falciforme, la chaîne β de l'hémoglobine a une seule substitution d'acide aminé, provoquant une modification à la fois de la structure et de la fonction de la protéine. Ce qui est le plus remarquable à considérer, c'est qu'une molécule d'hémoglobine est composée de deux chaînes alpha et de deux chaînes bêta composées chacune d'environ 150 acides aminés. La molécule a donc environ 600 acides aminés. La différence structurelle entre une molécule d'hémoglobine normale et une molécule de drépanocytose - qui diminue considérablement l'espérance de vie des individus affectés - est un seul acide aminé des 600.

En raison de ce changement d'un acide aminé dans la chaîne, les globules rouges normalement biconcaves ou en forme de disque prennent une forme de croissant ou de « faucille », qui obstrue les artères. Cela peut entraîner une myriade de problèmes de santé graves, tels qu'un essoufflement, des étourdissements, des maux de tête et des douleurs abdominales pour les personnes atteintes de cette maladie.

Les motifs de pliage résultant des interactions entre les parties non-R des groupes d'acides aminés donnent naissance à la structure secondaire de la protéine. Les plus courantes sont les structures en feuille à plis alpha (α) et bêta (β). Les deux structures sont maintenues en forme par des liaisons hydrogène. Dans l'hélice alpha, les liaisons se forment entre un acide aminé sur quatre et provoquent une torsion dans la chaîne d'acides aminés.

Dans la feuille à plis , les « plis » sont formés par des liaisons hydrogène entre des atomes sur le squelette de la chaîne polypeptidique. Les groupes R sont attachés aux carbones, et s'étendent au-dessus et au-dessous des plis du pli. Les segments plissés s'alignent parallèlement les uns aux autres et des liaisons hydrogène se forment entre les mêmes paires d'atomes sur chacun des acides aminés alignés. Les structures en feuillets en hélice et en feuillets se trouvent dans de nombreuses protéines globulaires et fibreuses.

La structure tridimensionnelle unique d'un polypeptide est connue sous le nom de structure tertiaire. Cette structure est causée par des interactions chimiques entre divers acides aminés et régions du polypeptide. Principalement, les interactions entre les groupes R créent la structure tertiaire tridimensionnelle complexe d'une protéine. Il peut y avoir des liaisons ioniques formées entre les groupes R sur différents acides aminés, ou des liaisons hydrogène au-delà de celles impliquées dans la structure secondaire. Lorsque le repliement des protéines a lieu, les groupes R hydrophobes des acides aminés non polaires se trouvent à l'intérieur de la protéine, tandis que les groupes R hydrophiles se trouvent à l'extérieur. Les premiers types d'interactions sont également appelés interactions hydrophobes.

Dans la nature, certaines protéines sont formées de plusieurs polypeptides, également appelés sous-unités, et l'interaction de ces sous-unités forme la structure quaternaire. De faibles interactions entre les sous-unités aident à stabiliser la structure globale. Par exemple, l'hémoglobine est une combinaison de quatre sous-unités polypeptidiques.

Chaque protéine a sa propre séquence et sa propre forme, maintenues ensemble par des interactions chimiques. Si la protéine est soumise à des changements de température, de pH ou d'exposition à des produits chimiques, la structure de la protéine peut changer, perdant sa forme dans ce que l'on appelle la dénaturation, comme indiqué précédemment. La dénaturation est souvent réversible car la structure primaire est préservée si l'agent dénaturant est éliminé, permettant à la protéine de reprendre sa fonction. Parfois, la dénaturation est irréversible, entraînant une perte de fonction. Un exemple de dénaturation des protéines peut être observé lorsqu'un œuf est frit ou bouilli. La protéine d'albumine dans le blanc d'œuf liquide est dénaturée lorsqu'elle est placée dans une casserole chaude, passant d'une substance claire à une substance blanche opaque. Toutes les protéines ne sont pas dénaturées à haute température, par exemple, les bactéries qui survivent dans les sources chaudes ont des protéines adaptées pour fonctionner à ces températures.

Concepts en action

Pour une perspective supplémentaire sur les protéines, explorez « Biomolécules : les protéines » à travers cette animation interactive.

Acides nucléiques

Les acides nucléiques sont des macromolécules clés dans la continuité de la vie. Ils portent le modèle génétique d'une cellule et portent des instructions pour le fonctionnement de la cellule.

Les deux principaux types d'acides nucléiques sont l'acide désoxyribonucléique (ADN) et l'acide ribonucléique (ARN). L'ADN est le matériel génétique présent dans tous les organismes vivants, allant des bactéries unicellulaires aux mammifères multicellulaires.

L'autre type d'acide nucléique, l'ARN, est principalement impliqué dans la synthèse des protéines. Les molécules d'ADN ne quittent jamais le noyau, mais utilisent plutôt un intermédiaire ARN pour communiquer avec le reste de la cellule. D'autres types d'ARN sont également impliqués dans la synthèse des protéines et leur régulation.

L'ADN et l'ARN sont constitués de monomères appelés nucléotides. Les nucléotides se combinent pour former un polynucléotide, un ADN ou un ARN. Chaque nucléotide est composé de trois composants : une base azotée, un sucre pentose (cinq carbones) et un groupe phosphate (figure 2.22). Chaque base azotée d'un nucléotide est liée à une molécule de sucre, qui est liée à un groupe phosphate.

Structure en double hélice d'ADN

L'ADN a une structure en double hélice (figure 2.23). Il est composé de deux brins, ou polymères, de nucléotides. Les brins sont formés avec des liaisons entre les groupes phosphate et sucre de nucléotides adjacents. Les brins sont liés les uns aux autres à leurs bases par des liaisons hydrogène, et les brins s'enroulent les uns sur les autres sur toute leur longueur, d'où la description de « double hélice », qui signifie une double spirale.

Les groupes de sucre et de phosphate en alternance se trouvent à l'extérieur de chaque brin, formant l'épine dorsale de l'ADN. Les bases azotées sont empilées à l'intérieur, comme les marches d'un escalier, et ces paires de bases sont liées les unes aux autres par des liaisons hydrogène. Les bases s'apparient de telle sorte que la distance entre les squelettes des deux brins soit la même tout au long de la molécule.

En tant qu'associé Amazon, nous gagnons des achats éligibles.

Vous voulez citer, partager ou modifier ce livre ? Ce livre est Creative Commons Attribution License 4.0 et vous devez attribuer OpenStax.

    Si vous redistribuez tout ou partie de ce livre dans un format imprimé, vous devez alors inclure sur chaque page physique l'attribution suivante :

  • Utilisez les informations ci-dessous pour générer une citation. Nous vous recommandons d'utiliser un outil de citation comme celui-ci.
    • Auteurs : Samantha Fowler, Rebecca Roush, James Wise
    • Éditeur/site Web : OpenStax
    • Titre du livre: Concepts of Biology
    • Date de parution : 25 avril 2013
    • Lieu : Houston, Texas
    • URL du livre : https://openstax.org/books/concepts-biology/pages/1-introduction
    • URL de la section : https://openstax.org/books/concepts-biology/pages/2-3-biological-molecules

    © 12 janvier 2021 OpenStax. Le contenu des manuels produit par OpenStax est sous licence Creative Commons Attribution License 4.0. Le nom OpenStax, le logo OpenStax, les couvertures de livres OpenStax, le nom OpenStax CNX et le logo OpenStax CNX ne sont pas soumis à la licence Creative Commons et ne peuvent être reproduits sans le consentement écrit préalable et exprès de Rice University.


    2.3 Un exemple simple de modélisation statistique

    Commencer par les données

    La procédure de modélisation comporte deux parties. Nous avons d'abord besoin d'une probabilité raisonnable Distribution pour modéliser le processus de génération de données. Comme nous l'avons vu au chapitre 1, les données de comptage discrètes peuvent être modélisées par des distributions de probabilité simples telles que des distributions binomiales, multinomiales ou de Poisson. La distribution normale, ou courbe en cloche, est souvent un bon modèle pour les mesures continues. Les distributions peuvent aussi être des mélanges plus compliqués de ces distributions élémentaires (plus de détails à ce sujet au chapitre 4).

    Reprenons l'exemple d'épitope du chapitre précédent, en commençant sans la valeur aberrante délicate.

    Goodness-of-fit : évaluation visuelle

    Notre première étape consiste à trouver un ajustement à partir des distributions candidates, ce qui nécessite de consulter des graphiques et des graphiques quantitatifs d'adéquation de l'ajustement. Pour les données discrètes, nous pouvons tracer un barplot des fréquences (pour les données continues, nous regarderions l'histogramme) comme dans la figure 2.2.

    Figure 2.2 : La distribution observée des données d'épitope sans la valeur aberrante.

    Cependant, il est difficile de décider quelle distribution théorique correspond le mieux aux données sans utiliser une comparaison. Un visuel qualité de l'ajustement diagramme est connu sous le nom de rootogramme (William S Cleveland 1988) il accroche les barres avec les comptes observés aux points rouges théoriques. Si les comptages correspondent exactement à leurs valeurs théoriques, le bas des cases s'alignera exactement avec l'axe horizontal.

    Figure 2.3 : Rootogramme montrant la racine carrée des valeurs théoriques sous forme de points rouges et la racine carrée des fréquences observées sous forme de rectangles déroulants. (Nous verrons un peu ci-dessous comment la fonction goodfit a décidé quel (lambda) utiliser.)

    Pour calibrer à quoi ressemble un tel graphique avec une variable de Poisson connue, utilisez rpois avec (lambda) = 0,05 pour générer 100 nombres distribués de Poisson et dessiner leur racineogramme.

    Nous voyons que le rootogramme pour e99 semble s'adapter assez bien au modèle de Poisson. Mais rappelez-vous, pour que cela se produise, nous avons supprimé la valeur aberrante. Le Poisson est complètement déterminé par un paramètre, souvent appelé la moyenne de Poisson (lambda) . Dans la plupart des cas où nous pouvons deviner que les données suivent une distribution de Poisson, nous devrons estimer le paramètre de Poisson à partir des données.

    ⊕ Le paramètre est appelé la moyenne de Poisson car c'est la moyenne de la distribution théorique et, comme il s'avère, est estimée par la moyenne de l'échantillon. Cette surcharge du mot est déroutante pour tout le monde.

    La façon la plus courante d'estimer (lambda) consiste à choisir la valeur (hat) qui rend les données observées les plus probables. C'est ce qu'on appelle le estimateur du maximum de vraisemblance (Rice 2006 Chapitre 8, Section 5) , souvent abrégé MLE. Nous illustrerons cette idée assez paradoxale dans la section suivante.

    Bien que nous ayons retiré ci-dessus l'observation extrême avant de deviner la distribution de probabilité, nous allons revenir aux données avec pour le reste de notre analyse. En pratique, nous ne saurions pas s'il existe une valeur aberrante et de quel(s) point(s) de données il s'agit. Le laisser de côté a pour effet de rendre notre estimation de la moyenne plus élevée. À son tour, cela rendrait plus probable que nous observions une valeur de 7 sous le modèle nul, ce qui entraînerait une valeur p plus élevée. Ainsi, si la valeur p résultante est petite même avec la valeur aberrante incluse, nous sommes assurés que notre analyse est à quelque chose de réel. Nous appelons une telle tactique être conservateur: nous péchons par excès de prudence, de ne pas détecter quelque chose.

    Estimation du paramètre de la distribution de Poisson

    Quelle valeur pour la moyenne de Poisson rend les données les plus probables ? Dans un premier temps, nous comptons les résultats.

    Ensuite, nous allons essayer différentes valeurs pour la moyenne de Poisson et voir laquelle correspond le mieux à nos données. Si la moyenne (lambda) de la distribution de Poisson était de 3, les comptes ressembleraient à ceci :

    qui a beaucoup plus de 2 et de 3 que ce que nous voyons dans nos données. Nous voyons donc qu'il est peu probable que (lambda=3) ait produit nos données, car les comptes ne correspondent pas aussi bien.

    Répétez cette simulation avec différentes valeurs de (lambda) . Pouvez-vous en trouver un qui donne des comptes proches de ceux observés juste par essai et erreur ?

    Nous pourrions donc essayer de nombreuses valeurs possibles et procéder par force brute. Cependant, nous allons faire quelque chose de plus élégant et utiliser un peu de mathématiques pour voir quelle valeur maximise la probabilité d'observer nos données. Calculons la probabilité de voir les données si la valeur du paramètre de Poisson est (m) . Puisque nous supposons que les données proviennent de tirages indépendants, cette probabilité est simplement le produit de probabilités individuelles :

    Pour (m=3) nous pouvons calculer ceci 22 22 Notez comment nous utilisons ici la vectorisation de R : l'appel à dpois renvoie quatre valeurs, correspondant aux quatre nombres différents. Nous les prenons ensuite aux puissances de 58, 34, 7 et 1, respectivement, en utilisant l'opérateur ^, ce qui donne à nouveau quatre valeurs. Enfin, nous les réduisons en un seul nombre, le produit, avec la fonction prod. .

    Calculez la probabilité comme ci-dessus pour (m=0,1,2) . (m) doit-il être un entier ? Essayez de calculer la probabilité pour (m=0.4) par exemple.

    Cette probabilité est la fonction de vraisemblance de (lambda) , étant donné les données, et nous l'écrivons ⊕ Ici (L) représente la vraisemblance et (f(k)=e^ <-lambda>,lambda^k,/ ,k!) , la probabilité de Poisson que nous avons vue précédemment.

    Au lieu de travailler avec des multiplications d'une centaine de petits nombres, c'est pratique 23 23 C'est généralement vrai à la fois pour le crayon et le papier et pour les calculs informatiques. pour prendre le logarithme. Étant donné que le logarithme est strictement croissant, s'il existe un point où le logarithme atteint son maximum dans un intervalle, ce sera également le maximum de la probabilité.

    Commençons par une illustration informatique. Nous calculons la vraisemblance pour de nombreuses valeurs différentes du paramètre de Poisson. Pour ce faire, nous devons écrire une petite fonction qui calcule la probabilité des données pour différentes valeurs 24 24 Ici, nous utilisons à nouveau la syntaxe vectorielle de R qui nous permet d'écrire le calcul sans boucle explicite sur les points de données. Par rapport au code ci-dessus, nous appelons ici dpois sur chacun des 100 points de données, plutôt que de tabuler les données avec la fonction table avant d'appeler dpois uniquement sur les valeurs distinctes. Il s'agit d'un exemple simple de solutions alternatives dont les résultats sont équivalents, mais peuvent différer en termes de facilité de lecture du code ou de temps d'exécution. .

    Nous pouvons maintenant calculer la vraisemblance pour toute une série de valeurs lambda de 0,05 à 0,95 (figure 2.4).

    Figure 2.4 : La courbe rouge est la fonction de log-vraisemblance. La ligne verticale montre la valeur de m (la moyenne) et la ligne horizontale la log-vraisemblance de m . Il semble que m maximise la probabilité.

    Que fait la fonction vapply dans le code ci-dessus ? Astuce : consultez sa page de manuel.

    vapply prend son premier argument, le vecteur lambdas dans ce cas, et applique de manière itérative la fonction loglikelihood (son deuxième argument) à chacun des éléments vectoriels. En conséquence, il renvoie un vecteur des résultats. La fonction a également besoin d'un troisième argument, numeric(1) dans ce cas, qui spécifie le type de valeur que chaque appel individuel à la probabilité de log est censé renvoyer : un seul nombre. (En général, il peut arriver que la fonction renvoie parfois autre chose, disons une chaîne de caractères, ou deux nombres dans ce cas, il ne serait pas possible d'assembler les résultats globaux en un vecteur cohérent, et vapply se plaindrait.)

    En fait il existe un raccourci : la fonction goodfit .

    La sortie de goodfit est un objet composite appelé liste. L'une de ses composantes est appelée par et contient la ou les valeurs du ou des paramètres ajustés pour la distribution étudiée. Dans ce cas, il ne s'agit que d'un nombre, l'estimation de (lambda) .

    Quels sont les autres composants de la sortie de la fonction goodfit ?

    Comparez la valeur de m à la valeur que nous avons utilisée précédemment pour (lambda) , 0.5. Refaire la modélisation que nous avons faite au chapitre 1 avec m au lieu de 0.5.

    2.3.1 Statistiques classiques pour données classiques

    Voici une preuve formelle de notre conclusion de calcul selon laquelle la moyenne maximise la (log-)vraisemblance.

    Nous utilisons le « const » fourre-tout. pour les termes qui ne dépendent pas de (lambda) (bien qu'ils dépendent de (x) , c'est-à-dire de (k_i) ). Pour trouver le (lambda) qui maximise cela, nous calculons la dérivée dans (lambda) et la mettons à zéro.

    Vous venez de voir les premiers pas d'un approche statistique, en partant « de la base » (à partir des données) pour déduire le(s) paramètre(s) du modèle : c'est statistique estimation d'un paramètre à partir des données. Un autre élément important sera de choisir de quelle famille de distributions proviennent nos données, cette partie se fait en évaluant le qualité de l'ajustement. Nous rencontrerons cela plus tard.

    Dans le classique tests statistiques cadre, nous considérons un modèle unique, que nous appelons le modèle nul, pour les données. Le modèle nul formule une ligne de base « inintéressante », telle que toutes les observations proviennent de la même distribution aléatoire, quel que soit le groupe ou le traitement dont elles proviennent. Nous testons ensuite s'il se passe quelque chose de plus intéressant en calculant la probabilité que les données soient compatibles avec ce modèle. Souvent, c'est le mieux que nous puissions faire, car nous ne savons pas de manière suffisamment détaillée quel devrait être le modèle « intéressant », non nul ou alternatif. Dans d'autres situations, nous avons deux modèles concurrents que nous pouvons comparer, comme nous le verrons plus tard.

    Quel est l'intérêt de la modélisation avec une distribution connue ? Par exemple, pourquoi est-il intéressant de savoir qu'une variable a une distribution de Poisson ?

    Les modèles sont des représentations concises mais expressives du processus de génération de données. Pour le Poisson par exemple, connaître un nombre permet de tout savoir sur la distribution, y compris, comme nous l'avons vu précédemment, les probabilités d'événements extrêmes ou rares.

    Une autre direction utile est régression. Nous pourrions être intéressés de savoir comment notre variable de réponse basée sur le nombre (par exemple, le résultat du comptage des lectures de séquençage) dépend d'une covariable continue, par exemple, la température ou la concentration en nutriments. Vous avez peut-être déjà rencontré la régression linéaire, où notre modèle est que la variable de réponse (y) dépend de la covariable (x) via l'équation (y = ax+b + e) , avec les paramètres (a ) et (b) (que nous devons estimer), et avec des résidus (e) dont le modèle de probabilité est une distribution normale (dont nous devons généralement aussi estimer la variance). Pour les données de dénombrement, le même type de modèle de régression est possible, bien que la distribution de probabilité pour les résidus doive alors être non normale. Dans ce cas, nous utilisons le modèles linéaires généralisés cadre. Nous verrons des exemples lors de l'étude de l'ARN-Seq au chapitre 8 et un autre type de données de séquençage de nouvelle génération, les données d'ARNr 16S, au chapitre 9.

    Sachant que notre modèle de probabilité implique une distribution de Poisson, binomiale, multinomiale ou une autre famille paramétrique nous permettra d'avoir des réponses rapides aux questions sur les paramètres du modèle et de calculer des quantités telles que les valeurs p et les intervalles de confiance.


    MÉTHODES

    Mise en œuvre et infrastructure

    Le serveur d'analyse psRNATarget se compose d'un pipeline back-end, développé en Java et déployé sur un cluster Linux hautes performances, et d'interfaces Web front-end. Nous avons également développé un système amélioré de gestion des files d'attente de tâches pour gérer les demandes d'analyse soumises par les utilisateurs et renvoyer les identifiants de session, qui peuvent être utilisés pour suivre la progression des tâches et récupérer les résultats finaux. Les tâches soumises sont affectées à l'une des quatre files d'attente de tâches individuelles en fonction de la taille des données, empêchant ainsi les tâches volumineuses de bloquer le pipeline d'analyse back-end.

    Le pipeline back-end recherche des candidats cibles potentiels pour des miARN donnés sur la base du schéma de notation de correspondance complémentaire personnalisable par l'utilisateur. Premièrement, le pipeline emploie recherche36, un composant du package FASTA (14) pour l'alignement de séquences entre les miARN et les cibles candidates. Les recherche36 dispose d'une implémentation Smith-Waterman accélérée SSE2 avec de bien meilleures performances pour l'alignement de séquences courtes par rapport au NCBI BLAST (15). Ceci est particulièrement important pour l'analyse de courtes séquences de miARN matures. Ensuite, l'énergie nécessaire pour déployer la structure secondaire autour du site cible, définie comme l'accessibilité du site cible, est calculée à l'aide du programme RNAup du Vienna Package (16), comme décrit dans la première version de psRNATarget (12). Cette étape est toutefois facultative dans le nouveau schéma de scoring.

    Le serveur Web psRNATarget a été développé en Flask, un framework Web Python. Les bibliothèques JavaScript et CSS populaires, jQuery et Bootstrap ont été utilisées pour générer des interfaces Web HTML5 interactives et conviviales. La nouvelle version psRNATarget implémente une page de téléchargement de données stable et volumineuse, dans laquelle jusqu'à des centaines de gigaoctets de données peuvent être téléchargés par plusieurs threads de téléchargement simultanément à l'aide de l'API de fichier HTML5. La taille de fichier maximale autorisée à être téléchargée pour analyse n'est soumise qu'à la capacité d'analyse du pipeline principal.

    Entrées et sorties

    La page d'accueil psRNATarget comprend trois onglets fonctionnels qui permettent aux utilisateurs de télécharger et de rechercher leurs miARN par rapport aux bibliothèques de transcrits cibles préchargées, de télécharger et de rechercher des transcrits cibles candidats par rapport aux séquences de miARN publiées téléchargées à partir de miRBase (17), ou de télécharger à la fois des miARN et des séquences cibles. et rechercher des interactions potentielles miARN-ARNm entre eux (Figure 1). La dernière version de psRNATarget contient beaucoup plus de bibliothèques cibles préchargées que la version précédente. À titre d'exemple, il comprend toutes les bibliothèques de transcrits de JGI Phytozome Release 12 (18).

    Une capture d'écran montrant les trois onglets fonctionnels du psRNATarget, permettant aux utilisateurs de (i) télécharger et rechercher des miARN par rapport aux bibliothèques de transcrits cibles préchargées, (ii) télécharger et rechercher des candidats cibles par rapport aux séquences de miARN publiées téléchargées à partir de miRBase ou (iii) télécharger les séquences miARN et cibles et rechercher des paires miARN-cible potentielles.

    Une capture d'écran montrant les trois onglets fonctionnels du psRNATarget, permettant aux utilisateurs de (i) télécharger et rechercher des miARN par rapport aux bibliothèques de transcrits cibles préchargées, (ii) télécharger et rechercher des candidats cibles par rapport aux séquences de miARN publiées téléchargées à partir de miRBase ou (iii) télécharger les séquences miARN et cibles et rechercher des paires miARN-cible potentielles.

    Le nouveau schéma de notation, V2, est défini comme schéma de notation par défaut du serveur psRNATarget mis à jour. Cependant, les utilisateurs peuvent choisir le schéma de notation défini dans la version précédente (c'est-à-dire le schéma V1) s'ils le souhaitent. Dans la nouvelle version, les règles de notation sont entièrement personnalisables. Cela offre des flexibilités supplémentaires pour répondre aux exigences particulières des utilisateurs finaux. Les utilisateurs peuvent ajuster davantage les paramètres individuels, tels que la désactivation de l'estimation de l'accessibilité de la cible pour accélérer l'analyse, le traitement des paires G:U comme d'autres discordances, la restriction du nombre maximum de discordances dans la région de départ ou la minimisation de la pénalité d'extension de l'écart pour permettre de longs renflements sur le miARN ou la séquence cible. Pour aider les utilisateurs à personnaliser leurs paramètres de recherche, nous avons créé des astuces contextuelles pour toutes les options personnalisables, auxquelles vous pouvez accéder en laissant le curseur de la souris sur l'étiquette de l'option individuelle pendant plus d'une seconde (Figure 2).

    Une capture d'écran de l'interface Web psRNATarget pour choisir un schéma de notation de correspondance complémentaire et personnaliser les paramètres obligatoires et facultatifs. Une invite d'aide contextuelle apparaît lorsque l'utilisateur laisse le curseur de la souris sur les étiquettes de texte de n'importe quel champ de saisie pendant plus d'une seconde.

    Une capture d'écran de l'interface Web psRNATarget pour choisir un schéma de notation de correspondance complémentaire et personnaliser les paramètres obligatoires et facultatifs. Une invite d'aide contextuelle apparaît lorsque l'utilisateur laisse le curseur de la souris sur les étiquettes de texte de n'importe quel champ de saisie pendant plus d'une seconde.

    La page de sortie de l'analyse varie en fonction du nombre d'interactions miARN-ARNm prévues dans la nouvelle version. Pour une sortie comprenant moins de 100 000 miRNA-cible in-silico interactions, la version mise à jour de psRNATarget fournit un tableau HTML paginé pour afficher le résultat de l'analyse. Les utilisateurs peuvent également utiliser les fonctions de recherche et de tri intégrées pour filtrer davantage les interactions miARN-ARNm prévues (Figure 3). Cependant, pour améliorer le temps de réponse du serveur et l'expérience utilisateur, seul un lien de téléchargement des résultats par lots est disponible pour la sortie comprenant plus de 100 000 miRNA-cible in-silico interactions.

    Une capture d'écran de la page de sortie psRNATarget. Les utilisateurs peuvent utiliser les fonctions de recherche et de tri intégrées pour filtrer davantage les interactions miARN-ARNm prévues.

    Une capture d'écran de la page de sortie psRNATarget. Les utilisateurs peuvent utiliser les fonctions de recherche et de tri intégrées pour filtrer davantage les interactions miARN-ARNm prévues.


    5.2 La base génétique de l'expression des gènes

    UNE gène est l'unité de base de l'héritage. Les gènes sont constitués de l'ADN d'acide nucléique, de grosses molécules emballées dans des structures cellulaires denses appelées chromosomes. Simplement, ADN (acide désoxyribonucléique) consiste en nucléotides qui sont eux-mêmes relativement simples : chaque nucléotide comprend un sucre (désoxyribose), un ion phosphate et une "base" riche en azote (ou azotée) - le double anneau purines la guanine et l'adénine, et l'anneau simple pyrimidines cytosine ou thymine. Les nucléotides sont joints dans une séquence linéaire qui représente l'un des brins de l'ADN. L'information génétique est stockée dans la séquence réelle de ces nucléotides, et ces séquences impliquent beaucoup d'informations. Par exemple, le génome humain, ou ensemble complet d'ADN, contient environ 3 milliards de bases nucléotidiques, formant environ 25 000 gènes.

    Vérifie toi-même

    La structure de l'ADN est assez simple

    Une molécule d'ADN implique deux brins, reliés aux bases, ancrés par une « épine dorsale » d'unités sucre-phosphate répétitives, et enroulés en une conformation hélicoïdale. Ainsi, l'ADN est souvent appelé « double hélice ». Les bases se rejoignent selon une complémentarité. Plus précisément, l'adénine (A) se lie à la thymine (T) et la cytosine (C) se lie à la guanine (G). Ils se combinent par des interactions chimiques appelées liaisons hydrogène, associations relativement faibles qui peuvent être rompues avec la chaleur ou l'une des nombreuses enzymes.

    neuf pieds) d'ADN sont emballés dans chacune des milliards de cellules individuelles. Les chromosomes sont la façon dont les cellules ont résolu le problème de l'emballage de tant d'informations (longs brins d'ADN) dans une petite structure étroitement compactée. Les protéines de liaison à l'ADN aident à emballer ces longs brins d'ADN dans les chromosomes.

    Figure 5.1 ADN dans une cellule eucaryote. Visualisation des cellules, des chromosomes et de l'ADN. Les chromosomes, trouvés dans le noyau de la cellule, sont une solution d'emballage pour les quantités massives d'ADN qui composent vos gènes. Les chromosomes sont constitués de molécules d'ADN double brin, qui elles-mêmes peuvent être subdivisées en gènes, régions d'ADN ayant une fonction de codage spécifique.

    L'ADN est constitué de bases appariées à un seul anneau (pyrimidine) et à double anneau (purine) azoté , ou riche en azote, socles. Les bases sont visualisées sous forme de lettres à droite. Leurs structures sont représentées ci-dessous.

    Figure 5.2 Purines versus Pyrimidines


    Instabilité génétique des virus à ARN

    JN. Barr , R. Fearns , dans Stabilité du génome , 2016

    5 La polymérase virale comme source d'erreur

    Les RdRps et les transcriptases inverses ont le potentiel d'introduire des délétions, des insertions et des mésappariements nucléotidiques dans le produit d'acide nucléique [10-12] . Contrairement aux formes de vie basées sur l'ADN, la plupart des virus à ARN n'ont aucun mécanisme pour identifier et réparer les mésappariements [11,13] et donc l'erreur de polymérase n'est pas corrigée. La nature sujette aux erreurs de l'activité de la polymérase, associée à l'absence de mécanisme de relecture, est la principale raison pour laquelle les génomes des virus à ARN acquièrent des mutations et existent comme un essaim de variantes génétiques. Bien que toutes les RdRps et transcriptases inverses soient capables d'introduire des mutations, elles ne sont pas également sujettes aux erreurs. Par exemple, le taux de mutation virale est inversement corrélé avec la taille du génome, de sorte que les virus avec des génomes plus gros ont un taux de mutation par nucléotide inférieur à ceux avec de petits génomes [14] . Ceci est intuitivement logique car un taux de mutation élevé dans un virus avec un grand génome augmenterait le risque que les génomes acquièrent une mutation mortelle et donc les virus avec des polymérases de faible fidélité ne pourraient pas être maintenus. Cela suggère que les virus avec des génomes plus grands ont évolué pour limiter leur taux de mutation et que certains virus à ARN codent pour des protéines qui fonctionnent pour atténuer l'erreur de polymérase, comme décrit ci-dessous. Cependant, même lorsque des virus apparentés avec des longueurs de génome similaires sont comparés, il existe des différences dans la fidélité à la polymérase [11,15] . Par exemple, dans une comparaison côte à côte, en utilisant des tests biochimiques in vitro, le RdRp du coxsackievirus B est d'une plus grande fidélité que celui du poliovirus, même s'il s'agit de virus fortement apparentés [16] . En somme, ces faits suggèrent que le taux d'erreur de la polymérase est déterminé par les pressions de sélection liées à la taille du génome viral et à d'autres facettes de la biologie virale.

    Les mécanismes moléculaires qui régissent la fidélité de la polymérase ont été élucidés par des études détaillées de cinétique enzymatique des polymérases de type sauvage et par l'étude de versions mutantes de polymérase avec une fidélité altérée [14,17-24] . Ces études ont montré que le taux d'erreur de la polymérase peut être modulé par des substitutions d'acides aminés uniques dans l'enzyme, et que les substitutions en dehors du site actif peuvent avoir un effet. Ainsi, la structure de la polymérase est réglée pour lui permettre de manifester une fidélité particulière. En plus de contrôler le taux d'erreur de réplication, les déterminants de la polymérase peuvent également influencer les mutations de substitution introduites. Dans une étude historique, une nouvelle approche de séquençage a été utilisée pour identifier les mutations à basse fréquence qui se sont accumulées dans le génome du poliovirus dans des conditions relativement constantes [25] . Les populations virales présentes à différents moments ont été analysées pour déterminer quelles mutations se sont accumulées dans cet environnement stable, où la pression de sélection a été minimisée. Cette analyse a montré que les transitions se produisaient plus fréquemment que les transversions, et au sein de ces catégories, il y avait des variations : les transitions C-à-U et G-à-A se sont accumulées plus fréquemment que U-à-C ou A-à-G. Ainsi, ces études indiquent qu'il existe une directionnalité dans le modèle de mutation de l'essaim viral. Des découvertes similaires ont été faites avec le VIH [10] et des études avec le virus du Nil occidental ont montré que différents variants de polymérase ont des biais mutationnels différents [26] . Ainsi, les virus à ARN ne subissent pas de substitutions au hasard, mais ont un biais de mutation qui est probablement régi par les déterminants moléculaires de la fidélité dans la polymérase. Ce biais pourrait jouer un rôle important en permettant au virus de générer un spectre de séquences favorable suite à un goulot d'étranglement génétique.


    Possibilités d'accès

    Obtenez un accès complet au journal pendant 1 an

    Tous les prix sont des prix NET.
    La TVA sera ajoutée plus tard dans la caisse.
    Le calcul des taxes sera finalisé lors du paiement.

    Obtenez un accès limité ou complet aux articles sur ReadCube.

    Tous les prix sont des prix NET.


    Liaison hydrogène et forces de Van der Waals

    Les liaisons hydrogène et les interactions de van der Waals sont deux types de liaisons faibles qui sont nécessaires aux éléments de base de la vie.

    Objectifs d'apprentissage

    Décrire comment se produisent les liaisons hydrogène et les interactions de van der Waals

    Points clés à retenir

    Points clés

    • Les liaisons hydrogène fournissent bon nombre des propriétés essentielles de maintien de la vie de l'eau et stabilisent également les structures des protéines et de l'ADN, la pierre angulaire des cellules.
    • Les liaisons hydrogène se produisent dans les molécules inorganiques, telles que l'eau, et les molécules organiques, telles que l'ADN et les protéines.
    • Les attractions de Van der Waals peuvent se produire entre deux molécules ou plus et dépendent de légères fluctuations des densités électroniques.
    • Alors que les liaisons hydrogène et les interactions de van der Waals sont faibles individuellement, elles sont fortes combinées en grand nombre.

    Mots clés

    • Interactions van der Waals: Une faible force d'attraction entre des molécules électriquement neutres qui entrent en collision ou passent très près les unes des autres. La force de van der Waals est causée par des attractions temporaires entre les régions riches en électrons d'une molécule et les régions pauvres en électrons d'une autre.
    • électronégativité: Tendance d'un atome ou d'une molécule à attirer des électrons vers lui-même, à former des dipôles, et ainsi à former des liaisons.
    • liaison hydrogène: L'attraction entre un atome d'hydrogène partiellement chargé positivement attaché à un atome hautement électronégatif (tel que l'azote, l'oxygène ou le fluor) et un autre atome électronégatif voisin.

    Les liaisons ioniques et covalentes entre les éléments nécessitent de l'énergie pour se rompre. Les liaisons ioniques ne sont pas aussi fortes que les liaisons covalentes, ce qui détermine leur comportement dans les systèmes biologiques. Cependant, toutes les liaisons ne sont pas des liaisons ioniques ou covalentes. Des liaisons plus faibles peuvent également se former entre les molécules. Deux liaisons faibles qui se produisent fréquemment sont les liaisons hydrogène et les interactions de van der Waals.

    Liaisons hydrogène entre les molécules d'eau: Le côté oxygène légèrement négatif de la molécule d'eau et le côté hydrogène légèrement positif de la molécule d'eau sont attirés l'un vers l'autre et forment une liaison hydrogène.

    Liaison à l'hydrogène

    Les liaisons hydrogène fournissent bon nombre des propriétés essentielles de maintien de la vie de l'eau et stabilisent également les structures des protéines et de l'ADN, la pierre angulaire des cellules. Lorsque des liaisons covalentes polaires contenant de l'hydrogène se forment, l'hydrogène dans cette liaison a une charge légèrement positive car l'un des électrons de l'hydrogène est attiré plus fortement vers l'autre élément et loin de l'hydrogène. Parce que l'hydrogène est légèrement positif, il sera attiré par les charges négatives voisines. Lorsque cela se produit, une interaction se produit entre le ?? + de l'hydrogène d'une molécule et le ??– charge sur les atomes les plus électronégatifs d'une autre molécule, généralement l'oxygène ou l'azote, ou au sein de la même molécule. Cette interaction est appelée liaison hydrogène. Ce type de liaison est courant et se produit régulièrement entre les molécules d'eau. Les liaisons hydrogène individuelles sont faibles et facilement rompues, cependant, elles se produisent en très grand nombre dans l'eau et dans les polymères organiques, créant une force majeure en combinaison. Les liaisons hydrogène sont également responsables de la fermeture éclair de la double hélice d'ADN.

    Applications for Hydrogen Bonds

    Hydrogen bonds occur in inorganic molecules, such as water, and organic molecules, such as DNA and proteins. The two complementary strands of DNA are held together by hydrogen bonds between complementary nucleotides (A&T, C&G). Hydrogen bonding in water contributes to its unique properties, including its high boiling point (100 °C) and surface tension.

    Water droplets on a leaf: The hydrogen bonds formed between water molecules in water droplets are stronger than the other intermolecular forces between the water molecules and the leaf, contributing to high surface tension and distinct water droplets.

    In biology, intramolecular hydrogen bonding is partly responsible for the secondary, tertiary, and quaternary structures of proteins and nucleic acids. The hydrogen bonds help the proteins and nucleic acids form and maintain specific shapes.

    Van der Waals Interactions

    Like hydrogen bonds, van der Waals interactions are weak attractions or interactions between molecules. Van der Waals attractions can occur between any two or more molecules and are dependent on slight fluctuations of the electron densities, which are not always symmetrical around an atom. For these attractions to happen, the molecules need to be very close to one another. These bonds—along with ionic, covalent, and hydrogen bonds—contribute to the three-dimensional structure of proteins that is necessary for their proper function.

    Van der Waals attraction: Explore how Van der Waals attractions and temperature affect intermolecular interactions.


    Voir la vidéo: Антибиотики из человека. Наночастицы и пролекарства. Звук и электроны и др. Новости QWERTY 193 (Juillet 2022).


Commentaires:

  1. Kanos

    Quelle est la question amusante

  2. Barta

    Ce n'est pas absolument nécessaire pour moi. Qui d'autre, qu'est-ce qui peut inciter?

  3. Daijon

    Où est l'INFA

  4. Norm

    Je félicite, l'excellente réponse.



Écrire un message