Code génétique

Le code génétique sert à désigner le dispositif de correspondance mis en jeu lors de la transformation de l'information génétique des gènes en protéines, au cours du processus de traduction.



Catégories :

Code génétique - Information génétique - Génétique

Recherche sur Google Images :


Source image : cellbiol.net
Cette image est un résultat de recherche de Google Image. Elle est peut-être réduite par rapport à l'originale et/ou protégée par des droits d'auteur.

Définitions :

  • code par lequel les gènes commandent la production de protéines dans les cellules. A l'alphabet en quatre lettres (les nucléotides) de l'ADN, correspond un alphabet en vingt lettres (les acides aminés) des protéines. (source : planetecologie)
  • Code de correspondance entre les acides nucléiques (ADN et ARN) et les protéines nécessaires aux organismes vivants. Il fait correspondre un triplet (succession ordonnée de 3 bases dans l'ADN ou l'ARN) à un acide aminé servant dans la fabrication d'une protéine.... (source : mddep.gouv.qc)
  • tableau de correspondance entre chaque triplet de nucléotide d'ARN messager et un acide aminé qui lui est spécifique, ou correspondant à un non-sens servant à séparer 2 gènes consécutifs sur un même brin d'ADN. (source : premiumorange)
Code Génétique.

Le code génétique sert à désigner le dispositif de correspondance mis en jeu lors de la transformation de l'information génétique des gènes en protéines, au cours du processus de traduction. Les ribosomes traduisent ainsi, en suivant ce code, l'enchaînement des bases nucléotidiques de l'ARN en une séquence d'acides aminés nommée séquence peptidique. Le code génétique est un code de longueur fixe, lu trois nucléotides par trois nucléotides, un triplet de nucléotides ou codon correspondant à un acide aminé donné.

Expression du génome

La séquence des bases de l'ADN est souvent comparée, par ressemblance, à la séquence des lettres d'un texte. La séquence prise en elle-même n'a aucun sens, si le lecteur n'en connaît pas le code, c'est-à-dire le langage utilisé.

Les mots du langage génétique, nommés codons sont des triplets de nucléotides (A, C, U ou G). Il existe 4³=64 combinaisons envisageables de ces quatre lettres en triplets. Trois codons, parmi ces 64 codes envisageables, signifient la fin de la traduction (codon stop). Aux 61 autres codons ne correspondent que 20 acides aminés. Le code génétique est par conséquent dit dégénéré ou redondant car un acide aminé est codé par plusieurs codons (on nomme ces codons «codons synonymes»). Ainsi, en moyenne une mutation génétique sur trois affectant une séquence d'ADN codante n'entraîne aucune modification de la protéine traduite.

Remarque : si un nucléotide avait codé un acide aminé, 20-41=16 acides aminés n'auraient pas été codés. Si deux nucléotides avaient codé un acide aminé, le même problème aurait eu lieu pour 20-4²=4 acides aminés. Avec un dispositif de codons de 3 nucléotides, il y a au contraire trop de combinaisons.

Ce code permet la synthèse des protéines. L'ADN est en ARN-messager (ARNm). Ce dernier est traduit par les ribosomes qui assemblent les acides aminés présents sur des ARN de transfert (ARNt). L'ARNt contient un «anti-codon», complémentaire d'un codon, et porte l'acide aminé correspondant au codon. L'estérification spécifique de l'acide aminé correspondant à un ARNt donné est réalisé par les aminoacyl-ARNt synthétases, une famille d'enzymes spécifique chacune d'un acide aminé donné. Au cours de la traduction, le ribosome lit l'ARNm codon par codon, met en relation un codon de l'ARNm avec l'anti-codon d'un ARNt et ajoute l'acide aminé porté par ce dernier à la protéine en cours de synthèse.

Codons

Dans le tableau suivant, la rangée indique la première lettre du codon, la colonne indique la seconde et la dernière colonne indique la dernière lettre du codon.

U C A G
U UUU phénylalanine UCU sérine UAU tyrosine UGU cystéine U
UUC UCC UAC UGC C
UUA leucine UCA UAA stop UGA stop/sélénocystéine A
UUG UCG UAG UGG tryptophane G
C CUU CCU proline CAU histidine CGU arginine U
CUC CCC CAC CGC C
CUA CCA CAA glutamine CGA A
CUG CCG CAG CGG G
A AUU isoleucine ACU thréonine AAU asparagine AGU sérine U
AUC ACC AAC AGC C
AUA ACA AAA lysine AGA arginine A
AUG méthionine/start ACG AAG AGG G
G GUU valine GCU alanine GAU acide
aspartique
GGU glycine U
GUC GCC GAC GGC C
GUA GCA GAA acide
glutamique
GGA A
GUG GCG GAG GGG G

Tableau inverse
Comme chaque acide aminé d'une protéine est codé par un ou plusieurs codons il est quelquefois utile de se référer au tableau suivant. Le code à une lettre de chaque acide aminé est indiqué en parenthèses.

Ala (A) GCU, GCC, GCA, GCG Lys (K) AAA, AAG
Arg (R) CGU, CGC, CGA, CGG, AGA, AGG Met (M) AUG
Asn (N) AAU, AAC Phe (F) UUU, UUC
Asp (D) GAU, GAC Pro (P) CCU, CCC, CCA, CCG
Cys (C) UGU, UGC Sec (U) UGA
Gln (Q) CAA, CAG Ser (S) UCU, UCC, UCA, UCG, AGU, AGC
Glu (E) GAA, GAG Thr (T) ACU, ACC, ACA, ACG
Gly (G) GGU, GGC, GGA, GGG Trp (W) UGG
His (H) CAU, CAC Tyr (Y) UAU, UAC
Ile (I) AUU, AUC, AUA Val (V) GUU, GUC, GUA, GUG
Leu (L) UUA, UUG, CUU, CUC, CUA, CUG
START AUG STOP UAG, UGA, UAA

Un ARNm et un gène se terminent toujours par un «codon non-sens» aussi nommé «codon-stop», il existe 3 codons-stop (UAG, UAA et UGA). Ceux-ci tiennent le rôle du point en bout de phrase. Le codon UGA peut quelquefois coder une sélénocystéine, produisant alors une sélénoprotéine.

Dégénérescence du code génétique

Comme on peut le voir dans le tableau ci-dessus, le code génétique est dégénéré (ou redondant), autrement dit qu'il existe plusieurs combinaisons de trois lettres pour coder le même acide aminé. Ainsi, l'histidine peut être codée par les codons CAU et CAC. On parle alors de codons synonymes. Seuls deux acides aminés ne montrent pas de redondance de leur code : la méthionine et le tryptophane. La redondance n'est pas la même pour l'ensemble des acides aminés. Ainsi, selon le nombre de codons différents codant le même acide aminé, on distingue des duo (histidine, lysine, asparagine, glutamine, acide glutamique, asparagine, tyrosine, cystéine et phénylalanine), des trio (isoleucine et codons stop), des quatuor (thréonine, proline, alanine, glycine et valine) et des sextuor (arginine, leucine et serine). Il existe par conséquent fréquemment plusieurs ARNt associé au même acide aminé, capables de lier les différents triplets dégénérés de nucléotides sur l'ADN. On parle alors d'ARNt isoaccepteurs, car ils acceptent le même acide aminé.

Cette dégénérescence du code génétique a pour conséquence pour la majorité des organismes un biais d'usage du code. En effet, les principales molécules fonctionnelles de la cellule sont les protéines, polymères d'acides aminés, et la dégénérescence du code fait qu'il y a plusieurs manières de coder chaque acide aminé. La cellule exprime généralement des prédilections assez marquées dans le choix des codons synonymes, ainsi par exemple, le codon AUA qui code pour l'isoleucine est beaucoup évité chez l'homme comme chez Escherichia coli, comparé aux deux autres codons synonymes AUU et AUC.

Cette prédilection d'usage des codons est particulièrement variable, et dépend de l'organisme, du génome (nucléaire, mitochondrial, chloroplastique, ... ), de la région génique et même du gène reconnu.

Principe de base

Ce dispositif de codage entre l'ADN et les acides aminés s'est avéré être utilisé par l'immense majorité des être vivants. De l'homme à la bactérie, ce même code est utilisé. Cette universalité du code est expliquée en termes d'évolution : si le changement d'une base dans l'ADN peut entraîner des changements quelquefois bénéfiques dans l'être vivant, cela n'est que peu probable dans le cas d'un changement du codage. En effet, cela reviendrait à changer la position des touches d'une machine à écrire d'un dactylographe tapant à l'aveugle : le texte résultant sera fort certainement totalement illisible. Le dispositif de codage est ainsi resté inchangé durant les milliards d'années d'évolution de la vie. On estime le plus souvent qu'il s'est fixé ainsi particulièrement tôt dans l'histoire de la vie, certainement avant le dernier ancêtre commun à l'ensemble des êtres vivant (baptisé LUCA).

Exceptions

Cette vision des choses est simpliste : si l'immense majorité des organismes vivants actuellement utilisent le code génétique standard, les généticiens ont découvert quelques variantes à ce code. De plus, ces variantes se retrouvent dans les différentes lignées évolutives et consistent en des traductions différentes de quelques codons.

  • Le codon CUG, traduit généralement par la leucine, correspond à la sérine[1] chez de nombreuses espèces de champignons Candida[2].
  • De nombreuses espèces d'algues vertes du genre Acetabularia utilisent les codons-stop UAG et UAA pour coder la glycine.
  • De nombreux ciliés, comme Paramecium tetraurelia, Tetrahymena thermophila ou Stylonychia[3] lemnæ utilisent les codons UAG et UAA pour coder la glutamine au lieu de stop. Seul UGA est stop chez ces cellules.
  • Le cilié Euplotes octocarinatus utilise le codon UGA pour coder la cystéine, ne laissant que UAG et UAA comme stops.
  • Dans les trois règnes du vivant, on trouve quelquefois un 21e acide aminé, la sélénocystéine, codé par le codon UGA (généralement un codon-stop).
  • Il existe quelques acides aminés spéciaux, comme la 5-Hydroxylysine dans le collagène, la 4-Hydroxyproline dans la paroi végétale, le gamma-carboxylglutamate dans la prothrombine (protéine de coagulation), et la gamma-methyl-lysine dans la myosine.
  • Dans les archées et les eubactéries, un 22e acide aminé, la pyrrolysine est quelquefois rencontré, codé par UAG (aussi généralement un codon-stop).

Le premier acide aminé incorporé (déterminé par le codon-start AUG) est une méthionine chez la majorité des eucaryotes, plus rarement une valine (chez certains eucaryotes), et une formyl-méthionine chez la majorité des procaryotes. En outre, ce codon d'initiation est quelquefois GUG ou GUU chez certains procaryotes.

On pense par conséquent actuellement que la vie comptait à l'origine un nombre plus restreint d'acides aminés. Ces acides aminés ont été modifiés et ont vu leur nombre augmenter (par un phénomène comparable à la formation de la sélénocytéine ainsi qu'à la pyrrolysine qui dérivent de la sérine et de la lysine, respectivement, modifiées tandis qu'elles sont sur leur ARN de transfert sur le ribosome. ) Ces nouveaux acides aminés ont alors utilisé un sous-ensemble des ARN de transfert et leur codage associé. On remarque peut-être des traces de ce phénomène avec la glutamine, qui dans certaines bactéries, dérive du glutamate toujours attaché à son ARN de transfert.

Autre exception : le code est quelquefois ambigu. Ainsi par exemple, le codon UGA peut dans un même organisme (Escherichia coli par exemple) coder tantôt pour le 21ème acide aminé évoqué plus haut (sélénocystéine) ou pour "stop".

Mitochondries

Article détaillé : génome mitochondrial.

Les variations du code utilisés par les mitochondries sont toujours plus nombreuses.

  • Dans le génome mitochondrial de la levure de boulanger (Saccharomyces cerevisiaie), la thréonine est codée par 4 des 6 codons correspondant classiquement à la leucine.
  • Dans les mitochondries humaines, AUA, comme AUG, code la méthionine et non l'isoleucine.
  • Dans les mitochondries humaines, AGA et AGG sont des codons-stop et ne codent pas l'arginine.
  • Dans les mitochondries humaines, de la levure de boulanger, de spiroplasmes et de Mycoplasma mollicutes, UGA n'est pas un codon-stop mais code le tryptophane.

Notes et références

Liens externes


Acide aminé

Ala | Arg | Asn | Asp | Cys | Glu | Gln | Gly | His | Ile | Leu | Lys | Met | Phe | Pro | Ser | Thr | Trp | Tyr | Val
Acide aminé essentiel | Protéine | Peptide | Code génétique



Recherche sur Amazone (livres) :



Ce texte est issu de l'encyclopédie Wikipedia. Vous pouvez consulter sa version originale dans cette encyclopédie à l'adresse http://fr.wikipedia.org/wiki/Code_g%C3%A9n%C3%A9tique.
Voir la liste des contributeurs.
La version présentée ici à été extraite depuis cette source le 17/09/2009.
Ce texte est disponible sous les termes de la licence de documentation libre GNU (GFDL).
La liste des définitions proposées en tête de page est une sélection parmi les résultats obtenus à l'aide de la commande "define:" de Google.
Cette page fait partie du projet Wikibis.
Accueil Recherche Aller au contenuDébut page
ContactContact ImprimerImprimer liens d'évitement et raccourcis clavierAccessibilité
Aller au menu