Génomique et informatique : l'impact sur les thérapies et sur l'industrie pharmaceutique

Rapports d'office parlementaire

Rapport n° 20 (1999-2000), déposé le 14 octobre 1999

N° 1871 ASSEMBLÉE NATIONALE CONSTITUTION DU 4 OCTOBRE 1958 ONZIÈME LÉGISLATURE		N° 20 SÉNAT SESSION ORDINAIRE DE 1999-2000
Enregistré à la Présidence de l'Assemblée nationale	Annexe au procès-verbal de la séance du
le 15 octobre 1999	14 octobre 1999

OFFICE PARLEMENTAIRE D'ÉVALUATION

DES CHOIX SCIENTIFIQUES ET TECHNOLOGIQUES

RAPPORT

sur

GÉNOMIQUE ET INFORMATIQUE : L'IMPACT SUR LES THÉRAPIES

ET SUR L'INDUSTRIE PHARMACEUTIQUE

par

M. Franck SÉRUSCLAT,

Sénateur.


Déposé sur le Bureau de l'Assemblée nationale par M. Jean-Yves LE DÉAUT Premier Vice-Président de l'Office.			Déposé sur le Bureau du Sénat par M. Henri REVOL Président de l'Office .

Recherche - Biologie - Génétique - Médicaments - Santé.

INTRODUCTION INTRODUCTION

I. STRUCTURE DU RAPPORT I. STRUCTURE DU RAPPORT

À l'évidence, nous assistons à un bouleversement des moyens utilisés pour guérir les hommes malades et non seulement les soigner.

Chaque jour, la presse, spécialisée ou non, fait état des recherches et de leurs résultats prévisibles ; la presse spécialisée en confirme la plupart tout en restant prudente dans ses audaces.

L'Office parlementaire d'évaluation des choix scientifiques et technologiques a adopté un rapport destiné à faire le point sur les enjeux, déjà perceptibles ou prévisibles, de cette rencontre entre l'informatique et la génomique.

Ce rapport, réalisé à partir d'informations recueillies en France comme aux États-Unis, nourri de la lecture de la presse spécialisée et de la consultation d'une documentation scientifique comprend deux parties :

La première partie décrit la véritable RÉVOLUTION SCIENTIFIQUE qui bouleverse depuis quelques années le domaine de la santé.

De façon aussi précise et détaillée que le permettent les informations recueillies, sont présentées en deux chapitres :

- LES CONNAISSANCES ET LES TECHNIQUES ENTIÈREMENT NOUVELLES récemment maîtrisées :

La génomique :	Étude des génomes des organismes, en particulier de l'ensemble des gènes et de leur disposition sur les chromosomes ;
La bio-informatique :	Combinaison de l'informatique et de la biologie, qui permet de déchiffrer les génomes et d'analyser l'information génétique ;
Les biopuces :	Supports issus de la micro-électronique classique, mais sur lesquels sont fixés des fragments d'ADN permettant d'analyser d'autres brins d'ADN ;
La chimie combinatoire et le criblage à haut débit :	Synthèse par combinaison chimique de très nombreuses molécules constituant des candidats-médicaments et tri rapide de ces molécules en fonction de leur action sur les cibles que constituent, par exemple, les protéines.

- LEURS MULTIPLES APPLICATIONS :

L'utilisation pour la recherche pharmaceutique de cibles issues de la génomique :	Chaque gène code pour une protéine ; la déficience ou l'excès de protéine est à l'origine de nombreuses pathologies. L'utilisation des protéines identifiées grâce à la génomique, permet de mieux orienter la recherche pharmaceutique ;
La thérapie génique :	Réparation d'un gène ou apport in situ d'un gène fonctionnel ;
Les nouveaux vaccins :	Nouvelles techniques d'immunothérapie ; vaccins à base d'ADN ; vaccins traditionnels découverts grâce à la connaissance du génome des bactéries ;
La pharmacogénomique :	Adaptation des traitements aux malades en fonction de leur profil génétique ;
Le diagnostic moléculaire :	Tests ciblant le patrimoine génétique et permettant de détecter les maladies infectieuses ou génétiques ;
Les protéines thérapeutiques :	L'utilisation des techniques du génie génétique pour la production de protéines par des bactéries ou des levures et, plus récemment par des animaux génétiquement modifiés.

La deuxième partie présente les NOUVEAUX CHOIX À FAIRE EN FRANCE , pour bénéficier de cette révolution scientifique, dans trois domaine :

LA RECHERCHE, ses STRUCTURES et ses ORIENTATIONS fondamentales, notamment vers la protéomique (étude des protéines) ;

L'INDUSTRIE, les ACTIONS EN FAVEUR DES JEUNES ENTREPRISES DE BIOTECHNOLOGIE, les BIOPÔLES ainsi que le problème des BREVETS ;

LA SOCIÉTÉ, avec les deux aspects spécifiques de la FORMATION PROFESSIONNELLE et de la MÉDECINE PRÉDICTIVE (étude génétique des prédispositions à certaines pathologies).

La conclusion propose une série de recommandations pour profiter de la révolution génomique et en maîtriser les conséquences.

II. PROPOS LIMINAIRES : GÉNOMIQUE INTIME II. PROPOS LIMINAIRES : GÉNOMIQUE INTIME

Je tiens avant tout à remercier M. Jacques DANGOUMAU , professeur des universités, praticien hospitalier, pharmacologue et M. Yves CHAMPEY , président de la Fondation Rhône-Poulenc Rorer, qui ont bien voulu constituer, pour m'assister dans l'élaboration de ce rapport, un comité de pilotage dont les conseils m'ont été infiniment précieux.

Dès le début de la préparation de ce rapport, et la rédaction de l'étude de faisabilité préalable, j'ai découvert combien avaient progressé les connaissances sur la nature intime de l'être humain. Les scientifiques sont arrivés à identifier, ou vont y parvenir, la composition du génome humain et, bientôt, ils n'hésiteront pas à le prendre comme matrice de médicaments spécifiques, en feront une méthode thérapeutique ordinaire adaptée à une maladie pour un malade personnalisé. Décrypter ces données nouvelles est indispensable, l'objectif du rapport étant de mettre à la portée de chacun des informations claires sur des sujets complexes.

" L'élucidation de la structure de la double hélice de l'ADN, la découverte de l'ARN messager, le déchiffrement du code génétique, le décryptage de la mécanique de la synthèse protéique, la compréhension des grands principes de la régulation des gènes sont des morceaux d'anthologie, désormais classiques [...]. L'étude approfondie des systèmes n'a cessé de progresser, appuyée par une impressionnante avancée des méthodes et des techniques. La plus spectaculaire a été sans doute l'avènement du génie génétique qui a offert aux biologistes une méthode quasi-générale pour isoler et purifier des gènes spécifiques, donc de les analyser et les manipuler à des fins cognitives ou productrices [...]. Dotée de concepts et d'outils performants, la recherche peut, au niveau moléculaire, aborder la confondante diversité du vivant [...] (en découvrant en même temps) l'homogénéité moléculaire du vivant qui contraste avec la grande diversité des formes [...]. À peine repère-t-on, sur quelques organismes très différents un trait marquant, que l'on peut formuler une loi générale s'appliquant à l'ensemble ou à des sous-ensembles du monde vivant [...]. Un biologiste moléculaire, aujourd'hui, raisonne et se documente de façon quasiment indifférente sur des données obtenues chez des bactéries, des levures, la mouche du vinaigre, l'oursin, la torpille, le crapaud, le poulet, le lapin, la souris ou l'homme [...]. Jamais peut-être l'impact de découvertes fondamentales dans ses applications n'a été si rapide [...] ^{1(

*
)} .

L'origine de la vie, son évolution font étonnement, certes ; les causes n'en sont, cependant, plus ignorées et des connaissances scientifiques et techniques peuvent prendre place dans des débats philosophiques ou théologiques.

La vie des êtres humains, des végétaux comme des animaux, est portée par les mêmes substances chimiques, substances que l'homme sait synthétiser dans ses cornues : l'ADN, deux bases puriques, deux pyrimidiques, 24 acides aminés, c'est tout. Avec des milliards de combinaisons, l'homme ne reproduit que des être humains, tous différents entre eux, noirs, jaunes, métis, blancs, avec des yeux bridés ou non, hommes grands ou petits, plus ou moins bancals, beaux ou vilains, mais toujours, et seulement, des êtres à visages, corps et comportements humains. Végétaux et animaux gênèrent des millions de différences, de l'arbre immense au pissenlit à la fleur d'une délicatesse surprenante, dans le règne végétal, de l'éléphant au virus du SIDA dans le règne animal.

Les plus fins détails de l'organisation du génome humain se sont précisés. Les milliards de nos cellules sont, avec des fonctions précises, réparties dans tous nos organes, peau et muscles, coeur, foie, cerveau, rein, pancréas, etc. Ces cellules, sauf celles qui nagent dans le sang, ont des ponts entre elles pour être maintenues en place ; dans le noyau de chacune d'entre elles est pelotonné l'ADN avec ses bases puriques et pyrimidiques organisées selon la séquence née de la fusion des patrimoines parentaux. Chacune de ces cellules pourrait intervenir dans la naissance et la vie de n'importe quel organe, mais chacune d'elle est limitée au rôle nécessaire pour l'organe où elle se trouve logée ; celles qui sont dans le tissu musculaire ne fourniront pas du tissu cérébral, cardiaque, ou rénal, etc. Le détail de l'intervention de l'ARN messager, la présence de verrous répressifs ne laissant s'exprimer que la séquence nécessaire d'ADN ne sont pas encore parfaitement connus.

L'objectif des scientifiques est d'acquérir la connaissance intime de ces mécanismes et leurs maîtrises ; un jour, ils construiront l'homme à leur manière pour créer " leur meilleur des mondes ". Fol espoir ! Terrible inquiétude !

Dégager les conséquences du recours au génome comme matière pour des " médicaments génétiques " conduit à se demander si l'homme ne serait qu'une étonnante " machine " faite de moteurs chimiques pour penser, créer, imaginer, aimer ou détester, caresser, torturer, tuer ou protéger, enchanter ou effrayer... La vie ne serait-elle plus ce " miracle " impressionnant tant Menuhin ( " Je suis né avec un héritage qui date de milliers d'années. L'enfant est l'incarnation de vies antérieures ; on croît qu'il est nouveau-né, mais il est le miracle d'une vie qui n'a pas été interrompue depuis l'origine de l'homme " ). Vie de l'homme, vie des animaux, vie des plantes, toutes ont les mêmes éléments pour accomplir les actes les plus essentiels comme les plus subtils de la vie à la mort. Chaque seconde, fraction de seconde, fraction de fraction de seconde, nos comportements les plus secrets, les plus ordinaires comme les plus compliqués en seraient-ils dépendants ? La chimie supplanterait-elle toutes les autres hypothèses ? Rendrait-elle caduc ce qui était légende ou mystère ?

Les premiers éléments réunis pour l'élaboration de ce rapport ont mis en lumière une fulgurante évolution démultipliée par le développement parallèle des moyens informatiques mis à la disposition de la recherche, et celui des connaissances de la structure intime de l'être humain.

Génomique, chimie combinatoire, informatique, thérapie génique, sont des mots qui aujourd'hui enthousiasment les uns, inquiètent les autres, font naître des espérances ou des inquiétudes ; jusqu'où l'homme va-t-il oser aller, sans risques majeurs ? Quelles chances, quels risques pour l'espèce humaine au moment où il disposera des clefs de son évolution dès avant la naissance, jusqu'à la fin de la vie ?

Pour en bien comprendre les rôles respectifs des composantes de ce génome humain, il m'a été utile d'en faire un recensement explicatif.

Chaque cellule humaine a un noyau et un cytoplasme, sauf les globules rouges.

Chaque cellule contient dans son noyau les 46 chromosomes porteurs des facteurs déterminant de l'hérédité

Le chromosome : Au début du XIXe siècle, l'examen microscopique de cellules animales et végétales traitées par certains colorants révéla la présence dans leurs noyaux de corps colorés qu'on appela chromosomes, du grec khrôma, couleur, et soma, corps.

Chaque chromosome est porteur de nombreux gènes originaux mais il n'a pas de fonction propre pour autant. Il n'y a pas un gène qui soit porteur d'une finalité type par exemple " yeux bleus ". C'est la conjugaison des gènes de plusieurs chromosomes qui permettra que ce caractère héréditaire apparaisse.

Ceci est vrai pour tous les chromosomes, sauf les chromosomes sexuels.

Chaque chromosome n'a pas de spécificité par lui-même, sauf sa forme.

Le composant principal des chromosomes est l'ADN (acide désoxyribonucléique) qui possède une structure en double hélice lui permettant de stocker et de transmettre une information génétique " À n'en pas douter, l'élucidation de la structure de l'ADN marque une étape majeure dans la compréhension du vivant et ouvre pour la recherche une nouvelle ère : celle de la biologie moléculaire du gène. Ce dernier, support de l'hérédité, vient en effet de trouver sa nature... " ^{2(
*
)} . Cette découverte, le 25 avril 1953, par CRICK et WATSON fut saluée par les plus brillants biologistes du monde et par Salvador DALI : " Aujourd'hui, les dernières découvertes de la science nous prouvent que les lois de Dieu sont celles de l'hérédité contenue dans l'acide désoxyribonucléique, ADN, et que l'acide ribonucléique, ARN, n'est que le messager chargé de transmettre le code génétique, qui est le legi intimus des deux acides en question formant ici l'échelle de Jacob de CRICK et WATSON " ^{3(
*
)} .

Cette première découverte n'était, pourtant, pas suffisante pour connaître et comprendre le mécanisme intime de la transmission de l'information génétique.

Il a fallu que SANGER, prix Nobel en 1958, interprète le rôle des protéines à partir des premiers travaux de BANTING et BEST en 1922 sur l'insuline, première protéine isolée à l'état pur, composée de 177 acides aminés ; il démontra que ces acides aminés n'étaient pas dans un ordre aléatoire mais en séquence bien déterminée et, si une seule erreur intervient dans cet agencement, l'insuline perd ses propriétés. Il en conclut que ces protéines étaient de grosses molécules chimiquement définies.

Ce sont, enfin, les travaux de J. MONOD, F. JACOB et A. WOLF, prix Nobel en 1965, qui ont permis de percer les mystères du mécanisme de la régulation génétique au niveau de la cellule : on leur doit la découverte de l'ARN messager ainsi que celle des étapes de la participation des acides aminés à la constitution des protéines du vivant, qu'il s'agisse des être humains, des animaux, des bactéries, des microbes mais aussi des plantes : pour tous ADN, ARN messager, protéines et acides aminés, en des quantités totalement différentes, sont les supports de la transmission de tous leurs caractères, jusque dans leurs moindres détails. Cet ADN est localisé dans le noyau des cellules et sert de matrice pour la synthèse des différents types d'acide ribonucléique, ou ARN, par le processus de transcription. Il est le support de la transmission héréditaire.

La molécule d'ADN est une molécule codée que l'on peut considérer comme un " mot " formé de plusieurs millions de lettres écrites avec un alphabet réduit de 4 lettres : A, C, G et T (adénine, cytosine, guanine et thymine). L'ordre dans lequel sont placés ces 4 constituants s'appelle une information codée.

Le génome est composé de tous les chromosomes d'un organisme vivant, humain, animal vertébré ou non, plante..., donc de tous les gênes qu'il contient, sans qu'il y ait de mélange.

La double hélice est constituée par le génome, donc par tous les chromosomes , donc par tous les gènes. Mais cette double hélice n'a pas pour autant un contenu physique unique ; elle est faite des 46 chromosomes restant individualisés : elle est faite de 46 fragments.

Le gène est la portion d'un chromosome qui commande l'expression d'un caractère héréditaire précis : c'est un tout petit fragment du chromosome Y qui détermine le sexe ; si ce petit fragment est présent dans la cellule oeuf, il entraîne la " fabrication " d'un garçon ; s'il est absent, d'une fille... La précision de leur localisation, permet d'établir, peu à peu, les cartes génétiques.

Chaque gène est constitué par une séquence de 4 bases allant toujours deux à deux : adénine et thymine , bases puriques, et guanine et cytosine, bases pyramidiques. On évalue à environ 80 000 à 100 000 le nombre de gènes.

Dans le cytoplasme sont produits et assemblés une vingtaine d'acides aminés déterminant la constitution des caractéristiques génétiques ; On distingue des :

- acides aminés essentiels apportés par l'alimentation et que l'individu ne peut synthétiser

- acides aminés ordinaires synthétisés par les cellules.

Ces acides aminés seront ordonnés (= mis en ordre) par l'ARN messager qui, sous la dictée de l'ADN, aura copié cet ordonnancement. Pour cela, l'ARN messager, avec sa copie, quitte le noyau, met en ordre les acides aminés contenus dans le cytoplasme selon les directives recopiées sur le fragment d'ADN dont il est le correspondant.

Ainsi se construisent les protéines utiles :

- les unes aux formes de la cellule (ce sont des briques de construction) ;

- les autres aux fonctions assurées par les cellules.

L'altération, l'absence d'un des éléments ou d'un ensemble d'entre eux peuvent être à l'origine de maladies. La découverte de la cause génétique d'une maladie, sauf dans le cas où celle-ci serait ou paraîtrait être due à un seul gène, est particulièrement difficile, tant le nombre de facteurs est élevé.

40 mille milliards de cellules (peau, muscles, nerfs...) contiennent, chacune dans leur noyau, 23 paires de chromosomes. Ces 23 paires sont enfermées dans un zygote totipotent et omnipotent, cellule initiale née du mariage entre le spermatozoïde du père et l'ovule de la mère ; celui-ci contient toutes les instructions nécessaires à notre création puis survie.

Chaque chromosome est un long filament d'acide désoxyribonucléique (ADN). Cette molécule est un serpentin à deux bandes formées d'une longue suite d'unités fondamentales, les minuscules nucléotides, eux-mêmes constitués de trois molécules : un phosphate, un sucre et une base. Phosphates et sucres forment le serpentin qui s'enroule pour former une double hélice. Les bases, associées deux à deux, forment des petits liens perpendiculaires aux deux bandes comme les barreaux d'une échelle torsadée.

La totalité de notre matériel génétique est constituée par quelques trois milliards de ces barreaux sur ces minces filaments d'un millième de millimètre d'épaisseur.

Les quatre bases (adénine, cytosine, guanine, thymine, désignés par leurs initiales A, C, G, T), sont disposées, par paires, en vis-à-vis, sur chacune des deux bandes, selon une règle immuable : l'adénine est toujours associée à la thymine (A-T) et la cytosine à la guanine (C-G). À chaque gène correspond une information génétique définie par le nombre et l'ordre de succession des paires de bases au sein du gène ; le nombre de paires de bases sur ces gènes peut aller de 800 à plus d'un million par gène.

Les lettres A, C, G, T, peuvent être considérés comme quatre notes pour écrire la partition de la vie. La lecture de cette partition se traduit par la fabrication de protéines (ou d'enzyme, protéine ayant une fonction d'un type précis, catalytique) toutes constituées d'une chaîne d'acides aminés qui, au départ, nagent dans la cellule ; ils sont alignés dans un ordre bien déterminé et caractéristique de la protéine en question. Chaque assemblage de bases puriques correspond à un acide aminé particulier : le codon CGA code pour l'acide aminé alanine, le triolet CCA pour la proline...

Dans la cellule, ces opérations sont dirigées par un organite appelé ribosome : il déchiffre un assemblage de bases puriques et ordonne à l'ARN messager d'aller chercher l'acide aminé correspondant ; il lit un assemblage suivant, fait chercher l'acide aminé pour le faire accrocher au précédent, jusqu'à lire le dernier de la phrase ; ce gène est limité à ses deux extrémités par deux triolets caractéristiques, au début ATG qui code pour l'acide aminé méthionine ; à la fin, le triolet " dit non sens ", TAA, ne correspond à aucun acide aminé : il ferme le gène.

La molécule d'ADN mesure 1,80 m de long pour 2 millièmes de millimètre d'épaisseur ; elle se pelotonne dans un espace de quelques micromètres.

Pour une compréhension plus facile de la fonction de chacun des composants, génome, chromosome, gène, base purique, acide aminé, protéine, le recours à des images plus familières peut être utile.

Comparaison avec une bibliothèque et des livres :

Le génome, enfermé dans le noyau, ressemble à une bibliothèque avec 2 fois 23 rangées de livres édités, les uns par la mère, les autres par le père ; la confrontation de ces deux éditions d'un même texte (la vie humaine) est à l'origine de la diversité humaine. Chaque édition a des petites différences, des petites erreurs dont le mélange, au fil des générations et des mariages, aboutit à créer nos particularité. Seul l'ADN mitochondrial échappe à cette règle. Chaque rangée correspond à un chromosome constitué d'ADN et porteur de caractères héréditaires spécifiques à ce chromosome ; ces livres ne peuvent pas quitter cette bibliothèque sans le secours de l'ARN messager ; celui-ci prend une copie d'une partie de livre et la transfère dans le cytoplasme ; les acides aminés, nageant dans ce cytoplasme sont comparables à des briques ; ils sont assemblés selon un plan porté par l'ARN messager ; celui-ci transfère des plans ou fragments de plans exprimés en combinaison des 4 bases puriques entre elles.

On peut comparer cette combinaison à un code comme le sont le morse ou un langage ; ce code sert à ordonnancer les acides aminés considérés comme des briques capables de construire des protéines adaptées aux multiples fonctions nécessaires à la vie.

III. PROPOS INTRODUCTIFS III. PROPOS INTRODUCTIFS

Pendant des siècles et des siècles, faisant référence à Hippocrate et Esculape, médecins et apothicaires ont fait usage de plantes et de produits d'origine animale pour tenter d'adoucir les symptômes de maladies et la souffrance des malades. En ces débuts, la thériaque était une mixture complexe ayant vocation de médicament à effets généralistes et, surtout, antidote des poisons les plus divers ; peu à peu, des onguents, des pommades, des sirops, des extraits et autres formes galéniques ont pris place dans les prescriptions médicales ; puis les Diafoirus, tant moqués et décriés par Molière, ont usé et abusé de la saignée et du lavement.

La notion de " principes actifs " et leur extraction datent du début du XIXe siècle. Nombreux d'entre eux ont été isolés des végétaux, tels les alcaloïdes (morphine en 1805, strychnine et quinine en 1818 et 1920, puis cocaïne, codéine...) et les hétérosides (digitaline cristallisée). En 1889, année de l'exposition universelle à Paris, la recherche industrielle a fait ses premiers pas et a abouti à la découverte des antiseptiques, des digitaliques et des antirhumatismaux.

En 1907, le médecin allemand, P. EHRLICH, en découvrant les arsenicaux de synthèse efficaces contre la syphilis et la maladie du sommeil, a donné naissance à la chimiothérapie . Celle-ci a pris son essor rapidement, permettant la découverte d'antiparasitaires, de barbituriques, d'antipaludéens et de sulfamides.

Pendant la seconde guerre mondiale, l'ère des antibiotiques a commencé avec la préparation à grande échelle de la pénicilline, puis la mise au point de la streptomycine et des tétracyclines.

Sont ensuite apparus les psychotropes (phénothiazine, benzodiazépine), les antituberculeux (isoniazide) les corticoïdes (prednissone) et, vers les années soixante-dix, les médicaments cardio-vasculaires modernes (bêtabloquants).

Tous ces médicament ont permis d'élargir considérablement la palette des possibilités thérapeutique, sans toutefois répondre complètement aux exigences déjà exprimées par Pierre LAROUSSE dans son Grand Dictionnaire Universel du XIXe siècle :

" La vraie classification des médicaments reposera sur la connaissance de leurs effets précis et bien déterminés. Elle doit être établie, non d'après les symptômes de guérison qu'il font apparaître dans les diverses maladies, mais sur la nature des modifications qu'ils déterminent dans tel ou tel tissu malade. Chaque tissu malade a son médicament , comme chaque tissu sain a son poison " .

Nous assistons actuellement à la naissance de ces médicaments : certains seront administrés comme leurs prédécesseurs mais atteindront des cibles très précises, d'autres seront de nature très différente, par exemple dans le domaine de la thérapie génique.

Cette rupture a pour origine la rencontre entre l'informatique et la génomique. Elle va bouleverser les modes de production et d'administration des substances thérapeutiques, avoir des répercussions considérables .

Voilà que depuis quelques 20 ans, l'homme découvre sa composition intime, son génome.

Il devient maintenant capable d'avoir la connaissance des rôles et des effets de l'ADN, des gènes des protéines, des allèles comme des microsatellites, de préciser quelle est la responsabilité de chacun de ses composants dans la quasi-totalité des maladies qui ont, donc, une cause cernable : une faiblesse ou une absence génétique ; voilà aussi qu'il peut les remettre en état de bon fonctionnement.

La connaissance des gènes provoque un bouleversement des connaissances et des comportements en médecine courante, dans l'industrie pharmaceutique, comme dans toutes les activités qui gravitent autour de la vie et de la maladie des hommes.

Il apprend même la " dualité " des gènes, celui de la prédisposition à la longévité étant également, par exemple, celui de la prédisposition à l'infarctus du myocarde précoce...

Il commence à connaître la composition des protéines codées par les gènes, à déterminer les conséquences pathologiques de l'excès ou du déficit de production protéinique ; il peut essayer d'enrayer les maladies en agissant sur leur cause c'est-à-dire en régulant le niveau d'expression des protéines.

Cette véritable Révolution scientifique prélude à de Nouveaux choix à faire.

POUR LES TERMES TECHNIQUES,

UN GLOSSAIRE EST CONSULTABLE EN FIN DE RAPPORT

1. PREMIÈRE PARTIE : UNE RÉVOLUTION SCIENTIFIQUE

1.1. DES CONNAISSANCES ET DES TECHNIQUES ENTIÈREMENT NOUVELLES

Elles sont apparues dans les domaines de la génomique, la bio-informatique, les biopuces et la chimie combinatoire associée au criblage à haut débit .

1.1.1. LA GÉNOMIQUE :

1.1.1.1. Définition et procédés

La génomique :

C'est l'étude exhaustive des génomes et en particulier de l'ensemble des gènes, de leur disposition sur les chromosomes, de leur séquence, de leur fonction et de leur rôle.

Le génome des organismes vivants est l'ensemble de leur matériel génétique. Il assure le fonctionnement des cellules et la transmission des caractères héréditaires au cours des générations. Il est constitué de molécules d'acides nucléiques (ADN), enchaînements d'unités élémentaires, les nucléotides. Les nucléotides sont constitués d'un sucre, d'un phosphate, et d'un élément variable, la base, qui peut être l'adénine, la guanine, la cytosine ou la thymine. Les gènes, c'est-à-dire les parties d'ADN porteuses d'une information génétique, ne constituent qu'une partie du génome.

Les génomes des organismes vivants ont des tailles considérables allant d'une centaine de millions à des milliards de nucléotides. Le génome humain, par exemple, est composé d'environ 3 milliards de bases. L'étude d'un génome passe donc par des opérations de cartographie puis de séquençage ainsi que par l'interprétation des séquences.

La cartographie physique :

C'est le positionnement de repères sur le génome.

On commence par couper l'ADN en grands fragments. Les grands fragments clonés de cette collection sont ensuite ordonnés (cartographiés) les uns par rapport aux autres, au moyen de points de repère (courtes séquences d'ADN) qui servent de balises identifiant les grands fragments. Lorsque plusieurs fragments ont une balise en commun, on en conclut qu'ils ont une partie d'ADN en commun. On dit que les fragments sont partiellement recouvrants ou chevauchants.

En analysant l'ensemble des fragments d'ADN en fonction de leur contenu en balises, on peut reconstituer l'enchaînement des balises et des fragments d'ADN, tels qu'ils existent dans la molécule d'ADN de départ.

La reconstitution de la molécule d'ADN de départ sous la forme d'un ensemble de fragments chevauchants constitue la carte physique. C'est à partir de cette carte que sera choisi l'ensemble minimal de fragments assurant la couverture complète du génome à séquencer.

Le séquençage :

Pour connaître les " instructions " que renferme un fragment d'ADN, on lit la succession des bases puriques et pyrimidiques (A, T, G, C) ^{4(
*
)} de l'enchaînement. Cette lecture est appelée séquençage.

Un fragment d'ADN à séquencer est constitué de l'enchaînement de centaines d'exemplaires de nucléotides dans un ordre défini. Séquencer une telle molécule, c'est déterminer cet ordre.

Le principe utilisé consiste à réaliser, à partir d'un point fixe, des copies partielles de la molécule, interrompues au hasard. On synthétise toutes les copies intermédiaires possibles à partir du point fixe.

Puis on les sépare selon leur taille par une migration électrophorétique dans un gel poreux. Ces gels permettent de séparer deux intermédiaires consécutifs qui ont une différence de taille d'un seul nucléotide. Si l'on peut identifier le nucléotide du point d'interruption sur chacune de ces copies partielles, de la plus petite à la plus grande, il devient possible de reconstituer la succession des nucléotides tout au long de la copie.

Dans la pratique, pour identifier les nucléotides terminaux, l'ADN à séquencer est recopié à l'aide d'un composé chimique qui provoquera l'interruption au hasard, mais systématiquement à la suite d'un seul des 4 nucléotides A, T, G ou C. On fera donc, en parallèle, 4 séries de copies. Dans chaque série, toutes les copies seront interrompues derrière un seul type de nucléotide ; par exemple, toutes les copies intermédiaires d'une série seront terminées par un A. En outre, le composé provoquant l'interruption est fluorescent pour pouvoir être détecté automatiquement à l'aide d'un système optique qui balaye le bas du gel d'électrophorèse dans les séquenceurs automatiques. Le signal obtenu est interprété par un programme informatique qui reconstituera la séquence originale du fragment d'ADN analysé ^{5(
*
)} .

La rapidité du séquençage :

Les centres publics ou privés de séquençage utilisent des outils de plus en plus perfectionnés, des séquenceurs à haut débit. Les deux séquenceurs les plus rapides sont actuellement :

- MegaBace 1000 , de la société américaine Molecular Dynamics-Amersham Pharmacia-Biotech qui permet de séquencer 96 échantillons par réaction et 1 100 par 24 heures (les premiers appareils ont été installés en Europe en août 1997).

- Abi Prism 3700 , de la société américaine Perkin Elmer Applied Biosystems, qui permet de séquencer 96 ou 384 échantillons par réaction, et 760 à 1240 par 24 heures (les premiers appareils ont été installés en Europe en janvier 1999).

Il peut être également intéressant, pour des raisons de rentabilité et de flexibilité de coupler plusieurs séquenceurs. La firme canadienne Visible Genetics a mis au point le Virtual DNA Sequencer. Ce système organise une connexion en réseau de plusieurs séquenceurs automatisés rapides. La centralisation dans l'ordinateur des données d'analyse issues de chacun de ces appareils permet de faire fonctionner l'ensemble comme un seul séquenceur très rapide.

L'interprétation des séquences :

La séquence d'un fragment d'ADN contient une série d'informations qu'il faut identifier et interpréter. Les éléments de séquences les mieux connus correspondent aux gènes, délimités par des signaux de début et de fin. Ces gènes ne s'expriment pas tous en permanence dans une cellule. Leur expression est régulée par des éléments de contrôle, situés dans leur voisinage, qui augmentent ou diminuent leur niveau d'expression en fonction du besoin. Grâce à des programmes informatiques, l'interprétation des séquences permet le repérage des gènes, des éléments de contrôle et de leurs relations.

La cartographie génétique :

Elle constitue une autre façon d'étudier les génomes. Compte tenu de la complexité des procédés déjà exposés (cartographie physique, séquençage, interprétation des séquences), il est évident que des approches différentes peuvent se révéler intéressantes pour la connaissance des génomes. On peut, sans disposer d'un séquençage complet ou de cartes physiques très précises, étudier un caractère physiologie ou pathologie particulier. On fait alors appel aux méthodes de cartographie génétique pour identifier les gènes qui contrôlent ces caractères. Ces méthodes consistent à détecter directement au niveau de l'ADN les polymorphismes, c'est-à-dire les variations génétiques différenciant un individu d'un autre.

1.1.1.2. L'état des connaissances

1.1.1.2.1. La soudaine accélération du séquençage du génome humain

Le projet international " Génome Humain " a été lancé dès 1990 avec, aux États-Unis, un budget de 18 milliards de francs sur quinze ans.

Ce programme se fondait notamment sur une carte physique, localisant géographiquement les gènes sur la molécule d'ADN : elle avait été dressée à 70 % par le Professeur Daniel COHEN, chercheur au Centre d'études du polymorphisme humain (CEPH) et au Généthon, le laboratoire de l'Association française contre les myopathies (AFM), puis achevée avec le concours des chercheurs de l'Institut de technologie du Massachusetts (MIT).

Il se fondait également sur une carte génétique, situant les gènes selon leur fonction, établie par le Professeur Jean WEISSENBACH, actuellement directeur général du Centre national français de séquençage.

Afin que les travaux soient menés le plus rationnellement possible, tous les responsables des centres nationaux d'étude du génome se réunirent aux Bermudes en 1996 et procédèrent au " partage " du génome afin de répartir son séquençage, chaque équipe étant chargée d'un chromosome entier ou d'une région particulière du génome.

La France, à cette époque, se montra hésitante et ce n'est qu'en 1998 qu'elle se vit confier le séquençage des chromosomes 3 et 14 (elle a ensuite renoncé au séquençage du chromosome 3).

Jusqu'en 1998, dans le cadre du programme international public Génome Humain, une fraction de 10 % des gènes a été séquencée.

Or, depuis un an, ce programme fait l'objet d'une accélération fulgurante. Le 15 mars 1999, les Instituts nationaux de la santé américaine (NIH) ont annoncé que le projet international de décryptage du génome humain avait achevé avec succès sa phase d'essai et que le financement du séquençage de l'ADN à grande échelle était décidé. Les échéances annoncées sont proches : un an pour l'ébauche globale, prévue pour le printemps 2000 et trois à quatre ans pour l'aboutissement d'un séquençage définitif de grande qualité (moins d'une erreur tous les cent mille nucléotides), prélude à la compréhension des protéines sécrétées.

Pour parvenir à ces résultats, les NIH ont réparti 493 millions de francs entre les trois plus grands groupes publics impliqués dans le séquençage :

- Whitehead Institute à Cambridge (Massachusetts)

- Washington University School of Medicine à Saint-Louis (Missouri) ;

- Baylor College of Medicine à Houston (Texas).

L'institut américain du génome, du département de l'énergie (Joint Genome Institute of the US Department of Energy, à Walnut Creek, California) a associé ses efforts à ceux de ces trois grands centres.

Dans le même temps, la fondation britannique Wellcome Trust a annoncé le versement, dans les douze mois à venir, d'une somme de 460 millions de francs au Centre Sanger (Royaume-Uni). Le Centre Sanger a été fondé en 1993 par le Wellcome Trust (la plus grande association mondiale pour la recherche médicale) et le Medical Research Council. C'est l'un des centres les plus productifs du monde ; il devrait produire, à lui seul, un tiers du séquençage du génome humain en 2001.

Les raisons de cette brusque accélération du décryptage du génome humain sont de deux ordres.

- Tout d'abord, le progrès technique a permis d'accroître les vitesses de séquençage : en 1992 les chercheurs identifiaient un million de bases par an. À ce rythme, il aurait fallu près d'un siècle pour achever le séquençage du génome humain. À l'heure actuelle, la vitesse de séquençage est dix fois plus élevée, grâce à des appareils tels que les Mega Bace 1000 ou les Abi Prism 3700. Non seulement on peut séquencer beaucoup plus vite, mais aussi beaucoup moins cher : le coût de la base séquencée est passé de 5 dollars en 1990 aux États-Unis à 50 cents aujourd'hui.

- Par ailleurs, cette accélération est liée à la " course " récemment née entre la recherche publique internationale et le secteur privé.

Le généticien américain Craig VENTER a fait sensation en annonçant, le 9 mai 1998 : " J'ai un plan pour achever de façon substantielle le séquençage du génome humain dans les trois ans à venir ". Pour ce faire, le fondateur de l'Institut de recherche génomique (TIGR à Rockville, Maryland) a créé une société privée, la firme Celera Genomics, en s'associant au géant américain de l'électronique, Perkin Elmer. Celera Genomics s'est équipée de 230 séquenceurs Abi-Prism 3700 dont le prix unitaire est de 300 000 dollars.

Puis la société Incyte Genetics créée en août 1998 par Incyte Pharmaceuticals, pour concurrencer Celera Genomics, a annoncé qu'elle séquencerait et cartographierait le génome humain d'ici 2001. Elle utilise des séquenceurs Mega Bace 1000 et a déjà établi de fortes relations commerciales avec plus de vingt grandes compagnies pharmaceutiques à travers le monde pour leur vendre les informations issues de ses recherches.

Cette émergence du secteur privé explique en grande partie le récent et massif engagement de la recherche publique internationale : il existe de grandes différences entre les objectifs des uns et des autres.

1.1.1.2.2. La divergence des approches publiques et privées dans le séquençage du génome humain

1.1.1.2.2.1. Deux logiques de recherche différentes

Les sociétés privées ont une stratégie de séquençage aléatoire sans cartographie préalable qui se veut rapide et puissante. Toutefois leur technique peut éventuellement se révéler peu efficace et en tout état de cause elle produit un séquençage " à trous ".

Le séquençage aléatoire rapide sans cartographie préalable n'a jusqu'alors démontré son efficacité que sur des génomes simples et pourrait marquer ses limites pour des génomes plus grands.

Aussi, Celera Genomics, avant de décrypter le génome humain, va tester sa méthode en séquençant le génome de la mouche du vinaigre Drosophila melanogaster (120 millions de bases). Si cette technique échoue pour la drosophile, elle a peu de chance de réussir pour le génome humain, infiniment plus important et plus complexe. Et même si elle donne satisfaction pour la drosophile, elle ne sera pas forcément transférable pour le génome humain.

Quant à Incyte Genetics, elle a déjà testé sa technique en menant à bien le séquençage complet d'une levure ( Candida albicans : 17 millions de bases). Pour cette société se posera aussi le problème de la taille du génome humain composé de 3 milliards de bases.

De toute façon, ce type de séquençage est effectué fragment par fragment, chacun d'entre eux comprenant environ 500 bases. Cela aboutit à une séquence très morcelée du génome constituée de dizaines voire de centaines de petits segments, non ou mal positionnés sur les cartes existantes.

Pour reconstituer dans ce puzzle des morceaux cohérents correspondant aux séquences des gènes, un gigantesque travail de réassemblage restera à faire. Il manquera inévitablement des morceaux importants, le résultat étant un séquençage " à trous ".

Selon Jean WEISSENBACH, " On ne peut pas croire que, comme le dit Craig VENTER, les " trous " restants au terme de son travail ne représenteront que moins de 10 millièmes du génome humain. Son programme comporte de nombreux mystères d'un point de vue méthodologique. En réalité, tout laisse à penser que cette équipe entend réaliser un " écrémage " lui permettant de trouver toute une série de choses intéressantes à breveter rapidement " ^{6(
*
)} .

Au contraire, les laboratoires du programme international public isolent des fragments de chromosomes et les ordonnent entre eux avant le séquençage, ce qui nécessite, au préalable, une cartographie fine des chromosomes. De plus, ils procèdent à dix vérifications pour chaque séquence, quand les équipes du secteur privé n'en font que trois. Cette technique est moins rapide mais le succès est assuré, ainsi que la qualité des résultats obtenus ^{7(
*
)} .

Toutefois, il semblerait que dans un premier temps les chercheurs publics aient décidé, en ce qui concerne le génome humain, de procéder de manière prioritaire au séquençage aléatoire à faible profondeur en continuant toutefois à ordonner les clones de fragments d'ADN sur une carte de préséquençage.

Cette technique permettrait d'obtenir pour le printemps 2000 l'ébauche globale. Cette étape sera bien entendu immédiatement suivie par un séquençage définitif de grande qualité. Retenir cette solution d'un séquençage en deux temps à pour avantage de fournir rapidement des données partielles mais suffisantes pour des projets de recherche de gènes responsables de maladies dans des régions données. L'offre de ces données, par le secteur public est essentielle car, là encore, les stratégies du privé et du public divergent.

1.1.1.2.2.2. Deux logiques d'accès aux connaissances

Les chercheurs du public craignent que les grandes entreprises privées de génomique ne confisquent l'information, alors que l'accès à celle-ci est un élément de base indispensable pour la communauté scientifique.

En 1992, Craig VENTER, alors chercheur aux NIH, avait déposé des centaines de demandes de brevets sur des gènes dont l'intérêt biologique n'était pas prouvé. Devant la polémique internationale déclenchée par cette initiative, les NIH avaient renoncé, sans que les règles du jeu de la brevetabilité aient été pour autant clarifiées.

Aujourd'hui Craig VENTER et ses associés ont l'intention de créer une banque de données sur le génome humain dont personne ne sait exactement quelles seront les conditions d'accès.

Par ailleurs, l'Office américain des brevets a accordé en mars 1999 à la société Incyte le premier brevet sur des marqueurs d'expression du génome (il s'agit de portions d'ARN messagers, molécules indispensables à l'expression des gènes, appelées " Expressed Sequence Tags " EST).

Or, la position des chercheurs publics est toute autre. Selon des accords internationaux issus des réunions des centres d'études du génome aux Bermudes, toute portion d'ADN séquencée à l'aide de fonds publics doit être publiée dans la littérature scientifique et diffusée rapidement sur Internet afin d'être disponible pour la communauté des chercheurs.

De plus, tout récemment, les cinq plus grands laboratoires publics de séquençage (Whitehead Institute, Washington University School of Medicine, Baylor College of Medicine, Joint Genome Institute, Sanger Centre) se sont engagés à rendre publics leurs résultats dans un délai de vingt-quatre heures : " Par cet effort majeur de financement public, nous permettons que les résultats restent dans le domaine public, en libre accès pour les chercheurs qui mettent au point les traitements du futur. C'est crucial pour en recueillir de manière efficace les vrais bénéfices médicaux " a indiqué Michael MORGAN, directeur du Wellcome Trust Genome Campus ^{8(
*
)} .

1.1.1.3. Les résultats déjà obtenus ou attendus et l'intérêt de ces résultats

1.1.1.3.1. Le génome humain

Bien que son séquençage complet ne soit pas réalisé, les chercheurs ont déjà identifié de très nombreux gènes impliqués dans les processus pathologiques. Il est très difficile d'en présenter une liste exhaustive. On ne peut que citer les découvertes les plus récentes :

Une équipe française vient de démontrer que le cancer du sein de type médullaire est une entité biologique dans laquelle on trouve 100 % de mutation du gène p 53, déjà suspecté précédemment d'avoir un rôle important dans le processus cancéreux.

L'unité de génétique des déficits sensoriels de l'Institut Pasteur vient de mettre en lumière le fait que plus de la moitié des surdités héréditaires de l'enfant sont dues à des mutations dans un gène unique, le DFNB1.

Aujourd'hui, on estime à 1 500 le nombre de gènes responsables de maladies strictement génétiques identifiés. Mais il est évident que des milliers d'autres gènes, en partie identifiés, sont impliqués dans des pathologies plus courantes (cancer, diabète, maladies cardio-vasculaires ou neurologiques).

Par exemple, au 1 ^er mars 1999, 487 gènes de maladies ont été localisés et 77 gènes de maladies ont été identifiés avec l'aide de l'AFM et/ou de Généthon.

Ces gènes se répartissent ainsi :

- Maladies neurologiques et psychiatriques	28 %
- Malformations congénitales Anomalies chromosomiques	13 %
- Maladies oculaires	11 %
- Maladies neuromusculaires	8 %
- Maladies métaboliques et endocriniennes	6 %
- Maladies systémiques	5 %
- Maladies cardiovasculaires	5 %
- Maladies dermatologiques	5 %
- Maladies ostéo-articulaires	4 %
- Surdité	4 %
- Maladies cancéreuses	4 %
- Maladies urogénitales	3 %
- Maladies de l'appareil digestif	3 %
- Maladies hématologiques	1 %

1.1.1.3.2. Le génome d'agents responsables de maladies

Si l'on excepte celui des très petits virus, le premier séquençage complet remonte à 1995. C'est celui d' Haemophilus influenzae (1,93 million de bases), suivi en 1996 par celui de Mycoplasma genitalium (9,58 millions de bases). Puis, à partir de 1996, ont été séquencés les génomes de :

- Mycoplasma pneumoniae (810 000 bases) ;

- Helicobacter pylori (1,66 million de bases), tenu depuis peu pour responsable de l'ulcère de l'estomac ;

- Escherichia coli (4,6 millions de bases) ;

- Borrelia burgdorferi (1,44 million de bases), agent pathogène de la maladie de Lyme ;

- Mycobacterium tuberculosis ou bacille de Koch. Le génome de ce bacille, composé de 4,41 millions de bases formant 4 000 gènes, a fini d'être séquencé en juin 1998 par une équipe de 42 chercheurs dirigés par le Professeur Stewart COLE, chef de l'unité de génétique moléculaire à l'Institut Pasteur de Paris et par Bart BASSEL du Centre Sanger au Royaume-Uni.

On peut espérer d'autres découvertes dans un avenir assez proche :

- Des biologistes américains ont réalisé la carte chromosomique de la bactérie responsable de la syphilis et vont commencer son séquençage.

- Les génomes d'agents pathogènes tels que Streptococcus pneumaniae (2,2 millions de bases) et Rickettsia prowazekii (1,1 million de bases) sont à l'étude, de même que ceux de Vibrio cholerae (2,5 millions de bases), responsable du choléra et Plasmodium falciparum , responsable du paludisme.

- Les génomes dont l'étude donnera des résultats un peu plus tard sont ceux d'agents pathogènes responsables de maladies malheureusement bien connues : Listeria monocytogènes , Candida albicans , Legionella pneumophila (maladie du légionnaire), Mycobacterium leprae (lèpre), Neisseria gonorrhoeae (gonococcie), Staphylococcus aureus (infections graves, notamment la septicémie), Trypanosoma brucei rhodosiense (maladie du sommeil) Yersinia pestis (peste).

Les génomes des organismes eucaryotes ^{9(
*
)}

Là encore, il est impossible d'être exhaustif mais l'on peut citer notamment les séquençages sur lesquels travaille le Génoscope d'Évry :

- l' Arabidopsis thaliana (arabette, petite crucifère de la famille du colza et du chou) ;

- Le Tetraodon fluviatilis , un poisson à génome " compact " c'est-à-dire débarrassé de l'ADN " superflu " (non codant).

Il convient également d'évoquer la levure Saccharomyces cerevisae , le premier organisme eucaryote dont le génome ait été séquencé, en 1996, grâce à un programme international placé sous la responsabilité du professeur A. GOFFEAU de l'Université de Louvain en Belgique.

Enfin, il faut souligner l'importance exceptionnelle d'un récent succès : le séquençage du génome d'un animal a été achevé au début de l'année 1999 ; c'est celui du ver Caenorhabditis elegans .

Ses 97 millions de bases forment plus de 19 000 gènes dont 12 000 encore inconnus. Ce travail considérable a été réalisé par l'Université Washington de Saint-Louis et le Sanger Center du Royaume Uni.

L'intérêt de ces séquençages

En ce qui concerne les génomes des bactéries pathogènes, l'utilité de leur décryptage est évidente. Un exemple en a été fourni très récemment avec le séquençage du Mycobacterium tuberculosis ou bacille de Koch. La tuberculose connaît aujourd'hui une inquiétante recrudescence et tue chaque année plus de 3 millions de personnes dans le monde, les vaccins demeurant bien faibles devant la maladie. Or le séquençage du Mycobacterium tuberculosis a permis, en octobre 1998, à des chercheurs de l'unité de génétique mycobactérienne de l'Institut Pasteur de Paris d'identifier un gène responsable de la virulence du bacille de la tuberculose. Appelé erp , ce gène commande la production d'une protéine dont le bacille a besoin pour se multiplier dans les cellules qu'il infecte. Inactiver ce gène pourrait permettre d'atténuer la virulence du bacille et de produire de nouveaux vaccins, en particulier des vaccins vivants atténués.

D'une façon plus générale, il est certain que connaître l'ensemble des gènes et donc des protéines d'un organisme pathogène est un préalable indispensable à la compréhension des mécanismes pathologiques induits par ces espèces.

" Cette connaissance devient cruciale à l'heure où l'on assiste à une généralisation du phénomène de résistance aux antibiotiques et aux moyens de lutte contre les parasites. Il devient essentiel d'inaugurer de nouvelles voies de lutte contre les pathogènes. On peut même penser qu'en raison de leur extraordinaire capacité d'évolution, de nouvelles variétés insensibles aux nouveaux agents anti-pathogènes ne vont cesser d'apparaître en réponse à l'utilisation de ces agents. La connaissance du génome permettra néanmoins de connaître rapidement les changements clés chez ces variants et de prendre des mesures appropriées " ^{10(
*
)} .

- En ce qui concerne les génomes d'organismes eucaryotes, leur intérêt réside essentiellement dans les possibilités de comparaison avec le génome humain qu'ils offrent. L'utilité de génomes d'espèces utilisées comme modèles expérimentaux, comme la souris, dont la physiologie est proche de l'homme, est évidente. Mais les génomes d'organismes très éloignés de l'homme peuvent être très intéressants également.

Si l'on prend l'exemple de la levure Saccharomyces cerevisiae , on constate que certaines protéines humaines ont une séquence en acides aminés qui ressemble de façon significative à celle d'une protéine de levure : ces protéines sont " homologues ". Selon les scientifiques, près de 40 % des gènes connus pour être impliqués dans une maladie génétique humaine ont un homologue chez la levure ^{11(
*
)} . Mais l'on ignore souvent le rôle des protéines que codent ces gènes humains. La levure peut alors fournir une indication sur la fonction des protéines. Le schéma de recherche est le suivant : le gène responsable d'une maladie génétique humaine est identifié ; la fonction de la protéine qu'il code est inconnue ; un homologue du gène existe chez la levure ; on utilise alors la levure comme une " éprouvette biologique " car il est aisé de détruire ou remplacer un gène précis dans un organisme tel que la levure et cela permet de commencer à décrypter le rôle et le fonctionnement des gènes dont l'équivalent humain provoque une maladie génétique. Cette méthode a, par exemple, été utilisée pour étudier l'ataxie de Friedreich (maladie due à une dégénérescence des neurones entraînant des handicaps physiques graves et une cardiomyopathie).

De même, le séquençage du génome du Caenorhabditis elegans aura des conséquences importantes, toujours grâce au caractère homologue de nombreux gènes humains avec ceux d'espèces bien différentes ; grâce à des années de recherche intensive, la fonction de nombreux gènes du ver est déjà connue. Les possibilités d'études comparatives seront donc nombreuses.

En ce qui concerne le génome humain, l'utilité de son décryptage est évidente, ainsi que le rappelle le Professeur Jean WEISSENBACH.

" Plus de 6 000 maladies d'origine clairement génétique, conséquence d'un défaut au niveau d'un gène, ont été répertoriées à ce jour. Ces maladies génétiques souvent incurables sont cependant rares, elles affectent un nouveau-né sur 1 000 à 100 000, voire moins. Depuis une dizaine d'années, les gènes responsables des maladies génétiques les plus fréquentes sont progressivement identifiés.

Ils constituent le point de départ à une approche rationnelle de la thérapie. Cette identification est considérablement facilitée lorsqu'on dispose de la séquence de l'ADN de la région dans laquelle le gène a pu être localisé. Cette localisation, elle-même encore très laborieuse il y a quelques années, s'est considérablement améliorée grâce à la cartographie du génome humain, préalable indispensable au séquençage. À ce jour, près de 1 500 gènes responsables de maladies génétiques ont été identifiés.

À côté de ces maladies strictement génétiques, d'autres pathologies beaucoup plus communes comme le diabète, les maladies cardiovasculaires, neuropsychiatriques, etc., ont elles aussi une composante génétique dans leur origine en général complexe. La recherche des gènes prédisposant à ces pathologies fréquentes devrait permettre de disposer de nouvelles cibles pour les médicaments du futur. Ces gènes représentent donc des enjeux majeurs pour l'industrie pharmaceutique, et la plupart des grands groupes internationaux se sont lancés dans de grands programmes visant à identifier les facteurs génétiques prédisposant aux pathologies communes. Ces travaux n'ont pas encore abouti à des découvertes majeures mais la séquence complète du génome humain devrait aussi considérablement faciliter la recherche de ces gènes.

Le diagnostic de maladies et de prédispositions génétiques reposera lui aussi sur la séquence du génome. À ce jour, cette activité, qui a bénéficié de nombreux progrès technologiques, est déjà largement répandue. La connaissance de la séquence complète du génome va cependant provoquer une véritable explosion dans le domaine du diagnostic génétique dans le but d'orienter de manière beaucoup plus ciblée les traitements et éventuellement de mettre en place de nouveaux modes de prévention ^{12(
*
)} ".

CARTE DU GÉNOME HUMAIN

Localisation sur les chromosomes de certains gènes

dont les mutations, associées ou non à d'autres mutations et mécanismes, sont impliquées dans l'apparition, l'évolution et la gravité de certaines maladies

Chromosome 1

Cataracte congénitale

Maladie de Charcot (atrophie musculaire progressive)

Facteur rhésus

Surdité de perception dominante

Prédisposition au cancer du poumon à petites cellules

Glaucome primaire à angle ouvert (forme précoce)

Prédisposition au cancer de la prostate

Maladie d'Alzheimer

Urticaire familial au froid

Susceptibilité à la dyslexie

Chromosome 2

Glaucome congénital

Cancer du côlon (forme non polyposique)

Gène freinant la croissance musculaire

Prédisposition au diabète sucré insulino-dépendant

Cataracte congénitale dominante

Diabète sucré non insulino-dépendant

Cécité nocturne congénitale

Chromosome 3

Prédisposition à la schizophrénie

Cancer du côlon (forme non polyposique)

Cécité nocturne congénitale stationnaire

Cancer familial du rein

Maladie inflammatoire de l'intestin (maladie de Crohn)

Surdité de perception récessive

Alcaptonurie (première maladie métabolique décrite)

Obésité sévère

Intolérance au saccharose

Chromosome 4

Nanisme (forme achondroplasie, hypochondroplasie)

Chorée de Huntington (à partir de 40 ans, tremblements puis démence)

Surdité de perception dominante

Diabète (atrophie optique, surdité)

Prédisposition à l'alcoolisme

Psychose maniaco-dépressive

Prédisposition au psoriasis

Prédisposition familiale à la maladie de Parkinson

Chromosome 5

Déficit de l'attention et hyperactivité

Nanisme hypophysaire résistant à l'hormone de croissance

Facteur de prédisposition à la sclérose en plaques

Résistance aux corticoïdes (par défaut du récepteur)

Prédisposition à la schistosomiase

Perte progressive de l'audition

Chromosome 6

Prédisposition à la schizophrénie

Spondylarthrite ankylosante

Système HLA d'histocompatibilité ( Human Leucocyte Antigen )

Hémochromatose

Prédisposition à la sclérose en plaques

Susceptibilité à la dyslexie

Athérosclérose coronarienne

Chromosome 7

Cancer du côlon (non polyposique)

Nanisme hypophysaire

Surdité de perception dominante

Glioblastome multiforme (tumeur maligne du système nerveux central)

Maladie des os de verre (ostéogénèse imparfaite)

Autisme

Surdité de perception récessive

Mucoviscidose

Prédisposition à l'obésité

Prédisposition à la schizophrénie

Chromosome 8

Épilepsie précoce

Maladie de Werner (vieillissement prématuré de l'enfant)

Alopécie universelle héréditaire

Prédisposition à la schizophrénie

Prédisposition à l'épilepsie généralisée

Goitre

Convulsions néonatales familiales bénignes

Chromosome 9

Albinisme oculo-cutané

Mélanome cutané malin

Galactosémie (impossibilité pour les enfants de digérer le lait)

Hypomagnésémie

Hirsutisme

Système sanguin ABO

Intolérance au fructose

Chromosome 10

Fente labiopalatine

Épilepsie partielle avec manifestations auditives

Surdité de perception auditive

Vitiligo (dépigmentation locale de la peau)

Obésité sévère

Atrophie de la choraïde et de la rétine

Chromosome 11

Prédisposition au diabète sucré insulino-dépendant

Thalassémie-bêta (maladie de l'hémoglobine)

Drépanocytose (maladie du sang)

Aniridie (absence d'iris)

Surdité de perception dominante

Albinisme oculo-cutané

Hyperlipidémie complexe

Psychose maniaco-dépressive

Arythmie cardiaque

Chromosome 12

Prédisposition aux maladies inflammatoires de l'intestin

Rachitisme vitaminodépendant

Rachitisme vitaminorésistant (défaut dans le métabolisme de la vitamine D)

Hyperimmunoglobuline E et asthme

Diabète sucré non insulino-dépendant

Rougeur faciale à l'ingestion d'alcool

Phénylcétonurie (dépistée à la naissance par le test de Güthrie)

Chromosome 13

Surdité dominante

Surdité récessive

Dystrophie musculaire de l'enfant

Énurésie nocturne héréditaire

Cancer du sein à début précoce (gène BRCA2)

Rétinoblastome

Maladie de Wilson (ATPase transporteuse de cuivre entraînant une encéphalopathie)

Chromosome 14

Prédisposition à l'atopie (eczéma)

Surdité de perception (débutant après l'acquisition du langage)

Maladie d'Alzheimer

Prédisposition au diabète sucré insulino-dépendant

Hyperthyroïdie congénitale

Prédisposition à la sclérose en plaques

Emphysème, hépatite néonatale et cirrhose

Chromosome 15

Susceptibilité à la dyslexie

Albinisme oculo-cutané tyrosinase positif ( " pink eyed " )

Maladie de Marfan (membres longs et taille très haute avec altération du tissu conjonctif)

Athérosclérose coronarienne

Diabète sucré insulino-dépendant

Chromosome 16

Psychose maniaco-dépressive

Maladie périodique (fièvre méditerranéenne)

Thalassémie-alpha (maladie de l'hémoglobine)

Cataracte et microphtalmie

Cataracte polaire postérieure

Cataracte zonulaire dominante

Maladie inflammatoire de l'intestin (maladie de Crohn)

Hypertension (alcalose hypokaliémique)

Chromosome 17

Prédisposition au cancer du sein (gène BCCR)

Prédisposition à tous les cancers

Asthme sévère

Prédisposition au psoriasis

Désinhibition, démence et amyotrophie

Prédisposition au cancer du sein et de l'ovaire (gène BRCA1)

Prédisposition à la sclérose en plaques

Risque d'infarctus du myocarde

Nanisme hypophysaire

Diabète sucré non insulino-dépendant

Chromosome 18

Psychose maniaco-dépressive

Obésité précoce, cheveux roux

Myopie importante

Prédisposition à la sclérose en plaques

Prédisposition au diabète sucré insulino-dépendant

Cancer du côlon

Chromosome 19

Migraine hémiplégique

Diabète sucré non insulino-dépendant résistant à l'insuline

Hypercholestérolémie familiale (récepteur LDL)

Crises migraineuses avec aura et lésions cérébrales

Surdité de perception dominante

Maladie d'Alzheimer à début tardif

Athérosclérose coronarienne

Chromosome 20

Déterminant quantitatif de la stature

Insomnie, dysautonomie, forme héréditaire de la maladie de Creutzfeldt-Jakob

Diabète insulino-dépendant type tardif du sujet jeune

Déficit immunitaire combiné sévère (adénosine désaminase)

Épilepsie frontale nocturne dominante

Convulsions bénignes du nouveau-né

Chromosome 21

Maladie d'Alzheimer

Sclérose latérale amyotrophique (maladie touchant Stephan Hawking)

Psychose maniaco-dépressive

Syndrome de Down

Épilepsie myoclonique progressive

Chromosome 22

Cardiopathies congénitales

Syndrome de l'oeil de chat

Prédisposition à la schizophrénie

Autisme, retard mental

Malabsorption du glucose et du galactose

Chromosome X

Prédisposition à la schizophrénie

Maladie de Duchenne de Boulogne

Myopie

Goutte

Psychose maniaco-dépressive

Hémophilie type B (facteur X)

Cécité aux couleurs monochromatiques

Cécité aux couleurs (daltonisme), cécité au vert (deutéranopie)

Hémophilie A (facteur VIII)

41 gènes impliqués dans le retard mental lié à l'X

Chromosome Y

Facteur déterminant dans la régulation des gènes contrôlant le développement des testicules ; dysgénésie gonadique (femme XY)

Azoospermie

Documentation AFM.

Les thèmes associés à ce dossier

Page mise à jour le 3 avril 2023

Partager cette page