Tableau 3.
Exemple du séquençage de J. Craig Venter, 62 ans, américain d’origine britannique en bonne santé : quelques données [42].
| Échantillon | Sang total Arbre généalogique présenté sur trois générations |
| Technique de séquençage | Méthode de Sanger (séquençage de novo) – lecture de 800 pb en moyenne |
| Méthode shotgun tout-génome | |
| Lecture de 32 millions de séquences (7,5 fois le génome humain) | |
| Résultat par alignement de séquences multiples | |
| Caryotype | Normal |
| Méthode de confirmation des SNP | Puces d’ADN Affymétrix Billes de génotypage Illumina |
| Méthode pour évaluer les variants du nombre de copies de gène, copy number variants (CNV) | Puces d’hybridation génomique comparative appelées aussi comparative genomic hybridization (CGH) |
| Nombre de gènes potentiels | 20 000–25 000 11 250 gènes de fonction connue (58 % des gènes) |
| Proportion de l’ADN codant pour un gène dans le génome | 2 % |
| Nombre de variants (polymorphismes SNP, microdélétions, microinsertions, insertions/délétions [indéls], inversions, duplications…) – étude d’haplotypes | 4 195 960 (dont 78 % SNP) dont 1 288 319 variants nouveaux, soit 12,3 Mb (référence utilisée : base de données du National Center for Biotechnology Information (NCBI) dont 62 % répertoriés dans la base de données de SNP, dbSNP) |
| Relation génotype/phénotype – Interprétation difficile (exemples) 44 % des gènes comprennent au moins un variant à l’état hétérozygote | Antécédents familiaux de maladie cardiovasculaire |
| Hétérozygote dans le gène Klotho (KL, Omim 604824) pour deux variants (F352V et C370S) associé à une diminution du risque cardiovasculaire | |
| Homozygote 5A/5A dans le promoteur du gène matrix metalloproteinase 3 (MMP3, Omim 185250) associé à une augmentation du risque d’infarctus du myocarde. | |
| Nombreux variants aux conséquences inconnues ou paradoxales (rôle des gènes modificateurs, de leurs produits et de l’environnement). | |
| Par exemple Délétion hétérozytoge de 4 pb du gène ACOX2 (Acyl-CoA oxidase 2, Omim 609751) créant une protéine anormale tronquée. Cette enzyme est impliquée dans le métabolisme lipidique. | |
| Génotype pour le gène lactase (LCT, Omim 603202) compatible avec une intolérance au lactose, non rapportée par le sujet. | |
| Difficultés principales | Séquençage des zones répétées |
| Alignement des séquences | |
| Confirmation des séquences variantes (notamment délétions, insertions, indéls) | |
| Incertitudes sur certains variants : nécessité de couvrir plus de sept fois le génome humain pour atteindre un taux d’exactitude du séquençage proche de 100 % (au moins, 20 fois idéalement) | |