David Poznik vient de publier un papier intéressant à partir du séquençage complet du chromosomse Y de 69 individus: Sequencing Y Chromosomes Resolves Discrepancy in Time to Common Ancestor of Males Versus Females.

Le chromosome Y contient la plus longue branche d'ADN non recombiné dans le génome humain. C'est donc un outil puissant pour étudier l'histoire humaine. L'estimation du temps (TMRCA) où vivait le plus vieil ancêtre commun paternel connu calculé à partir du chromosome Y, varie d'un facteur 2 par rapport au TMRCA maternel calculé à partir de l'ADN mitochondrial. Le TMRCA paternel est estimé entre 50.000 et 115.000 et le TRMCA maternel est estimé entre 150.000 et 240.000 ans selon les sources. Cependant la qualité et la quantité des données disponibles varient fortement. Si le génome mitochondrial complet a été séquencé des milliers de fois, le séquençage complet du chromosome Y n'est possible que depuis très récemment. Les précedentes estimations du TMRCA paternel étaient faites à partir de courts segments, des microsatellites à mutation rapide ou des SNPs. Ces méthodes sous-estiment la diversité génétique et donc le TMRCA.

Dans cette étude, les auteurs ont séquencé complètement le chromosome Y de 69 individus appartenant à 9 populations: les San de Namibie, les pygmées Mbuti du Congo, les pygmées Baka et les Nzebi du Gabon, les berbères Mozabites d'Algérie, les Pashtuns du Pakistan, les Cambodgiens, les Yakuts de Sibérie et les Maya du Mexique.

La longueur du chromosome Y est de 59,36 millions de paires de base. Mais celle-ci comprend une bande d'hétérochromatine de 30 millions de paires de base, une centromère de 3 millions de paires de base, des régions pseudo-autosomale télomériques de longueurs respectives de 2,65 millions de paires de base et de 330.000 paires de base qui recombinent avec le chromosome X. La partie restante de 22,98 millions de paires de base sert de séquence de référence à l'étude du chromosome Y. Cependant une partie est mal adaptée à la méthode de séquençage si bien que seule une portion de 9,99 millions de paires de base a été utilisée dans cette étude. Un total de 11.640 variations a été détecté dans la portion étudiée. Seules 2293 (19,7%) sont présentes dans les bases de données de SNPs. Les haplogroupes ont été déterminés à partir de 390 SNPs (3,4%) identifiés par l'ISOGG. Les auteurs ont construit une arbre à maximum de vraisemblance à partir des 11.640 SNPs détectés en utilisant la méthode de Tamura-Nei:
2013 Poznik Figure 2

Les auteurs ont identifié une profondeur extraordinaire des branches africaines des San qui apparaissent peu après la racine de l'arbre. De plus deux régions avec des branches courtes correspondent à de rapides expansions: la sortie de l'Afrique à partir de F-M89 et les expansions Bantou néolithiques à partir de E-M2. De plus les auteurs ont identifié un nouveau SNP: M578 qui sépare l'haplogroupe G des haplogroupes HIJK.

Afin de comparer les TMRCA paternel et maternel, les auteurs ont estimé les taux de mutation du chromosome Y et mitochondrial par calibration de l'événement correspondant à l'entrée de l'homme moderne dans les Amériques. L'archéologie indique que cet événement a eu lieu il y a environ 15.000 ans via une migration côtière rapide. Les deux haplogroupes du chromosome Y: Q-M3 et Q-L54*(xM3) ont probablement divergé à cette époque. Le taux de mutation du chromosme Y est ainsi estimé à 0,82 10-9 mutation par paire de base et par an. Comme point de comparaison une deuxième calibration basée sur la sortie de l'Afrique estimée à environ 50.000 ans conduit à une valeur équivalente. Une méthode équivalente a été utilisée en faisant un séquençage complet de l'ADN mitochondrial des 69 individus auxquels on a ajouté 24 femmes issus de 7 populations. L'haplogroupe A2 de l'ADN mitochondrial a probablement divergé au moment de l'entrée des hommes modernes aux Amériques. le taux de mutation de l'ADN mitochondrial est ainsi estimé à 2,3 10-8 mutation par paire de base et par an. Ainsi le TMRCA paternel est estimé à environ 138.000 ans (entre 120.000 et 156.000 ans) et le TMRCA maternel est estimé à environ 124.000 ans (entre 99.000 et 148.000 ans). Ces valeurs sont donc sensiblement équivalentes.