L'haplogroupe G1 du chromosome Y a de relative faible fréquence en Asie du sud-ouest avec un maximum dans la population Madiar du Kazakhstan, et son lieu d'origine reste incertain.

L'âge des branches du chromosome Y reste incertain du fait de l'écart important entre les taux de mutation évolutionnaire et généalogique des marqueurs Y-STRs. Les récents progrès du séquençage complet du chromosome Y permet maintenant d'estimer le taux de mutation des marqueurs SNPs et d'obtenir ainsi de meilleures estimations de l'âge de ces branches. Les résultats obtenus jusqu'ici ont estimé ce taux de mutation entre 0,6 et 1x10-9 par paire de bases et par an.

Oleg Balanovsky vient de publier un papier intitulé: Deep Phylogenetic Analysis of Haplogroup G1 Provides Estimates of SNP and STR Mutation Rates on the Human Y-Chromosome and Reveals Migrations of Iranic Speakers. Il a testé 5.346 individus appartenant à 27 populations eurasiennes et identifié parmi ceux-ci 367 échantillons appartenant à l'haplogroupe G1. Chacun de ces échantillons a ensuite été testé sur 17 marqueurs STR. Ensuite, parmi ces 367 échantillons, 19 ont été séquencés sur une bonne partie du chromosome Y à l'aide du test BIGY de la compagnie privée Family Tree DNA. Ceux-ci ont été sélectionnés afin de choisir chacun des principaux clusters identifiés.

La carte de la distribution géographique de la fréquence de l'haplogroupe G1 est présentée dans la figure ci-dessous:
2015_Balanovsky_Figure2.jpeg

Cet haplogroupe est répandu sur une large région qui s'étend de l'Italie à la Mongolie, incluant les steppes d'Asie Centrale et le plateau Irano-Arménien. Deux pics de fréquence apparaissent, l'un au nord du Kazakhstan (> 80%), et le second en Arménie (> 42%). Au Kazakhstan, l'haplogroupe G1 se retrouve essentiellement dans la tribu Argyn (environ 500.000 personnes). En Arménie, l'haplogroupe G1 est particulièrement fréquent chez les Hémichis (environ 150.000 personnes).

Un réseau a été construit à partir des haplotypes STR:
2015_Balanovsky_Figure3.jpeg

Quatre groupes sont mis en évidence: deux sont arméniens, un est Kazakh et le dernier est Bachkir. Le groupe Kazakh correspond à la tribu Argyn, les groupes Arméniens incluent de nombreux Hémichis, enfin le groupe Bachkir inclue la tribu Kangly. Certaines branches du réseau ont de hautes fréquences liées à un effet fondateur.

La diversité des haplotypes pour l'haplogroupe G1 varie de 92% en Iran à 0% en Mongolie. La carte de la diversité ci-dessous révèle un gradient qui décroit de l'ouest de l'Iran vers la partie orientale de l'Asie du sud-ouest.
2015_Balanovsky_Figure4.jpeg

Cette carte permet de supposer que la région d'origine de l'haplogroupe G1 est située à l'ouest du plateau Irano-Arménien.

Les 19 séquençages du chromosome Y ont permi d'identifier 766 SNPs dont 281 sont déjà connus. Deux échantillons indiens de l'haplogroupe G1 séquencés par le projet des 1000 génomes ont été rajoutés à l'analyse. L'arbre obtenu apparait dans la figure ci-dessous:
2015_Balanovsky_Figure5.jpeg

On retrouve les clusters Kazakh, Arméniens et Bachkir. Les deux échantillons indiens forment un autre cluster. Les échantillons Mongoles se rattachent au cluster Kazakh. Les groupes Arménien et Bachkir ont un ancêtre commun séparé des Kazakh. Ce schéma se rapproche du réseau obtenu à partir des haplotypes STR, sauf pour les Arméniens qui formaient 2 groupes dans le réseau des haplotypes STR, n'en forme plus qu'un dans l'arbre phylogénétique.

La tribu Argyn est supposée descendre d'un seul individu. Elle est composée maintenant de 12 clans. Bien qu'il n'y ait pas de preuve historique de l'existence réelle de Argyn, son arrière petit fils Karakhoja est un personnage historique connu pour être un ambassadeur du Khan Tokhtamych, dirigeant de la horde d'or de Tamerlan en 1405.

L'arbre génétique formé par les échantillons Kazakh de l'haplogroupe G1 ressemble beaucoup à l'arbre généalogique des différents clans de la tribu Argyn:
2015_Balanovsky_Figure6.jpeg

Considérant l'écart de temps entre Karakhoja qui avait 50 ans en 1405, et le présent (606 ans), on en déduit un taux de mutation de 0,77 10-9 par paire de bases et par an. Si, maintenant on prend en compte trois nouveaux échantillons qui se réclament descendant de Somdyk, frère de Karakhoja, on obtient un taux de mutation de 0,78 10-9 par paire de bases et par an. En appliquant la même méthode aux marqueurs STR, les auteurs ont obtenu un taux de mutation de 0,0022 par locus et par génération, voisin du taux généalogique, mais éloigné du taux évolutionnaire.

A partir de ces valeurs ont peut estimer l'âge de séparation des groupes Arménien et Bachkir à environ 8000 ans, et l'âge de tous les échantillons G1 sauf les Indiens à environ 10.500 ans.

L'expansion du groupe Arménien est daté de 1150 ans et correspond bien aux données historiques qui nous disent que les Hémichis sont originaires de l'entourage du Prince Shapuh Amatuni qui a émigré en l'an 791 depuis la Perse.

L'expansion du groupe Bachkir est daté du 15ème siècle. La tribu Kangly est originaire des Petchénègues vers le 8ème siècle avant de joindre les Bachkirs. Une expansion plus tardive pourrait être causée par des changements démographiques quand ils participèrent à la Horde d'Or au 14ème siècle, puis à l'état Russe au 16ème siècle.

Malgré la proximité géographique entre les Bachkirs et les Kazakhs, il n'y a pas de relation génétique entre ces deux groupes.