Peter A. Underhill vient de publier un nouveau papier intitulé: The phylogenetic and geographic structure of Y-chromosome haplogroup R1a.

L'haplogroupe du chromosome Y: R se divise en deux composantes principales: R1-M173 et R2-M479. R1 se divise ensuite en deux groupes importants: R1a-M420 et R1b-M343. En Europe R1a est plus fréquent à l'est, alors que R1b est prédominant à l'ouest. Les études précédentes ont suggéré que cette division reflète l'expansion de populations à une période post-glaciaire notamment durant le néolithique. Plus de 10% des hommes habitant une région s'étendant de l'Asie du sud à la Scandinavie partage un ancêtre commun appartenant à l'haplogroupe R1a-M420. La majorité d'entre eux appartient à la sous-clade R1a-M198. La découverte des marqueurs Z93 et Z280 dans le projet des 1000 génomes a permis de diviser ces échantillons R1a en deux régions asiatique et européenne.

Cette étude a testé 16.244 hommes appartenant à 126 populations eurasiennes. 13 de ces échantillons appartenant à l'haplogroupe R ont été totalement séquencés sur 9,99 millions de paires de base sur le chromosome Y. Sur l'ensemble des échantillons, 2923 individus appartiennent à l'haplogroupe R1a-M420. Ceux-ci ont été ensuite testé pour les SNPs suivants: SRY10831.2, M17, M198, M417, Page7, Z282/S198, Z284/S221, M458, M558/CTS3607, Z93/S202, Z95, Z2125, M434, M560, M780, M582, M746, M204 et L657:
2014 Underhill Figure 1

La fréquence de R1a a été calculée pour toutes les populations. Sur les 2923 échantillons, 2893 appartiennent à la sous-clade: R1a-M417/Page7 (1693 sont européens et 1200 sont asiatiques). Parmi les séquences rares, il y a 24 R1a*-M420(xSRY10831.2), 6 R1a1*-SRY10831.2(xM198), et 12 R1a1a1-M417/Page7*(xZ282,Z93). Parmi les 1693 européens R1a-M417, plus de 96% appartiennent à la sous-clade: R1a-Z282. Parmi les 490 sud et centre asiatiques R1a-M417, plus de 98,4% appartiennent à la sous-clade R1a-Z93. Ces deux sous-clades se retrouvent parmi les 560 échantillons du Proche-Orient, du Moyen-Orient ou du Caucase.

La sous-clade européenne R1a-Z282 se répartit géographiquement de la façon suivante:
2014 Underhill Figure 2

La sous-clade R1a-Z282* se situe principalement au nord de l'Ukraine, en Biélorussie et en Russie. La sous-clade R1a-Z284 est confinée en Scandinavie. R1a-M458 et R1a-M558 ont une distribution similaire avec leurs plus hautes fréquences en Europe Centrale et de l'Est. Cependant R1a-M558 est présent dans la région Volga-Oural, contrairement à R1a-M458.

La sous-clade asiatique R1a-Z93 se répartit géographiquement de la façon suivante:
2014 Underhill Figure 3

La sous-clade R1a-Z93* est plus commune dans le sud de la Sibérie, dans la région de l'Altaï. La sous-clade R1a-Z2125 se retrouve au Kirghizstan et chez les Pashtuns d'Afghanistan, ainsi que dans des population du Caucase et de l'Iran. La sous-clade R1a-M780 se situe dans le sud de l'Asie: Inde, Pakistan, Afghanistan et dans l'Himalaya. On retrouve ce groupe également en Iran et chez les Roms de Croatie et Hongrie. Enfin la rare sous-clade R1a-M560 se retrouve chez 2 individus parlant le Burushaski dans le nord du Pakistan, 1 individu Hazara d'Afghanistan, et 1 individu Azeri iranien.

1335 échantillons R1a ont ensuite été testés sur 10 à 19 marqueurs STR. Un réseau a été construit pour les R1a-Z282 et les R1a-Z93. Cependant, peu de sous-structures ont été identifiées dans ces réseaux. Les plus faibles diversités apparaissent dans la sous-clade: R1a-Z93*, chez les juifs R1a-M582 et chez les Roms R1a-M780. Ces résultats sont consistants avec des effets fondateurs dans ces groupes.

Afin de déterminer l'origine de l'haplogroupe R1a, les auteurs ont identifié les populations hébergeant au moins une des sous-clades basales et possédant la plus forte diversité génétique. 6 populations remplissent ces critères, et parmi elles 5 sont situées en Iran. Ce qui fait de cette région l'origine probable de l'haplogroupe R1a.

Une analyse en composantes principales permet de différencier les groupes européens et asiatiques sur la première composante, et les groupes juifs (notamment ashkénazes) sur la seconde composante.

Le plus ancien échantillon R1a en Europe, testé jusqu'à maintenant, correspond à des individus de la culture cordée datés de 2600 av. JC. Les échantillons antérieurs du début du néolithique sont F* et G2a. Ceci suppose une rapide diffusion de l'haplogroupe R1a-Z282 en Europe au chalcolithique ou à l'âge du bronze ancien, de la rivière Volga jusqu'au Rhin. La diffusion équivalente de R1a au Moyen-Orient et en Asie du sud est plus obscure. Cependant la civilisation de l'Indus pourrait correspondre à cette période (voir notamment la répartition géographique de R1a-M780).

Pour évaluer le rôle potentiel de R1a dans ces deux événements archéologiques, les auteurs ont utilisé 2 approches pour estimer l'âge des ancêtres communs des différentes sous-clades de R1a. La première utilise les taux de mutations des marqueurs STR. Cependant les dates obtenues avec le taux généalogique sont largement sous-estimées. Les dates obtenues avec le taux de Zhivotovsky sont elles sur-estimées et doivent être considérées comme des bornes supérieures. La seconde approche est basée sur le séquençage complet du chromosome Y. Pour cela, 13 individus (8 R1a et 5 R1b) ont été testés, et 928 SNPs appartenant à l'arbre R1 ont été utilisés:
2014 Underhill Figure 5

Il n'y a pas encore de consensus sur le taux de mutations à utiliser pour un séquençage sur 9,99 millions de paires de bases. Cela varie de 1 mutation tous les 100 ans jusqu'à 1 mutation tous les 162 ans. En utilisant un taux de 1 mutation tous les 122 ans, les auteurs ont estimé la séparation entre R1a et R1b à environ 25.000 ans. L'âge de R1a-M417 est estimé à 5.800 ans. La forme de l'arbre obtenu pour R1a implique une rapide diffusion de cet haplogroupe.

En conclusion, les auteurs de cette étude estiment que l'haplogroupe R1a s'est diffusé à partir de l'Iran et de l'est de la Turquie il y a environ 5800 ans. Cela suppose une dispersion au chalcolithique ou à l'âge du bronze.