Les populations modernes parlant une langue turque représentent plus de 170 millions d'individus à travers l'Eurasie s'étalant en Europe de l'Est, au Moyen-Orient, au Nord du Caucase, en Asie Centrale, en Sibérie du Sud, au Nord de la Chine et au Nord-Est de la Sibérie. La variété des langues turques sur cette vaste étendue géographique reflète une divergence historique récente datée d'environ 2100 à 2300 ans. Les plus anciens systèmes politiques entre les 6ème et 9ème siècles étaient centrés sur une région située en Mongolie, le Nord de la Chine et le Sud de la Sibérie. Ainsi, cette région a souvent été considérée comme le lieu d'origine des migrations nomades turques.

Les études génétiques précédentes montrent que les peuples turcs d'Asie de l'Ouest (Anatoliens et Azéris) et de l'Est de l'Europe (Gagaouzes, Tatars, Tchouvaches et Bachkirs) sont généralement génétiquement similaires à leurs voisins géographiques non turcs. Cependant, en plus, ils montrent quelques haplogroupes mitochondriaux et du chromosome Y d'Asie de l'Est. Enfin les populations turques d'Asie Centrale (Kirghizes, Kazakhs, Ouzbeks et Turkmènes) partagent une grosse partie de leur gènes avec les peuples d'Asie de l'Est et de Sibérie.

Bayazit Yunusbayev vient de publier un papier intitulé: The Genetic Legacy of the Expansion of Turkic-Speaking Nomads across Eurasia. Il a séquencé 322 nouveaux échantillons appartenant à 38 populations Eurasiennes et les a ajouté à des données déjà publiées pour formé un ensemble de 1444 échantillons testés sur 515.841 marqueurs autosomaux. Les nouveaux échantillons appartiennent à des régions sous-représentées dans les publications précédentes. Les individus de langue turque sont indiqués en rouge dans la figure A ci-dessous. L'arbre linguistique turc est montré dans la figure B:
2015_Yunusbayev_Figure1.jpeg

Le programme ADMIXTURE a été utilisé pour explorer la structure génétique de ces échantillons. Le résultat obtenu pour le paramètre K=8 est donné dans la figure ci-dessous:
2015_Yunusbayev_Figure2.jpeg

Dans la figure ci-dessus, les populations turques sont indiquées en rouge. On voit que les populations Est Asiatiques ont deux composantes principales K6 et K8 respectivement en jaune clair et jaune foncé. Ces 2 composantes sont présentes principalement en Sibérie et en Asie de l'Est. En Eurasie Occidentale, on remarque que les populations turques appartiennent à 4 composantes principales K1, K2, K3 et K4 comme leurs voisins géographiques non turcs. En plus, les populations turques de la région Volga-Oural (Tchouvaches, Tatars et Bachkirs) possèdent également la composante K5 que l'on retrouve dans de fortes proportions dans des populations Sibériennes non turques parlant une langue Ouralique (Nganassanes et Nénètses). Cette composante K5 se retrouve également dans des populations Européennes parlant aussi une langue Ouralique (Maris, Oudmourtes et Komis). Enfin, dans la pluspart des cas, les populations turques possèdent une plus forte proportion des composantes K6 et K8 que leurs voisins non turques.

Les composantes K6 et K8 présentes dans les populations d'Eurasie Occidentales et les composantes K1, K2 et K3 présentes dans les populations de Sibérie peuvent être dues à des flux de gènes passés dans des directions opposées. Ces influx génétiques peuvent être testés à l'aide de la statistique f3. Ainsi f3(Population,A,B) a une valeur significativement négative si la Population est issue d'un mélange génétique entre les populations A et B. Le résultat de ces tests sur les échantillons de cette étude, montre que presque toutes les populations Ouest Eurasiennes turques (15 sur 16) ou leurs voisins non turcs (49 sur 61) sont issues d'un mélange entre des populations de Sibérie ou de l'Est de l'Asie. De la même façon toutes les populations Sibériennes turques ainsi que certaines populations Est Eurasiennes non turques (11 sur 27) montrent un mélange génétique entre des populations Ouest Eurasiennes.

Les auteurs ont ensuite étudié la distribution de longues séquences de chromosomes partagées entre les populations de cette étude. Ils ont ainsi observé une corrélation entre le taux de segments IBD (identical by descent) partagés entre les populations et leur distance géographique. Cette corrélation est probablement guidée par un modèle d'Isolation par la distance et de flux de gènes entre populations (voir le paragraphe précédent). Il y a ainsi une décroissance du partage de gènes dépendant de la longitude. Il y a cependant des populations qui s'éloignent de cette isolation par la distance. Par exemple, si l'on retire les échantillons turcs d'Eurasie Occidentale, on observe une meilleure corrélation en fonction de la distance.

Les auteurs ont ensuite calculé le partage de segments IBD pour les 12 populations turques occidentales et ont soustrait cette même statistique calculée pour leurs voisins géographiques. Ils ont ainsi mis en évidence un fort signal inhabituel de partage de segments IBD avec les populations de Sibérie du Sud, de Mongolie et de Sibérie du Nord-Est:
2015_Yunusbayev_Figure3.jpeg

La figure ci-dessus montre ce signal pour différentes tailles de segments IBD: 1 à 2 cM pour la figure A, 2 à 3 cM pour la figure B et 3 à 4 cM pour la figure C. Ce signal indique ainsi un flux de gènes récent de Sibérie vers l'Eurasie Occidentale.

D'après les preuves historiques, les migrations turques ont eu lieu entre le 5ème et le 16ème siècle. En prenant 30 ans par génération, cela correspond à des migrations qui ont eu lieu entre 20 et 53 générations. Les longueurs attendus de segments IBD hérités d'un ancêtre vivant à ces périodes varient de 2,5 cM et 0,94 cM. Ces données sont cohérentes avec le signal mis en évidence dans la figure ci-dessus. Les auteurs ont utilisé deux méthodes pour estimer la date de mélanges génétiques: ALDER et SPCO:
2015_Yunusbayev_Figure5.jpeg

Les résultats donnent des dates comprises entre le 5ème et le 17ème siècle en cohérence avec les preuves historiques. Cependant les deux méthodes donnent des estimations qui se superposent seulement partiellement et sont discordantes pour de nombreuses populations. Il semble que les dates obtenues avec la méthode ALDER soient plus proche de la réalité, alors que la méthode SPCO surestime ces dates. Ces résultats montrent que l'expansion turque en Eurasie Occidentale s'est déroulée en plusieurs vagues.

Un point important de cette étude est que deux des populations de la région d'origine de l'expansion turque sont de langue mongole. Ceci peut être expliqué de plusieurs façon. Par exemple, on peut supposer que les conquêtes Mongoles débutant au 13ème siècle, ont été accompagnées par des tribus turques et que cela a conduit à des mélanges génétiques entre turcs et mongoles. Une autre possibilité est qu'il est probable que les ancêtres des turcs et des mongoles étaient originaires de la même région et ont subi plusieurs épisodes de mélanges génétiques avant leurs expansions respectives. Cette seconde hypothèse est la plus probable.