Les Balkans et l'Anatolie sont souvent décris comme des régions périphériques de l'Europe et de l'Asie, plutôt que comme une région réunissant les deux continents. Iosif Lazaridis et ses collègues viennent de publier un papier intitulé: The genetic history of the Southern Arc: A bridge between West Asia and Europe dans lequel ils ont pris une vue différente en analysant l'histoire génétique de la région qu'ils appellent l'Arc sud centrée sur l'Anatolie et incluant l'Europe du sud-est: Balkans et région Égéenne et une partie de l'Asie de l'ouest: Arménie, Mésopotamie, Levant, Azerbaïdjan et Iran. Ils ont publié le génome de 777 individus de cette région qui ajoutés aux génomes préalablement publiés pour cette région forment un ensemble de 1317 échantillons répartis sur une durée de plus de 10.000 ans. Dans la figure ci-dessous les nouveaux génomes sont représentés par des disques jaunes et les anciens par des disques gris:

2022_Lazaridis1_Figure1A.jpg, août 2022

Les auteurs ont réalisé une Analyse en Composantes Principales:

2022_Lazaridis1_Figure1C.jpg, août 2022

Les auteurs ont ensuite utilisé cinq sources d'ascendance pour ces individus de l'Arc sud: les chasseurs-cueilleurs du Caucase (disques bleus ci-dessus), les chasseurs-cueilleurs d'Europe de l'Est (disques rouges), les chasseurs-cueilleurs des Balkans (disques roses), les fermiers d'Anatolie (disques jaunes) et les fermiers du Levant (disques oranges).

L'utilisation de ces cinq sources en Anatolie montre qu'avant 1000 av. JC., tous les individus sont composés d'ascendances locales: Anatolie, Levant et Caucase avec très peu d'ascendance Européenne. La tendance générale montre une augmentation des ascendances du Caucase et du Levant au cours du temps pendant le Néolithique et le Chalcolithique:

2022_Lazaridis1_Figure2.jpg, août 2022

Au début du Néolithique, la composante Anatolienne varie de 100% dans la région de Marmara à 16% dans le sud-est de l'Anatolie et en Mésopotamie alors que les composantes du Caucase et du Levant varient respectivement de 50% et 32% dans le nord de la Mésopotamie à 0% dans le nord-ouest de l'Anatolie.

Entre le Néolithique et le Chalcolithique, la composante du Caucase (CHG) augmente de 0 à 33% dans la région de Marmara, de 10 à 33% en Anatolie Centrale et jusqu'à 42% à l'Âge du Bronze. Les tendances sont identiques le long de la côte Méditerranéenne. Ces résultats suggèrent la diffusion de la composante du Caucase vers l'ouest durant cette période.

Cette tendance est inversée dans l'est de l'Anatolie avec une augmentation de la composante d'Anatolie du nord-ouest et une diminution de la composante du Caucase durant la même période. De manière générale l'Anatolie voit une homogénéisation génétique de ces populations durant le Chalcolithique et l'Âge du Bronze. Mais cette homogénéisation n'est pas complète car les régions orientales montrent toujours plus d'ascendance du Caucase que les régions occidentales.

Cette homogénéisation de l'Anatolie est couplée à une imperméabilité aux composantes Européennes qui restent absentes dans cette région.

Dans les steppes, la composante du Caucase apparaît dès 5000 av. JC. pour former les populations Énéolithiques de Khvalynsk et Progress-2 en s'ajoutant à la composante des chasseurs-cueilleurs d'Europe de l'est (EHG):

2022_Lazaridis1_Figure3.jpg, août 2022

Cependant toutes les populations des Steppes antérieures à 3000 av. JC. n'ont pas de composante Anatolienne à l'inverse des individus de l'Arc sud qui ont toutes cette composante dès le début du Néolithique. Cela montre que la composante du Caucase qui arrive dans les Steppes vers 5000 av. JC. est issue d'une région non encore étudiée.

A partir de 3000 av. JC. la population Yamnaya des steppes possède une proportion de composante Anatolienne (3%) et du Levant (3,5%). Cette arrivée de ces deux composantes dans les steppes ne peut pas prendre son origine en Europe, car en Europe toutes les populations possèdent une certaine proportion de composante des chasseurs-cueilleurs d'Europe de l'ouest. Or cette dernière est absente des populations Yamnaya. Ainsi, ces deux composantes ne peuvent venir que de la région de l'Arc sud où elles sont associées à la composante du Caucase. Les modélisations des auteurs montrent que le flux de gènes en provenance de l'Arc sud vers 3000 av. JC varie entre 21 et 26%. Ainsi la région des steppes a subi deux migrations en provenance de l'Arc sud. Une première vers 5000 av. JC qui voit l'apparition de la composante du Caucase et une seconde vers 3000 av. JC qui voit l'arrivée d'un mélange des composantes d'Anatolie, du Levant et du Caucase.

Les populations Yamnaya ont diffusé les composantes EHG et CHG en Europe. Cependant dans certaines régions la composante CHG est venue indépendamment des migrations venues des steppes notamment dans la région Égéenne, la Sicile mais aussi la péninsule Ibérique. Les populations Yamnaya ont environ la même proportion d'ascendance CHG que d'ascendance EHG. Il est ainsi possible d'identifier les populations Européennes qui possèdent plus d'ascendance CHG que d'EHG comme les anciens Minoens ou les anciens Mycéniens:

2022_Lazaridis1_Figure4.jpg, août 2022

L'Europe du sud-ouest a d'abord subi l'arrivée des fermiers venus d'Anatolie il y a 8500 ans, puis l'arrivée des pasteurs des steppes il y a environ 5000 ans. Si en Anatolie, l'Âge du Bronze correspond à une période d'homogénéisation génétique, en Europe du sud-est c'est une période de contrastes. Un des aspects de cet hétérogénéité est la rétention de la composante chasseurs-cueilleurs dans certaines populations des Balkans jusqu'à l'Âge du Bronze. Ainsi les individus du site Chalcolithique de Bodrogkeresztúr en Roumanie possèdent 12% d'ascendance chasseur-cueilleur et ceux des sites de l'Âge du Bronze de Cârlomăneşti, Ploiesti et Târgşoru Vechi entre 24 et 30%. Ces résultats suggèrent une préservation substantielle de cette ascendance dans le nord des Balkans après l'arrivée des fermiers d'Anatolie et des pasteurs des steppes. Cela contraste avec le sud des Balkans où aucune population du Néolithique ou de l'Âge du Bronze a autant d'ascendance chasseur-cueilleur. Cette hétérogénéité est notamment mise en évidence par la composante EHG qui peut être élevée dans certaines populations (31 à 44% en Moldavie à l'âge du bronze) et plus faible dans d'autres (4% chez les Mycéniens). Le logiciel DATES permet d'estimer la date de mélange génétique vers 2850 av. JC. ce qui suggère que l'ascendance des steppes arrive principalement en Europe de l'est avec les migrations Yamnaya.

L'Arménie est située sur les hauteurs d'Asie de l'ouest au sud du Caucase et à l'est de l'Anatolie. La composante CHG a toujours été importante dans cette région: 50 à 70% depuis 8000 ans. Comme en Anatolie les composantes des fermiers d'Anatolie et du Levant sont également importantes:

2022_Lazaridis1_Figure5.jpg, août 2022

Le point le plus intéressant concernant cette région est l'évolution de l'ascendance EHG. Elle apparaît il y a 6000 ans dans la grotte du Chalcolithique Areni-1 avant de disparaître il y a 5000 ans au début de l'âge du Bronze dans la culture Kura-Araxes. Elle réapparaît ensuite à l'Âge du Bronze Moyen (14%) et à la fin de l'Âge du Bronze et à l'Âge du Fer (10%) avant de se diluer à la période de l'Ourartou. De manière intéressante, à l'Âge du Bronze Moyen ou Final, les populations d'Arménie possèdent bien plus d'ascendance EHG que les autres régions d'Asie de l'ouest: Anatolie, Iran ou Levant. Ce résultat suggère qu'il y a eu des migrations en Arménie en provenance des steppes.

La première apparition de l'ascendance EHG en Arménie suit de peu l’apparition de la composante CHG dans les steppes. La seconde apparition date du milieu du troisième millénaire av. JC. en parallèle à sa diffusion en Europe.

L'analyse de l'haplogroupe R1b du chromosome Y est également informatif:

2022_Lazaridis1_Figure6.jpg, août 2022

La branche R1b-V1636 dont l'ancêtre commun date du 5ème millénaire av. JC., suggère des flux de gènes entre les steppes et l'Arc sud à la période Chalcolithique/Énéolithique. On la trouve dans le sud-est de la Turquie, en Arménie mais également dans les steppes à Progress-2 et Khvalynsk. De manière intéressante les individus de Turquie et d'Arménie ne possèdent pas d'ascendance EHG alors que celle-ci est maximale à Khvalynsk. Ces résultats suggèrent une origine de la branche R1b-V1636 au sud du Caucase. Cependant la date plus ancienne de cet haplogroupe au nord du Caucase peut laisser supposer une origine dans les steppes suivie d'une migration en Arménie avec une dilution de la composante EHG. De plus, les plus anciens individus de l'haplogroupe R1b-L389 appartiennent à la branche R1b-P297 et sont des chasseurs-cueilleurs de la région de Samara en Russie ou de la région Baltique. Ces individus n'ont pas d'ascendance CHG.

De plus une forte proportion d'individus d'Arménie ou du nord-ouest de l'Iran de l'Âge du Bronze appartiennent à l'haplogroupe R1b-M12149, une sous-clade de R1b-Z2103 renforçant le lien avec les populations Yamnaya. Certains de ces individus n'ont pas d'ascendance EHG suggérant une dilution de cette composante au cours du temps.

Les auteurs ont ensuite discuté des implications de ces résultats génétiques sur les différentes hypothèses de diffusion des langues Indo-européennes et Anatoliennes malgré le fait que les langues peuvent être changées dans certaines populations sans changement génétique, ou inversement des migrations importantes dans certaines régions peuvent ne pas être accompagnées par un changement linguistique.

Les résultats des études précédentes de génétique ont montré des migrations importantes depuis les steppes vers l'Europe Centrale et du Nord ou vers la Sibérie et l'Asie Centrale et du sud au début de l'Âge du Bronze suggérant une diffusion concomitante des langues Indo-européennes. Cependant cette étude ne permet pas d'établir une migration des steppes vers l'Anatolie à cause de l'absence de la composante EHG dans cette dernière région.

Les étude linguistiques ont montré que les langues Anatoliennes se sont séparées des autres langues Indo-européennes avant que ces dernières divergent. Cette étude a montré que la composante CHG s'est diffusée en Anatolie et dans les steppes au début du Chalcolithique bien qu'il soit difficile d'identifier pour le moment sa région d'origine. D'autre part une diffusion des steppes vers le sud du Caucase est également possible d'après l'analyse de l'haplgroupe R1b. Ces résultats suggèrent donc deux hypothèses de diffusion des langues Proto-indo-anatoliennes:

  • la population Proto-indo-anatolienne avait une forte proportion d'ascendance EHG et était située dans les steppes. Les migrations vers l'Anatolie n'ont pas ou peu laissé de trace génétique dans les populations.
  • la population Proto-indo-anatolienne était située en Asie de l'ouest ou dans le Caucase. Elle n'avait pas d'ascendance EHG, mais une forte proportion d'ascendance CHG. Elle s'est diffusée en Anatolie en provenance de l'est avec les langues Anatoliennes. Elle s'est également diffusée dans les steppes en provenance du sud pour former la population Proto-Indo-Européenne. Cette deuxième hypothèse colle davantage avec les résultats de génétique pour plusieurs raisons: la transformation génétique de l'Anatolie au Chalcolithique est une claire opportunité à la diffusion des langues Anatoliennes et leur coexistence avec la langue Hatti. Ensuite les deux transformations des populations des steppes au début de l'Énéolithique (arrivée de la composante CHG) et au début de l'âge du Bronze (arrivée de l'ascendance des fermiers d'Anatolie) coïncident avec des diffusions dans le sens sud vers le nord:


2022_Lazaridis1_Figure0.jpg, août 2022