Située au centre de l'Europe occidentale, la France est un pont entre l'Europe du Nord et les espaces Méditerranéen et Ibérique. Cette position a fortement affecté l'histoire démographique de son territoire attestée par les nombreux peuples et cultures qui s'y installèrent: Grecs, Romains, Celtes, Germains, Musulmans, Magyars et Vikings. A la lumière de ce passé complexe, peu d'études génétiques de la France ont été réalisées. Une étude mitochondriale a été réalisée en 2007 par Richard et une étude autosomale a été réalisée sur l'ouest de la France en 2015 par Karakachoff.

Simone Andrea Biagini et ses collègues viennent de publier un papier intitulé: Reshaping the Hexagone: the genetic landscape of modern France. Ils ont testé le génome de 331 individus de différents départements de la France, dont seulement 276 ont donné des résultats. Les auteurs ont utilisé également 79 échantillons supplémentaires d'une étude préalablement publiée en 2016 par Lazaridis et al., et 60 échantillons non encore publiés localisés dans le pays Basque et la région Franco-Cantabre. Cependant 20 individus considérés comme des outliers ont été écartés, conduisant à un total de 395 échantillons utilisés pour cette étude, répartis sur 20 départements. Dans la figure ci-dessous les points bleus correspondent aux échantillons testés dans le cadre de cette étude, les points jaunes aux échantillons de l'étude de Lazaridis et les points rouges aux échantillons non publiés:
2019_Biagini2_Figure1.jpg

Pour des besoins de comparaison avec les populations voisines, les auteurs ont utilisé 218 échantillons d'Allemagne, de Norvège, d'Espagne, d'Italie, d'Angleterre, d'Irlande et d’Écosse, ainsi que 107 échantillons supplémentaires d'Espagne et 8 échantillons supplémentaires d'Italie.

Les auteurs ont réalisé une Analyse en Composantes Principales avec les échantillons Français (Figure A ci-dessous). La première composante sépare deux groupes principaux constitués par les échantillons Basques (en noir à droite) d'une part et les autres échantillons (à gauche) d'autre part, reliés par un pont formé par les échantillons de la région Franco-Cantabre en orange:
2019_Biagini2_Figure2.jpg

Dans la figure B, les auteurs ont supprimé les échantillons Basques et Franco-Cantabres. Dans cette figure les échantillons de la région Bretagne (en rouge à gauche) se séparent des autres.

Les auteurs ont ensuite réalisé une analyse de la distance génétique Fst. La plus grande distance estimée se trouve entre les individus Basques et Franco-Cantabres et les individus de Bretagne. Ensuite la plus grande distance sépare les bretons des individus du sud-est de la France. Ces résultats sont illustrés par une analyse multi-échelles basée sur la distance génétique. Dans la figure ci-dessous, le schéma du haut sépare les Basques (en noir à gauche) des autres individus. Le schéma du bas est réalisé sans les Basques et Franco-Cantabres. Il sépare les Bretons (en rouge à droite) des autres individus:
2019_Biagini2_FigureS5.jpg

Les auteurs ont réalisé une analyse EEMS pour visualiser les motifs de diversité et les barrières génétiques. Il y a ainsi plus de migrations dans le nord de la France que dans les autres régions et beaucoup moins dans l'ouest:
2019_Biagini2_Figure3.jpg

Les auteurs ont ensuite comparé les génomes Français avec celui des individus des pays voisins. Les Bretons ont beaucoup d'affinité génétique avec les individus des îles Britanniques. Cela se voit notamment sur l'analyse avec le logiciel ADMIXTURE.

L'utilisation de la statistique f3 montre d'autre part que de nombreux Français sont issus d'un mélange génétique entre des Irlandais et des Italiens du sud.

Les auteurs ont ensuite analyser les partages d'allèles entre individus de départements différents à l'aide du logiciel fineStructure. Les auteurs ont ainsi mis en évidence au moins quatre groupes différents. D'une part les individus de la région Franco-Cantabre se séparent en deux groupes: les locuteurs du Basque et les autres. Les Bretons forment un autre groupe à part, et les individus du nord et du nord-est forment encore un autre groupe.

Les auteurs ont refait la même analyse avec le logiciel fineStructure en incluant les individus d'autres pays d'Europe. Ils ont obtenus ainsi 35 groupes distincts dont 11 situés en France. Les auteurs ont supprimé trois groupes parmi ces 11 car ils incluent très peu d'individus. Il reste ainsi huit groupes qui correspondent à différentes régions de France:
2019_Biagini2_FigureS10.jpg

Les auteurs ont ensuite fait une analyse avec le logiciel GlobeTrotter basée sur les huit groupes identifiés ci-dessus. La figure ci-dessous donne ainsi les profils d'ascendance pour chacun de ces groupes. Toutes les nuances de rose donnent les proportions des différentes ascendances françaises, et les autres couleurs donnent les proportions d'ascendances externes:
2019_Biagini2_Figure5.jpg

Ainsi les groupes du sud-ouest reçoivent plus d'ascendance venue d'Espagne et le groupe de Bretagne reçoit une forte ascendance venue d'Irlande et d’Écosse. Le groupe du nord reçoit une forte ascendance de Grande Bretagne. Le groupe du nord-est reçoit des ascendances d'Europe centrale et de l'est et le groupe du sud-est une forte ascendance venue du nord de l'Italie et d'autres parties de la Méditerranée.

Le lien génétique de la Bretagne avec les îles Britanniques fait écho aux migrations historiques du 4ème siècle ainsi qu'aux migrations durant la guerre d'Irlande du 17ème siècle. On retrouve ce lien dans l'analyse avec la statistique f3 qui modélise de nombreux Français comme issus d'un mélange génétique entre des Irlandais et des Italiens du sud. Ce dernier lien est probablement relié aux diffusions des Grecs durant l'Âge du Fer qui a produit un mélange génétique entre une population Celte continentale avec des populations Méditerranéennes. Les autres influences externes correspondent probablement à des événements beaucoup plus récents comme la révolution industrielle du 19ème siècle ou la politique d'asile pour les populations soumises à des régimes répressifs au 20ème siècle.

Mise à jour

Ce papier a été définitivement publié en avril 2020: The place of metropolitan France in the European genomic landscape