La France a subi des migrations de population successives: arrivée des chasseurs-cueilleurs, des fermiers du Néolithique et des pasteurs des steppes. Ensuite, pendant l'âge du Fer, il y a eu les expansions celtiques suivies par l'intégration dans l'empire Romain, puis par les migrations Germaniques. La position de la France à l'extrême ouest de l'Europe en a fait une destination finale pour nombre de mouvement de populations mais également une étape vers les îles Britanniques et la péninsule Ibérique.

Géographiquement, la France est limitée par la Manche au nord, l'océan Atlantique à l'ouest, les Pyrénées et la mer Méditerranée au sud, les Alpes et le Rhin à l'est.

Une étude génétique précédente s'est focalisée sur l'ouest de la France alors qu'une ébauche de la présente étude a été réalisée en 2015.

Aude Saint Pierre et ses collègues viennent de publier un papier intitulé: The Genetic History of France. Ils ont étudié le génome de plus de 2000 français issus de deux cohortes: les trois cités (3C: 770 individus) et Suvimax (1414 individus).

Les auteurs ont d'abord utilisé le logiciel fineStructure pour étudier la structure génétique de la France. Le résultat a permis d'identifier 17 groupes pour la cohorte 3C et 27 groupes pour la cohorte Suvimax. Ces différents groupes sont fortement corrélés avec la géographie indiquant ainsi une structure génétique locale importante. L'axe principal de variation génétique est un axe nord/sud. Si on force les résultats pour obtenir seulement deux clusters génétique, on sépare le sud-ouest du reste de la France. A un niveau un peu plus fin, on obtient 6 clusters pour 3C et 7 clusters pour Suvimax. Dans la figure ci-dessous, SW correspond au groupe du sud-ouest, SO au sud, CTR au centre, NW au nord-ouest, NO au nord, SE au sud-est:
2019_StPierre_Figure1.jpg

Le septième cluster pour Suvimax comprend un seul individu qui a été éliminé dans la suite de l'étude.

Le cluster du sud-est est identifié que pour la cohorte Suvimax qui a effectivement une meilleure couverture de cette région que le projet des trois cités. Les deux clusters les plus importants pour les deux cohortes sont ceux du centre et du nord qui restent largement intacts même lorsque on raffine le nombre de clusters à 17 et 27 pour les deux cohortes.

De manière intéressante les frontières de ces clusters génétiques suivent deux fleuves majeurs: la Loire et la Garonne. A une échelle plus fine la rivière Adour permet également de séparer les clusters du sud-ouest et du sud dans la cohorte 3C:
2019_StPierre_Figure2.jpg

Dans les deux jeux de données, la plus forte différentiation génétique se trouve entre le cluster du sud-ouest et les autres.

Les résultats de l'analyse avec le logiciel ADMIXTURE permettent de confirmer les résultats obtenus avec fineStructure. Pour K=2, le groupe du sud-ouest montre une composante majoritaire bleu claire qui est beaucoup moins fréquente dans les autres groupes génétiques. Pour K=3, une troisième composante vert claire apparaît qui est majoritaire dans le nord et absente dans le sud-ouest pour la cohorte 3C. Dans la cohorte Suvimax cette troisième composante est majoritaire dans le groupe du sud-est. Pour K=6, les deux cohortes différencient essentiellement les groupes du sud-ouest et celui du nord-ouest:
2019_StPierre_FigureS6a.jpg 2019_StPierre_FigureS6b.jpg

Les auteurs ont ensuite utilisé le logiciel EEMS pour mettre en évidence d'éventuelles barrières génétiques:
2019_StPierre_Figure3.jpg

Les deux cohortes identifient une barrière autour du sud-ouest de la France, mais aussi une barrière dans le nord-ouest et le long de la Loire. Enfin une autre barrière est identifiable dans le sud-est autour des Alpes et de la frontière Italienne.

Les auteurs ont étudié les segments IBD. Ils montrent une augmentation importante de la taille de la population effective dans les 150 dernières générations en France. Il y a cependant une décroissance visible entre les générations 22 et 12 (années 1300 à 1700) dont le début semble coïncider avec l'apparition de la peste noire au Moyen-Âge:
2019_StPierre_FigureS10.jpg

Les auteurs ont ensuite étudié les relations entre les clusters génétiques français et les populations Européennes voisines à l'aide des données du projet des 1000 génomes. Ainsi l'héritage Britannique est plus marqué dans le nord-ouest (Bretagne: 74%) et dans le nord de la France (63%). L'héritage italien contribue principalement au sud-est et l'héritage ibérique contribue essentiellement au sud-ouest.