La France a subi des migrations de population successives: arrivée des chasseurs-cueilleurs, des fermiers du Néolithique et des pasteurs des steppes. Ensuite, pendant l'âge du Fer, il y a eu les expansions celtiques suivies par l'intégration dans l'empire Romain, puis par les migrations Germaniques. La position de la France à l'extrême ouest de l'Europe en a fait une destination finale pour nombre de mouvement de populations mais également une étape vers les îles Britanniques et la péninsule Ibérique.
Géographiquement, la France est limitée par la Manche au nord, l'océan Atlantique à l'ouest, les Pyrénées et la mer Méditerranée au sud, les Alpes et le Rhin à l'est.
Une étude génétique précédente s'est focalisée sur l'ouest de la France alors qu'une ébauche de la présente étude a été réalisée en 2015.
Aude Saint Pierre et ses collègues viennent de publier un papier intitulé: The Genetic History of France. Ils ont étudié le génome de plus de 2000 français issus de deux cohortes: les trois cités (3C: 770 individus) et Suvimax (1414 individus).
Les auteurs ont d'abord utilisé le logiciel fineStructure pour étudier la structure génétique de la France. Le résultat a permis d'identifier 17 groupes pour la cohorte 3C et 27 groupes pour la cohorte Suvimax. Ces différents groupes sont fortement corrélés avec la géographie indiquant ainsi une structure génétique locale importante. L'axe principal de variation génétique est un axe nord/sud. Si on force les résultats pour obtenir seulement deux clusters génétique, on sépare le sud-ouest du reste de la France. A un niveau un peu plus fin, on obtient 6 clusters pour 3C et 7 clusters pour Suvimax. Dans la figure ci-dessous, SW correspond au groupe du sud-ouest, SO au sud, CTR au centre, NW au nord-ouest, NO au nord, SE au sud-est:
Le septième cluster pour Suvimax comprend un seul individu qui a été éliminé dans la suite de l'étude.
Le cluster du sud-est est identifié que pour la cohorte Suvimax qui a effectivement une meilleure couverture de cette région que le projet des trois cités. Les deux clusters les plus importants pour les deux cohortes sont ceux du centre et du nord qui restent largement intacts même lorsque on raffine le nombre de clusters à 17 et 27 pour les deux cohortes.
De manière intéressante les frontières de ces clusters génétiques suivent deux fleuves majeurs: la Loire et la Garonne. A une échelle plus fine la rivière Adour permet également de séparer les clusters du sud-ouest et du sud dans la cohorte 3C:
Dans les deux jeux de données, la plus forte différentiation génétique se trouve entre le cluster du sud-ouest et les autres.
Les résultats de l'analyse avec le logiciel ADMIXTURE permettent de confirmer les résultats obtenus avec fineStructure. Pour K=2, le groupe du sud-ouest montre une composante majoritaire bleu claire qui est beaucoup moins fréquente dans les autres groupes génétiques. Pour K=3, une troisième composante vert claire apparaît qui est majoritaire dans le nord et absente dans le sud-ouest pour la cohorte 3C. Dans la cohorte Suvimax cette troisième composante est majoritaire dans le groupe du sud-est. Pour K=6, les deux cohortes différencient essentiellement les groupes du sud-ouest et celui du nord-ouest:
Les auteurs ont ensuite utilisé le logiciel EEMS pour mettre en évidence d'éventuelles barrières génétiques:
Les deux cohortes identifient une barrière autour du sud-ouest de la France, mais aussi une barrière dans le nord-ouest et le long de la Loire. Enfin une autre barrière est identifiable dans le sud-est autour des Alpes et de la frontière Italienne.
Les auteurs ont étudié les segments IBD. Ils montrent une augmentation importante de la taille de la population effective dans les 150 dernières générations en France. Il y a cependant une décroissance visible entre les générations 22 et 12 (années 1300 à 1700) dont le début semble coïncider avec l'apparition de la peste noire au Moyen-Âge:
Les auteurs ont ensuite étudié les relations entre les clusters génétiques français et les populations Européennes voisines à l'aide des données du projet des 1000 génomes. Ainsi l'héritage Britannique est plus marqué dans le nord-ouest (Bretagne: 74%) et dans le nord de la France (63%). L'héritage italien contribue principalement au sud-est et l'héritage ibérique contribue essentiellement au sud-ouest.
Mise à jour
Ce papier a été définitivement publié en février 2020: The genetic history of France
16 réactions
1 De philippe - 25/07/2019, 10:22
Bonjour Bernard.
Tout d'abord, encore un grand merci pour votre travail de vulgarisation. Votre blog est devenu une référence sur le net pour les amateurs & autres amoureux de la génétique des populations.
Enfin Aude saint-Pierre & ses collègues ont publié une étude sur l'ensemble de la population!
Depuis le temps qu'on l'attendait...un grand merci à eux aussi.
J'ai été étonné par l'importance des clusters Nord & Centre qui, à eux deux, couvrent quasiment tout le territoire.
Dans le même registre, la composante bleue est quasiment partout présente, y compris dans le cluster Sud-Est, sauf dans le cluster Sud-Ouest au sud de l'Adour dans la SUVIMAX, aire géographique qui doit correspondre au Béarn.
Pratiquement, les Béarnais, ne sont-ils des Basques parlant une langue le Gascon?
Une chose que je n'ai pas comprise; pourquoi les auteurs mentionnent l'existence d'importantes barrières naturelles aux flux génétiques alors qu'ils évoquent aussi, en plus de l'isolation par la distance, des flux génétiques constants des voisins européens à travers le temps pour expliquer le pattern génétique de la population française?
Je ne comprends pas non plus comment on peut expliquer sur la base de migrations historiquement attestées les héritages anglais & ibériques.
D'après-vous Bernard, ces héritages anglais & ibérique ne reflètent-ils pas un substrat de peuplement commun ancien plutôt que des flux génétiques constants?
Sinon, je ne vois pas comment expliquer la surreprésentation de la composante anglaise dans 5 des 6 clusters, surtout dans celui du Sud-Est, par exemple, par des flux constants.
Quelque chose m'échappe peut-être?
2 De Bernard - 25/07/2019, 21:37
Bonjour Philippe,
Il faut se méfier de la figure 4 dans laquelle 100% de l'ascendance est issue des îles Britanniques, d'Italie et de la péninsule Ibérique: c'est effectivement complètement biaisé car cette analyse suppose qu'il n'y a pas d'ascendance locale à la France. Donc effectivement ce résultat ne reflète pas des flux de gènes venue de ces pays mais bien un substrat de peuplement commun de la France avec ces trois pays.
3 De Rivi - 26/07/2019, 12:19
Bonjour Bernard,
Comment faire correspondre ces données avec celles que nous possédons sur la part des trois grandes ascendances repérées dans les populations européennes (chasseurs cueilleurs de l'Ouest, fermiers néolithiques anatoliens et pasteurs des steppes) ? Merci
4 De Bernard - 26/07/2019, 17:49
Bonjour Rivi,
On ne peux pas car les auteurs n'ont pas décomposé les génomes français en fonction des trois ascendances anciennes
5 De Rivi - 26/07/2019, 23:02
C'est bien dommage, apparemment aucune étude n'a encore été menée pour déterminer la part de ces trois ascendances dans la population française, est-ce exact ?
Si oui pourquoi, les chercheurs français ont-ils des scrupules à réaliser à ce que tous leurs collègues européens ont déjà fait ?
Encore bravo pour votre passionnant blog
6 De Héron - 26/07/2019, 23:38
Bonjour Bernard,
Je suis très étonné par le faible nombre d'individus testés par départements. Quelle est la fiabilité des résultats ? Il y a t il une autre phase de tests prévue bientôt pour confirmation ?
7 De Bernard - 27/07/2019, 07:38
Non Rivi, tous les généticiens Européens n'ont pas décomposé le génome des individus de leur pays en fonction des trois ascendances ancestrales. Déjà peu de pays ont fait une étude équivalente à celle-ci et parmi les études réalisées, à ma connaissance seuls les italiens ont décomposé les génomes en fonction des anciennes ascendances ancestrales. En Grande-Bretagne ou dans la péninsule Ibérique, cela n'a pas été fait. Si vous avez des sources à me donner, n'hésitez pas...
8 De Bernard - 27/07/2019, 07:41
Bonjour Héron,
Dans cette étude française il y a 2184 échantillons. Dans l'étude Britannique il y en avait 2039, dans l'étude italienne 1616, dans l'étude ibérique 1413. Donc cette étude française est aussi fiable que celles des autres pays Européens.
9 De philippe - 27/07/2019, 11:49
Bonjour Bernard.
Que pensez-vous de l'échantillonnage? On peut lire, ici ou là, que le sampling est mauvais, qu'il ne garantit pas de l'origine géographique réelle des individus.
10 De Héron - 27/07/2019, 15:15
Certes, mais dans l'étude Britannique, les individus avaient leur grands parents nés au même endroit, ce n'est pas le cas pour l'étude française où un individu peut être né à Bordeaux et avoir tous ses grands parents nés à Strasbourg. Quand on connait la mobilité dans nos familles depuis l'après guerre...
11 De Bernard - 27/07/2019, 17:58
Les auteurs ont utilisé deux cohortes médicales pour réaliser leur étude et ont eu les informations disponibles dans ces cohortes et rien de plus. On peut effectivement critiqué le fait d'avoir seulement des informations sur la naissance des individus. Cependant le fait de mettre en, évidence des barrière génétiques comme la Loire, la Garonne ou l'Adour montre bien que cette étude n'a pas trop souffert de précision sur la localisation des échantillons. Sinon les auteurs n'auraient pas mis en évidence des sous-structure à l'intérieur de la population française.
12 De Pradin - 28/07/2019, 16:20
Pour comprendre les bizarreries locales il ne faut pas regarder que l'évolution génétique, il faut en faire un complément à l'histoire. La France actuelle est une agglomération des territoires fort divers. On peut se souvenir que les frontières ont évolués jusqu'après la seconde guerre, que la Savoie n'est arrivée que sous Napo 3, que les anglais ont occupé l'Aquitaine pendant des siècles, ou qu'a l'inverse les rois de France ont été maîtres de Milan ou Barcelone.
Il y avait bien des frontières internes, mais si on se souvient de la Navarre, qui se souvient des principautés de Dombes, Orange, Sedan, et bien d'autres, bien réelles à une époque ?
On sait que les armées françaises, notamment sous Napoléon, ont beaucoup circulé dans toute l'europe et ont partiellement renouvelé la génétique...
Les enfants de là-bas sont tous français, ma mère, vu qu'on est tous les pères des enfants de là-bas, pouvaient dire certains grognards.
13 De Héron - 28/07/2019, 16:26
Ils ont eu beaucoup de chance alors de ne pas tomber sur des "faux locaux" dans les départements à faible représentation. Merci Bernard pour ces réponses et pour ce blog très utile.
14 De Coucou - 05/08/2019, 13:58
Le "sampling" de l'étude n'a probablement pas trop souffert de distorsions en lien avec le choix, quand même très léger, de se baser sur le seul lieu de naissance (la mobilité était déjà intense en France dans les années 40, du moins là où se trouvent aujourd'hui de grandes métropoles, comme Bordeaux, Nantes ou Marseille).
Maintenant, le choix de se baser sur les départements est lui-même assez contestable, quand on sait que les grandes frontières historiques, bien souvent, les transcendent.
On nous dira, ce sera pour une prochaine étude. Et il nous tarde ! Cette frontière de la Loire, par exemple, mérite d'être affinée sur les zones-tampons entre "Grand Sud" et "Grand Nord", comme les Mauges ou le Pays de Retz.
Par ailleurs, l'absence de PCA, avec des comparaisons avec des individus anciens, est quand même dommageable, on a l'impression d'un relatif archaïsme des études génétiques françaises.
15 De Gab - 19/09/2019, 14:32
Il y a au moins un apport majeur en terme de données génétiques sur la partie centre du pays (vu le nombre élevé de personnes étudiées dans cette zone, à une époque où la population était largement autochtone). Cela dit, que peut-on dire de ce cluster jaune? Est-il plus proche des résultats italiens, espagnols ou britanniques?
Cordialement,
Gab
16 De Docgianc - 11/09/2024, 16:44
Bonjour
Je vois que la Corse est exclue de cet article.
Les chercheurs français ou italiens ont-ils recherché l’origine des différents peuplements successifs depuis le néolithique sur cette île riche en sites archéologiques parfois très anciens ?
Merci