Généalogie génétique

Aller au contenu | Aller au menu | Aller à la recherche

Génétique des populations

Fil des billets - Fil des commentaires

samedi 20 mai 2017

Histoire génomique de la Sicile et de l'Italie du Sud

La mer Méditerranée a joué un rôle primordial dans les migrations humaines à partir du Levant et du Proche-Orient, notamment durant le Néolithique. Cependant des événements démographiques plus récents ont pu modifier la structure génétique des populations de Sicile et d'Italie du Sud, notamment dans les deux minorités ethnolinguistiques d'Italie: les Arberèches parlant Albanais et situés en Sicile dans la province de Palerme et en Calabre dans la province de Cosenza. Ils ont fui l'Albanie aux 15ème et 16ème siècles, suite à l'invasion Ottomane des Balkans. L'autre minorité est constituée des populations parlant le Grec dans la province de Lecce en Apulie et dans la province de Reggio Calabria en Calabre. Leur origine est incertaine: soit au temps des colonies Grecques, soit durant l'empire Byzantin.

Stefania Sarno et ses collègues viennent de publier un papier intitulé: Ancient and recent admixture layers in Sicily and Southern Italy trace multiple migration routes along the Mediterranean. Ils ont séquencé le génome de 511 échantillons appartenant à 23 populations différentes de Sicile, d'Italie du Sud, d'Albanie et de Grèce:
2017_Sarno_Figure1.jpg

Ces individus ont été comparés à un ensemble de 1469 échantillons issus de 68 populations contemporaines et à 263 anciens génomes. Les auteurs ont réalisé une Analyse en Composantes Principales et une analyse avec le logiciel ADMIXTURE. La figure A ci-dessous montre la PCA dans son ensemble et la figure B indique uniquement les populations Méditerranéennes étudiées dans ce papier:
2017_Sarno_Figure2.jpg

Les populations d'Italie du Sud et des Balkans se situent au centre de la PCA formant un pont ininterrompu entre les populations du Proche-Orient et du Caucase (à droite) et les populations Européennes (au centre). Notamment les populations d'Italie du Sud et de Sicile se regroupent avec les populations des Îles Méditerranéennes (Chypre, Crète, Îles de la mer Égée et Îles Anatoliennes). A l'inverse les populations de Grèce continentale et du Péloponnèse se regroupent avec les autres populations du Sud des Balkans: Albanie et Kosovo, et les populations du Nord des Balkans avec les populations Est Européennes.

L'analyse ADMIXTURE montre les populations étudiées comme un mélange de composantes issues de la région Méditerranéenne: Europe, Caucase, Sardaigne et Proche-Orient. Trois d'entre elles correspondent à d'anciennes populations Européennes: chasseurs-cueilleurs de l'Ouest, chasseurs-cueilleurs du Caucase et premiers fermiers d'Europe. Toutes les populations d'Italie du Sud, de Grèce et du Sud des Balkans montrent une majorité de composante premiers fermiers du Néolithique (en vert ci-dessous), suivie par la composante du Caucase (en jaune ci-dessous). La composante du Proche-Orient (en rouge ci-dessous) est plus importante chez les populations du Sud de l'Italie et des Îles Grecques, alors que la composante Européenne (en bleu ci-dessous) est plus présente chez les populations du Sud des Balkans:
2017_Sarno_FigureS2B.jpg

Les auteurs ont ensuite utilisé le logiciel fineStructure pour mettre en évidence des regroupements à l'intérieur des populations étudiées. Les meilleurs résultats sont obtenus pour un ensemble de 14 groupes:
2017_Sarno_Figure3.jpg

Ainsi la figure ci-dessus montre que les populations de Grèce continentale se regroupent entre elles (cluster bleu clair). Cette couleur est absente dans les populations des Îles Grecques et dans le sud de l'Italie sauf chez les Arberèches de Calabre. Les individus d'Italie du Sud, de Crète et des Îles Égées sont assignés à deux autres groupes. Le premier en vert clair est dominant en Sicile et en Calabre, mais également présent dans les îles Grecques. Le second en violet est présent en Apulie et en Sicile de l'ouest, mais aussi dans le Péloponnèse et dans les îles Grecques. Enfin, les population de Chypre et les grecs d'Italie possèdent leur propre cluster.

Les populations Albanaises d'Italie montrent un partage récent d'ascendances avec les populations des Balkans, mais aussi un échange de gènes avec les populations Italiennes qui les entourent. A l'inverses les populations Grecques d'Italie ne montrent pas de partage récent d'ascendances avec les populations Grecques continentales. Ils se rapprochent davantage des populations du Sud de l'Italie et des îles Grecques. L'arrivée de ces populations remontent donc à l'antiquité. Elles se sont ensuite mélangées génétiquement et culturellement avec les populations voisines dans le sud de l'Italie. De plus ces populations Grecques d'Italie ne présentent pas la composante du Sud des Balkans détectée en Grèce continentale, en Albanie et chez les Arberèches de Calabre (en bleu clair). Ainsi leur arrivée en Italie du Sud précède l'arrivée de cette composante dans les Balkans, probablement au début du Moyen-Âge.

Les auteurs ont ensuite utilisé le logiciel ADLER et la statistique f3 pour mettre en évidence des mélanges génétiques récents. Ainsi les populations des Balkans et du Sud de l'Italie ont vu l'arrivée de populations Européennes, il y a environ 3000 ans (Âge du Fer) et 1500 ans (début du Moyen-Âge). Ces derniers événement peuvent être reliés aux migrations Slaves du Moyen-Âge. La présence de la composante du Caucase dans les populations Méditerranéennes est cependant plus faible que dans les populations du Nord-Est de l'Europe, indiquant probablement une origine différente que celle des migrations Yamnaya. Les auteurs proposent des migrations spécifiques plus tardives, le long des côtes Méditerranéennes, et qui ont pu également apporté les langues Indo-Européennes dans la région.

vendredi 5 mai 2017

Dispersion et adaptation génétique des populations Bantoues en Afrique et en Amérique du Nord

Les preuves linguistiques et archéologiques montrent que les langues Bantoues se sont diffusées avec l'agriculture il y a entre 5000 et 4000 ans de l'Ouest de l'Afrique vers l'Est et le Sud.

Etienne Patin et ses collègues viennent de publier un papier intitulé: Dispersals and genetic adaptation of Bantu-speaking populations in Africa and North America. Ils ont séquencé le génome de 1318 individus issus de 35 populations Bantoues d'Afrique de l'Ouest qu'ils ont fusionnés avec le génome d'autres populations Africaines Bantoues ou non pour former un ensemble de 2055 échantillons issus de 57 populations différentes. Dans les figures ci-dessous, BSP (Bantu-speaking populations) est indiqué pour les populations Bantoues de l'Ouest (wBSP), de l'Est (eBSP), du Sud-Ouest (swBSP) et du Sud-Est (seBSP). RHG (Rainforest Hunter-Gatherer) est utilisé pour les chasseurs-cueilleurs des forêts de l'Ouest (wRHG) et de l'Est (eRHG):
2017_Patin_Figure1A.jpg

Les auteurs ont réalisé une analyse avec le logiciel ADMIXTURE:
2017_Patin_Figure1B.jpg

La figure ci-dessus, indique que toutes les populations Bantoues se regroupent entre elles, avec une majorité d'ascendance rouge. Cette homogénéité reflète la récente dispersion de ces populations en Afrique Sub-Saharienne. Elles possèdent de faibles proportions d'ascendance chasseur-cueilleur des forêts (16% en vert clair), Afro-asiatique (17% en rose), et chasseur-cueilleur San (23% en jaune pâle).

Le logiciel GLOBETROTTER a permis de mettre en évidence des événements de mélange génétique. Ainsi un mélange génétique a eu lieu il y a entre 1500 et 1000 ans, puis entre 400 et 150 ans entre des Bantous de l'Ouest d'Angola et des populations Afro-asiatiques d’Éthiopie (10%) (Figure A ci-dessous). En Afrique du Sud, un mélange génétique a eu lieu il y a environ 700 ans entre une population Bantoue d'Angola mais aussi de l'Est, et des chasseurs-cueilleurs San de Namibie (23%) (Figure B ci-dessous):
2017_Patin_Figure2.jpg

Il y a environ 800 ans un mélange génétique a eu lieu entre une population Bantoue de l'Ouest et des chasseurs-cueilleurs des forêts.

Ces données renforcent le modèle selon lequel l'expansion Bantoue s'est effectuée d'abord vers le sud depuis le lieu d'origine situé à la frontière entre le Nigeria et le Cameroun, jusqu'en Angola à travers la zone forestière, puis vers l'Est et vers le Sud en deux mouvements séparés.

Les auteurs ont ensuite recherché des signes de sélection naturelle durant la dispersion des populations Bantoues. Ils ont ainsi mis en évidence 8, 5 et 7 régions du génome présentant une forte sélection dans les populations Bantoues de l'Ouest, de l'Est et du Sud-Est respectivement:
2017_Patin_Figure3.jpg

Ainsi, les gènes HLA qui transmettent la réponse immunitaire, présentent les plus forts signaux de sélection. Ensuite le gène CD36 associé à la réponse à la malaria présente le second signal. Le gène LCT qui code la réaction au lactase présente un signal fort chez les populations Bantoues de l'Est.

Les auteurs ont ensuite estimé la contribution Bantoue dans la population Afro-Nord Américaine en analysant 5244 échantillons. Ainsi le logiciel ADMIXTURE estime que les Afro-Américains possèdent entre 73% et 78% d'ascendance Africaine dont 13% issue de Sénégambie, 7% de Côte d'Ivoire, 50% du Golfe du Bénin et 30% d'Afrique Centrale de l'Ouest:
2017_Patin_Figure4.jpg

mardi 25 avril 2017

L'héritage génétique des Zoroastriens d'Iran et d'Inde

Le Zoroastrisme est une religion de différentes tribus d'Iran et d'Inde du Nord, supposée fondée par le prophète Zarathoustra qui vivait autour de 1200 av. J.C. Cette religion est devenue la religion d'état de trois grand Empires Iraniens: les Achéménides entre 559 et 330 av. J.C., les Parthes entre 247 av. J.C. et 224 ap. J.C. et les Sassanides entre 224 et 651 ap. J.C. jusqu'aux conquêtes Arabes.

D'après la tradition, un groupe de Zoroastriens d'Iran a navigué vers les côtes de l'Inde du Nord pour échapper aux persécutions Musulmanes. Ils ont débarqué dans le Gujarat où ils ont pu s'installer et pratiquer leur religion. La date de cette arrivée est sujette à débat et varie entre 785 et 936 ap. J.C. Les Zoroasriens d'Inde (appelés Parsis) ont toujours gardé le contact avec les Zoroastriens d'Iran. Aujourd'hui, les communautés Zoroastriennes sont concentrées en Inde (61.000 individus), dans le Sud du Pakistan (1675 individus) et en Iran (14.000 individus). Cependant durant les 200 dernières années, des communautés se sont formées aux États-Unis (14.300), au Canada (6400), au Royaume-Uni (5000), en Australie (3808) et au Moyen-Orient (2030). Le Zoroastrisme est une religion non prosélyte avec une hérédité masculine chez les prêtres.

Saioa López et ses collègues viennent de publier un papier intitulé: The genetic legacy of Zoroastrianism in Iran and India: Insights into population structure, gene flow and selection. Ils ont analysé le génome de 526 hommes d'Inde, Iran, des Émirats Arabes Unis et du Royaume Uni. Ces données ont été comparées à différentes populations mondiales et à quelques génomes anciens d'Europe, d'Asie et d'Afrique.

Les auteurs ont réalisé une Analyse en Composantes Principales:
2017_Lopez_FigureS3.jpg

La plupart des Zoroastriens Iraniens (points vert clair) se regroupent avec les autres échantillons Iraniens (points vert). Les Parsis (points bleu clair) s'étirent le long de la composante PC1 entre les Iraniens et les échantillons Indiens (points bleu).

Le logiciel fineStructure permet de regrouper les échantillons Indiens et Iraniens en 51 groupes différents. Un de ces groupes comprend les 13 Parsis et un autre 27 des 29 Zoroastriens d'Iran plus un autre Iranien:
2017_Lopez_Figure1A.jpg

Les mesures de distance génétique montrent que les Zoroastriens sont fortement génétiquement différentiés des échantillons non Zoroastriens. Ces résultats indiquent une forte isolation génétique des groupes Zoroastriens. Cependant les Parsis montrent davantage de mélange génétique avec les groupes non Zoroastriens d'Inde.

Les analyses des haplogroupes mitochondriaux et du chromosome Y montrent également moins de diversité génétique chez les Zoroastriens que chez les non Zoroastriens.

L'analyse de la statistique f3 montre que les Parsis sont composés d'une ascendance Indienne et d'une ascendance proche des anciens Néolithiques d'Anatolie ou des populations actuelles du Proche-Orient. Par contre pour les Zoroastriens d'Iran, aucun mélange génétique n'est détecté.

L'analyse avec le logiciel GLOBETROTTER permet d'identifier un mélange génétique chez les Parsis entre une population actuelle d'Inde (30%) et une population actuelle d'Iran (70%) qui remonte entre 27 et 32 générations. Chez les Zoroastriens d'Iran un mélange génétique entre une population actuelle de Croatie ou de Chypre et une ancienne population Néolithique d'Iran et qui remonte à environ 66 générations, est détectée.

L'haplogroupe du chromosome Y principal chez les Zoroastriens (Iraniens ou Indiens) est J alors que chez les non Zoroastriens d'Inde et du Pakistan l'haplogroupe dominant est R. A l'inverse, tous les groupes d'Inde et du Pakistan ainsi que les Parsis ont un haplogroupe mitochondrial principal qui est M, différent des Zoraostriens d'Iran. Les Parsis sont très proches des Zoroastriens d'Iran concernant le chromosome Y, alors qu'ils en sont éloignés concernant l'ADN mitochondrial. Ainsi la contribution des Zoroastriens Iraniens aux Parsis est de 96% sur le chromosome Y, alors qu'il est seulement de 8% sur l'ADN mitochondrial. Ces résultats indiquent que la migration des Zoroastriens d'Iran vers l'Inde a été essentiellement composée d'hommes qui ont pris des femmes localement en Inde.

De plus, l'étude des haplogroupes du chromosome Y des prêtres Parsis montre qu'ils descendent de seulement deux ascendants fondateurs dont l'âge remonte à 37 (1036 ans environ) et 31 (868 ans environ) générations respectivement.

mercredi 29 mars 2017

Histoire génétique du sous-continent Indien

A la suite de la migration hors d'Afrique, l'Asie du Sud a probablement été l'un des premiers territoires colonisés par les hommes modernes. Ce point est conforté par la forte diversité génétique de cette région. Quoique les premiers fossiles humains remontent seulement entre 36.000 et 28.000 ans, les estimations génétiques et archéologiques suggèrent une arrivée de l'homme moderne il y a environ 50.000 ans, soit après l'éruption volcanique du mont Toba.

L'Inde est composé de différents groupes de populations associés à différentes religions et différentes langues. Les langues Indo-Européennes sont plus souvent parlées dans le Nord de l'Inde, le Pakistan et le Bangladesh. On suppose que leur arrivée dans la région remonte aux invasions Indo-Aryennes datées d'environ 3500 ans. Le Sud de l'Inde est dominé par les langues Dravidiennes souvent associées aux dispersions Néolithiques à partir de l'Asie du Sud-Ouest. De manière générale, l'Inde montre un haut niveau d'endogamie lié à des barrières sociales strictes et une dérive génétique importante consécutive à l'isolation de certaines de ces populations.

Marina Silva et ses collègues viennent de publier un papier intitulé: A genetic chronology for the Indian Subcontinent points to heavily sex-biased dispersals. Ils ont réuni les séquences complètes mitochondriales disponibles dans la littérature, le projet des 1000 génomes et le projet Human Genome Diversity, relatives aux populations d'Asie du Sud. Ils ont également analysé le génome complet à partir des données disponibles, ainsi que l'ADN du chromosome Y.

Les auteurs ont d'abord construit un arbre phylogéographique mitochondrial en se concentrant sur les lignages originaires d'Asie du Sud à partir de 1478 échantillons. Ils ont également estimé l'âge des principales sous-clades:

2017_Silva_Figure1.jpg

Il y a deux haplogroupes principaux en Asie du Sud: M et R. L'haplogroupe N reste lui rare dans la région. L'âge de M est estimé à environ 50.000 ans en Asie du Sud et l'âge de R à environ 64.500 ans. Les plus anciennes sous-clades de R sont plus fréquentes dans l'ouest et le sud de la région, supportant ainsi une route côtière sud de colonisation de l'Asie. La phylogéographie de l'haplogroupe M est plus complexe montrant à priori des âges équivalents dans les différentes régions de l'Asie du Sud. Cependant si les auteurs tiennent compte de l'origine probable de chaque sous-clade, l'âge de l'haplogroupe M dans l'ouest est plus ancien que dans les autres régions, supportant également une route côtière sud de colonisation de l'Asie. Ce résultat suggère des ré-expansions de certaines sous-clades de M à une date plus récente à l'intérieur du sous-continent Indien. Ainsi plusieurs branches: M38, M65, M45, M5b, M5c, M34, M57 et M33a montrent une diffusion autour de 38.000 ans. Ces résultats sont supportés par une analyse Bayesian Skyline Plots avec le logiciel BEAST qui montre un accroissement de la population effective portant l'haplogroupe M à cette période:
2017_Silva_FigureS1.jpg

La figure ci-dessus montre une seconde expansion autour de 12.000 ans correspondant au réchauffement climatique à la suite du Dernier Maximum Glaciaire. C'est le cas des sous-clades suivantes: M6a1a (11.4 ka), M18a (9.2 ka), M30d (12.1 ka), R8b1 (11.6 ka) et U2b2 (9.2 ka) à partir du Sud et de R30c + 373 (12.4 ka) à partir de l'Ouest.

L'analyse phylogéographique indique également que certaines clades arrivent en Asie du Sud en provenance du Proche-Orient autour de 21.000 ans: N1a1b1, pre-HV2, HV + 146!, HV + 9716, HV + 73!, pre-U1c, U1a1, J1d et une clade de T2. Autour de 12.000 ans, plusieurs clades arrivent d'Asie du Sud-Ouest: T2e2, T2 + 195 + 4225, W3a1 + 143, W3a1b, U1a3 + 10253, N1a2, U7a + 12373 et U7a3a + 6150. Ensuite plusieurs lignages mitochondriaux semblent arriver avec le Néolithique en provenance d'Anatolie, du Caucase ou d'Iran: K2a5 + 2831 + 189, HV14 + 150, H13a2a + 8952, K2a5 + 2831, X2 + 153! + 7109 et U1a3a ou d'Arabie Saoudite: R0a2 + 11152. A l'Âge du Bronze, il y a également l'arrivée de H29 + 9156 + 4689, R2a + 7142 et U1a1a2a.

Les auteurs ont ensuite analysé le génome complet de la population d'Asie du Sud avec le logiciel ADMIXTURE:
2017_Silva_Figure2a.jpg

La figure ci-dessus montre que les ascendances occidentales (en marron, jaune et bleu foncé) sont plus fréquentes dans l'Ouest de l'Asie du Sud notamment au Pakistan. La composante marron correspondant aux chasseurs-cueilleurs du Caucase (mais aussi au Mésolithique et Néolithique d'Iran) atteint ainsi 35% au Pakistan et dans le Gujarat. Cette composante correspond également à environ 50% de l'ascendance des pasteurs nomades de la culture Yamnaya des Steppes.

La composante jaune correspondant aux populations de la péninsule Arabique, se retrouve avec une proportion d'environ 15% chez certaines populations Musulmanes du Pakistan: Baloutches, Brahouis et Makranis.

Les auteurs ont également construit une Analyse en Composantes Principales:
2017_Silva_Figure2b.jpg

La figure ci-dessus montre que les populations d'Asie du Sud sont plus proches des populations d'Asie Centrale et du Caucase que des populations du Proche-Orient ou d'Arabie. Les populations Pakistanaises se retrouvent dans une position intermédiaire. L'analyse classique pour expliquer la structure génétique des populations d'Asie du Sud est de considérer qu'elle dérive de deux populations ancestrales: Ancient North Indians (ANI) et Ancient South Indians (ASI). La composante ANI (importante dans le Nord-Ouest) serait arrivée dans la région en deux vagues (Néolithique et Âge du Bronze). Les résultats mitochondriaux suggèrent que la réalité a été plus complexe avec au moins quatre vagues d'arrivée entre la Dernière Glaciation et l'Âge du Bronze.

Les résultats mitochondriaux montrent une proportion de lignages autochtones située entre 70 et 90%. Elle est supérieure à la proportion d'ascendance autosomale autochtone (entre la moitié et deux tiers). Les auteurs ont ensuite analysé les lignages paternels issus de l'ADN du chromosome Y. La proportion de lignages occidentaux se situe entre 50 et 90% selon les régions d'Asie du Sud:
2017_Silva_Figure3.jpg

La figure ci-dessus résume ces résultats pour différentes régions: Penjab (PJL), Gujarat (GIH), Telugu (ITU), Sri Lanka (STU) et Bengale (BEB). La figure b montre les proportions des différentes origines (Africaine en orange, Est Asiatique en gris, Occidentale en noir et autochtone en vert) pour les lignages maternels. La figure c montre les proportions pour les lignages paternels et la figure d pour les lignages autosomaux. De manière générale les lignages paternels occidentaux sont beaucoup plus fréquents que les lignages maternels occidentaux.

Ainsi les lignages maternels sont principalement autochtones à l'Asie du Sud et permettent de remonter à la première colonisation de la région par l'homme moderne il y a environ 55.000 ans. Ensuite plusieurs lignages mitochondriaux arrivent d'Asie du Sud-Ouest durant et après le Dernier Maximum Glaciaire. Ces mouvements ont dû commencer à contribuer à la proportion d'ANI dans la population d'Asie du Sud, au niveau génomique.

2017_Silva_Figure4.jpg

Les premiers sites Néolithiques de la vallée de l'Indus datent d'environ 9000 ans. De nombreux lignages mitochondriaux datent de cette période. Certaines hypothèses attribuent l'arrivée des langues Indo-Européennes à cette époque, bien que d'autres suggèrent plutôt l'arrivée des langues Dravidiennes. Ainsi l'hypothèse de la dispersion des langues Indo-Européennes la plus largement acceptée est celle des Steppes de l'Âge du Bronze. Elle a reçu des supports des dernières études d'ADN ancien sur les populations de la culture Yamnaya et les anciennes populations d'Europe. Une arrivée de tels migrants en Asie du Sud a probablement contribué à l'augmentation de la composante marron dans l'ADN autosomal. Les preuves archéologiques suggèrent que les descendants de la culture d'Andronovo et de la culture de Sintashta ont d'abord infiltré l'Asie Centrale (BMAC) avant d'entrer en contact avec la civilisation de l'Indus il y a environ 4000 à 3500 ans.

Notamment des analyses récentes du chromosome Y suggèrent que l'haplogroupe R1a s'est dispersé à la fois vers l'ouest et vers l'est en Eurasie à la fin du Néolithique et à l'Âge du Bronze. La clade R1a-M17 représente environ 17,5% des lignages paternels en Inde et montre de plus hautes fréquences dans les groupes Indo-Européens que dans les groupes Dravidiens. Notamment, l'âge des sous-clades R1a-Z93 et R1a-Z94 sont trop récents pour correspondre à l'arrivée du Néolithique:
2017_Silva_Figure5.jpg

De plus tous les individus des cultures Andronovo et Sintashta actuellement analysés appartiennent à l'haplogroupe R1a. Tous ces résultats suggèrent que l'haplogroupe R1a est le marqueur de la diffusion des Indo-Aryens en Asie du Sud. Ces résultats doivent cependant être validés par des test d'ADN ancien en Asie du Sud.

Les auteurs ont également mis en évidence que l'haplogroupe mitochondrial H2b semble également lié à la diffusion des Indo-Européens en Asie du Sud:
2017_Silva_Figure6.jpg

Cette clade est datée d'environ 6200 ans avec une probable origine en Europe de l'Est. Elle inclut notamment des individus Sud Asiatiques, ainsi que deux individus anciens des cultures Yamnaya et Srubnaya.

Finalement le schéma général du peuplement de l'Asie du Sud ressemble par certains côtés à celui de l'Europe avec plusieurs vagues de migrations au Paléolithique, au Mésolithique, au Néolithique et à l'Âge du Bronze. Ainsi l'haplogroupe R1b semble avoir joué le rôle en Europe de l'haplogroupe R1a en Asie du Sud avec une migration conduite principalement par des hommes porteurs des langues Indo-Européennes. Cependant l'influence sur l’Europe a été plus importante qu'en Asie du Sud avec une plus grande fréquence de l'haplogroupe R1b en Europe que celle de l'haplogroupe R1a en Asie du Sud et une plus grande influence des langues Indo-Européennes en Europe qu'en Asie du Sud.

mardi 14 mars 2017

Histoire génomique de la population du Péloponnèse

Le Péloponnèse a été peuplé par une série de migrations depuis des millénaires. Les premiers fermiers du Néolithique ont quitté l'Anatolie pour s'installer dans la péninsule vers 9000 av. JC. Plus tard les Mycéniens ont développé une civilisation de l'Âge du Bronze importante. Le débat reste ouvert pour savoir s'ils sont arrivés du Nord vers 2200 av. JC ou s'ils ont émergé des sociétés Néolithiques locales. Au début du premier millénaire av. JC, les Doriens ont envahi le Péloponnèse. Les quatorze siècles suivants ont été marqués par des changements suite à des guerres ou à des épidémies. Durant la période Médiévale, la migration des Slaves dans les Balkans a pu influencer le Péloponnèse. L'importance de cette influence fait débat depuis 170 ans lorsque l'historien Allemand Jacob Philipp Fallmerayer a présenté une théorie dans laquelle il suppose que la totalité de la population du Péloponnèse a été remplacée par des Slaves.

George Stamatoyannopoulos et ses collègues viennent de publier un papier intitulé: Genetics of the peloponnesean populations and the theory of extinction of the medieval peloponnesean Greeks. Ils ont analysé le génome de 241 individus du Péloponnèse:
2017_Stama_Figure1a.jpg

Les auteurs ont réalisé une Analyse en Composantes Principales:
2017_Stama_Figure1b.jpg

Les habitants de la Tsakonie se situent dans la partie en haut à gauche, alors que ceux de la péninsule de Mani dans le sud du Péloponnèse se situent à droite. Tous les autres habitants du Péloponnèse se regroupent ensemble, dans le bas de la figure. Les Tsakoniens sont la population du Péloponnèse la plus éloignée des autres. De plus ils parlent un dialecte d'origine Dorienne qui n'est pas compris par les autres populations du Péloponnèse.

L'analyse avec le logiciel ADMIXTURE confirme que les habitants de Tsakonie et de Mani se situent à part:
2017_Stama_Figure1e.jpg

L'analyse des segments IBD (Identity by descent) confirme l'existence d'une structure génétique dans la population du Péloponnèse. Ainsi les Maniots partagent plus de segments entre eux qu'avec les autres populations, de même que les Tsakoniens.

Les auteurs ont ensuite comparé la population du Péloponnèse (en rouge ci-dessous) à d'autres populations Européennes:
2017_Stama_Figure2a.jpg

La figure ci-dessus montre que les habitants du Péloponnèse sont proches des Siciliens (triangles verts) et des Italiens (carrés violets, disques bleu clair et carré noirs). L'analyse par réseau ci-dessous indique également qu'ils sont par contre éloignés des Slaves:
2017_Stama_Figure2c.jpg

Les habitants du Péloponnèse sont connectés aux populations du Proche-Orient via les Crétois et les habitants du Dodécanèse.

Une Analyse en Composantes Principales spécifique avec les populations Slaves, montrent que les habitants du Péloponnèse en sont très éloignés:
2017_Stama_Figure3a.jpg

Ces résultats vont à l'encontre de l'hypothèse de Fallmerayer qui proposait que la population du Péloponnèse a été remplacée par des tribus Slaves à l'époque Médiévale. L'ascendance Slave dans cette population varie de 0 (ches les Maniots) à 15% (chez les Messéniens). Il est cependant clair que des tribus Slaves ont bien séjourné dans le Péloponnèse, mais ils devaient être peu nombreux et ont été assimilés par la population locale.

lundi 20 février 2017

Histoire génétique des populations Sibériennes

L'histoire des populations Sibériennes est importante pour éclairer l'origine des populations Eurasiennes et Amérindiennes. La Sibérie est peuplée depuis des centaines de milliers d'années. En effet l'homme de Neandertal est identifié dans la région entre 260.000 et 40.000 ans. De plus, une nouvelle espèce: l'homme de Denisova a été détecté récemment en Sibérie. Les traces de l'homme moderne remontent à 45.000 ans dont notamment l'os découvert récemment à Ust’-Ishim, et qui a été séquencé. Il présente des traces d'ADN de Neandertal. D'autres anciens restes humains ont produit de l'ADN ancien comme le garçon de Mal’ta vieux de 24.000 ans et le Sibérien de Afontova Gora vieux de 17.000 ans. Les analyses ont montré que 42% de l'ascendance des Amérindiens était issu de cette ancienne population Nord Eurasienne.

Les populations actuelles de Sibérie montrent une forte diversité génétique et culturelle. Dans la région de l'Oural, elles parlent des langues Ouraliennes divisées en langues Ougriennes et Samoyèdes. Dans la région Centrale et Orientale, elles parlent des langues Altaïques divisées en langues Mongoles, Toungouses et Turques:
2017_Wong_FigureS1.jpg

Emily HM. Wong et ses collègues viennent de publier un papier intitulé: Reconstructing Genetic History of Siberian and Northeastern European Population. Ils ont séquencé le génome de 28 individus appartenant à 14 groupes ethniques de Sibérie et d'Europe de l'Est, ainsi que de 45 individus Mansi et 37 individus Khanty:
2017_Wong_Figure1a.jpg

Les auteurs ont comparé ces échantillons à 892 individus d'Asie, d'Europe, de Sibérie et Amérindiens en effectuant une analyse en composantes principales:
2017_Wong_Figure1b.jpg

La première composante permet de séparer les populations Européennes des populations Est Asiatiques. La seconde composante sépare les populations du Nord des populations du Sud.

Les auteurs ont ensuite utilisé le logiciel TreeMix:
2017_Wong_Figure2.jpg

Les populations de l'Ouest de la Sibérie: Khantys, Mansis et Nénètses apparaissent comme un groupe relié aux Européens, bien qu'ayant divergé précocement. De plus 43% de l'ascendance de ces populations est attribué aux Evenkis de Sibérie Orientale, et 38% de l'ascendance des Nénètses est issu des Evènes également de Sibérie Orientale. Ces résultats sont confirmés par la statistique D. Enfin 6% des populations de Sibérie Occidentale vient des Amérindiens. Ce résultat s'explique par un lignage Ancien Nord Eurasien (ANE) commun entre les Sibériens Occidentaux et les Amérindiens.

Ensuite les auteurs ont utilisé une méthode MSMC pour estimer les temps de divergence entre les différentes populations. Ainsi les résultats suggèrent que les populations de Sibérie Occidentale se sont séparées récemment il y a environ 4800 ans, donc après le mélange génétique avec les Evenkis estimés autour de 6800 ans. La séparation entre Français et les populations de l'Europe de l'Est remonte entre 7000 et 2300 ans.

Les Sibériens, les Amérindiens, les Est Asiatiques et les Kalmouks du bassin de la Volga en Russie, forment un groupe séparé. Ainsi les Bouriates, Iakoutes, Évènes, Evenkis et Altaïens forment une clade spécifique après leur divergence des Est Asiatiques il y a environ 8800 ans.

Les auteurs ont ensuite étudié les haplogroupes du chromosome Y et mitochondriaux à partir de 54 individus actuels et 8 anciens individus:
2017_Wong_Figure4a.jpg

La divergence la plus ancienne correspond à la séparation de l'haplogroupe A il y a environ 131.000 ans. Ensuite l'haplogroupe Africain E diverge il y a environ 69.000 ans, fournissant une limite supérieure à la date de l'Out Of Africa.

L'arbre mitochondrial montre que la plus ancienne divergence correspond à celle de l'haplogroupe L0 à une date voisine de 124.000 ans:
2017_Wong_Figure4b.jpg

Les trois premières divergences séparent des groupes Africains. Le plus récent est L2 daté d'environ 85.000 ans qui fournit là aussi une limite supérieure à l'Out Of Africa.

La divergence des haplogroupes Amérindiens est consistante avec la première colonisation des Amériques autour de 15.000 ans.

Les haplogroupes principaux Européens du chromosome Y sont I, J, R et N. Parmi ceux-ci, I est le plus ancien. Il diverge de sa clade sœur: J il y a environ 44.000 ans et se diffuse en Europe il y a au moins 29.000 ans. Ensuite K2 qui diverge de IJ, est ancestral à NO et à QR. L'ancien individu Ust’-Ishim est ancestral à la clade NO. L'haplogroupe Européen R se sépare en deux clades: R1a et R1b il y a environ 23.000 ans. R1b se retrouve principalement en Europe Occidentale, alors que R1a se retrouve en Europe de l'Est, mais aussi dans la région de l'Altaï et dans le Nord de l'Inde et au Pakistan. Ces derniers ont un ancêtre commun vieux de 5100 ans. L'haplogroupe du chromosome Y N s'étend de la Sibérie à l'Europe de l'Est, mais est le plus fréquent parmi les Iakoutes, les Nénètses et les Nganassanes. La divergence entre les haplogroupes N et O est estimée autour de 38.000 ans.

Les auteurs ont ensuite comparer les génomes Sibériens avec quinze ancien génomes. Notamment le logiciel TreeMix place l'individu de Ust’-Ishim avant la divergence entre Européen et Est Asiatiques. L'ancêtre commun aux Sibériens et aux Est Asiatiques reçoit 38% d'ADN de l'individu de Ust’-Ishim. Ces résultats sont confirmés par la statistique D. Les Amérindiens reçoivent 41% de leur ADN d'un lignage ANE représenté par les deux individus de Mal’ta et de Afontova Gora. De plus les groupes Sibériens Mansi et Nénètses se regroupent avec ces deux anciens individus. Ces résultats sont encore supportés par la statistique D. Les Mansis reçoivent 43% de leur ADN des Evenkis et des Evènes et 57% d'un lignage ANE. L'ancien individu du Groenland: Saqqaq vieux de 4000 ans est relié aussi bien aux Est Asiatiques et aux Sibériens Orientaux, notamment les Evènes. La statistique D montre également que les Mansis ont de l'ascendance issue des chasseurs-cueilleurs d'Europe de l'Est.

Les résultats de cette étude peuvent être résumé par la figure ci-dessous qui présente un modèle des dispersions des différentes populations Nord Eurasiennes:
2017_Wong_Figure8.jpg

Ce modèle indique que les hommes modernes ont quitté l'Afrique il y a environ 70.000 ans avant de diverger il y a environ 45.000 ans entre l'Europe et l'Asie Orientale. Notamment les Sibériens Orientaux ont divergé des Est Asiatiques il y a environ 10.000 ans. D'autre part, il y a un lien génétique entre les anciens Sibériens de Mal'ta et les Amérindiens, mais aussi avec les Sibériens Occidentaux comme les Mansis et les chasseurs-cueilleurs d'Europe de l'Est. Il faut noter également que les anciens Yamnayas ont une plus grande affinité ANE que les Mansis, mais également une plus grande affinité génétique avec les Mansis qu'avec les Européens Occidentaux, ou les Sibériens Orientaux. Cependant le flux de gènes de Sibérie Occidentale en Europe de l'Est prédate la culture Yamnaya puisque les chasseurs-cueilleurs d'Europe de l'Est ont déjà cette affinité génétique de Sibérie Occidentale.

jeudi 9 février 2017

Histoire génomique du peuple Gond en Inde

Le paysage linguistique de l'Inde est composé de quatre familles principales et quelques isolats. La majorité de la population parle une langue Indo-Européenne qui couvre principalement le Nord et l'Ouest de l'Inde. Les langues Dravidiennes sont parlées surtout dans le Sud de l'Inde avec quelques exceptions: les Brahouis du Pakistan, les Kurukh–Malto dans l'Est de l'Inde et les Gonds dans le centre de l'Inde. Les langues Austro-asiatiques sont dispersées principalement dans le centre et l'est de l'Inde. Enfin les Tibéto-Birmans sont localisés près de l'Himalaya et dans le Nord-Est de l'Inde.

De manière générale, les études génétiques précédentes ont montré que l'ascendance génétique des peuples Austro-asiatiques et Tibéto-Birmans était fortement corrélée avec la distance linguistique, alors que l'ascendance génétique des peuples Indo-Européens et Dravidiens était corrélée avec la distance géographique.

La région Centre-Est de l'Inde présente trois groupes linguistiques différents. Elle abrite plus de 30% des populations tribales de l'Asie du Sud, dont certaines pratiquent encore la chasse et la cueillette. Des études précédentes ont montré des changements de langues dans certaines populations sans modification de leur composition génétique. Le peuple Gond représente la tribu la plus nombreuse de cette région avec plus de 12 millions d'individus. Ils sont situés principalement dans l'Est du Centre de l'Inde. Ils parlent différentes langues de la famille Dravidienne: Gondi, Konda, Kui, Kuvi, Pengo et Manda.

Gyaneshwer Chaubey et ses collègues viennent de publier un papier intitulé: Reconstructing the population history of the largest tribe of India: the Dravidian speaking Gond. Ils ont analysé le génome de 18 individus Gonds situés dans quatre localités différentes des états Indiens suivants: Madhya Pradesh, Chhattisgarh et Uttar Pradesh:
2017_Chaubey_FigureS1.jpg

Ils ont été comparés à différentes populations Eurasiennes. Les auteurs ont réalisé une Analyse en Composantes Principales. La figure ci-dessous montre une direction principale entre les Européens et les Dravidiens avec les Pakistanais et les Indiens Indo-Européens situés entre les deux extrémités:
2017_Chaubey_Figure1a.jpg

Les Gonds se situent en dehors de cette direction principale, décalés vers les Est Asiatiques. Ils se situent notamment proche des Indiens Austro-asiatiques. Le groupe Transitionnal correspond aux populations Indiennes dont on sait qu'elles ont changé de langues récemment.

Ensuite les auteurs ont réalisé une analyse avec le logiciel ADMIXTURE. Le meilleur résultat est obtenu pour le paramètre K=9:
2017_Chaubey_Figure1b.jpg

La composante k4 vert foncé est majoritaire chez les Gonds. La composante k7 vert clair est négligeable chez les Gonds par rapport aux Indiens Indo-Européens et Dravidiens. Les Gonds sont plutôt similaires aux Indiens Nord Mundas qui parlent une langue Austro-asiatique.

Les auteurs ont ensuite utilisé le logiciel fineSTRUCTURE pour mieux comprendre le partage de gènes entre les Gonds et les autres populations Indiennes. La figure ci-dessous indique ainsi le nombre de segments d'ADN partagés avec les Gonds:
2017_Chaubey_Figure2a.jpg

Comme attendu, les Gonds reçoivent plus de segments d'ADN des populations Sud Asiatiques et parmi celles-ci, ils en reçoivent le plus des Mundas Austro-asiatiques et des populations Transitional.

Ces résultats sont confirmés par les statistiques f3 et D. Cependant le nombre de segments d'ADN issus des populations Sud Munda est plus faible que le nombre de segments issus des populations Nord Munda, ce qui suggère une identité spécifique des Gonds. Le niveau de flux de gènes entre Gonds et Mundas est cependant plus faible que le niveau de flux de gènes entre populations Nord et Sud Mundas.

Enfin les auteurs ont utilisé le logiciel TreeMix pour évaluer l'affinité génétique des Gonds avec les autres populations Indiennes. Les Gonds se regroupent avec les populations Austro-asiatiques de l'Ouest. Cependant différents flux de gènes sont révélés entre populations de la région du Centre Est de l'Inde. Ainsi les effets de la géographie, de la langue ou de l'ethnicité qui jouent un rôle majeur dans d'autres régions de l'Inde, sont minimisés dans cette région qui a servi d'aire marginale de rencontre entre différentes populations.

Tous ces résultats pointent vers un changement de langues des populations Gonds de l'Austro-asiatique vers le Dravidien, suite à un contact avec une population probablement moins nombreuse mais plus développée technologiquement.

mercredi 8 février 2017

Histoire génomique des Brahouis du Pakistan

Le Pakistan se situe en Asie du Sud et représente environ 10% de la population de cette région caractérisée par de multiples groupes ethniques et linguistiques. On suppose que les premiers hommes modernes y sont entrés à la suite de leur première expansion hors d'Afrique il y a entre 70.000 et 50.000 ans. Il y a environ 9000 ans ont émergé les premières cités Néolithiques de la culture de Harappa. Depuis, la région a subi plusieurs vagues de migration qui ont influencé le motif génétique des populations actuelles.

Les première études génétiques au Pakistan ont montré que les affinités génétiques entre groupes sont davantage corrélées avec la distance géographique qu'avec l'origine linguistique. Une exception notable est celle de la population Kalash qui semble reliée à des chasseurs-cueilleurs de Sibérie.

Les langues Indo-Européennes prédominent au Pakistan à côté d'un isolat linguistique: le Bourouchaski, plusieurs groupes Tibéto-Birmans et un groupe Dravidien: les Brahouis. Ce groupe est entouré géographiquement de groupes Indo-Européens et est éloigné des autres groupes Dravidiens situés en Inde et au Sri-Lanka. Les premières études mitochondriales et du chromosome Y ont montré que les Brahouis étaient similaires génétiquement à leurs voisins Indo-Européens.

Luca Pagani et ses collègues viennent de publier un papier intitulé: An ethnolinguistic and genetic perspective on the origins of the Dravidian speaking Brahui in Pakistan. Ils ont analysé le génome complet de plusieurs Brahouis ainsi que d'échantillons appartenant à d'autres populations d'Afrique, de Chine, de Russie, d'Inde et du Pakistan:
2017_Pagani_Figure1.jpg

Dans la figure ci-dessus, les populations Indo-Européennes sont représentées par des disques noirs, les populations Dravidiennes par des disques rouges et les populations d'autres langues par des cercles noirs. DRI représente un groupe Indien Dravidien, IEI un groupe Indien Indo-Européen et AAI un groupe Indien Austro-asiatique. L'ensemble est constitué de 237 échantillons génotypés sur environ 470.000 SNPs.

Les auteurs ont réalisé une Analyse en Composantes Principales. La figure ci-dessous représente en A les deux premières composantes et en B les composantes PC2 et PC3:
2017_Pagani_Figure3A.jpg

La première composante sépare les Africains (en bleu) des autres populations. La seconde composante sépare les Adyges de Russie (en cyan) des Chinois Han (en rouge). Les groupes Sud Asiatiques s'étirent entre Adyges et Han avec quelques groupes qui montrent un léger flux de gènes Africains témoin de la traite des esclaves depuis l'Afrique de l'Est. La troisième composante sépare les Indiens Dravidiens et Austro-asiatiques des populations Russes et Chinoises. Les groupes Pakistanais et Indiens Indo-Européens s'étirent entre les Adyges et les Indiens Dravidiens. Les Brahouis se situent à proximité de leurs voisins Pakistanais et Indo-Européens, loin des Indiens Dravidiens.

Les auteurs ont également réalisé une analyse avec le logiciel ADMIXTURE:
2017_Pagani_Figure3C.jpg

Là encore les Brahouis sont très différents des Indiens Dravidiens, mais similaires à leurs voisins Pakistanais Indo-Européens, à l'exception des Kalashs qui forment un isolat génétique et des Hazaras qui montrent un flux de gènes issus des Chinois Han attribué à l'invasion Mongole.

Les auteurs ont ensuite utilisé la statistique f3 et ont montré que les Indiens Dravidiens n'ont pas contribué au génome des Brahouis. Ces résultats ont été confirmés par la statistique f4 qui a montré que les Indiens Dravidiens n'ont pas plus contribué au génome des Brahouis que de leurs voisins Indo-Européens.

En conclusion, les Brahouis, même s'ils présentent une composante Dravidienne dans leur génome (composante jaune ci-dessus), n'en possèdent pas plus que leurs voisins Pakistanais Indo-Européens. Il y a deux modèles possibles pour expliquer la présence de Dravidiens au Pakistan. Soit les ancêtres des Brahouis étaient des Dravidiens locaux qui ont été assimilés génétiquement par les Indo-Européens qui sont arrivés il y a environ 3000 ans. Soit les ancêtres des Brahouis étaient des Indo-Européens qui ont ensuite adopté une langue Dravidienne. Les données historiques et linguistique supportent davantage le premier scénario.

lundi 30 janvier 2017

Structure génétique des populations Népalaises

L'Himalaya a été colonisé par l'homme il y a environ 25.000 ans. La région s'étend sur le Tibet, le Népal, le nord de l'Inde et du Pakistan, et le Bhoutan. Elle abrite de nombreuses populations résidant entre 3000 et 5000 m d'altitude. Le Népal est un pays composé de 121 groupes ethniques enregistrés par le recensement de 2011. Son histoire est complexe et il a servi souvent de refuge entre l'Inde et l'Asie. La première tribu Népalaise documentée est celle des Kirats, un groupe Tibéto-Birman qui est arrivé dans la région il y a environ 2500 ans. Ils ont d'abord résidé à Katmandou avant de monter dans la vallée de Khumbu au pied de l'Everest au 4ème siècle de notre ère, suite à l'arrivée d'un clan Indien: les Licchavi. La vallée de Khumbu héberge également la population Sherpa dont on suppose qu'ils ont émigré de la région de Kham dans l'est du Tibet vers le Népal il y a environ 400 ou 600 ans suite à des tensions politiques.

Les études génétiques au Népal ont mis en évidence des influences Indienne et Tibétaine dans les populations Népalaises suggérant ainsi des mélanges génétiques importants.

Amy M. Cole et ses collègues viennent de publier un papier intitulé: Genetic structure in the Sherpa and neighboring Nepalese populations. Ils ont testé le génome d'individus appartenant à sept villages Sherpa de la vallée de Khumbu (Thame, Khumjung, Namche, Lukla, Khunde, Forte et Solukhumbu) ainsi que cinq populations Népalaises voisines: Rai, Magar, Tamang, Newar et Indo-Aryens. Ces individus ont été comparés à des populations Tibétaines (Lhasa, Yunnan, région de la rivière Tuo Tuo, Maduo et résidant au Royaume-Uni), de la région du Pamir (Kazakhstan, Ouzbékistan, Tadjikistan et Kirghizistan), du nord de l'Inde et du Pakistan et enfin des chinois Han.

Les auteurs ont fait une Analyse en Composantes Principales. Le résultat fait apparaître quatre groupes principaux: un groupe Nord Himalayen constitué des Tibétains, des Sherpas et des chinois Han (en rouge), un groupe du Nord-Ouest constitué des populations de la région du Pamir (en bleu), un groupe du Sud-Ouest constitué des populations Indienne et Pakistanaise (en vert) et un groupe centre Himalayen constitué des populations Népalaises (en noir):
2017_Cole_Figure1.jpg

De manière intéressante, la figure ci-dessus montre que les résultats génétiques se calquent sur la géographie de la région. De plus les populations Népalaises (en dehors des Sherpas) apparaissent comme issues d'un mélange génétique à des degrés divers, entre les Tibétains et les Indiens. A l'inverse, les Sherpas semblent non mélangés et conservent leur gènes Tibétains. Une Analyse en Composantes Principales a été réalisée uniquement avec les populations Sherpas:
2017_Cole_FigureS2.jpg

Là encore le résultat calque la géographie de cette région de la vallée de Khumbu, en montrant des sous-structures génétiques intéressantes parmi ces populations.

Les auteurs ont ensuite utilisé le logiciel ADMIXTURE. Les résultats sont optimaux pour une valeur du paramètre K=6:
2017_Cole_Figure2.jpg

Les Indiens (ANI, ASI, AAA et ATB) sont à gauche de la figure, suivis des Népalais, des Sherpas, des Tibétains et des Chinois Han sur la droite. La composante cyan est majoritaire chez les Tibétains, mais aussi bien présente chez les Népalais et les Sherpas, alors que la composante rouge est majoritaire chez les Sherpas, mais aussi présente chez les Tibétains et les Népalais. Les auteurs pensent que ces deux composantes forment l'ascendance préalablement identifiée chez les populations situées à haute altitude dans une étude génétique précédente. La figure ci-dessus montre également que les populations Népalaises (à l'exception des Sherpas) se rapprochent le plus des populations Indiennes Tibéto-Birmanes, sauf les Indo-Aryens qui se rapprochent le plus des populations ANI (Ancestral North India). Les analyses de distance génétique Fst montrent néanmoins que les populations Népalaises sont plus proches génétiquement des populations Tibétaines que des populations Indiennes, suggérant ainsi davantage une origine Tibétaine. Parmi ces populations Népalaises, les Rai suivis des Magar et des Tamang sont les plus proches génétiquement de la population Sherpa.

Afin de déterminer la population Indienne qui a le plus contribué à l’ascendance des populations Népalaises, les auteurs ont utilisé la statistique f3 dont les populations source sont d'une part les Tibétains et d'autre part une des populations Indiennes suivantes: ANI (North Indian), ASI (South Indian), AAA (Austro-Asiatic) et ATB (Tibeto-Burman). Le signal le plus significatif apparait entre les ANI et les Tibétains.

Les auteurs ont ensuite utilisé le logiciel TreeMix:
2017_Cole_Figure3.jpg

La figure ci-dessus indique ainsi un flux de gènes important des populations ANI vers les populations Népalaises.

Ensuite les auteurs ont utilisé la statistique f4 en prenant comme populations source les Tibétains et les Indiens ANI. Les Rai ont le plus d'ascendance Tibétaine (92%), suivis des Magar (82%), des Tamang (79%) et des Newars (50%). Les Indo-Aryens possèdent 93% d'ascendance ANI. Ces mélanges génétiques ont ensuite été datés: 1500 ans pour les Newars, 1230 ans pour les Tamang, 870 ans pour les Magar. Ces dates correspondent bien aux écrits historiques.

Enfin les auteurs ont mesuré les segments homozygotes parmi les populations Sherpa et Népalaises. Les valeurs élevées obtenues indiquent un niveau important de consanguinité récent dans ces populations. Les Indo-Aryens Népalais sont la population avec les plus longs segments homozygotes.

En résumé, ces résultats montrent que l'influence génétique de la région Himalayenne sur le Nord de l'Inde a été plus forte que l'inverse, et que la population Sherpa est restée isolée des autres populations.

jeudi 26 janvier 2017

Ascendance Amérindienne chez les Rapanuis de l'île de Pâques

La Polynésie est définie par les îles du Pacifique qui s'étendent entre la Nouvelle-Zélande au sud, Hawaï au nord et l'île de Pâques (Rapa Nui) à l'est. Cette dernière se trouve à 3700 km à l'ouest de l'Amérique du Sud. Sa superficie est de 163 km2. Il est aujourd'hui accepté que la Polynésie a été colonisée suite à l'expansion Austronésienne dont l'origine se situe à Taïwan et aux Philippines il y a environ 5000 ans. Celle-ci est caractérisée par une identité linguistique, une culture spécifique appelée Lapita et un type particulier de bateau. On a estimé la colonisation des îles Tonga et Samoa vers 800 av. JC. et l'ensemble des îles Polynésiennes entre 1200 et 1300 de notre ère. L'île de Pâques a ainsi été colonisée vers l'an 1200 par une population estimée entre 30 et 100 individus.

Les Rapanuis se sont distingués par une culture archéologique spécifique composée de plateformes géantes de pierre (ahu) sur lesquelles sont posées de monumentales statues de pierre (moai). Environ 900 statues sont enregistrées sur l'île.

L'île de Pâques a été découverte par les occidentaux le dimanche de Pâques de l'an 1722. Ce contact a démarré une période dramatique dans l'histoire des Rapanuis incluant notamment l'exposition des indigènes aux maladies apportées par les occidentaux, puis la traite des esclaves par les Péruviens dans les années 1860. On a estimé que la population de l'île estimée à l'arrivée des occidentaux aux environ de 4000 individus, a baissé jusqu'à atteindre seulement 110 habitants. Une conséquence de ces contacts a été également l'introduction de flux de gènes dans la population indigène.

L'origine précise de la population Rapanui reste insaisissable. En effet si la dispersion Austronésienne a bien atteint l'île de Pâques, certains indices suggèrent un contact avec les populations Amérindiennes, notamment la présence de cultures comme la patate douce ou la calebasse avant l'arrivée des Européens. D'autre part des restes de poulets de signature génétique Polynésienne ont été retrouvés au Chili et sont datés d'avant l'arrivée des Européens.

J. Victor Moreno-Mayar et ses collègues ont publié un papier intitulé: Genome-wide Ancestry Patterns in Rapanui Suggest Pre-European Admixture with Native Americans. Ils ont analysé le génome de 27 individus Rapanuis sur plus de 650.000 SNPs autosomaux. Ces données ont été comparées à des génomes d'individus d'autres populations: Européens, papous de Nouvelle-Guinée, Amérindiens, Asiatiques et autres Polynésiens.

Les auteurs ont utilisé le logiciel ADMIXTURE. La figure ci-dessous donne le résultat pour une valeur du paramètre K=4. La composante Européenne est en bleu, la composante papou en jaune et la composante Amérindienne en rouge. Les Polynésiens sont composés d'une ascendance majoritaire en rose et d'une ascendance papou minoritaire:
2014_Moreno_Figure1.jpg

Les Rapanuis se situent sur la droite de la figure. Bien que globalement similaires aux Polynésiens, ils contiennent une faible proportion d'une ascendance Amérindienne en rouge et d'une ascendance Européenne en bleu.

Les auteurs ont ensuite restreint les populations aux Européens, Amérindiens et Polynésiens. Le logiciel ADMIXTURE pour K=3 donne alors le résultat suivant:
2017_Moreno_Figure2.jpg

L'ascendance Amérindienne chez les Rapanuis est alors de 6% en moyenne et l'ascendance Européenne d'environ 16%. Cependant l'ascendance Amérindienne est plus homogène que l'ascendance Européenne chez les Rapanuis, signe probablement d'une plus grande ancienneté.

Cette ascendance Amérindienne chez les Rapanuis ne veut pas dire qu'il y ait eu des contacts pré-Colombiens entre l'île de Pâques et l'Amérique du Sud. Il faut pour cela dater les mélanges génétiques Amérindiens et Européens chez les Rapanuis. Les auteurs ont ainsi utilisé le logiciel RFmix. Ils ont montré que les segments d'ADN Amérindien chez les Rapanuis sont plus courts que les segments d'ADN Européen, indiquant ainsi une plus grande ancienneté du mélange génétique Amérindien.

Les auteurs ont ensuite modélisé les mélanges génétiques Amérindiens et Européens chez les Rapanuis et déterminé la probabilité des distributions de longueurs de segments d'ADN Amérindiens et Européens en fonction des temps de mélanges génétiques chez les Rapanuis. La figure ci-dessous donne cette distribution en fonctions des temps de mélanges génétiques:
2017_Moreno_Figure3.jpg

Elle est maximale pour un temps de mélange génétique avec les Amérindiens de 22 générations et avec les Européens de 4 générations. Pour une génération entre 25 et 30 ans et un temps présent correspondant à l'année 1970, cela correspond à un mélange génétique entre Rapanuis et Amérindiens entre les années 1310 et 1420 et entre Rapanuis et Européens entre les années 1850 et 1870.

Ces résultats montrent que le contact entre les Rapanuis et les Amérindiens date d'avant l'arrivée des Européens sur l'île de Pâques. Cependant on ne sait pas comment ce mélange génétique s'est produit. Il y a deux scénarios possibles: des Amérindiens ont navigué jusqu'à l'île de Pâques ou les Polynésiens sont allés en Amérique du Sud et sont revenus sur l'île de Pâques. Le second scénario est cependant le plus probable, si on considère les aptitudes des deux populations à la navigation.

mardi 24 janvier 2017

Histoire des Siddis de l'Inde à partir de leur génome

L'Inde est formée d'une très grande diversité ethnique, culturelle et linguistique. Elle a connu un grand nombre de vagues d'immigration de différentes parties du monde aux temps préhistoriques et historiques. Les Siddis sont un groupe ethnique unique d'origine Africaine que l'on trouve principalement dans les états Indiens de Gujarat, Karnataka, Andhra Pradesh et Telengana. Les premières traces de leur migration remontent vers l'an 1100 sur la côte ouest de l'Inde. Au 13ème siècle leur nombre a augmenté lorsqu'ils furent importés par les rois et princes Indiens pour servir comme esclaves ou soldats. Ensuite d'autres furent importés en Inde comme esclaves par les Portugais entre les 16ème et 19ème siècles.

Les premières études génétiques ont montré que le génome des Siddis était composé d'ascendances Africaine, Sud Asiatique et Européenne.

Ranajit Das et Priyanka Upadhyai viennent de publier un papier intitulé: Unraveling the population history of Indian Siddis. Ils ont analysé le génome de 14 individus Siddis du Gujarat et du Karnataka. Ces génomes ont été comparés à celui de nombreux individus Africains issus du projet des 1000 génomes et du projet Human Genome Diversity. Il s'agit de Yorubas du Nigéria, de Luhyas du Kenya, de Gambiens, de Mendes de Sierra Leone, d'Esans du Nigeria et de sept populations Bantoues.

L'analyse Multi-Dimensionnelle révèle cinq groupes différents. Dans la figure ci-dessous YRI représente les Yorubas, MSL les Mendes, LWK les Luhyas, GWD les Gambiens et ESN les Esans:
2017_Das_Figure1.jpg

Les Siddis se regroupent en haut à droite, mais s'étirent vers le groupe formé par les Luhyas (population Bantoue du Kenya) et les Bantous du Nord-Est (du Kenya également).

Les auteurs ont ensuite utilisé le logiciel ADMIXTURE. La figure ci-dessous donne le résultat pour une valeur du paramètre K=5:
2017_Das_Figure2.jpg

Les cinq ascendances se retrouvent majoritairement chez les Esans (k1), les Mendes (k2), les Gambiens (k3), les Luhyas (k4) et les Siddis (k5). On retrouve cependant un peu de la cinquième composante dans la population Bantoue (HGDP et Luhyas).

Les auteurs ont ensuite utilisé le logiciel TreeMix pour estimer les regroupements des différentes populations:
2017_Das_Figure3.jpg

La figure ci-dessus confirme la proximité entre les Siddis et les populations Bantoues, notamment les Luhyas. Elle indique notamment que les Siddis ont divergé des Luhyas il y a environ 2700 ans.

Les auteurs ont ensuite estimé la zone géographique en Afrique correspondant à la zone d'origine des Siddis à l'aide du logiciel Geographical Population Structure (GPS). Ainsi 10 des 14 Siddis ont été assignés à l'ouest de la Zambie et les 4 autres entre le Zimbabwe et le Nord-Est du Bostwana:
2017_Das_Figure4.jpg

Il est intéressant de noter que GPS affecte l'origine des Siddis le long de la route secondaire postulée de l'expansion Bantoue entre l'Afrique de l'Est et la région inter-lacustre autour des grands lacs Africains, datée d'il y a environ 1700 ans.

Le logiciel ADLER a estimé à environ 300 ans l'âge du mélange génétique entre les ascendances Africaine et Sud Asiatique chez les Siddis. Cette estimation est en accord avec la période de traite des esclaves entre l'Afrique et l'Inde, par les Portugais.

lundi 16 janvier 2017

Relations entre diverses populations humaines en dehors de l'Afrique

Les hommes modernes ont émergé en Afrique Sub-Saharienne et se sont ensuite dispersé en dehors de l'Afrique d'abord en Asie puis en Europe. Les premières preuves archéologiques de la présence de l'homme moderne en dehors de l'Afrique se trouvent au Levant et sont datées d'environ 100.000 ans. Cependant cette première sortie d'Afrique ne semble pas reliée aux Eurasiens contemporains, contrairement à la dispersion qui s'est répandue en Eurasie entre 50.000 et 40.000 ans.

Les premières analyses génétiques ont montré que la population Eurasienne peut être divisée en deux clades principales orientale et occidentale. La clade orientale est différentiée déjà il y a 40.000 ans environ comme le montre le génome ancien de l'individu de Tianyuan, alors que la clade occidentale comprend les anciens chasseurs-cueilleurs Européens ainsi que les anciens Nord Eurasiens comme le garçon de Mal’ta. Les Européens descendent principalement des individus de cette clade occidentale, avec cependant une autre ascendance nommée "Basal Eurasian" qui a divergé encore plus tôt des lignages non Africains. De manière intéressante, deux anciens individus: Ust’-Ishim de Sibérie et Oase 1 de Roumanie vieux d'environ 45.000 ans, n'ont pas ou très peu de liens génétiques avec la population contemporaine. Plus tard de nouvelles migrations ont conduit à la formation des populations d'Asie du Sud et des Amériques.

Certains ont remis en cause se modèle de séparation ancienne des Eurasiens orientaux et occidentaux, notamment au sujet de certaines populations d'Océanie et d'Asie du Sud-Est comme les aborigènes d'Australie, les papous de Nouvelle-Guinée ou les negritos des Philippines. Ils pensent en effet que ces trois populations sont issues d'une plus ancienne dispersion de l'homme moderne hors d'Afrique qui a suivi une route côtière Sud. Cependant des études génomiques récentes ont montré qu'il n'était pas nécessaire de faire appel à cette première sortie d'Afrique pour expliquer l'ascendance génétique des Australiens.

Mark Lipson et David Reich viennent de publier un papier intitulé: A working model of the deep relationships of diverse modern human genetic lineages outside of Africa. Ils proposent un modèle qui explique les différentes relations entre les populations non Africaines, mais aussi avec les populations archaïques.

Le modèle proposé par les auteurs comprend les populations suivantes: Chimpanzés, Néandertals de l'Altaï, Denisoviens, Dinkas du Soudan, l'ancien individu Ust’-Ishim de Sibérie, l'ancien individu Kostenki 14 de Russie, l'ancien individu de Malt'a de Sibérie, papous de Nouvelle-Guinée, aborigènes d'Australie, Mamanwa (negritos des Philippines), Onges des îles Andaman, Amis (aborigène de Taïwan) et amérindiens Surui du Brésil. Le modèle dessiné ci-dessous est basé sur environ 123.000 SNPs autosomaux. Il incorpore sept populations contemporaines, trois anciens hommes modernes, deux hommes archaïques et un Chimpanzé. Il y a neuf événements de mélange génétique dont six sont issus des hommes archaïques:
2017_Lipson_Figure1.jpg

L'homme de Denisova reçoit un flux génétique issu d'un homme archaïque inconnu correspondant à environ 3% de son génome. Toutes les populations d'homme moderne non Africain reçoivent environ 3% de gènes issus de l'homme de Neandertal. Les anciens individus Ust’-Ishim et K14 ont reçu des gènes supplémentaires en provenance de Neandertal (environ 1,5%). Cependant une étude récente a montré que la proportion de gènes de Neandertal a diminué chez les hommes modernes au cours du temps. Il n'est donc peut-être pas nécessaire d'ajouter un flux de gènes supplémentaire en provenance de Neandertal chez les deux individus: Ust’-Ishim et K14. Les aborigènes d'Australie, les papous de Nouvelle-Guinée et les negritos des Philippines reçoivent un flux de gènes issu de l'homme de Denisova (environ 4%). L'homme de Malt'a reçoit également un flux de gènes issu de l'homme de Denisova.

Les aborigènes d'Australie et les papous de Nouvelle-Guinée forment deux groupes frères dont l'ascendance vient principalement des anciens Est Asiatiques. Les negritos des Philippines montrent trois composantes ancestrales: les anciens Australasiens d'avant la divergence entre aborigènes et papous, une issue des anciens Est Asiatiques (interprétée comme issue de la migration Austronésienne) et une issue de l'homme de Denisova. Les Onges forment un groupe frère avec les anciens Australasiens et les populations d'Asie de l'Est.

L'ancien individu K14 ne semble pas issu d'un mélange génétique en dehors de l'homme de Neandertal, néanmoins le garçon de Malt'a reçoit en plus de la composante correspondant aux anciens occidentaux une proportion de gènes issus des anciens orientaux. Les Européens non indiqués dans la figure ci-dessus, montrent qu'ils sont issus de quatre composantes: par exemple les Français incorporent des gènes des anciens occidentaux (28%), Nord Eurasiens (35%), anciens orientaux (23%) et Basal Eurasian (14%).

Les Amérindiens du Brésil sont issus d'un mélange entre Est Asiatiques (73%) et Anciens Nord Eurasiens (27%). Ils incorporent également un peu d'ascendance issue d'une population inconnue, nommée population Y, reliée aux Onges et aux anciens Australasiens.

Dans le modèle ci-dessus, après la sortie d'Afrique et la divergence avec la population Dinka, la plus ancienne divergence est entre groupes occidentaux et orientaux. Dans le groupe occidental, la divergence suivante se situe entre Ust’-Ishim et K14. Dans le groupe Oriental la divergence suivante se situe entre anciens Australasiens, Onges et anciens Est Asiatiques.

mardi 10 janvier 2017

Expansions post-glaciaires en Asie du Sud-Ouest

Les changements du climat ont influencé drastiquement l'occupation de l'Asie du Sud-Ouest par l'homme moderne depuis sa première occupation sur les sites de Skhul et Qafzeh au Proche-Orient il y a environ 100.000 ans. Ces impacts climatiques sur les mouvements de population et sur le développement des différentes cultures ont été fortement débattus. Durant le dernier maximum glaciaire, les conditions ont poussé les populations à occuper différents refuges autour de la Méditerranée, la Mer Noire et le Sud de la péninsule Arabique. Ensuite, le réchauffement post-glaciaire et la révolution Néolithique ont permis l'expansion de ces différentes populations en Asie du Sud-Ouest.

Les dernières études d'analyse de l'ADN ancien ont identifié une population ancestrale nommée "Basal Eurasians" qui a injecté une quantité significative de gènes dans la population Européenne. Cette ascendance est distincte de la signature génétique des premiers fermiers du Proche-Orient. Ces études ont également montré que la population Yamnaya des Steppes a été à l'origine de la culture Cordée et d'une expansion de population en Europe à la fin du Néolithique et au début de l'Âge du bronze.

Des analyses récentes sur les populations contemporaines ont également identifié des signatures génétiques d'un possible refuge glaciaire dans le sud de la péninsule Arabique. Ces populations se sont ensuite dispersées dans le Croissant Fertile, au Levant et dans la corne de l'Afrique. Ainsi l'haplogroupe du chromosome Y J1 est commun en Arabie Saoudite et a marqué l'expansion Islamique, alors que J2 semble correspondre à une expansion post-Néolithique.

Daniel E. Platt et ses collègues viennent de publier un papier intitulé: Mapping Post-Glacial expansions: The Peopling of Southwest Asia. Ils ont cherché à identifier et dater l'isolation des populations avant leur expansion, puis à tracer leur routes de dispersion en Asie du Sud-Ouest, à partir de tests de l'ADN du chromosome Y et autosomal de populations contemporaines en Eurasie et en Afrique.

Un total de 8515 échantillons a été analysé sur leur ADN du chromosome Y. Des marqueurs STR et SNP ont été testés. L'étude s'est notamment focalisée sur l'haplogroupe J du chromosome Y. Ensuite 994 échantillons ont été testés sur leur ADN autosomal sur un total de 500.000 SNPs environ.

Les haplogroupes du chromosome Y: J1, J2 et E1b1b sont les lignages paternels les plus fréquents en Asie du Sud-Ouest et en Afrique du Nord totalisant à eux trois 50,9%:
2016_Platt_FigureS1.jpg

La figure ci-dessus indique la fréquence des principaux haplogroupes, et l'encart en bas à gauche indique la fréquence des différentes sous-clades de l'haplogroupe J. Ces résultats montrent de fortes différentiations régionales.

Les auteurs se sont ensuite focalisés sur les haplogroupes du chromosome Y: J*(xJ2) et J2. La figure ci-dessous montre la fréquence de ces haplogroupes respectivement en A et B:
2016_Platt_FigureS2.jpg

La diversité de J*(xJ2) est maximale dans le Caucase et celle de J2 est maximale en Arménie. Elle est indicative d'une possible origine de ces populations. La figure ci-dessous indique la variance des deux haplogroupes J*(xJ2) en A et J2 en B:
2016_Platt_FigureS3.jpg

Les mesures de TMRCA pour les haplogroupes montrent une plus grande ancienneté des haplogroupes J*, J1, J2 en Turquie et dans le Caucase, et une grande différentiation de E1b entre l'Afrique du Nord et l'Asie. L'estimation du temps de divergence des différentes populations est indiquées pour les trois haplogroupes J1, J2 et E1b dans la figure ci-dessous:
2016_Platt_Figure2.jpg

J1 est en a, J2 en b et E1b en c. Ces résultats confirment les estimations de TRMCA et indiquent que J1 et J2 sont probablement originaire du Caucase.

Les auteurs ont ensuite fait une analyse avec le logiciel ADMIXTURE à partir de l'ADN autosomal. La figure ci-dessous indique les résultats pour des valeurs de K allant de 2 à 5:
2016_Platt_Figure3.jpg

Pour K=3, l'analyse identifie des composantes qui caractérisent la Géorgie dans le Caucase en bleu foncé, la Palestine en violet et l'Arabie Saoudite en rouge.

L'Analyse en Composantes Principales identifie également ces trois centres d'origine:
2016_Platt_Figure4.jpg

Les auteurs supposent que ces trois centres d'origines correspondent à trois refuges pour les populations pendant le dernier maximum glaciaire. Le refuge du Caucase aurait ainsi abrité les populations porteuses des haplogroupes J1 et J2. Celles-ci se sont ensuite dispersées vers le Sud en Mésopotamie, puis dans la péninsule Arabique.

mardi 13 décembre 2016

Analyse génomique de la population Sarde

Un point clef de l'histoire de la Sardaigne réside dans sa différentiation avec les populations continentales au niveau culturel, linguistique et archéologique. Les premières études génétiques ont également montré que la population Sarde était isolée génétiquement. Un des points caractéristiques de l'histoire démographique de la Sardaigne est son affinité génétique avec les anciennes populations Néolithiques Européennes. Dans ce modèle, la Sardaigne a été colonisée par les premiers fermiers Européens au début du Néolithique avec une faible contribution des groupes de chasseurs-cueilleurs. Ensuite la Sardaigne est restée largement isolée des migrations successives du continent notamment les expansions de l'Âge du Bronze en provenance des Steppes. Ce point se retrouve notamment au niveau mitochondrial qui montre que l'haplogroupe U, caractéristique des populations de chasseurs-cueilleurs, est relativement faible en Sardaigne par rapport au continent. Au niveau archéologique, ce modèle est aussi conforté par le faible nombre de sites pré-Néolithiques suivi par un grand nombre de sites Néolithiques, et le développement d'une culture spécifique locale à l'Âge du Bronze: la culture Nuragique.

Charleston Chiang et ses collègues viennent de publier un papier intitulé: Population history of the Sardinian people inferred from whole-genome sequencing. Ils ont séquencé le génome complet de 3514 individus Sardes:
2016_Chiang_Figure1.jpg

Les auteurs ont ensuite extrait de l'ensemble des échantillons, un sous-ensemble de 1577 individus non reliés généalogiquement entre eux dont au moins trois grands-parents sont issus de la même région de Sardaigne, afin de s'affranchir des migrations récentes. Les auteurs ont ensuite réalisé une Analyse en Composantes Principales:
2016_Chiang_Figure2A.jpg

Dans la figure ci-dessus, les individus de la région montagneuse de Ogliastra (à droite) sont séparés des autres Sardes (à gauche) par la première composante. Les Sardes, en dehors de Ogliastra, sont très peu différenciés que ce soit par distance génétique ou par partage d'allèles, malgré leur plus grande distance géographique entre populations.

L'analyse avec le logiciel ADMIXTURE est optimal pour K=2 composantes:
2016_Chiang_Figure2B.jpg

Il permet ainsi de séparer une composante rouge caractéristique de la région de Ogliastra, d'une composante bleue majoritaire en dehors de cette région. Ces résultats permettent de montrer que la région montagneuse de Gennargentu située au sein de Ogliastra est une région qui est restée isolée du reste de l'île.

Les auteurs ont ensuite comparé les échantillons Sardes avec des individus de la région Méditerranéenne. Ils ont réalisé une Analyse en Composantes Principales:
2016_Chiang_Figure4A.jpg

La figure ci-dessus montre une isolation génétique par la distance entre les populations Nord Africaines (en marron), du Proche-Orient (en violet) et d'Europe (en bleu).

L'analyse avec le logiciel ADMIXTURE est optimal pour K=4 composantes:
2016_Chiang_Figure4C.jpg

La composante rouge est associée à la Sardaigne et aux Européens du Sud, la bleue à l'Afrique du Nord, la violette au Proche-Orient et au Caucase et la verte aux Européens du Nord. Les individus du village de Arzana dans les montagnes de Gennargentu possèdent 100% de composante rouge, alors que les Sardes de Cagliari en possèdent 93%.

L'analyse du partage des allèles rares montre que la Sardaigne est très isolée des autres populations. Les auteurs ont utilisé plusieurs méthodes pour estimer le temps de divergence entre la population Sarde des autres populations. Ils ont ainsi trouvé une valeur de 327 générations (environ 8000 ans) entre les Sardes et les Européens continentaux de l'ouest, supérieure à la valeur qui sépare les Toscans et les Européens de l'ouest: 190 générations (environ 4500 ans).

A cause de leur faible taille effective de population, les Sardes sont supposés avoir subi une dérive génétique importante. En utilisant la statistique f3, les auteurs ont montré que les Sardes se rapprochent le plus de la population Basque:
2016_Chiang_FigureS6A.jpg

La statistique D permet de confirmer ces résultats:
2016_Chiang_FigureS6C.jpg

Les Basques sont connus pour avoir également une forte proportion d'ascendance fermier Néolithique. De plus certains ont avancé que certain lieu Sarde avaient un nom d'origine non Indo-Européenne et proche du Basque. Si on associe la diffusion des langues Indo-Européennes aux migrations de l'Âge du Bronze en provenance des Steppes, il est tentant d'associer le Basque à la langue parlée par les premiers fermiers Néolithiques.

Les individus de Cagliari possèdent environ 7% de composante violette que l'on retrouve dans différentes populations d'Europe du Sud, du Proche-Orient, du Caucase et d'Afrique du Nord. Le logiciel ADLER indique que les populations Sardes en dehors de la région de Ogliastra ont subi un mélange génétique issu d'Eurasie, mais également d'Afrique Sub-Saharienne qui semble un meilleur proxy que l'Afrique du Nord. Ce mélange Sub-Saharien est estimé entre 1 et 4% et remonte entre 59 et 109 générations, soit environ 2500 ans.

Les études d'ADN ancien ont montré que les Sardes possèdent le plus haut niveau d'ascendance des premiers fermiers Néolithiques, parmi les Européens. Ces résultats sont confirmés par la statistique f3 avec les échantillons de cette étude comme le montre la figure ci-dessous qui donne les valeurs f3(San; Stuttgart, X) dans lequel Stuttgart est le génome d'un individu du Néolithique Ancien:
2016_Chiang_Figure6A.jpg

Cependant, un point surprenant est que plus l'ascendance Gennargentu augmente dans l'échantillon Sarde, plus l'affinité génétique avec un fermier Néolithique mais aussi avec un chasseur-cueilleur augmente, alors qu'il n'y a pas de corrélation avec l'ascendance issue des Steppes:
2016_Chiang_Figure6C.jpg

Ce point est confirmé par l'estimation des proportions entre chasseurs-cueilleurs, fermiers du Néolithique et pasteurs des Steppes dans les différents échantillons Sardes:
2016_Chiang_FigureS10.jpg

La proportion d'ascendance des Steppes diminue dans la région Gennargentu alors que la proportion d'ascendance néolithique et chasseur-cueilleur augmente. Il est probable que ce mélange fermier néolithique/chasseur-cueilleur dans la région Gennargentu soit représentatif de la population initiale de l'île au début du Néolithique, même s'il est difficile de savoir si ce mélange a eu lieu sur l'île ou sur le continent.

Ainsi ces résultats indiquent que si les Sardes hébergent la plus forte proportion d'ascendance Néolithique parmi les Européens, il y a cependant des variations sensibles parmi ces proportions selon la population de l'île considérée.

Les auteurs ont ensuite estimé le biais selon le sexe en comparant les résultats génomiques entre le chromosome X et le reste des autosomes. Ainsi la comparaison des résultats du logiciel ADMIXTURE montre qu'il y a plus de composante Gennargentu dans le chromosome X que dans les autosomes. Ces résultats indiquent donc que les ascendances chasseurs-cueilleurs et néolithiques sont plus maternelles alors que l'ascendance des pasteurs des Steppes est plus paternelle. Ces résultats sont confirmés par la statistique D comme le montre la figure ci-dessous:
2016_Chiang_Figure7.jpg

Ci-dessus, Bichon et Loschbour sont des chasseurs-cueilleurs alors que Stuttgart et NE1 des fermiers Néolithiques.

jeudi 24 novembre 2016

La diversité génétique des Tchadiens révèle plusieurs migrations Eurasiennes vers l'Afrique

La diversité génétique des Africains n'est pas encore complètement comprise, et de vastes régions d'Afrique ne sont toujours pas documentées génétiquement. Ainsi, le Tchad s'étend sur une superficie égale à 5% du continent Africain et sa position centrale entre l'Afrique Sub-Saharienne, l'Afrique du Nord et l'Afrique de l'Est, a dû jouer un rôle important dans les migrations humaines. Cependant ce pays a été peu étudié au niveau du génome. Il inclue 200 groupes ethniques différents qui parlent plus de 120 langues et dialectes. Il a été suggéré que cette diversité culturelle peut être attribuée à la présence du lac Tchad qui a toujours attiré les groupes humains pour son environnement fertile depuis les temps préhistoriques, notamment pendant l'assèchement progressif du Sahara il y a environ 7000 ans.

Marc Haber et ses collègues viennent de publier un papier intitulé Chad Genetic Diversity Reveals an African History Marked by Multiple Holocene Eurasian Migrations. Ils ont génotypé 480 individus de quatre populations Tchadiennes, du Moyen-Orient (Liban et Yémen) et d'Europe (Grèce) sur 2,5 millions de SNPs autosomaux, et ils ont séquencé le génome de 19 individus parmi ces mêmes populations. Les quatre populations Tchadiennes sont les Toubous, une population nomade du Nord du Tchad parlant une langue Nilo-Saharienne, les Saras, une population sédentaire du Sud du Tchad parlant aussi une langue Nilo-Saharienne, les Laals, une population du Sud du Tchad, de seulement 750 individus qui parlent une langue non classifiée et la population urbaine de la ville de N’Djamena.
2016_Haber_Figure1A.jpg

Ces échantillons ont été comparés avec diverses populations mondiales issues du projet des 1000 génomes. Les auteurs ont réalisé une Analyse en Composantes Principales:
2016_Haber_Figure1B.jpg

Dans la figure B ci-dessus, la première composante permet de séparer les populations Africaines (à droite) et Eurasiennes (à gauche). Les populations du Moyen-Orient, d'Afrique du Nord et d'Afrique de l'Est se situent entre les Européens et les Africains Sub-Sahariens. Les groupes Sara (en rose dans la figure 1C ci-dessus) et Laal (en orange) du Tchad se situent proches des populations Sub-Sahariennes, alors que les Toubous (en vert) et les individus de N’Djamena (en rouge) se trouvent dans une position plus centrale.

Les auteurs ont ensuite étudié la taille de la population effective pour les différents groupes:
2016_Haber_Figure2.jpg

Les Africains et les Eurasiens ont divergé entre 60.000 et 80.000 ans. Ils montrent ainsi une évolution différente de leur taille de la population effective. Notamment la décroissance des populations Eurasiennes est plus marquée que celle des populations Africaines. La population Égyptienne montre une décroissance intermédiaire. Les Toubous et les Éthiopiens montrent des évolutions de leur courbe de la taille de la population effective similaires. De même, les Saras, les Laals et les Africains Sub-Sahariens. Les auteurs suggèrent que la similarité des courbes pour les Toubous et les Éthiopiens est liée à une expérience identique de mélange génétique avec une population Eurasienne.

Ainsi une étude précédente avait montré que les Éthiopiens avaient reçu il y a environ 3000 ans un flux de gènes important en provenance d'Eurasie. Les auteurs ont utilisé la statistique f3 sous la forme: f3(X; Eurasian, Yoruba) pour estimer le degré de mélange génétique entre populations Africaine et Eurasienne, dans les populations Éthiopienne et Tchadienne. Ils ont ainsi montré que toutes les populations Éthiopiennes sont un mélange entre Africains et Eurasiens. De la même façon les Toubous montrent un degré important de mélange génétique entre Africains et Eurasiens, contrairement aux Saras et aux Laals. Cependant la statistique f3 n'est pas sensible aux faibles mélanges génétiques. Les auteurs ont donc ensuite fait une analyse avec les logiciels ALDER et MALDER qui permettent de déduire un faible mélange génétique dans une population à partir du déséquilibre de liaison. Ils ont ainsi mis en évidence un mélange génétique entre Africains et Eurasiens chez les Toubous, les Saras et les Laals:
2016_Haber_Figure3A.jpg

Dans la figure ci-dessus les résultats du logiciel ADLER sont donnés par les croix et ceux du logiciel MALDER sont donnés par les losanges. Le logiciel MALDER a également la possibilité de détecter plusieurs événements de mélange génétique ce qui est le cas pour les Toubous (losanges verts), il y a 200 ans et 3000 ans environ. Chez les Saras le mélange génétique a eu lieu entre 4800 et 3900 ans et chez les Laals, il a eu lieu entre 7200 et 4750 ans. Ces deux derniers événements sont estimés comme des signaux d'un même événement de mélange génétique. Cet événement est supposé différent de l'événement de mélange génétique chez les Toubous et chez les Éthiopiens autour de 3000 ans. En effet l'événement situé au Sud du Tchad précède l'autre d'environ 3000 ans, et d'autre part il y a au Tchad un lignage Eurasien du chromosome Y (R1b-V88) qui est absent dans les populations Éthiopiennes. De plus la date d'émergence de cet haplogroupe au Tchad est situé entre 7200 et 4750 ans et correspond à la date de mélange génétique dans la population Laal.

Les auteurs ont ensuite montré que la population Eurasienne la plus proche de la source du mélange génétique chez les Toubous est la population Sarde. En utilisant des échantillons d'ADN ancien, les auteurs ont ensuite montré que les premiers fermiers Néolithiques représentent également une population proche de la source Eurasienne du mélange génétique chez les Toubous et chez les Éthiopiens. En utilisant le logiciel ADMIXTURE avec un paramètre K=2, les auteurs ont ensuite estimé la proportion d'ascendance Eurasienne chez les Toubous (entre 26 et 30%), chez les Saras (entre 0,3 et 2%) et chez les Laals (entre 1,2 et 4,5%). Il est a noter également que la date de mélange génétique entre Africains et Eurasiens chez les Saras et les Laals se situe peu après l'explosion démographique consécutive à l'émergence du Néolithique au Proche-Orient.

vendredi 4 novembre 2016

Génétique de la population Colombienne

La Colombie est directement reliée à la région sud de l'Amérique Centrale. Ainsi, depuis les temps préhistoriques, la Colombie a été sujet à de nombreux flux de gènes apportés par les différentes migrations Amérindiennes. Cela se traduit par une forte diversité génétique de sa population qui a également subi des mélanges génétiques issus de populations Européennes et Africaines à partir de la fin du 15ème siècle.

La région des Andes a vu prospérer la civilisation Chibcha, le troisième groupe Amérindien après les Aztèques et les Incas. La région des Caraïbes se différencie des autres régions par sa population ethnique très diverse. Ces deux régions sont les plus peuplées de la Colombie. Les trois autres régions sont la région Pacifique, la région Orinoquía et la région Amazonienne dont la superficie est la plus importante, mais également la moins peuplée.

L'arrivée des Européens a provoqué différents taux de mélanges entre les populations Amérindiennes, Européennes et Africaines.

Humberto Ossa et ses collègues viennent de publier un papier intitulé: Outlining the Ancestry Landscape of Colombian Admixed Populations. Ils ont analysé 46 marqueurs autosomaux sur 761 échantillons répartis sur le territoire Colombien. Le plus grand nombre d'échantillons est issu de la région des Andes car cette région est la plus densément peuplée. Elle a été ensuite divisée en six sous-régions:
2016_Ossa_Figure1.jpg

Les auteurs ont également introduit dans cette étude les résultats précédemment publiés obtenus sur 121 échantillons appartenant à cinq populations Amérindiennes de Colombie: la première est de la région Cauca, la deuxième est le groupe des Emberá-Chami qui vivent dans le département Antioquia, la troisième est de la région Guainía, la quatrième est le groupe des Motilón-Barí qui vivent dans le Norte de Santander et la cinquième est le groupe des Pijao qui vivent dans le département Tolima. Ces populations appartiennent à différents groupes ethniques et linguistiques.

Les auteurs ont utilisé le logiciel ADMIXTURE avec un coefficient K=3 pour séparer les ascendances Amérindienne, Européenne et Africaine. Les proportions de ses ascendances varient d'une région à l'autre de la Colombie:
2016_Ossa_Figure2.jpg

L'ascendance Européenne est majoritaire dans les régions des Andes, des Caraïbes et Orinoquía. L'ascendance Africaine est majoritaire dans la région Pacifique et l'ascendance Amérindienne est majoritaire dans la région Amazonienne. La forte proportion d'ascendance Européenne dans la région des Andes est en accord avec les données historiques car durant la colonisation Européenne la rivière Magdalena située dans les Andes, a servi d'accès principal vers l'intérieur des terres. La forte proportion Amérindienne dans la région Amazonienne est liée à l'isolation de cette région. Les proportions d'ascendance dans la région Amazonienne est équivalente à ceux issus du groupe Amérindien des Pijao.

Toutes les sous-régions de la régions des Andes sont caractérisées par une prédominance de l'Ascendance Européenne:
2016_Ossa_Figure3.jpg

L'Ascendance Amérindienne arrive en seconde position devant l'ascendance Africaine. La région Centrale Ouest montre la plus forte proportion d'ascendance Européenne et la plus faible proportion d'ascendance Amérindienne. La plus forte proportion d'ascendance Africaine se trouve dans la région Ouest qui est aussi la plus proche de la région Pacifique. Les plus fortes proportions d'ascendance Amérindienne se trouvent dans les deux régions situées le plus au sud.

Les auteurs ont également effectué une analyse Multi-Echelles basée sur la distance génétique:
2016_Ossa_Figure4.jpg

Les populations Amérindiennes se situent à gauche, la population Africaine en haut à droite et la population Européenne en bas. La région Pacifique est plus proche de la population Africaine, la région Amazonienne est plus proche de la population Amérindienne et les régions des Andes, des Caraïbes et Orinoquía sont plus proche de la population Européenne.

lundi 24 octobre 2016

Des migrations récentes ont formé le génome des populations Berbères et Arabes d'Afrique du Nord

Les populations d'Afrique du Nord sont le résultat d'un mélange de différentes migrations car elles sont situées à la croisée de trois continents. Cette région est limitée au sud par le désert du Sahara qui a agi comme une barrière perméable avec le reste du continent Africain, au nord par le bassin Méditerranéen qui a permis le transit des civilisations maritimes à partir de l'Europe, et à l'est par le Moyen-Orient. La présence de l'homme en Afrique du Nord est attestée depuis 130.000 à 190.000 ans. Différentes cultures archéologiques sont attestées comme la culture Atérienne suivie par la culture Ibéromaurusienne durant l'holocène et la culture Caspienne qui a émergé avant le Néolithique. La continuité ou non des populations de ces anciennes cultures est largement débattue.

Les écrits historiques affirment que l'Afrique du Nord a été peuplée par différents groupes supposés être les ancêtres des populations actuelles Berbères. Ces peuples ont vu l'arrivée des Phéniciens au second millénaire av. JC, puis des Romains jusqu'au 5ème siècle de notre ère. L'expansion Arabe a démarré dans la péninsule Arabique au 7ème siècle et s'est poursuivie vers l'Ouest à travers l’Égypte jusqu’à la côte Atlantique. Cette influence a décliné au 16ème siècle lorsque l'empire Ottoman a pris le contrôle de la région, puis avec la colonisation Européenne des 18 et 19ème siècles. La complexité de toutes ces influences a laissé des traces dans le génome des populations d'Afrique du Nord.

De plus, la diversité culturelle de la région est caractérisée par la présence de deux branches principales de langues appartenant à la famille Afro-Asiatique: l'Arabe introduit par l'expansion de l'Islam et le Berbère composé de nombreux langues et dialectes distincts. Aujourd'hui les populations Berbères identifiées par leur langue sont considérées comme les populations ancestrales d'Afrique du Nord.

Les premières études génétiques basées sur les marqueurs uni-parentaux ont montré une forte hétérogénéité parmi les populations Berbères, quelques lignages autochtones comme les haplogroupes mitochondriaux U6 et M1 ou les haplogroupes du chromosome Y E-M78 et E-M81, et un manque de différentiation entre les groupes Arabes et Berbères.

Lara R. Arauna et ses collègues viennent de publier un papier intitulé: Recent historical migrations have shaped the gene pool of Arabs and Berbers in North Africa. Ils ont génotypé environ 900.000 SNPs autosomaux de quatre groupes Berbères du Maroc, d'Algérie et de Tunisie. Ils ont ensuite comparé les résultats avec celui de différentes populations d'Afrique du Nord, d'Afrique Sub-Saharienne, du Moyen-Orient et d'Europe.

Ils ont ainsi effectué une Analyse en Composantes Principales et une analyse avec le logiciel ADMIXTURE:
2016_Arauna_Figure1.jpg

Dans la figure ci-dessus en haut, les populations Sub-Sahariennes sont représentées par des carrés noirs à gauche, les populations Européennes par des ronds noirs en bas à droite et les populations du Moyen-Orient par des triangles noirs. Les populations Nord Africaines sont représentées par des ronds de couleur. Les populations Égyptiennes (en bleu clair) et Libyennes (en vert) sont proches des populations du Moyen-Orient et les Berbères de Timimoun (en rouge) se rapprochent des populations Sub-Sahariennes.

Dans la figure ci-dessus en bas, le paramètre K=4 permet de différentier une composante Sub-Saharienne en noir, une composante Européenne en vert, une composante Moyen-Orientale en bleu et une composante Nord Africaine en orange. Pour K=5 on voit apparaitre une composante spécifique pour les Berbères Chenini de Tunisie. Cette population est située en haut à droite dans la figure de la PCA.

Dans la PCA, les populations Berbères se mélangent avec les autres populations Nord Africaines sans constituer un groupe spécifique. Les deux populations Berbères du Maroc se situent dans une position intermédiaire proches des populations non Berbères du Maroc, la population Berbère Sened de Tunisie est proche des populations non Berbères de Libye et d'Algérie. La population Berbère de Timimoun est fortement différenciée et se rapproche des populations Sub-Sahariennes. Enfin la population Berbère de Chenini en Tunisie forme un groupe à part.

Les auteurs ont ensuite utilisé le logiciel fineSTRUCTURE afin d'analyser la structure génétique des populations Nord Africaines. Les auteurs ont ainsi mis en évidence 14 groupes parmi les échantillons Nord Africains qui peuvent être reliés ensemble sous la forme d'un arbre d'affinité génétique visible en haut dans la figure ci-dessous:
2016_Arauna_Figure2.jpg

Ci-dessus, la figure du bas indique pour chacune des populations d'Afrique du Nord, la composition à partir des 14 groupes génétiques identifiés. Ces populations ne sont pas homogènes à l'exception des Berbères Chenini de Tunisie formée uniquement par le groupe C, à l'inverse des populations Européennes, Moyen-Orientales et Sub-Sahariennes. Cependant une certaine structure peut-être identifiée. Ainsi le regroupement des clusters R et S proche des populations Sub-Sahariennes. Les groupes B, J et K se situent principalement le long de la côte Nord, et le groupe L se situe à l'Est. Le groupe D se situe dans le Sahara Occidental, et les groupes G et I chez les Berbères Sened de Tunisie. De manière générale, la distribution des différents groupes n'est pas corrélée avec la langue parlée par les individus.

Pour analyser le degré d'endogamie dans les populations d'Afrique du Nord, les auteurs ont fait une analyse des segments d'homozygotie:
2016_Arauna_Figure4.jpg

Ainsi le cluster C spécifique des Berbères Chenini de Tunisie et les clusters G et I spécifiques des Berbères Sened de Tunisie présentent le plus de segments d'homozygotie quel que soit la longueur de ceux-ci. Ces résultats indiquent une forte endogamie récente dans ces populations. Cependant les autres populations Berbères montrent une degré d'endogamie équivalent à celui des populations non Berbères contredisant ainsi l'hypothèse selon laquelle les populations Berbères sont plus isolées que les populations non Berbères. De la même façon l'estimation de la taille effective des populations Nord Africaines montre que les Berbères Chenini et Sened de Tunisie présentent une taille effective inférieure aux autres populations.

Enfin, la date des événements de mélange génétique a été estimée avec le logiciel GLOBETROTTER. Les résultats montrent une histoire de flux de gènes continue depuis au moins le premier siècle de notre ère. Les sources principales de ces flux de gènes sont Sub-Sahariennes et Moyen-Orientales. Cette dernière étant la plus importante notamment entre les 7ème et 13ème siècles de notre ère. L'influence Sub-Saharienne est encore plus récente et reliée au commerce des esclaves à partir du 16ème siècle.

En conclusion cette étude montre la forte hétérogénéité génétique des populations d'Afrique du Nord et la complexité de l'histoire démographique de cette région. S'il est courant de différentier les groupes Berbères et Arabes selon leurs pratiques culturelles, notamment leur langue, il n'est pas possible de les différencier génétiquement. Les différentes populations Berbères sont en effet très différentes génétiquement l'une de l'autre et présentent une histoire complexe de mélanges génétiques de la même façon que les autres populations non Berbères d'Afrique du Nord. Cependant certaines populations Berbères comme les Chenini de Tunisie sont plus homogènes et spécifiques génétiquement.

vendredi 30 septembre 2016

Analyse génomique de la population mondiale

Pour obtenir une vision complète de la diversité génomique humaine, il est nécessaire de séquencer les génomes de nombreux individus d'origines diverses. Actuellement le projet incluant la plus grande diversité génomique est celui des 1000 génomes qui inclue 26 populations à travers le monde. Cependant celui-ci s'est intéressé uniquement aux populations de grande taille démographique et a ignoré les plus petites populations qui sont aussi importantes pour englober la diversité humaine.

Swapan Mallick et ses collègues viennent de publier un papier intitulé: The Simons Genome Diversity Project: 300 genomes from 142 diverse populations. Ils présentent le Simons Genome Diversity Project (SGDP) dans lequel ils ont séquencé à haute couverture (x43) le génome de 300 individus appartenant à 142 populations de façon à inclure une grande variété de cultures, langues et gènes. Ils ont ainsi identifié 34,4 millions de SNPs.

Les auteurs ont réalisé une analyse avec le logiciel ADMIXTURE. La figure ci-dessous donne les résultats obtenus pour K variant de 2 à 12:
2016_Mallick_FigureS3.jpg

Ils ont également fait une Analyse en Composantes Principales:
2016_Mallick_FigureS4.jpg

Ils ont aussi construit un arbre de voisinage basé sur la divergence par nucléotide:
2016_Mallick_Figure1A.jpg

Ces résultats montrent que les divergences les plus anciennes sont parmi les populations Africaines. Les mesures d'hétérozygotie montrent que la plus grande diversité génétique se retrouve également parmi les populations Africaines. Une surprise est que les chasseurs-cueilleurs pygmées présentent moins de diversité que les autres populations Africaines.

Toutes les populations non Africaines possèdent de l'ascendance issue de l'homme de Neandertal. Cependant les Eurasiens de l'Est en possèdent davantage que les autres comme le montre la figure ci-dessous:
2016_Mallick_Figure1C.jpg

De plus les Eurasiens de l'Est possèdent de l'ascendance issue de l'homme de Denisova. Les Australo-Mélanésiens sont ceux qui en possèdent le plus comme le montre la figure ci-dessous:
2016_Mallick_Figure1D.jpg

Les auteurs ont ensuite utilisé une méthode markovienne pour déterminer que la population humaine a commencé à développer une différenciation génétique il y a au moins 200.000 ans. Ce point est visible surtout chez les chasseurs-cueilleurs Africains comme les KhoeSan du Sud ou les pygmées Mbuti du Centre:
2016_Mallick_Figure2A.jpg

Ainsi les populations non Africaines se sont séparées des KhoeSan il y a environ 131.000 ans et des Mbuti il y a environ 112.000 ans. Parmi les populations Africaines, les Yoruba se sont séparés des KhoeSan il y a environ 87.000 ans et des Mbuti il y a environ 56.000 ans. En dehors d'Afrique, la plus ancienne divergence date d’environ 50.000 ans, ce qui est consistant avec les preuves archéologiques.

Il y a un débat intense pour savoir si les aborigènes Australiens, les papous de Nouvelle-Guinée et les negritos d'Asie descendent de la même population ancestrale que les Eurasiens, ou s'ils descendent d'une population qui a migré hors d'Afrique avant la migration qui a donné les actuels Eurasiens. Pour étudier ce point, les auteurs ont construit un graphe de mélanges génétiques en incluant les populations archaïques. Le résultat indique que ces populations (aborigènes, papous et negritos) sont issus d'une clade orientale commune avec les Est Asiatiques. Ils sont donc issus de la même migration hors d'Afrique que les autres populations Eurasiennes:
2016_Mallick_Figure3.jpg

Ces résultats ne sont pas en contradiction avec les preuves archéologiques et de fossiles montrant l'existence d'une migration hors d'Afrique plus ancienne. Cela montre simplement que cette migration plus ancienne n'a pas contribué de manière significative au génome des populations actuelles.

Le SGDP fournit une opportunité de comparer le taux de mutations dans les différentes populations. Ainsi les auteurs ont mis en évidence un excès de mutations (environ 5%) dans les populations non Africaines par rapport aux populations Sub-Sahariennes. Une explication de ce phénomène pourrait être la diminution du temps entre deux générations chez les non Africains par rapport aux Africains Sub-Sahariens.

mardi 27 septembre 2016

Histoire du peuplement de l'Eurasie à partir d'analyses génomiques

Les chemins pris par l'homme moderne pour sortir d'Afrique sont sujets à de nombreux débats. Les preuves archéologiques (mobilier et fossiles) ainsi que les mesures crâniométriques des populations Africaines et Asiatiques ont démontré que Homo Sapiens était présent hors de l'Afrique entre 120.000 et 70.000 ans. Cependant, cette colonisation est considérée comme une expansion qui a échoué puisque les analyses génétiques des populations actuelles suggèrent une unique sortie d'Afrique plus récente.

Le séquençage ADN d'anciens individus a mis en évidence un échange de gènes entre les premiers Eurasiens et au moins deux populations humaines archaïques (Neandertal et Denisova), et suggère que les hommes modernes sont entrés en Eurasie il y a environ 100.000 ans puisqu'un homme de Neandertal de l'Altaï de cet âge possède un flux de gènes issu d'hommes modernes. Enfin la majorité de la diversité génétique des hommes modernes hors d'Afrique dérive d'une unique migration vieille d'environ 75.000 ans.

Luca Pagani et ses collègues viennent de publier un papier intitulé: Genomic analyses inform on migration events during the peopling of Eurasia. Ils ont utilisé le séquençage complet à haute couverture de 483 échantillons issus de 125 populations formant le EGDP (Estonian Biocentre Human Genome Diversity Panel):
2016_Pagani_FigureS1A.jpg

Ils ont fait une analyse avec le logiciel ADMIXTURE. La figure C ci-dessus indique le résultat obtenu pour K=8 (en bas) et 14 (en haut). L'analyse avec le logiciel fineSTRUCTURE a mis en évidence le fait que l'ensemble des échantillons se regroupent en 12 groupes régionaux principaux.

Les auteurs ont ensuite considéré le gradient des fréquences d'allèles:
2016_Pagani_Figure1.jpg

La figure ci-dessus indique une bonne corrélation entre les forts gradients (fortes distances génétiques) et des particularités géographiques ou climatiques comme les montagnes ou les zones arides qui ont donc servi de barrières génétiques.

Le logiciel fineSTRUCTURE montrent que les papous de Nouvelle-Guinée et les negritos de Philippines montrent plus de courts segments Africains que les autre populations non Africaines. Ces résultats seraient consistants avec une divergence plus ancienne entre ces populations et les Africains.

Deux modèles principaux sont compatibles avec ces résultats:

  • mélanges génétiques avec une population archaïque potentielle
  • mélanges génétiques avec une population d'hommes modernes qui a quitté l'Afrique avant la migration principale hors d'Afrique


Les auteurs estiment cependant que le second modèle permet de mieux expliquer les données. Cela conduit à une proportion de 2% d'ADN issus d'un flux de gènes venant d'une population d'hommes modernes issus d'une sortie d'Afrique plus ancienne, mais n'ayant pas de descendance actuelle.

Une étude supplémentaire est nécessaire pour savoir si cette signature présente chez les papous est la même que celle observée dans le génome d'un Neandertal de l'Altaï vieux de 100.000 ans et qui présente un flux de gènes issus d'hommes modernes.

vendredi 23 septembre 2016

Histoire génomique des aborigènes Australiens

Durant la plupart des 100.000 dernières années, l'Australie, la Tasmanie et la Nouvelle Guinée formait un unique continent appelé Sahul, séparé du reste de l'Asie continentale. Des études récentes suggèrent que le Sahul a été colonisé entre 55.000 et 47.000 ans. La spécificité du mobilier archéologique et des restes humains fossiles en Australie a conduit plusieurs études précédentes à suggérer que les ancêtres des aborigènes Australiens et des papous de Nouvelle-Guinée ont quitté l'Afrique avant les ancêtres des Eurasiens. De plus, les aborigènes et les papous possèdent des gènes issus de populations archaïques comme les Neandertaliens et les Denisoviens.

A l'arrivée des Européens, les aborigènes Australiens parlaient plus de 250 langues différentes, dont les deux tiers appartiennent à la famille Pama–Nyungan qui couvre environ 90% du continent. L'origine de cette famille linguistique a été longtemps débattue et sa date d'expansion a été estimée datée du milieu de l'Holocène. D'autres changements qui ont suivi il y a environ 4000 ans, incluent la prolifération de lames de silex et l'introduction du dingo. Une étude génétique récente a proposé d'associer ces changements avec l'introduction d'un flux de gènes Indien.

Anna-Sapfo Malaspinas et ses collègues viennent de publier un papier intitulé: A genomic history of Aboriginal Australia. Ils ont séquencé le génome de 83 aborigènes d'Australie et de 25 papous de Nouvelle-Guinée. Dans la figure ci-dessous les étoiles représentent la position des individus testés dans cette étude. Le nombre entre parenthèses indique le nombre d'individus par site. Les carrés sont les génomes préalablement publiés et utilisés pour comparaison. Les cercles noirs indiquent les sites archéologiques et les cercles blancs les restes humains fossiles:
2016_Malaspinas_Figure1.jpg

Les auteurs ont réalisé une analyse des principales ascendances des génomes aborigènes. Le résultat est optimal pour un paramètre K=7:
2016_Malaspinas_Figure2a.jpg

Ainsi la diversité génomique de la population des aborigènes Australiens est le mieux modélisée par quatre ascendances principales qui peuvent être associées à quatre régions géographiques: Europe, Asie de l'Est, Nouvelle-Guinée et Australie. Les proportions de ces ascendances varient selon les groupes aborigènes. Le groupe parlant la langue Ngaanyatjarra (WCD) situé dans le centre de l'Australie possède la plus forte proportion d'ascendance Australienne (95%). Les composantes Est Asiatique et Nouvelle-Guinée se retrouvent principalement dans le Nord-Est de l'Australie, alors que la composante Européenne se retrouve dans tous les groupes.

En utilisant la statistique f3, les auteurs ont montré que les aborigènes Australiens et les papous de Nouvelle-Guinée sont des groupes plus proches l'un de l'autre, que de n'importe quelle autre population. La figure b ci-dessous montre une analyse Multi-Dimensionnelle et la figure c l'affinité génétique des différentes populations avec les aborigènes Australiens:

2016_Malaspinas_Figure2b.jpg

Ces résultats sont consistants avec un modèle dans lequel les aborigènes Australiens et les papous de Nouvelle-Guinée sont originaires d'une population ancestrale commune qui a colonisé le Sahul. Les auteurs ont ensuite simulé plusieurs modèles démographiques et ont montré que le modèle de colonisation de l'Australie en une seule migration est le plus probable.

Les analyses ont montré que la population ancestrale aux aborigènes et aux papous a subi un effet de goulot génétique il y a environ 50.000 ans. Cette date correspond aux premières preuves archéologiques dans la région. Les populations aborigènes et papous ont ensuite divergé il y a environ 37.000 ans:
2016_Malaspinas_Figure3.jpg

Les auteurs ont ensuite utilisé plusieurs méthodes pour analyser la présence d'ADN archaïque chez les aborigènes Australiens. Ainsi les papous et les aborigènes présentent un excès d'ADN Denisovien par rapport aux autres populations non Africaines. Ces éléments permettent d'affirmer que le flux de gènes Denisovien est antérieur à la divergence entre les aborigènes et les papous. Les analyses ont montré également qu'il y a eu un flux de gènes Neandertalien à une date antérieure à la divergence de toutes les populations non Africaines. Ce flux de gènes est estimé avoir eu lieu il y a environ 60.000 ans.

Les auteurs ont ensuite utilisé la statistique D. Ils ont ainsi montré que les aborigènes Australiens et les Eurasiens sont à la même distance génétique de l'ancien individu d'Ust’-Ishim, lorsqu'on prend en compte le flux de gènes issus de populations archaïques. Ce résultat implique un scénario correspondant à une unique migration de l'homme moderne en dehors de l'Afrique. Cette migration unique a subi un effet de goulot génétique il y a environ 72.000 ans. Ce modèle implique également que les aborigènes et les papous ont divergé avec les Eurasiens (58.000 ans) avant que les Européens ne divergent avec les Est Asiatiques (42.000 ans):
2016_Malaspinas_Figure4.jpg

Les auteurs ont également montré que les groupes aborigènes du Nord-Est ont divergé des groupes du Sud-Ouest il y a environ 31.000 ans. L'intérieur de continent très aride a donc servi de barrière génétique durant le Dernier Maximum Glaciaire. Ils ont également mis en évidence une expansion qui a débuté il y a environ 10.000 ans dans le Nord-Est de l'Australie. Ces données sont cohérentes avec les restes archéologiques.

Enfin les auteurs n'ont mis en évidence aucun flux de gènes en provenance d'Inde chez les aborigènes Australiens, à l'aide des statistiques f3 et D.

- page 1 de 4