Généalogie génétique

Aller au contenu | Aller au menu | Aller à la recherche

Génétique des populations

Fil des billets - Fil des commentaires

mercredi 15 novembre 2017

Ascendance génomique des communautés Noir Marron de Guyane Française et du Suriname

Entre 1526 et 1875 environ 7 millions d'Africains ont été transportés en Amérique du Sud. D'après les archives, ils ont embarqué dans différentes régions côtières d'Afrique. Ainsi les populations d'origine Africaine de Guyane Française et du Suriname venaient principalement de la Côte de l'Or, du Golfe du Bénin et d'Afrique du Centre Ouest.

Les précédentes études génétiques des populations d'Amérique d'origine Africaine ont révélé des différences dans leurs proportions d'ascendance Africaine, Européenne et Amérindienne, leurs dates de mélanges génétiques et leur flux génétique biaisé en fonction du sexe.

Les communautés Noir Marron sont des descendants d'esclaves Africains qui se sont échappés et ont formé des villages d'hommes libres. Ainsi la communauté Noir Marron du Suriname et de Guyane Française est l'une des plus importantes en Amérique du Sud. Ils sont les descendants des esclaves Africains qui se sont échappés des plantations Hollandaises du Suriname durant les 16ème et 17ème siècles.

Cesar Fortes-Lima et ses collègues viennent de publier un papier intitulé: Genome-wide Ancestry and Demographic History of African-Descendant Maroon Communities from French Guiana and Suriname. Ils ont analysé le génome de 107 Sud Américains d'origine Africaine dont 71 Noir Marrons de Guyane Française et du Suriname (23 Aluku, 23 Ndjuka, 19 Saramaka et six Paramaka), 16 Afro-Brésiliens et 20 Afro-Colombiens:
2017_FortesLima_FigureS1.jpg

Ils ont également analysé le génome de 124 Ouest Africains dont 19 Fon, 24 Bariba et 24 Yoruba du Bénin, 20 Ahizi et 17 Yacouba de Côte d'Ivoire et 20 Bwa du Mali. Ces résultats ont été fusionnés avec deux ensembles de génomes préalablement obtenus dont 157 individus des Caraïbes (ACB) et d'Amérique du Nord (ASW).

Les auteurs ont réalisé une analyse avec le logiciel ADMIXTURE. La figure ci-dessous donne le résultat obtenu pour une valeur de K=4:
2017_FortesLima_FigureS3.jpg

Les Noir Marrons représentent la population Afro-Américaine qui contient le plus d'ascendance Africaine (98%). Elle est équivalente dans les quatre communautés à l'exception d'un individu Saramaka (90%) et un individu Ndjuka (79%). De plus cette population a un haut coefficient de consanguinité et un grand nombre de segments homozygotes, signes d'une forte isolation.

A l'inverse les Afro-Brésiliens ont 23% d'ascendance Européenne et 5% d'ascendance Amérindienne et les Afro-Colombiens ont 12% d'ascendance Amérindienne et 11% d'ascendance Européenne. Ils se sont donc mélangés beaucoup plus que les Noir Marrons.

Ces résultats se retrouvent également dans l'Analyse en Composantes Principales. Dans la figure ci-dessous les populations Africaines sont en rouge à gauche, les populations Européennes en bleu foncé en bas à droite et les populations Est Asiatiques en violet en haut à droite:
2017_FortesLima_FigureS6.jpg

PEL sont les Péruviens de Lima, MXL les Mexicains de Los Angeles, CLM les Colombiens de Medellin et PUR les Portoricains. Les Noir Marrons représentés par des cercles gris sont bien la population la plus proche des populations Africaines.

D'autre part l'analyse avec le logiciel ADMIXTURE pour K=12 permet de mettre en évidence 12 ascendances distinctes. La figure ci-dessous donne le résultat pour les différentes populations d'ascendance Africaines:
2017_FortesLima_Figure2B.jpg

La population Noir Marron (NM) est similaire à la population Africaine du Golfe du Bénin (population 5 Africaine ci-dessus).

Les auteurs ont ensuite masqué les ascendances Européenne et Amérindienne dans les populations Afro-Américaines et construit une nouvelle Analyse en Composantes Principales:
2017_FortesLima_Figure2C.jpg

Les résultats montrent que les populations Noir Marron et Afro-Colombienne se superposent avec les populations du Golfe du Bénin et du Ghana. A l'inverse la population Afro-Brésilienne se superpose avec les populations Bantoues du Cameroun, du Gabon et d'Angola en Afrique du Centre Ouest. Ces résultats sont confirmés par une analyse des segments IBD.

Les auteurs ont ensuite utilisé le logiciel GLOBETROTTER pour estimer les dates de mélanges génétiques. Ainsi plusieurs vagues de mélanges ont été identifiées au 18ème siècle dans les différentes populations. Les Noir marrons ont reçu un flux de gènes Amérindien vers 1750 suivi d'un flux de gènes Européen vers 1775. Les Afro-Brésiliens ont reçu un flux de gènes Amérindien vers 1756 suivi d'un flux de gènes Européen vers 1796. Enfin les Afro-Colombiens ont reçu un flux de gènes Amérindien vers 1731 suivi d'un flux de gènes Européen vers 1749.

Ces flux de gènes sont biaisés sexuellement. Ainsi dans la population Afro-Brésilienne l'ascendance Européenne est plus masculine alors que les ascendances Africaine et Amérindienne sont plus féminine. Dans la population Afro-Colombienne les ascendances Européenne et Amérindienne sont plus masculine alors que l'ascendance Africaine est plus féminine.

jeudi 9 novembre 2017

Histoire génomique des Amérindiens du Mexique

La population des Amériques est originaire de l'Asie du Nord-Est il y a environ 23.000 ans, franchissant ensuite le détroit de Béring avant de se répandre sur tout le continent. La population actuelle est le résultat de plusieurs migrations, mélanges génétiques et processus d'adaptation. Au quinzième siècle, avant la conquête du Mexique par les Européens, le territoire est occupé par plusieurs groupes Amérindiens nomades ou semi-nomades. Après la conquête Espagnole, de nombreux processus de mélanges génétiques ont eu lieu, d'abord entre Amérindiens et Espagnols, puis avec une population Africaine venue avec le commerce des esclaves. Actuellement il y a 68 langues Amérindiennes connues au Mexique. Environ 21% de la population s'identifie à l'un des groupes Amérindiens, et 7% (soit environ 7 millions d'individus) parle une des langues Amérindiennes.

Sandra Romero-Hidalgo et ses collègues viennent de publier un papier intitulé: Demographic history and biologically relevant genetic variation of Native Mexicans inferred from whole-genome sequencing. Ils ont séquencé le génome complet de 12 Amérindiens du Mexique appartenant à six groupes ethniques différents (TAR: Tarahumara, TEP: Tepehuano, NAH: Nahua, TOT: Totonaca, ZAP: Zapoteca et MAY: Maya) et trois Mexicains métisses (MES: Mestizo). L'ascendance Amérindienne est estimée supérieure à 98% pour tous les individus Amérindiens sauf les Tepehuanos du Nord dont l'ascendance Amérindienne est estimée à 91%:
2017_RomeroHidalgo_Figure1.jpg

Ils ont également analysé l'ADN autosomal de 312 Amérindiens du Mexique, obtenu par puces à ADN. Les individus se regroupent en trois clusters: Nord, Sud et Maya.

Les auteurs ont réalisé une Analyse Multi-échelles. La figure a ci-dessous représente les deux premières composantes qui séparent bien les Africains en vert foncé, les Européens en rouge et les Amérindiens à gauche (les 12 individus séquencés sont en noir et gris):
2017_RomeroHidalgo_Figure2a.jpg

Enfin la troisième composante visible dans la figure b ci-dessus permet de séparer les Amérindiens. Les Seri (SER) sont en haut à gauche (croix bleu foncé) alors que les Lacandona (LAC) sont en bas à gauche (croix jaunes).

Les auteurs ont également réalisé une analyse avec le logiciel ADMIXTURE. Les individus séquencés sont représentés à la figure d ci-dessous. L'analyse est optimale pour une valeur de K=10. La composante Africaine est représentée en vert foncé, la composante Européenne en rouge:
2017_RomeroHidalgo_Figure2c.jpg

L'analyse permet ainsi d'identifier une composante Seri en bleu foncé, Huichol en gris bleu, Nahua en bleu, Totonaca en violet, Zapoteca en vert clair, Maya en orange, Tojolabal en marron et Lacandona en jaune. Parmi les Amérindiens séquencés, les Tarahumara et Tepehuano possèdent la plus forte proportion d'ascendance du Nord en gris bleu. Les Nahua et Totonaca montrent le plus de mélange de composantes. La diversité des individus Nahua est probablement une conséquence de l'expansion de l'empire Aztèque au 15ème et début du 16ème siècles.

Les auteurs ont déterminé les haplogroupes mitochondriaux et du chromosome Y des individus séquencés:
2017_RomeroHidalgo_Table1.jpg

Il y a 6 hommes. Les cinq hommes Amérindiens sont de l'haplogroupe Q1a2a spécifique des populations Amérindiennes, alors que l'homme métisse est R1b commun dans la péninsule Ibérique. Tous les individus ont un haplogroupe mitochondrial typique des populations Amérindiennes. Ces données confirment l'hypothèse selon laquelle la contribution Européenne est essentiellement masculine.

Les auteurs ont également construit un arbre avec le logiciel TreeMix à partir des 12 génomes Amérindiens, 11 génomes de la population mondiale et 4 anciens individus: Néandertal, Denisova, un ancien Amérindien: Anzick et un ancien Sibérien de Mal’ta:
2017_RomeroHidalgo_FigureS2.jpg

L'arbre ci-dessus sépare bien les groupes Amérindiens du Nord (Tarahumaras et Tepehuanos) de ceux du Sud (Totonacas, Zapotecas, Nahuas, Mayas et Karitiana). Le flux de gènes issu de la population Sibérienne liée au garçon de Mal’ta vers toutes les populations Amérindiennes est également représenté (flèche orange).

La reconstruction démographique avec des méthodes PSMC et MSMC montre que les populations non Africaines ont subi une goulet d'étranglement génétique entre 60.000 et 50.000 ans correspondant à la sortie de l'Afrique. De plus les populations Amérindiennes montrent ensuite une faible valeur de la population effective de l'ordre de 2000 individus jusqu'à 20.000 ans, date correspondant à la position de la population en Béringie avant de se diffuser aux Amériques. Cette population reste faible jusqu'à 10.000 ans. Ensuite la population d'Amérique du Sud augmente constamment à l'inverse de la population d'Amérique du Nord qui décroit jusqu'à 4000 ans.

mercredi 11 octobre 2017

Structure génétique en Indonésie

L'Indonésie est le quatrième pays le plus peuplé du monde. Elle est formée par un archipel qui comprend plus de 900 îles habitées et abrite une très forte diversité humaine. La plupart des plus de 700 langues parlées dans ce pays, appartiennent à la famille Austronésienne. L'archipel d'Indonésie, avec les Philippines et Taïwan forment les Îles du Sud-Est Asiatique (ISEA), une région maritime unique pour son rôle clef dans la dispersion et l'évolution de l'homme. Elle est au départ de la diffusion Néolithique qui a propagé la culture Austronésienne, puis a permis également la colonisation de Madagascar et de l'Océanie lointaine. Cette diffusion Néolithique Austronésienne prend sa source sur l'île de Taïwan entre 2500 et 2000 av. JC, atteint les Philippines entre 2000 et 1500 av. JC, Bornéo et les Célèbes (Sulawesi) entre 1500 et 1000 av. JC., puis la Mélanésie Occidentale entre 1350 et 750 av. JC.

Cette histoire est cependant plus complexe qu'un simple mouvement de gènes, de langues et de technologies à partir de Taïwan. Le substrat pré-Austronésien en Indonésie montre des influences continentales à partir du Sud-Est Asiatique. La Nouvelle-Guinée représente également un centre de domestication indépendant focalisé sur les fruits et les tubercules qui se sont propagés d'est en ouest. Le débat reste ouvert pour savoir si cette révolution Néolithique s'est effectuée par un mouvement de population et/ou par un transfert de langues, culture et technologie.

Georgi Hudjashov et ses collègues viennent de publier un papier intitulé: Complex Patterns of Admixture across the Indonesian Archipelago. Ils ont séquencé le génome de 498 individus appartenant à 25 populations de cette région. Ces données ont été fusionnées avec les génomes préalablement disponibles de cette région. Dans la figure ci-dessous, les échantillons du continent Asiatique sont en jaune, de Taïwan et des Philippines en bleu, d'Indonésie Occidentale en rouge, d'Indonésie Orientale en vert, de Mélanésie en violet et de Polynésie en turquoise:
2017_Hudjashov_Figure1A.jpg

Les auteurs ont réalisé une Analyse en Composantes Principales:
2017_Hudjashov_Figure1B.jpg

La première composante sépare les populations suivant un axe corrélé plus ou moins avec la géographie de l'ouest (à gauche) vers l'est (à droite).

Les auteurs ont ensuite réalisé une analyse avec le logiciel ADMIXTURE:
2017_Hudjashov_Figure2.jpg

Dans la région il y a deux composantes principales: une composante continentale en jaune et une composante Papoue en violet. Une troisième composante souvent qualifiée d'Austronésienne apparait en bleu clair à partir de K=5. Il y a une claire différence entre l'Indonésie Occidentale qui comprend une forte proportion d'ascendance Austronésienne et quasiment pas d'ascendance Papoue, et l'Indonésie Orientale qui a peu d'ascendance Austronésienne et une forte proportion d'ascendance Papoue.

Les auteurs ont utilisé le logiciel fineStructure basé sur la similarité des haplotypes. Les échantillons de la région ISEA se regroupent alors suivant un dendogramme:
2017_Hudjashov_Figure3B.jpg

On peut ainsi mettre en évidence cinq groupes:

  • Taïwan, les Philippines, Bornéo et Sulawesi
  • l'Indonésie Occidentale (sans Bornéo et Sulawesi)
  • l'Indonésie Orientale
  • la Mélanésie
  • la Polynésie

Les auteurs ont utilisé le logiciel GLOBETROTTER. Ils ont ainsi mis en évidence un flux de gènes Sud Asiatique dans la région ISEA daté de l'an 1200 à Sumatra, l'an 760 à Bali et de l'an 1060 dans les Philippines. Un flux de gènes Européen apparait dans la population des Philippines non Kankanaey daté de l'an 1710, à Tahiti daté de 1705 et au Tonga et à Samoa en 1820. Toutes les populations d'Indonésie Orientale montrent un signal identique de contact génétique entre une ascendance Papoue et une ascendance des Philippines ou d'Indonésie Occidentale, daté entre 185 av. JC et 360 ap. JC. Ce signal détecté reflète probablement l'interaction entre une population locale Papoue et une population étrangère Austronésienne en provenance des Philippines. Il est notable que cet événement soit daté bien après les preuves archéologiques associées à l'expansion Austronésienne dans la région, comme si les deux populations de chasseurs-cueilleurs et Néolithique étaient restées séparées pendant un certain temps, avant de se mélanger. D'autre part, les populations de Java et Bali montrent un contact supplémentaire avec une population continentale par rapport aux autres populations d'Indonésie Occidentale. Enfin les populations de Nias et Mentawai en Indonésie Occidentale montrent peu d'ascendance continentale ou Austronésienne, mais des preuves d'une forte isolation et d'une faible taille effective.

Les auteurs ont ensuite utilisé le logiciel MALDER pour savoir si la composante continentale a été introduite en Indonésie avec l'expansion Austronésienne ou avec une autre migration. Les résultats montrent qu'en Indonésie Orientale, la composante continentale est arrivée avec l'expansion Austronésienne. Les résultats sont moins nets pour les populations d'Indonésie Occidentale. Cependant la statistique f3 semble montrer que la composante continentale et la composante Austronésienne sont arrivées en même temps partout en Indonésie. D'autre part, la statistique f3 indique également que les populations de Java et Bali montrent des contacts génétiques supplémentaires avec le continent.

Les auteurs ont analysé les segments homozygotes et la diversité génétique des populations d'Indonésie. Le nombre de segments homozygotes est environ 5 fois supérieur aux valeurs trouvées sur le continent Asiatique, alors que la diversité génétique est comparable. Cependant deux populations d'Indonésie Occidentale: les Nias et les Mentawai montrent une faible diversité génétique ainsi qu'un excès de segments homozygotes signes d'une forte dérive génétique.

Enfin les auteurs ont montré que la distance génétique est fortement corrélée avec la distance linguistique en Indonésie.

vendredi 15 septembre 2017

Forte structure génétique en Nouvelle Guinée

L'île de Nouvelle Guinée contient quelques unes des plus anciennes preuves archéologiques de la présence de l'homme moderne en dehors de l'Afrique, datées d'environ 50.000 ans. La culture des plantes a démarré il y a environ 10.000 ans parallèlement et de manière indépendante au Moyen-Orient, à l'Asie de l'Est et aux Amériques. Aujourd'hui la Papouasie Nouvelle Guinée occupe la partie orientale de l'île ainsi que les îles située au nord de la Malaisie. Elle est le pays le plus diversifié linguistiquement avec environ 850 langues parlées. La moitié de celles-ci appartiennent à la famille Trans-Nouvelle-Guinée qui est supposée s'être diffusée pendant le Néolithique.

Le continent Sahul est resté isolé du reste du monde depuis au moins 10.000 ans. Il est intéressant de se demander si la néolithisation de la Nouvelle-Guinée a été déclenchée par des mouvements de populations comme en Eurasie et en Afrique.

Anders Bergström et ses collègues viennent de publier un papier intitulé: A Neolithic expansion, but strong genetic structure, in the independent history of New Guinea. Ils ont séquencé le génome de 381 individus de Papouasie Nouvelle Guinée, parlant 85 langues qu'ils ont fusionné avec le génome de 39 individus de la même région préalablement publiés:
2017_Bergstrom_Figure1A.jpg

L'analyse avec le logiciel ADMIXTURE montre que les individus des montagnes ne possèdent pas de flux de gènes issu d'Asie de l'Est (composante rouge ci-dessous) contrairement aux individus des plaines:
2017_Bergstrom_Figure1B.jpg

La composante Est Asiatique chez les individus des plaines, est plus forte dans les populations parlant une langue Austronésienne. Elle est la plus faible chez les populations parlant une langue Sepik-Ramu.

L'analyse de l'ADN mitochondrial et du chromosome Y confirme que les populations des montagnes n'ont pas d'haplotypes non originaire du Sahul.

La statistique D montre que les papous de Nouvelle-Guinée ont divergé génétiquement des aborigènes Australiens bien avant la séparation des deux régions par la mer il y a environ 8000 ans.

Les auteurs ont réalisé une Analyse en Composantes Principales:
2017_Bergstrom_Figure2A.jpg

A l'intérieur des populations de Nouvelle Guinée, la plus forte séparation génétique apparait entre l'île principale et l'archipel Bismarck (groupe de droite dans la figure B ci-dessus). D'autre part, les populations des montagnes se regroupent en trois clusters différents alors que toutes les populations des plaines se regroupent ensemble (figure A ci-dessus). Cependant, aucun des trois groupes des montagnes n'est plus proche génétiquement des populations des plaines. Cependant, parmi les différentes populations des plaines, les populations des montagnes sont plus proches de la population de la région de la rivière Sepik, alors que les langues Trans-Nouvelle-Guinée ne sont pas reliées aux langues Sepik-Ramu. Il y a cependant des preuves archéologiques de contacts culturels entre les deux populations durant l'holocène.

Les auteurs ont utilisé la méthode MSMC pour estimer les dates de divergence entre les différentes populations de Nouvelle Guinée. Ainsi les populations des montagnes et les populations de la région de la rivière Sepik ont divergé il y a entre 10.000 et 20.000 ans. La divergence entre les différents groupes des populations des montagnes a eu lieu dans les 10.000 dernières années. D'autre part la population des montagnes a augmenté durant les 10.000 dernières années, contrairement à la population de la région de la rivière Sepik probablement à cause de la diffusion de la malaria.

La différentiation génétique est plus forte dans la population de Nouvelle Guinée (2 à 3%) que dans les populations de taille similaire en Eurasie (< 1%). Elle atteint 4 à 5% entre les populations des montagnes parlant Angan et les autres groupes papous (valeur équivalente à la différentiation génétique entre Européens et Sud Asiatiques).

Les résultats de cette étude confirment l'évolution indépendante des populations du Sahul durant les 50.000 dernières années et l'indépendance de la Nouvelle Guinée par rapport à l'Australie pour une bonne partie de cette période. La structure génétique de la Nouvelle Guinée s'est mise en place durant les 20.000 dernières années et la structure des populations des montagnes durant les 10.000 dernières années correspondant à la néolithisation de la région et à la diffusion des langues de la famille Trans-Nouvelle-Guinée. A la différence d'autres régions du monde, la Nouvelle Guinée n'a pas connu d'Âge des métaux. Ceci peut expliquer que la structure génétique actuelle soit due principalement au phénomène de néolithisation de la région.

mardi 5 septembre 2017

Le génome des Africains du Nord-Est

La vallée du Nil et l'Afrique du Nord-Est ont une longue histoire des peuplements humains. La région contient des fossiles des premiers hommes modernes et a abrité certaines des plus anciennes civilisations du monde. L'agriculture est datée autour de 5000 ans av. JC. avec des plantes issues du Moyen-Orient et du sorgho. Les premiers troupeaux sont datés du 5ème millénaire av. JC. et le pastoralisme s'est rapidement diffusé parmi les premières sociétés néolithiques. La première unité politique est le royaume de Kerma qui émerge vers 3000 ans av. JC.

Aujourd'hui la région du Soudan montre une grande diversité linguistique dont les populations appartiennent à trois grandes familles: Afro-Asiatique, Nilo-Saharienne et Niger-Congo.

Nina Hollfelder et ses collègues viennent de publier un papier intitulé: Northeast African genomic variation shaped by the continuity of indigenous groups and Eurasian migrations. Ils ont séquencé le génome de 221 individus appartenant à 18 populations du Soudan et du Sud-Soudan:
2017_Hollfelder_Figure1A.jpg

Ces populations ont été comparées à d'autres populations mondiales. Les auteurs ont ainsi réalisé une analyse basée sur la distance génétique (Fst):
2017_Hollfelder_Figure1B.jpg

et une analyse avec le logicel ADMIXTURE:
2017_Hollfelder_Figure2.jpg

Les résultats montrent certains niveaux de structure et de différentiation dans les différentes populations du Nord-Est de l'Afrique. Certains groupes montrent notamment une forte affinité génétique avec des populations d'Europe, du Moyen-Orient ou d'Afrique de l'Ouest. De plus les variations génétiques sont corrélées davantage avec la géographie qu'avec la linguistique. Ainsi des populations du Nord et de l'Est du Soudan montrent des affinités génétiques avec des populations non Africaines.

Parmi les populations du Soudan, les quatre populations Nilotiques (Dinka, Nuer, Shilluk et Baria) forment un groupe à part. Dans la figure ci-dessus, ils possèdent une composante bleue foncée qui est partagée avec les autres populations d'Afrique du Nord-Est pour de faibles valeurs de K. Ces populations Nilotiques apparaissent donc comme une source ancestrale pour les autres populations du Soudan. La comparaison avec les anciens fermiers Européens montre qu'ils possèdent très peu de gènes non Africains. Ces populations Nilotiques sont essentiellement des pasteurs. Ils sont fortement endogamiques et sont restés longtemps isolés.

Les populations du Soudan montrent très peu d'ascendance Ouest Africaine (en orange ci-dessus) sauf les Hausa. Ainsi les migrations Bantoues n'ont pas causé de flux de gènes importants en Afrique du Nord-Est, contrairement à d'autres régions Sub-Sahariennes. Les Hausa originaire d'Afrique de l'Ouest, ont migré dans la région très récemment il y a environ 300 ans.

Les Nubiens (Danagla, Mahas et Halfawieen) habitent la vallée du Nil dans le désert aride du Nord du Soudan. Ils parlent une langue Nilo-Saharienne. Ils ont une longue histoire dans la région qui remonte aux dynasties Égyptiennes. Ils sont également proche génétiquement des populations Arabes et Beja voisines. Bien que proches linguistiquement des populations Nilotiques, ils en sont différentiés génétiquement à cause de leur fort mélange génétique avec des populations Eurasiennes (proportion entre 39 et 47%).

Toutes les populations du Nord-Est du Soudan montrent des flux de gènes Eurasiens d'une quantité similaire. Les études précédentes historiques et génétiques ont montré que ce flux de gènes était lié à l'expansion de l'Islam à partir de la péninsule Arabique. Cette étude confirme la date de mélange génétique autour de 56 générations, ce qui nous amène proche du 7ème siècle. Cependant une population: les Halfawieen ont reçu le flux de gènes Eurasien plus récemment il y a seulement 19 générations. Il est connu historiquement que les Arabes rencontrèrent les Nubiens au 7ème siècle, mais furent ensuite bloqués jusqu'à la chute de Dongola vers 1315 ou 1316, et l'éclatement du royaume de Makurie. Cette dernière date est consistante avec la date de mélange génétique de la population Halfawieen.

Les Coptes représentent une minorité Chrétienne qui a migré au Soudan il y a environ 200 ans. Ils sont proches génétiquement de la population Égyptienne, et montre, comme cette dernière, plusieurs mélanges génétiques successifs entre une population sub-Saharienne et des populations Eurasiennes. Il semble qu'ils soient restés isolés une fois arrivés au Soudan.

Les Messiria représentent une population parlant Arabe et habitant les régions du Darfour et du Kordofan. Ils sont proches génétiquement des populations voisines géographiquement, et différents des populations Arabes du Nord-Est du Soudan. Ils montrent un mélange génétique entre une population Nilotique (85%) et une population Eurasienne (15%). Ce mélange est daté de seulement 7 générations, soit environ 200 ans.

Les Gemar, une population parlant une langue Nilo-Saharienne du Darfour et du Kordofan, montrent également un mélange génétique avec une population Eurasienne, daté d'environ 13 générations.

Enfin les Zaghawa et les Nuba, autres populations du Darfour et du Kordofan, montrent très peu de flux de gènes Eurasiens. Il sont proches génétiquement des populations Nilotiques ainsi que des Messiria et des Gemar, suggérant ainsi que toutes les populations du Darfour et du Kordofan ont une origine commune proche de celles des populations Nilotiques.

mercredi 2 août 2017

Diversité génomique de la population de Madagascar

Madagascar est un exemple remarquable de contacts intercontinentaux entre une population Austronésienne et une population Africaine. Malgré de nombreuses théories relatives au lieu et à la date de rencontre entre ces deux populations, il n'y a aucun consensus sur le sujet.

Denis Pierron et ses collègues viennent de publier un papier intitulé: Genomic landscape of human diversity across Madagascar. Ils ont étudié le génome de 2704 individus appartenant à 257 villages Malgaches. Ils ont analysé la séquence mitochondriale complète de 2691 individus, l'ADN du chromosome Y de 1554 hommes et le génome complet de 700 individus.

Les résultats mitochondriaux montrent que tous les lignages Malgaches sont originaires d'Asie de l'Est ou d'Afrique à l'exception de l'haplogroupe M23 qui est détecté uniquement à Madagascar. Les fréquences des haplogroupes Asiatiques et Africains sont sensiblement identiques bien qu'inégalement réparties géographiquement. Tous les lignages Africains sont associés à des populations Bantoues, à l'exception de la sous-clade L2a1b1a associée à une population Est Africaine. Bien que M23 soit spécifique à Madagascar, sa date de diffusion est récente autour de 1200 ans seulement. Ainsi cet haplogroupe n'est pas le signal d'un ancien peuplement pré-Austronésien à Madagascar. Les fréquences des haplogroupes mitochondriaux sont indiquées dans la figure A ci-dessous. Les haplogroupes Africains sont en rouge et les haplogroupes Asiatiques en bleu:
2017_Pierron_Figure2.jpg

Les fréquences des haplogroupes du chromosome Y sont indiquées dans la figure B ci-dessus. Les lignages Africains (en rouge) sont beaucoup plus fréquents que les lignages Asiatiques (en bleu). Quelques lignages d'origine Européenne ou Proche-Orientale sont également présents (R, J, T et G) à faible fréquence.

Les auteurs ont ensuite fait une analyse avec le logiciel ADMIXTURE à partir des génomes complets comparés aux génomes d'autres populations mondiales. Pour K=3, les résultats montrent une nette distinction entre une ascendance Africaine (59%), une ascendance Est Asiatique (37%) et une ascendance Ouest Eurasienne (4%). De plus le partage de segments IBD (identical by descent) indique que les populations Bantoue d'Afrique du Sud et Indonésienne du Sud de Bornéo partagent le plus de génome avec les populations Malgaches. La séparation avec la population du Sud de Bornéo est survenue entre 3000 et 2000 ans, alors que la séparation avec la population Bantoue d'Afrique du Sud remontent à environ 1500 ans.

La répartition géographique des ascendances Africaine et Asiatique présentent des différences notables d'une région à une autre:
2017_Pierron_Figure1B.jpg

Les lignages maternels Africains sont fréquents principalement dans le Nord de l'île, alors que les lignages maternels Est Asiatiques sont fréquents dans le Centre et le Sud de l'île. Les lignages paternels Est Asiatiques sont plus fréquents dans le centre, et les lignages paternels Africains sont présents surtout sur la côte et le Nord de l'île.

Les auteurs ont ensuite réalisé une analyse avec le logiciel fineSTRUCTURE. Pour k=2, le logiciel sépare les populations des Montagnes (avec une forte ascendance Asiatique) de celles des régions côtières (avec une forte ascendance Africaine). Pour des valeurs de k plus élevées, le logiciel révèle une structure génétique plus complexe corrélée fortement à la géographie. Cependant, quel que soit le nombre de clusters, tous ces groupes sont plus proches des mêmes populations d'origine, à savoir une population Bantoue d'Afrique du Sud et une population Indonésienne du Sud de Bornéo. Cette structure génétique est donc liée à l'histoire récente de la population Malgache.

Les auteurs ont ensuite étudié les événements de mélange génétique pour chacun des clusters identifiés précédemment, avec les logiciels GLOBEtrotter et ALDER. Les résultats montrent pour tous les groupes identifiés une source Bantoue Sud Africaine et une source Indonésienne du sud de Bornéo. Cette dernière correspond à la population Banjar pour un groupe et à la population sud Dayak pour les autres. Pour tous les groupes sauf un, il n'y a qu'un seul événement de mélange génétique daté entre 900 et 500 ans. Le dernier groupe montre deux événements de mélange génétique: le premier il y a 28 générations et le dernier il y a seulement quatre générations. La différence de date de mélange génétique d'un groupe à l'autre ainsi que la différence de proportions d'ascendance Africaine et Asiatique d'un groupe à l'autre, suggèrent des événements indépendants d'une région à l'autre de l'île de Madagascar. Enfin les études démographiques menées à partir des partagent de segments IBD suggèrent une expansion de la population commençant entre 1250 et 1000 ans d'abord dans le Nord de l'île:
2017_Pierron_Figure6.jpg

Le scénario correspondant à l'arrivée de la population Africaine dans le Nord de l'île est en accord avec les données archéologiques. Cette étude a montré que cette population Africaine était composée de plus d'hommes que de femmes. La population Africaine arrive donc dans une île préalablement peuplée par une population Est Asiatique qui semble se réfugier dans les montagnes du centre de Madagascar. Cette population du Centre décroit fortement en nombre pas forcément à cause d'une raison dramatique comme les maladies ou la famine, mais peut-être simplement à cause d'une migration d'un petit nombre d'individus.

samedi 20 mai 2017

Histoire génomique de la Sicile et de l'Italie du Sud

La mer Méditerranée a joué un rôle primordial dans les migrations humaines à partir du Levant et du Proche-Orient, notamment durant le Néolithique. Cependant des événements démographiques plus récents ont pu modifier la structure génétique des populations de Sicile et d'Italie du Sud, notamment dans les deux minorités ethnolinguistiques d'Italie: les Arberèches parlant Albanais et situés en Sicile dans la province de Palerme et en Calabre dans la province de Cosenza. Ils ont fui l'Albanie aux 15ème et 16ème siècles, suite à l'invasion Ottomane des Balkans. L'autre minorité est constituée des populations parlant le Grec dans la province de Lecce en Apulie et dans la province de Reggio Calabria en Calabre. Leur origine est incertaine: soit au temps des colonies Grecques, soit durant l'empire Byzantin.

Stefania Sarno et ses collègues viennent de publier un papier intitulé: Ancient and recent admixture layers in Sicily and Southern Italy trace multiple migration routes along the Mediterranean. Ils ont séquencé le génome de 511 échantillons appartenant à 23 populations différentes de Sicile, d'Italie du Sud, d'Albanie et de Grèce:
2017_Sarno_Figure1.jpg

Ces individus ont été comparés à un ensemble de 1469 échantillons issus de 68 populations contemporaines et à 263 anciens génomes. Les auteurs ont réalisé une Analyse en Composantes Principales et une analyse avec le logiciel ADMIXTURE. La figure A ci-dessous montre la PCA dans son ensemble et la figure B indique uniquement les populations Méditerranéennes étudiées dans ce papier:
2017_Sarno_Figure2.jpg

Les populations d'Italie du Sud et des Balkans se situent au centre de la PCA formant un pont ininterrompu entre les populations du Proche-Orient et du Caucase (à droite) et les populations Européennes (au centre). Notamment les populations d'Italie du Sud et de Sicile se regroupent avec les populations des Îles Méditerranéennes (Chypre, Crète, Îles de la mer Égée et Îles Anatoliennes). A l'inverse les populations de Grèce continentale et du Péloponnèse se regroupent avec les autres populations du Sud des Balkans: Albanie et Kosovo, et les populations du Nord des Balkans avec les populations Est Européennes.

L'analyse ADMIXTURE montre les populations étudiées comme un mélange de composantes issues de la région Méditerranéenne: Europe, Caucase, Sardaigne et Proche-Orient. Trois d'entre elles correspondent à d'anciennes populations Européennes: chasseurs-cueilleurs de l'Ouest, chasseurs-cueilleurs du Caucase et premiers fermiers d'Europe. Toutes les populations d'Italie du Sud, de Grèce et du Sud des Balkans montrent une majorité de composante premiers fermiers du Néolithique (en vert ci-dessous), suivie par la composante du Caucase (en jaune ci-dessous). La composante du Proche-Orient (en rouge ci-dessous) est plus importante chez les populations du Sud de l'Italie et des Îles Grecques, alors que la composante Européenne (en bleu ci-dessous) est plus présente chez les populations du Sud des Balkans:
2017_Sarno_FigureS2B.jpg

Les auteurs ont ensuite utilisé le logiciel fineStructure pour mettre en évidence des regroupements à l'intérieur des populations étudiées. Les meilleurs résultats sont obtenus pour un ensemble de 14 groupes:
2017_Sarno_Figure3.jpg

Ainsi la figure ci-dessus montre que les populations de Grèce continentale se regroupent entre elles (cluster bleu clair). Cette couleur est absente dans les populations des Îles Grecques et dans le sud de l'Italie sauf chez les Arberèches de Calabre. Les individus d'Italie du Sud, de Crète et des Îles Égées sont assignés à deux autres groupes. Le premier en vert clair est dominant en Sicile et en Calabre, mais également présent dans les îles Grecques. Le second en violet est présent en Apulie et en Sicile de l'ouest, mais aussi dans le Péloponnèse et dans les îles Grecques. Enfin, les population de Chypre et les grecs d'Italie possèdent leur propre cluster.

Les populations Albanaises d'Italie montrent un partage récent d'ascendances avec les populations des Balkans, mais aussi un échange de gènes avec les populations Italiennes qui les entourent. A l'inverses les populations Grecques d'Italie ne montrent pas de partage récent d'ascendances avec les populations Grecques continentales. Ils se rapprochent davantage des populations du Sud de l'Italie et des îles Grecques. L'arrivée de ces populations remontent donc à l'antiquité. Elles se sont ensuite mélangées génétiquement et culturellement avec les populations voisines dans le sud de l'Italie. De plus ces populations Grecques d'Italie ne présentent pas la composante du Sud des Balkans détectée en Grèce continentale, en Albanie et chez les Arberèches de Calabre (en bleu clair). Ainsi leur arrivée en Italie du Sud précède l'arrivée de cette composante dans les Balkans, probablement au début du Moyen-Âge.

Les auteurs ont ensuite utilisé le logiciel ADLER et la statistique f3 pour mettre en évidence des mélanges génétiques récents. Ainsi les populations des Balkans et du Sud de l'Italie ont vu l'arrivée de populations Européennes, il y a environ 3000 ans (Âge du Fer) et 1500 ans (début du Moyen-Âge). Ces derniers événement peuvent être reliés aux migrations Slaves du Moyen-Âge. La présence de la composante du Caucase dans les populations Méditerranéennes est cependant plus faible que dans les populations du Nord-Est de l'Europe, indiquant probablement une origine différente que celle des migrations Yamnaya. Les auteurs proposent des migrations spécifiques plus tardives, le long des côtes Méditerranéennes, et qui ont pu également apporté les langues Indo-Européennes dans la région.

vendredi 5 mai 2017

Dispersion et adaptation génétique des populations Bantoues en Afrique et en Amérique du Nord

Les preuves linguistiques et archéologiques montrent que les langues Bantoues se sont diffusées avec l'agriculture il y a entre 5000 et 4000 ans de l'Ouest de l'Afrique vers l'Est et le Sud.

Etienne Patin et ses collègues viennent de publier un papier intitulé: Dispersals and genetic adaptation of Bantu-speaking populations in Africa and North America. Ils ont séquencé le génome de 1318 individus issus de 35 populations Bantoues d'Afrique de l'Ouest qu'ils ont fusionnés avec le génome d'autres populations Africaines Bantoues ou non pour former un ensemble de 2055 échantillons issus de 57 populations différentes. Dans les figures ci-dessous, BSP (Bantu-speaking populations) est indiqué pour les populations Bantoues de l'Ouest (wBSP), de l'Est (eBSP), du Sud-Ouest (swBSP) et du Sud-Est (seBSP). RHG (Rainforest Hunter-Gatherer) est utilisé pour les chasseurs-cueilleurs des forêts de l'Ouest (wRHG) et de l'Est (eRHG):
2017_Patin_Figure1A.jpg

Les auteurs ont réalisé une analyse avec le logiciel ADMIXTURE:
2017_Patin_Figure1B.jpg

La figure ci-dessus, indique que toutes les populations Bantoues se regroupent entre elles, avec une majorité d'ascendance rouge. Cette homogénéité reflète la récente dispersion de ces populations en Afrique Sub-Saharienne. Elles possèdent de faibles proportions d'ascendance chasseur-cueilleur des forêts (16% en vert clair), Afro-asiatique (17% en rose), et chasseur-cueilleur San (23% en jaune pâle).

Le logiciel GLOBETROTTER a permis de mettre en évidence des événements de mélange génétique. Ainsi un mélange génétique a eu lieu il y a entre 1500 et 1000 ans, puis entre 400 et 150 ans entre des Bantous de l'Ouest d'Angola et des populations Afro-asiatiques d’Éthiopie (10%) (Figure A ci-dessous). En Afrique du Sud, un mélange génétique a eu lieu il y a environ 700 ans entre une population Bantoue d'Angola mais aussi de l'Est, et des chasseurs-cueilleurs San de Namibie (23%) (Figure B ci-dessous):
2017_Patin_Figure2.jpg

Il y a environ 800 ans un mélange génétique a eu lieu entre une population Bantoue de l'Ouest et des chasseurs-cueilleurs des forêts.

Ces données renforcent le modèle selon lequel l'expansion Bantoue s'est effectuée d'abord vers le sud depuis le lieu d'origine situé à la frontière entre le Nigeria et le Cameroun, jusqu'en Angola à travers la zone forestière, puis vers l'Est et vers le Sud en deux mouvements séparés.

Les auteurs ont ensuite recherché des signes de sélection naturelle durant la dispersion des populations Bantoues. Ils ont ainsi mis en évidence 8, 5 et 7 régions du génome présentant une forte sélection dans les populations Bantoues de l'Ouest, de l'Est et du Sud-Est respectivement:
2017_Patin_Figure3.jpg

Ainsi, les gènes HLA qui transmettent la réponse immunitaire, présentent les plus forts signaux de sélection. Ensuite le gène CD36 associé à la réponse à la malaria présente le second signal. Le gène LCT qui code la réaction au lactase présente un signal fort chez les populations Bantoues de l'Est.

Les auteurs ont ensuite estimé la contribution Bantoue dans la population Afro-Nord Américaine en analysant 5244 échantillons. Ainsi le logiciel ADMIXTURE estime que les Afro-Américains possèdent entre 73% et 78% d'ascendance Africaine dont 13% issue de Sénégambie, 7% de Côte d'Ivoire, 50% du Golfe du Bénin et 30% d'Afrique Centrale de l'Ouest:
2017_Patin_Figure4.jpg

mardi 25 avril 2017

L'héritage génétique des Zoroastriens d'Iran et d'Inde

Le Zoroastrisme est une religion de différentes tribus d'Iran et d'Inde du Nord, supposée fondée par le prophète Zarathoustra qui vivait autour de 1200 av. J.C. Cette religion est devenue la religion d'état de trois grand Empires Iraniens: les Achéménides entre 559 et 330 av. J.C., les Parthes entre 247 av. J.C. et 224 ap. J.C. et les Sassanides entre 224 et 651 ap. J.C. jusqu'aux conquêtes Arabes.

D'après la tradition, un groupe de Zoroastriens d'Iran a navigué vers les côtes de l'Inde du Nord pour échapper aux persécutions Musulmanes. Ils ont débarqué dans le Gujarat où ils ont pu s'installer et pratiquer leur religion. La date de cette arrivée est sujette à débat et varie entre 785 et 936 ap. J.C. Les Zoroasriens d'Inde (appelés Parsis) ont toujours gardé le contact avec les Zoroastriens d'Iran. Aujourd'hui, les communautés Zoroastriennes sont concentrées en Inde (61.000 individus), dans le Sud du Pakistan (1675 individus) et en Iran (14.000 individus). Cependant durant les 200 dernières années, des communautés se sont formées aux États-Unis (14.300), au Canada (6400), au Royaume-Uni (5000), en Australie (3808) et au Moyen-Orient (2030). Le Zoroastrisme est une religion non prosélyte avec une hérédité masculine chez les prêtres.

Saioa López et ses collègues viennent de publier un papier intitulé: The genetic legacy of Zoroastrianism in Iran and India: Insights into population structure, gene flow and selection. Ils ont analysé le génome de 526 hommes d'Inde, Iran, des Émirats Arabes Unis et du Royaume Uni. Ces données ont été comparées à différentes populations mondiales et à quelques génomes anciens d'Europe, d'Asie et d'Afrique.

Les auteurs ont réalisé une Analyse en Composantes Principales:
2017_Lopez_FigureS3.jpg

La plupart des Zoroastriens Iraniens (points vert clair) se regroupent avec les autres échantillons Iraniens (points vert). Les Parsis (points bleu clair) s'étirent le long de la composante PC1 entre les Iraniens et les échantillons Indiens (points bleu).

Le logiciel fineStructure permet de regrouper les échantillons Indiens et Iraniens en 51 groupes différents. Un de ces groupes comprend les 13 Parsis et un autre 27 des 29 Zoroastriens d'Iran plus un autre Iranien:
2017_Lopez_Figure1A.jpg

Les mesures de distance génétique montrent que les Zoroastriens sont fortement génétiquement différentiés des échantillons non Zoroastriens. Ces résultats indiquent une forte isolation génétique des groupes Zoroastriens. Cependant les Parsis montrent davantage de mélange génétique avec les groupes non Zoroastriens d'Inde.

Les analyses des haplogroupes mitochondriaux et du chromosome Y montrent également moins de diversité génétique chez les Zoroastriens que chez les non Zoroastriens.

L'analyse de la statistique f3 montre que les Parsis sont composés d'une ascendance Indienne et d'une ascendance proche des anciens Néolithiques d'Anatolie ou des populations actuelles du Proche-Orient. Par contre pour les Zoroastriens d'Iran, aucun mélange génétique n'est détecté.

L'analyse avec le logiciel GLOBETROTTER permet d'identifier un mélange génétique chez les Parsis entre une population actuelle d'Inde (30%) et une population actuelle d'Iran (70%) qui remonte entre 27 et 32 générations. Chez les Zoroastriens d'Iran un mélange génétique entre une population actuelle de Croatie ou de Chypre et une ancienne population Néolithique d'Iran et qui remonte à environ 66 générations, est détectée.

L'haplogroupe du chromosome Y principal chez les Zoroastriens (Iraniens ou Indiens) est J alors que chez les non Zoroastriens d'Inde et du Pakistan l'haplogroupe dominant est R. A l'inverse, tous les groupes d'Inde et du Pakistan ainsi que les Parsis ont un haplogroupe mitochondrial principal qui est M, différent des Zoraostriens d'Iran. Les Parsis sont très proches des Zoroastriens d'Iran concernant le chromosome Y, alors qu'ils en sont éloignés concernant l'ADN mitochondrial. Ainsi la contribution des Zoroastriens Iraniens aux Parsis est de 96% sur le chromosome Y, alors qu'il est seulement de 8% sur l'ADN mitochondrial. Ces résultats indiquent que la migration des Zoroastriens d'Iran vers l'Inde a été essentiellement composée d'hommes qui ont pris des femmes localement en Inde.

De plus, l'étude des haplogroupes du chromosome Y des prêtres Parsis montre qu'ils descendent de seulement deux ascendants fondateurs dont l'âge remonte à 37 (1036 ans environ) et 31 (868 ans environ) générations respectivement.

mercredi 29 mars 2017

Histoire génétique du sous-continent Indien

A la suite de la migration hors d'Afrique, l'Asie du Sud a probablement été l'un des premiers territoires colonisés par les hommes modernes. Ce point est conforté par la forte diversité génétique de cette région. Quoique les premiers fossiles humains remontent seulement entre 36.000 et 28.000 ans, les estimations génétiques et archéologiques suggèrent une arrivée de l'homme moderne il y a environ 50.000 ans, soit après l'éruption volcanique du mont Toba.

L'Inde est composé de différents groupes de populations associés à différentes religions et différentes langues. Les langues Indo-Européennes sont plus souvent parlées dans le Nord de l'Inde, le Pakistan et le Bangladesh. On suppose que leur arrivée dans la région remonte aux invasions Indo-Aryennes datées d'environ 3500 ans. Le Sud de l'Inde est dominé par les langues Dravidiennes souvent associées aux dispersions Néolithiques à partir de l'Asie du Sud-Ouest. De manière générale, l'Inde montre un haut niveau d'endogamie lié à des barrières sociales strictes et une dérive génétique importante consécutive à l'isolation de certaines de ces populations.

Marina Silva et ses collègues viennent de publier un papier intitulé: A genetic chronology for the Indian Subcontinent points to heavily sex-biased dispersals. Ils ont réuni les séquences complètes mitochondriales disponibles dans la littérature, le projet des 1000 génomes et le projet Human Genome Diversity, relatives aux populations d'Asie du Sud. Ils ont également analysé le génome complet à partir des données disponibles, ainsi que l'ADN du chromosome Y.

Les auteurs ont d'abord construit un arbre phylogéographique mitochondrial en se concentrant sur les lignages originaires d'Asie du Sud à partir de 1478 échantillons. Ils ont également estimé l'âge des principales sous-clades:

2017_Silva_Figure1.jpg

Il y a deux haplogroupes principaux en Asie du Sud: M et R. L'haplogroupe N reste lui rare dans la région. L'âge de M est estimé à environ 50.000 ans en Asie du Sud et l'âge de R à environ 64.500 ans. Les plus anciennes sous-clades de R sont plus fréquentes dans l'ouest et le sud de la région, supportant ainsi une route côtière sud de colonisation de l'Asie. La phylogéographie de l'haplogroupe M est plus complexe montrant à priori des âges équivalents dans les différentes régions de l'Asie du Sud. Cependant si les auteurs tiennent compte de l'origine probable de chaque sous-clade, l'âge de l'haplogroupe M dans l'ouest est plus ancien que dans les autres régions, supportant également une route côtière sud de colonisation de l'Asie. Ce résultat suggère des ré-expansions de certaines sous-clades de M à une date plus récente à l'intérieur du sous-continent Indien. Ainsi plusieurs branches: M38, M65, M45, M5b, M5c, M34, M57 et M33a montrent une diffusion autour de 38.000 ans. Ces résultats sont supportés par une analyse Bayesian Skyline Plots avec le logiciel BEAST qui montre un accroissement de la population effective portant l'haplogroupe M à cette période:
2017_Silva_FigureS1.jpg

La figure ci-dessus montre une seconde expansion autour de 12.000 ans correspondant au réchauffement climatique à la suite du Dernier Maximum Glaciaire. C'est le cas des sous-clades suivantes: M6a1a (11.4 ka), M18a (9.2 ka), M30d (12.1 ka), R8b1 (11.6 ka) et U2b2 (9.2 ka) à partir du Sud et de R30c + 373 (12.4 ka) à partir de l'Ouest.

L'analyse phylogéographique indique également que certaines clades arrivent en Asie du Sud en provenance du Proche-Orient autour de 21.000 ans: N1a1b1, pre-HV2, HV + 146!, HV + 9716, HV + 73!, pre-U1c, U1a1, J1d et une clade de T2. Autour de 12.000 ans, plusieurs clades arrivent d'Asie du Sud-Ouest: T2e2, T2 + 195 + 4225, W3a1 + 143, W3a1b, U1a3 + 10253, N1a2, U7a + 12373 et U7a3a + 6150. Ensuite plusieurs lignages mitochondriaux semblent arriver avec le Néolithique en provenance d'Anatolie, du Caucase ou d'Iran: K2a5 + 2831 + 189, HV14 + 150, H13a2a + 8952, K2a5 + 2831, X2 + 153! + 7109 et U1a3a ou d'Arabie Saoudite: R0a2 + 11152. A l'Âge du Bronze, il y a également l'arrivée de H29 + 9156 + 4689, R2a + 7142 et U1a1a2a.

Les auteurs ont ensuite analysé le génome complet de la population d'Asie du Sud avec le logiciel ADMIXTURE:
2017_Silva_Figure2a.jpg

La figure ci-dessus montre que les ascendances occidentales (en marron, jaune et bleu foncé) sont plus fréquentes dans l'Ouest de l'Asie du Sud notamment au Pakistan. La composante marron correspondant aux chasseurs-cueilleurs du Caucase (mais aussi au Mésolithique et Néolithique d'Iran) atteint ainsi 35% au Pakistan et dans le Gujarat. Cette composante correspond également à environ 50% de l'ascendance des pasteurs nomades de la culture Yamnaya des Steppes.

La composante jaune correspondant aux populations de la péninsule Arabique, se retrouve avec une proportion d'environ 15% chez certaines populations Musulmanes du Pakistan: Baloutches, Brahouis et Makranis.

Les auteurs ont également construit une Analyse en Composantes Principales:
2017_Silva_Figure2b.jpg

La figure ci-dessus montre que les populations d'Asie du Sud sont plus proches des populations d'Asie Centrale et du Caucase que des populations du Proche-Orient ou d'Arabie. Les populations Pakistanaises se retrouvent dans une position intermédiaire. L'analyse classique pour expliquer la structure génétique des populations d'Asie du Sud est de considérer qu'elle dérive de deux populations ancestrales: Ancient North Indians (ANI) et Ancient South Indians (ASI). La composante ANI (importante dans le Nord-Ouest) serait arrivée dans la région en deux vagues (Néolithique et Âge du Bronze). Les résultats mitochondriaux suggèrent que la réalité a été plus complexe avec au moins quatre vagues d'arrivée entre la Dernière Glaciation et l'Âge du Bronze.

Les résultats mitochondriaux montrent une proportion de lignages autochtones située entre 70 et 90%. Elle est supérieure à la proportion d'ascendance autosomale autochtone (entre la moitié et deux tiers). Les auteurs ont ensuite analysé les lignages paternels issus de l'ADN du chromosome Y. La proportion de lignages occidentaux se situe entre 50 et 90% selon les régions d'Asie du Sud:
2017_Silva_Figure3.jpg

La figure ci-dessus résume ces résultats pour différentes régions: Penjab (PJL), Gujarat (GIH), Telugu (ITU), Sri Lanka (STU) et Bengale (BEB). La figure b montre les proportions des différentes origines (Africaine en orange, Est Asiatique en gris, Occidentale en noir et autochtone en vert) pour les lignages maternels. La figure c montre les proportions pour les lignages paternels et la figure d pour les lignages autosomaux. De manière générale les lignages paternels occidentaux sont beaucoup plus fréquents que les lignages maternels occidentaux.

Ainsi les lignages maternels sont principalement autochtones à l'Asie du Sud et permettent de remonter à la première colonisation de la région par l'homme moderne il y a environ 55.000 ans. Ensuite plusieurs lignages mitochondriaux arrivent d'Asie du Sud-Ouest durant et après le Dernier Maximum Glaciaire. Ces mouvements ont dû commencer à contribuer à la proportion d'ANI dans la population d'Asie du Sud, au niveau génomique.

2017_Silva_Figure4.jpg

Les premiers sites Néolithiques de la vallée de l'Indus datent d'environ 9000 ans. De nombreux lignages mitochondriaux datent de cette période. Certaines hypothèses attribuent l'arrivée des langues Indo-Européennes à cette époque, bien que d'autres suggèrent plutôt l'arrivée des langues Dravidiennes. Ainsi l'hypothèse de la dispersion des langues Indo-Européennes la plus largement acceptée est celle des Steppes de l'Âge du Bronze. Elle a reçu des supports des dernières études d'ADN ancien sur les populations de la culture Yamnaya et les anciennes populations d'Europe. Une arrivée de tels migrants en Asie du Sud a probablement contribué à l'augmentation de la composante marron dans l'ADN autosomal. Les preuves archéologiques suggèrent que les descendants de la culture d'Andronovo et de la culture de Sintashta ont d'abord infiltré l'Asie Centrale (BMAC) avant d'entrer en contact avec la civilisation de l'Indus il y a environ 4000 à 3500 ans.

Notamment des analyses récentes du chromosome Y suggèrent que l'haplogroupe R1a s'est dispersé à la fois vers l'ouest et vers l'est en Eurasie à la fin du Néolithique et à l'Âge du Bronze. La clade R1a-M17 représente environ 17,5% des lignages paternels en Inde et montre de plus hautes fréquences dans les groupes Indo-Européens que dans les groupes Dravidiens. Notamment, l'âge des sous-clades R1a-Z93 et R1a-Z94 sont trop récents pour correspondre à l'arrivée du Néolithique:
2017_Silva_Figure5.jpg

De plus tous les individus des cultures Andronovo et Sintashta actuellement analysés appartiennent à l'haplogroupe R1a. Tous ces résultats suggèrent que l'haplogroupe R1a est le marqueur de la diffusion des Indo-Aryens en Asie du Sud. Ces résultats doivent cependant être validés par des test d'ADN ancien en Asie du Sud.

Les auteurs ont également mis en évidence que l'haplogroupe mitochondrial H2b semble également lié à la diffusion des Indo-Européens en Asie du Sud:
2017_Silva_Figure6.jpg

Cette clade est datée d'environ 6200 ans avec une probable origine en Europe de l'Est. Elle inclut notamment des individus Sud Asiatiques, ainsi que deux individus anciens des cultures Yamnaya et Srubnaya.

Finalement le schéma général du peuplement de l'Asie du Sud ressemble par certains côtés à celui de l'Europe avec plusieurs vagues de migrations au Paléolithique, au Mésolithique, au Néolithique et à l'Âge du Bronze. Ainsi l'haplogroupe R1b semble avoir joué le rôle en Europe de l'haplogroupe R1a en Asie du Sud avec une migration conduite principalement par des hommes porteurs des langues Indo-Européennes. Cependant l'influence sur l’Europe a été plus importante qu'en Asie du Sud avec une plus grande fréquence de l'haplogroupe R1b en Europe que celle de l'haplogroupe R1a en Asie du Sud et une plus grande influence des langues Indo-Européennes en Europe qu'en Asie du Sud.

mardi 14 mars 2017

Histoire génomique de la population du Péloponnèse

Le Péloponnèse a été peuplé par une série de migrations depuis des millénaires. Les premiers fermiers du Néolithique ont quitté l'Anatolie pour s'installer dans la péninsule vers 9000 av. JC. Plus tard les Mycéniens ont développé une civilisation de l'Âge du Bronze importante. Le débat reste ouvert pour savoir s'ils sont arrivés du Nord vers 2200 av. JC ou s'ils ont émergé des sociétés Néolithiques locales. Au début du premier millénaire av. JC, les Doriens ont envahi le Péloponnèse. Les quatorze siècles suivants ont été marqués par des changements suite à des guerres ou à des épidémies. Durant la période Médiévale, la migration des Slaves dans les Balkans a pu influencer le Péloponnèse. L'importance de cette influence fait débat depuis 170 ans lorsque l'historien Allemand Jacob Philipp Fallmerayer a présenté une théorie dans laquelle il suppose que la totalité de la population du Péloponnèse a été remplacée par des Slaves.

George Stamatoyannopoulos et ses collègues viennent de publier un papier intitulé: Genetics of the peloponnesean populations and the theory of extinction of the medieval peloponnesean Greeks. Ils ont analysé le génome de 241 individus du Péloponnèse:
2017_Stama_Figure1a.jpg

Les auteurs ont réalisé une Analyse en Composantes Principales:
2017_Stama_Figure1b.jpg

Les habitants de la Tsakonie se situent dans la partie en haut à gauche, alors que ceux de la péninsule de Mani dans le sud du Péloponnèse se situent à droite. Tous les autres habitants du Péloponnèse se regroupent ensemble, dans le bas de la figure. Les Tsakoniens sont la population du Péloponnèse la plus éloignée des autres. De plus ils parlent un dialecte d'origine Dorienne qui n'est pas compris par les autres populations du Péloponnèse.

L'analyse avec le logiciel ADMIXTURE confirme que les habitants de Tsakonie et de Mani se situent à part:
2017_Stama_Figure1e.jpg

L'analyse des segments IBD (Identity by descent) confirme l'existence d'une structure génétique dans la population du Péloponnèse. Ainsi les Maniots partagent plus de segments entre eux qu'avec les autres populations, de même que les Tsakoniens.

Les auteurs ont ensuite comparé la population du Péloponnèse (en rouge ci-dessous) à d'autres populations Européennes:
2017_Stama_Figure2a.jpg

La figure ci-dessus montre que les habitants du Péloponnèse sont proches des Siciliens (triangles verts) et des Italiens (carrés violets, disques bleu clair et carré noirs). L'analyse par réseau ci-dessous indique également qu'ils sont par contre éloignés des Slaves:
2017_Stama_Figure2c.jpg

Les habitants du Péloponnèse sont connectés aux populations du Proche-Orient via les Crétois et les habitants du Dodécanèse.

Une Analyse en Composantes Principales spécifique avec les populations Slaves, montrent que les habitants du Péloponnèse en sont très éloignés:
2017_Stama_Figure3a.jpg

Ces résultats vont à l'encontre de l'hypothèse de Fallmerayer qui proposait que la population du Péloponnèse a été remplacée par des tribus Slaves à l'époque Médiévale. L'ascendance Slave dans cette population varie de 0 (ches les Maniots) à 15% (chez les Messéniens). Il est cependant clair que des tribus Slaves ont bien séjourné dans le Péloponnèse, mais ils devaient être peu nombreux et ont été assimilés par la population locale.

lundi 20 février 2017

Histoire génétique des populations Sibériennes

L'histoire des populations Sibériennes est importante pour éclairer l'origine des populations Eurasiennes et Amérindiennes. La Sibérie est peuplée depuis des centaines de milliers d'années. En effet l'homme de Neandertal est identifié dans la région entre 260.000 et 40.000 ans. De plus, une nouvelle espèce: l'homme de Denisova a été détecté récemment en Sibérie. Les traces de l'homme moderne remontent à 45.000 ans dont notamment l'os découvert récemment à Ust’-Ishim, et qui a été séquencé. Il présente des traces d'ADN de Neandertal. D'autres anciens restes humains ont produit de l'ADN ancien comme le garçon de Mal’ta vieux de 24.000 ans et le Sibérien de Afontova Gora vieux de 17.000 ans. Les analyses ont montré que 42% de l'ascendance des Amérindiens était issu de cette ancienne population Nord Eurasienne.

Les populations actuelles de Sibérie montrent une forte diversité génétique et culturelle. Dans la région de l'Oural, elles parlent des langues Ouraliennes divisées en langues Ougriennes et Samoyèdes. Dans la région Centrale et Orientale, elles parlent des langues Altaïques divisées en langues Mongoles, Toungouses et Turques:
2017_Wong_FigureS1.jpg

Emily HM. Wong et ses collègues viennent de publier un papier intitulé: Reconstructing Genetic History of Siberian and Northeastern European Population. Ils ont séquencé le génome de 28 individus appartenant à 14 groupes ethniques de Sibérie et d'Europe de l'Est, ainsi que de 45 individus Mansi et 37 individus Khanty:
2017_Wong_Figure1a.jpg

Les auteurs ont comparé ces échantillons à 892 individus d'Asie, d'Europe, de Sibérie et Amérindiens en effectuant une analyse en composantes principales:
2017_Wong_Figure1b.jpg

La première composante permet de séparer les populations Européennes des populations Est Asiatiques. La seconde composante sépare les populations du Nord des populations du Sud.

Les auteurs ont ensuite utilisé le logiciel TreeMix:
2017_Wong_Figure2.jpg

Les populations de l'Ouest de la Sibérie: Khantys, Mansis et Nénètses apparaissent comme un groupe relié aux Européens, bien qu'ayant divergé précocement. De plus 43% de l'ascendance de ces populations est attribué aux Evenkis de Sibérie Orientale, et 38% de l'ascendance des Nénètses est issu des Evènes également de Sibérie Orientale. Ces résultats sont confirmés par la statistique D. Enfin 6% des populations de Sibérie Occidentale vient des Amérindiens. Ce résultat s'explique par un lignage Ancien Nord Eurasien (ANE) commun entre les Sibériens Occidentaux et les Amérindiens.

Ensuite les auteurs ont utilisé une méthode MSMC pour estimer les temps de divergence entre les différentes populations. Ainsi les résultats suggèrent que les populations de Sibérie Occidentale se sont séparées récemment il y a environ 4800 ans, donc après le mélange génétique avec les Evenkis estimés autour de 6800 ans. La séparation entre Français et les populations de l'Europe de l'Est remonte entre 7000 et 2300 ans.

Les Sibériens, les Amérindiens, les Est Asiatiques et les Kalmouks du bassin de la Volga en Russie, forment un groupe séparé. Ainsi les Bouriates, Iakoutes, Évènes, Evenkis et Altaïens forment une clade spécifique après leur divergence des Est Asiatiques il y a environ 8800 ans.

Les auteurs ont ensuite étudié les haplogroupes du chromosome Y et mitochondriaux à partir de 54 individus actuels et 8 anciens individus:
2017_Wong_Figure4a.jpg

La divergence la plus ancienne correspond à la séparation de l'haplogroupe A il y a environ 131.000 ans. Ensuite l'haplogroupe Africain E diverge il y a environ 69.000 ans, fournissant une limite supérieure à la date de l'Out Of Africa.

L'arbre mitochondrial montre que la plus ancienne divergence correspond à celle de l'haplogroupe L0 à une date voisine de 124.000 ans:
2017_Wong_Figure4b.jpg

Les trois premières divergences séparent des groupes Africains. Le plus récent est L2 daté d'environ 85.000 ans qui fournit là aussi une limite supérieure à l'Out Of Africa.

La divergence des haplogroupes Amérindiens est consistante avec la première colonisation des Amériques autour de 15.000 ans.

Les haplogroupes principaux Européens du chromosome Y sont I, J, R et N. Parmi ceux-ci, I est le plus ancien. Il diverge de sa clade sœur: J il y a environ 44.000 ans et se diffuse en Europe il y a au moins 29.000 ans. Ensuite K2 qui diverge de IJ, est ancestral à NO et à QR. L'ancien individu Ust’-Ishim est ancestral à la clade NO. L'haplogroupe Européen R se sépare en deux clades: R1a et R1b il y a environ 23.000 ans. R1b se retrouve principalement en Europe Occidentale, alors que R1a se retrouve en Europe de l'Est, mais aussi dans la région de l'Altaï et dans le Nord de l'Inde et au Pakistan. Ces derniers ont un ancêtre commun vieux de 5100 ans. L'haplogroupe du chromosome Y N s'étend de la Sibérie à l'Europe de l'Est, mais est le plus fréquent parmi les Iakoutes, les Nénètses et les Nganassanes. La divergence entre les haplogroupes N et O est estimée autour de 38.000 ans.

Les auteurs ont ensuite comparer les génomes Sibériens avec quinze ancien génomes. Notamment le logiciel TreeMix place l'individu de Ust’-Ishim avant la divergence entre Européen et Est Asiatiques. L'ancêtre commun aux Sibériens et aux Est Asiatiques reçoit 38% d'ADN de l'individu de Ust’-Ishim. Ces résultats sont confirmés par la statistique D. Les Amérindiens reçoivent 41% de leur ADN d'un lignage ANE représenté par les deux individus de Mal’ta et de Afontova Gora. De plus les groupes Sibériens Mansi et Nénètses se regroupent avec ces deux anciens individus. Ces résultats sont encore supportés par la statistique D. Les Mansis reçoivent 43% de leur ADN des Evenkis et des Evènes et 57% d'un lignage ANE. L'ancien individu du Groenland: Saqqaq vieux de 4000 ans est relié aussi bien aux Est Asiatiques et aux Sibériens Orientaux, notamment les Evènes. La statistique D montre également que les Mansis ont de l'ascendance issue des chasseurs-cueilleurs d'Europe de l'Est.

Les résultats de cette étude peuvent être résumé par la figure ci-dessous qui présente un modèle des dispersions des différentes populations Nord Eurasiennes:
2017_Wong_Figure8.jpg

Ce modèle indique que les hommes modernes ont quitté l'Afrique il y a environ 70.000 ans avant de diverger il y a environ 45.000 ans entre l'Europe et l'Asie Orientale. Notamment les Sibériens Orientaux ont divergé des Est Asiatiques il y a environ 10.000 ans. D'autre part, il y a un lien génétique entre les anciens Sibériens de Mal'ta et les Amérindiens, mais aussi avec les Sibériens Occidentaux comme les Mansis et les chasseurs-cueilleurs d'Europe de l'Est. Il faut noter également que les anciens Yamnayas ont une plus grande affinité ANE que les Mansis, mais également une plus grande affinité génétique avec les Mansis qu'avec les Européens Occidentaux, ou les Sibériens Orientaux. Cependant le flux de gènes de Sibérie Occidentale en Europe de l'Est prédate la culture Yamnaya puisque les chasseurs-cueilleurs d'Europe de l'Est ont déjà cette affinité génétique de Sibérie Occidentale.

jeudi 9 février 2017

Histoire génomique du peuple Gond en Inde

Le paysage linguistique de l'Inde est composé de quatre familles principales et quelques isolats. La majorité de la population parle une langue Indo-Européenne qui couvre principalement le Nord et l'Ouest de l'Inde. Les langues Dravidiennes sont parlées surtout dans le Sud de l'Inde avec quelques exceptions: les Brahouis du Pakistan, les Kurukh–Malto dans l'Est de l'Inde et les Gonds dans le centre de l'Inde. Les langues Austro-asiatiques sont dispersées principalement dans le centre et l'est de l'Inde. Enfin les Tibéto-Birmans sont localisés près de l'Himalaya et dans le Nord-Est de l'Inde.

De manière générale, les études génétiques précédentes ont montré que l'ascendance génétique des peuples Austro-asiatiques et Tibéto-Birmans était fortement corrélée avec la distance linguistique, alors que l'ascendance génétique des peuples Indo-Européens et Dravidiens était corrélée avec la distance géographique.

La région Centre-Est de l'Inde présente trois groupes linguistiques différents. Elle abrite plus de 30% des populations tribales de l'Asie du Sud, dont certaines pratiquent encore la chasse et la cueillette. Des études précédentes ont montré des changements de langues dans certaines populations sans modification de leur composition génétique. Le peuple Gond représente la tribu la plus nombreuse de cette région avec plus de 12 millions d'individus. Ils sont situés principalement dans l'Est du Centre de l'Inde. Ils parlent différentes langues de la famille Dravidienne: Gondi, Konda, Kui, Kuvi, Pengo et Manda.

Gyaneshwer Chaubey et ses collègues viennent de publier un papier intitulé: Reconstructing the population history of the largest tribe of India: the Dravidian speaking Gond. Ils ont analysé le génome de 18 individus Gonds situés dans quatre localités différentes des états Indiens suivants: Madhya Pradesh, Chhattisgarh et Uttar Pradesh:
2017_Chaubey_FigureS1.jpg

Ils ont été comparés à différentes populations Eurasiennes. Les auteurs ont réalisé une Analyse en Composantes Principales. La figure ci-dessous montre une direction principale entre les Européens et les Dravidiens avec les Pakistanais et les Indiens Indo-Européens situés entre les deux extrémités:
2017_Chaubey_Figure1a.jpg

Les Gonds se situent en dehors de cette direction principale, décalés vers les Est Asiatiques. Ils se situent notamment proche des Indiens Austro-asiatiques. Le groupe Transitionnal correspond aux populations Indiennes dont on sait qu'elles ont changé de langues récemment.

Ensuite les auteurs ont réalisé une analyse avec le logiciel ADMIXTURE. Le meilleur résultat est obtenu pour le paramètre K=9:
2017_Chaubey_Figure1b.jpg

La composante k4 vert foncé est majoritaire chez les Gonds. La composante k7 vert clair est négligeable chez les Gonds par rapport aux Indiens Indo-Européens et Dravidiens. Les Gonds sont plutôt similaires aux Indiens Nord Mundas qui parlent une langue Austro-asiatique.

Les auteurs ont ensuite utilisé le logiciel fineSTRUCTURE pour mieux comprendre le partage de gènes entre les Gonds et les autres populations Indiennes. La figure ci-dessous indique ainsi le nombre de segments d'ADN partagés avec les Gonds:
2017_Chaubey_Figure2a.jpg

Comme attendu, les Gonds reçoivent plus de segments d'ADN des populations Sud Asiatiques et parmi celles-ci, ils en reçoivent le plus des Mundas Austro-asiatiques et des populations Transitional.

Ces résultats sont confirmés par les statistiques f3 et D. Cependant le nombre de segments d'ADN issus des populations Sud Munda est plus faible que le nombre de segments issus des populations Nord Munda, ce qui suggère une identité spécifique des Gonds. Le niveau de flux de gènes entre Gonds et Mundas est cependant plus faible que le niveau de flux de gènes entre populations Nord et Sud Mundas.

Enfin les auteurs ont utilisé le logiciel TreeMix pour évaluer l'affinité génétique des Gonds avec les autres populations Indiennes. Les Gonds se regroupent avec les populations Austro-asiatiques de l'Ouest. Cependant différents flux de gènes sont révélés entre populations de la région du Centre Est de l'Inde. Ainsi les effets de la géographie, de la langue ou de l'ethnicité qui jouent un rôle majeur dans d'autres régions de l'Inde, sont minimisés dans cette région qui a servi d'aire marginale de rencontre entre différentes populations.

Tous ces résultats pointent vers un changement de langues des populations Gonds de l'Austro-asiatique vers le Dravidien, suite à un contact avec une population probablement moins nombreuse mais plus développée technologiquement.

mercredi 8 février 2017

Histoire génomique des Brahouis du Pakistan

Le Pakistan se situe en Asie du Sud et représente environ 10% de la population de cette région caractérisée par de multiples groupes ethniques et linguistiques. On suppose que les premiers hommes modernes y sont entrés à la suite de leur première expansion hors d'Afrique il y a entre 70.000 et 50.000 ans. Il y a environ 9000 ans ont émergé les premières cités Néolithiques de la culture de Harappa. Depuis, la région a subi plusieurs vagues de migration qui ont influencé le motif génétique des populations actuelles.

Les première études génétiques au Pakistan ont montré que les affinités génétiques entre groupes sont davantage corrélées avec la distance géographique qu'avec l'origine linguistique. Une exception notable est celle de la population Kalash qui semble reliée à des chasseurs-cueilleurs de Sibérie.

Les langues Indo-Européennes prédominent au Pakistan à côté d'un isolat linguistique: le Bourouchaski, plusieurs groupes Tibéto-Birmans et un groupe Dravidien: les Brahouis. Ce groupe est entouré géographiquement de groupes Indo-Européens et est éloigné des autres groupes Dravidiens situés en Inde et au Sri-Lanka. Les premières études mitochondriales et du chromosome Y ont montré que les Brahouis étaient similaires génétiquement à leurs voisins Indo-Européens.

Luca Pagani et ses collègues viennent de publier un papier intitulé: An ethnolinguistic and genetic perspective on the origins of the Dravidian speaking Brahui in Pakistan. Ils ont analysé le génome complet de plusieurs Brahouis ainsi que d'échantillons appartenant à d'autres populations d'Afrique, de Chine, de Russie, d'Inde et du Pakistan:
2017_Pagani_Figure1.jpg

Dans la figure ci-dessus, les populations Indo-Européennes sont représentées par des disques noirs, les populations Dravidiennes par des disques rouges et les populations d'autres langues par des cercles noirs. DRI représente un groupe Indien Dravidien, IEI un groupe Indien Indo-Européen et AAI un groupe Indien Austro-asiatique. L'ensemble est constitué de 237 échantillons génotypés sur environ 470.000 SNPs.

Les auteurs ont réalisé une Analyse en Composantes Principales. La figure ci-dessous représente en A les deux premières composantes et en B les composantes PC2 et PC3:
2017_Pagani_Figure3A.jpg

La première composante sépare les Africains (en bleu) des autres populations. La seconde composante sépare les Adyges de Russie (en cyan) des Chinois Han (en rouge). Les groupes Sud Asiatiques s'étirent entre Adyges et Han avec quelques groupes qui montrent un léger flux de gènes Africains témoin de la traite des esclaves depuis l'Afrique de l'Est. La troisième composante sépare les Indiens Dravidiens et Austro-asiatiques des populations Russes et Chinoises. Les groupes Pakistanais et Indiens Indo-Européens s'étirent entre les Adyges et les Indiens Dravidiens. Les Brahouis se situent à proximité de leurs voisins Pakistanais et Indo-Européens, loin des Indiens Dravidiens.

Les auteurs ont également réalisé une analyse avec le logiciel ADMIXTURE:
2017_Pagani_Figure3C.jpg

Là encore les Brahouis sont très différents des Indiens Dravidiens, mais similaires à leurs voisins Pakistanais Indo-Européens, à l'exception des Kalashs qui forment un isolat génétique et des Hazaras qui montrent un flux de gènes issus des Chinois Han attribué à l'invasion Mongole.

Les auteurs ont ensuite utilisé la statistique f3 et ont montré que les Indiens Dravidiens n'ont pas contribué au génome des Brahouis. Ces résultats ont été confirmés par la statistique f4 qui a montré que les Indiens Dravidiens n'ont pas plus contribué au génome des Brahouis que de leurs voisins Indo-Européens.

En conclusion, les Brahouis, même s'ils présentent une composante Dravidienne dans leur génome (composante jaune ci-dessus), n'en possèdent pas plus que leurs voisins Pakistanais Indo-Européens. Il y a deux modèles possibles pour expliquer la présence de Dravidiens au Pakistan. Soit les ancêtres des Brahouis étaient des Dravidiens locaux qui ont été assimilés génétiquement par les Indo-Européens qui sont arrivés il y a environ 3000 ans. Soit les ancêtres des Brahouis étaient des Indo-Européens qui ont ensuite adopté une langue Dravidienne. Les données historiques et linguistique supportent davantage le premier scénario.

lundi 30 janvier 2017

Structure génétique des populations Népalaises

L'Himalaya a été colonisé par l'homme il y a environ 25.000 ans. La région s'étend sur le Tibet, le Népal, le nord de l'Inde et du Pakistan, et le Bhoutan. Elle abrite de nombreuses populations résidant entre 3000 et 5000 m d'altitude. Le Népal est un pays composé de 121 groupes ethniques enregistrés par le recensement de 2011. Son histoire est complexe et il a servi souvent de refuge entre l'Inde et l'Asie. La première tribu Népalaise documentée est celle des Kirats, un groupe Tibéto-Birman qui est arrivé dans la région il y a environ 2500 ans. Ils ont d'abord résidé à Katmandou avant de monter dans la vallée de Khumbu au pied de l'Everest au 4ème siècle de notre ère, suite à l'arrivée d'un clan Indien: les Licchavi. La vallée de Khumbu héberge également la population Sherpa dont on suppose qu'ils ont émigré de la région de Kham dans l'est du Tibet vers le Népal il y a environ 400 ou 600 ans suite à des tensions politiques.

Les études génétiques au Népal ont mis en évidence des influences Indienne et Tibétaine dans les populations Népalaises suggérant ainsi des mélanges génétiques importants.

Amy M. Cole et ses collègues viennent de publier un papier intitulé: Genetic structure in the Sherpa and neighboring Nepalese populations. Ils ont testé le génome d'individus appartenant à sept villages Sherpa de la vallée de Khumbu (Thame, Khumjung, Namche, Lukla, Khunde, Forte et Solukhumbu) ainsi que cinq populations Népalaises voisines: Rai, Magar, Tamang, Newar et Indo-Aryens. Ces individus ont été comparés à des populations Tibétaines (Lhasa, Yunnan, région de la rivière Tuo Tuo, Maduo et résidant au Royaume-Uni), de la région du Pamir (Kazakhstan, Ouzbékistan, Tadjikistan et Kirghizistan), du nord de l'Inde et du Pakistan et enfin des chinois Han.

Les auteurs ont fait une Analyse en Composantes Principales. Le résultat fait apparaître quatre groupes principaux: un groupe Nord Himalayen constitué des Tibétains, des Sherpas et des chinois Han (en rouge), un groupe du Nord-Ouest constitué des populations de la région du Pamir (en bleu), un groupe du Sud-Ouest constitué des populations Indienne et Pakistanaise (en vert) et un groupe centre Himalayen constitué des populations Népalaises (en noir):
2017_Cole_Figure1.jpg

De manière intéressante, la figure ci-dessus montre que les résultats génétiques se calquent sur la géographie de la région. De plus les populations Népalaises (en dehors des Sherpas) apparaissent comme issues d'un mélange génétique à des degrés divers, entre les Tibétains et les Indiens. A l'inverse, les Sherpas semblent non mélangés et conservent leur gènes Tibétains. Une Analyse en Composantes Principales a été réalisée uniquement avec les populations Sherpas:
2017_Cole_FigureS2.jpg

Là encore le résultat calque la géographie de cette région de la vallée de Khumbu, en montrant des sous-structures génétiques intéressantes parmi ces populations.

Les auteurs ont ensuite utilisé le logiciel ADMIXTURE. Les résultats sont optimaux pour une valeur du paramètre K=6:
2017_Cole_Figure2.jpg

Les Indiens (ANI, ASI, AAA et ATB) sont à gauche de la figure, suivis des Népalais, des Sherpas, des Tibétains et des Chinois Han sur la droite. La composante cyan est majoritaire chez les Tibétains, mais aussi bien présente chez les Népalais et les Sherpas, alors que la composante rouge est majoritaire chez les Sherpas, mais aussi présente chez les Tibétains et les Népalais. Les auteurs pensent que ces deux composantes forment l'ascendance préalablement identifiée chez les populations situées à haute altitude dans une étude génétique précédente. La figure ci-dessus montre également que les populations Népalaises (à l'exception des Sherpas) se rapprochent le plus des populations Indiennes Tibéto-Birmanes, sauf les Indo-Aryens qui se rapprochent le plus des populations ANI (Ancestral North India). Les analyses de distance génétique Fst montrent néanmoins que les populations Népalaises sont plus proches génétiquement des populations Tibétaines que des populations Indiennes, suggérant ainsi davantage une origine Tibétaine. Parmi ces populations Népalaises, les Rai suivis des Magar et des Tamang sont les plus proches génétiquement de la population Sherpa.

Afin de déterminer la population Indienne qui a le plus contribué à l’ascendance des populations Népalaises, les auteurs ont utilisé la statistique f3 dont les populations source sont d'une part les Tibétains et d'autre part une des populations Indiennes suivantes: ANI (North Indian), ASI (South Indian), AAA (Austro-Asiatic) et ATB (Tibeto-Burman). Le signal le plus significatif apparait entre les ANI et les Tibétains.

Les auteurs ont ensuite utilisé le logiciel TreeMix:
2017_Cole_Figure3.jpg

La figure ci-dessus indique ainsi un flux de gènes important des populations ANI vers les populations Népalaises.

Ensuite les auteurs ont utilisé la statistique f4 en prenant comme populations source les Tibétains et les Indiens ANI. Les Rai ont le plus d'ascendance Tibétaine (92%), suivis des Magar (82%), des Tamang (79%) et des Newars (50%). Les Indo-Aryens possèdent 93% d'ascendance ANI. Ces mélanges génétiques ont ensuite été datés: 1500 ans pour les Newars, 1230 ans pour les Tamang, 870 ans pour les Magar. Ces dates correspondent bien aux écrits historiques.

Enfin les auteurs ont mesuré les segments homozygotes parmi les populations Sherpa et Népalaises. Les valeurs élevées obtenues indiquent un niveau important de consanguinité récent dans ces populations. Les Indo-Aryens Népalais sont la population avec les plus longs segments homozygotes.

En résumé, ces résultats montrent que l'influence génétique de la région Himalayenne sur le Nord de l'Inde a été plus forte que l'inverse, et que la population Sherpa est restée isolée des autres populations.

jeudi 26 janvier 2017

Ascendance Amérindienne chez les Rapanuis de l'île de Pâques

La Polynésie est définie par les îles du Pacifique qui s'étendent entre la Nouvelle-Zélande au sud, Hawaï au nord et l'île de Pâques (Rapa Nui) à l'est. Cette dernière se trouve à 3700 km à l'ouest de l'Amérique du Sud. Sa superficie est de 163 km2. Il est aujourd'hui accepté que la Polynésie a été colonisée suite à l'expansion Austronésienne dont l'origine se situe à Taïwan et aux Philippines il y a environ 5000 ans. Celle-ci est caractérisée par une identité linguistique, une culture spécifique appelée Lapita et un type particulier de bateau. On a estimé la colonisation des îles Tonga et Samoa vers 800 av. JC. et l'ensemble des îles Polynésiennes entre 1200 et 1300 de notre ère. L'île de Pâques a ainsi été colonisée vers l'an 1200 par une population estimée entre 30 et 100 individus.

Les Rapanuis se sont distingués par une culture archéologique spécifique composée de plateformes géantes de pierre (ahu) sur lesquelles sont posées de monumentales statues de pierre (moai). Environ 900 statues sont enregistrées sur l'île.

L'île de Pâques a été découverte par les occidentaux le dimanche de Pâques de l'an 1722. Ce contact a démarré une période dramatique dans l'histoire des Rapanuis incluant notamment l'exposition des indigènes aux maladies apportées par les occidentaux, puis la traite des esclaves par les Péruviens dans les années 1860. On a estimé que la population de l'île estimée à l'arrivée des occidentaux aux environ de 4000 individus, a baissé jusqu'à atteindre seulement 110 habitants. Une conséquence de ces contacts a été également l'introduction de flux de gènes dans la population indigène.

L'origine précise de la population Rapanui reste insaisissable. En effet si la dispersion Austronésienne a bien atteint l'île de Pâques, certains indices suggèrent un contact avec les populations Amérindiennes, notamment la présence de cultures comme la patate douce ou la calebasse avant l'arrivée des Européens. D'autre part des restes de poulets de signature génétique Polynésienne ont été retrouvés au Chili et sont datés d'avant l'arrivée des Européens.

J. Victor Moreno-Mayar et ses collègues ont publié un papier intitulé: Genome-wide Ancestry Patterns in Rapanui Suggest Pre-European Admixture with Native Americans. Ils ont analysé le génome de 27 individus Rapanuis sur plus de 650.000 SNPs autosomaux. Ces données ont été comparées à des génomes d'individus d'autres populations: Européens, papous de Nouvelle-Guinée, Amérindiens, Asiatiques et autres Polynésiens.

Les auteurs ont utilisé le logiciel ADMIXTURE. La figure ci-dessous donne le résultat pour une valeur du paramètre K=4. La composante Européenne est en bleu, la composante papou en jaune et la composante Amérindienne en rouge. Les Polynésiens sont composés d'une ascendance majoritaire en rose et d'une ascendance papou minoritaire:
2014_Moreno_Figure1.jpg

Les Rapanuis se situent sur la droite de la figure. Bien que globalement similaires aux Polynésiens, ils contiennent une faible proportion d'une ascendance Amérindienne en rouge et d'une ascendance Européenne en bleu.

Les auteurs ont ensuite restreint les populations aux Européens, Amérindiens et Polynésiens. Le logiciel ADMIXTURE pour K=3 donne alors le résultat suivant:
2017_Moreno_Figure2.jpg

L'ascendance Amérindienne chez les Rapanuis est alors de 6% en moyenne et l'ascendance Européenne d'environ 16%. Cependant l'ascendance Amérindienne est plus homogène que l'ascendance Européenne chez les Rapanuis, signe probablement d'une plus grande ancienneté.

Cette ascendance Amérindienne chez les Rapanuis ne veut pas dire qu'il y ait eu des contacts pré-Colombiens entre l'île de Pâques et l'Amérique du Sud. Il faut pour cela dater les mélanges génétiques Amérindiens et Européens chez les Rapanuis. Les auteurs ont ainsi utilisé le logiciel RFmix. Ils ont montré que les segments d'ADN Amérindien chez les Rapanuis sont plus courts que les segments d'ADN Européen, indiquant ainsi une plus grande ancienneté du mélange génétique Amérindien.

Les auteurs ont ensuite modélisé les mélanges génétiques Amérindiens et Européens chez les Rapanuis et déterminé la probabilité des distributions de longueurs de segments d'ADN Amérindiens et Européens en fonction des temps de mélanges génétiques chez les Rapanuis. La figure ci-dessous donne cette distribution en fonctions des temps de mélanges génétiques:
2017_Moreno_Figure3.jpg

Elle est maximale pour un temps de mélange génétique avec les Amérindiens de 22 générations et avec les Européens de 4 générations. Pour une génération entre 25 et 30 ans et un temps présent correspondant à l'année 1970, cela correspond à un mélange génétique entre Rapanuis et Amérindiens entre les années 1310 et 1420 et entre Rapanuis et Européens entre les années 1850 et 1870.

Ces résultats montrent que le contact entre les Rapanuis et les Amérindiens date d'avant l'arrivée des Européens sur l'île de Pâques. Cependant on ne sait pas comment ce mélange génétique s'est produit. Il y a deux scénarios possibles: des Amérindiens ont navigué jusqu'à l'île de Pâques ou les Polynésiens sont allés en Amérique du Sud et sont revenus sur l'île de Pâques. Le second scénario est cependant le plus probable, si on considère les aptitudes des deux populations à la navigation.

mardi 24 janvier 2017

Histoire des Siddis de l'Inde à partir de leur génome

L'Inde est formée d'une très grande diversité ethnique, culturelle et linguistique. Elle a connu un grand nombre de vagues d'immigration de différentes parties du monde aux temps préhistoriques et historiques. Les Siddis sont un groupe ethnique unique d'origine Africaine que l'on trouve principalement dans les états Indiens de Gujarat, Karnataka, Andhra Pradesh et Telengana. Les premières traces de leur migration remontent vers l'an 1100 sur la côte ouest de l'Inde. Au 13ème siècle leur nombre a augmenté lorsqu'ils furent importés par les rois et princes Indiens pour servir comme esclaves ou soldats. Ensuite d'autres furent importés en Inde comme esclaves par les Portugais entre les 16ème et 19ème siècles.

Les premières études génétiques ont montré que le génome des Siddis était composé d'ascendances Africaine, Sud Asiatique et Européenne.

Ranajit Das et Priyanka Upadhyai viennent de publier un papier intitulé: Unraveling the population history of Indian Siddis. Ils ont analysé le génome de 14 individus Siddis du Gujarat et du Karnataka. Ces génomes ont été comparés à celui de nombreux individus Africains issus du projet des 1000 génomes et du projet Human Genome Diversity. Il s'agit de Yorubas du Nigéria, de Luhyas du Kenya, de Gambiens, de Mendes de Sierra Leone, d'Esans du Nigeria et de sept populations Bantoues.

L'analyse Multi-Dimensionnelle révèle cinq groupes différents. Dans la figure ci-dessous YRI représente les Yorubas, MSL les Mendes, LWK les Luhyas, GWD les Gambiens et ESN les Esans:
2017_Das_Figure1.jpg

Les Siddis se regroupent en haut à droite, mais s'étirent vers le groupe formé par les Luhyas (population Bantoue du Kenya) et les Bantous du Nord-Est (du Kenya également).

Les auteurs ont ensuite utilisé le logiciel ADMIXTURE. La figure ci-dessous donne le résultat pour une valeur du paramètre K=5:
2017_Das_Figure2.jpg

Les cinq ascendances se retrouvent majoritairement chez les Esans (k1), les Mendes (k2), les Gambiens (k3), les Luhyas (k4) et les Siddis (k5). On retrouve cependant un peu de la cinquième composante dans la population Bantoue (HGDP et Luhyas).

Les auteurs ont ensuite utilisé le logiciel TreeMix pour estimer les regroupements des différentes populations:
2017_Das_Figure3.jpg

La figure ci-dessus confirme la proximité entre les Siddis et les populations Bantoues, notamment les Luhyas. Elle indique notamment que les Siddis ont divergé des Luhyas il y a environ 2700 ans.

Les auteurs ont ensuite estimé la zone géographique en Afrique correspondant à la zone d'origine des Siddis à l'aide du logiciel Geographical Population Structure (GPS). Ainsi 10 des 14 Siddis ont été assignés à l'ouest de la Zambie et les 4 autres entre le Zimbabwe et le Nord-Est du Bostwana:
2017_Das_Figure4.jpg

Il est intéressant de noter que GPS affecte l'origine des Siddis le long de la route secondaire postulée de l'expansion Bantoue entre l'Afrique de l'Est et la région inter-lacustre autour des grands lacs Africains, datée d'il y a environ 1700 ans.

Le logiciel ADLER a estimé à environ 300 ans l'âge du mélange génétique entre les ascendances Africaine et Sud Asiatique chez les Siddis. Cette estimation est en accord avec la période de traite des esclaves entre l'Afrique et l'Inde, par les Portugais.

lundi 16 janvier 2017

Relations entre diverses populations humaines en dehors de l'Afrique

Les hommes modernes ont émergé en Afrique Sub-Saharienne et se sont ensuite dispersé en dehors de l'Afrique d'abord en Asie puis en Europe. Les premières preuves archéologiques de la présence de l'homme moderne en dehors de l'Afrique se trouvent au Levant et sont datées d'environ 100.000 ans. Cependant cette première sortie d'Afrique ne semble pas reliée aux Eurasiens contemporains, contrairement à la dispersion qui s'est répandue en Eurasie entre 50.000 et 40.000 ans.

Les premières analyses génétiques ont montré que la population Eurasienne peut être divisée en deux clades principales orientale et occidentale. La clade orientale est différentiée déjà il y a 40.000 ans environ comme le montre le génome ancien de l'individu de Tianyuan, alors que la clade occidentale comprend les anciens chasseurs-cueilleurs Européens ainsi que les anciens Nord Eurasiens comme le garçon de Mal’ta. Les Européens descendent principalement des individus de cette clade occidentale, avec cependant une autre ascendance nommée "Basal Eurasian" qui a divergé encore plus tôt des lignages non Africains. De manière intéressante, deux anciens individus: Ust’-Ishim de Sibérie et Oase 1 de Roumanie vieux d'environ 45.000 ans, n'ont pas ou très peu de liens génétiques avec la population contemporaine. Plus tard de nouvelles migrations ont conduit à la formation des populations d'Asie du Sud et des Amériques.

Certains ont remis en cause se modèle de séparation ancienne des Eurasiens orientaux et occidentaux, notamment au sujet de certaines populations d'Océanie et d'Asie du Sud-Est comme les aborigènes d'Australie, les papous de Nouvelle-Guinée ou les negritos des Philippines. Ils pensent en effet que ces trois populations sont issues d'une plus ancienne dispersion de l'homme moderne hors d'Afrique qui a suivi une route côtière Sud. Cependant des études génomiques récentes ont montré qu'il n'était pas nécessaire de faire appel à cette première sortie d'Afrique pour expliquer l'ascendance génétique des Australiens.

Mark Lipson et David Reich viennent de publier un papier intitulé: A working model of the deep relationships of diverse modern human genetic lineages outside of Africa. Ils proposent un modèle qui explique les différentes relations entre les populations non Africaines, mais aussi avec les populations archaïques.

Le modèle proposé par les auteurs comprend les populations suivantes: Chimpanzés, Néandertals de l'Altaï, Denisoviens, Dinkas du Soudan, l'ancien individu Ust’-Ishim de Sibérie, l'ancien individu Kostenki 14 de Russie, l'ancien individu de Malt'a de Sibérie, papous de Nouvelle-Guinée, aborigènes d'Australie, Mamanwa (negritos des Philippines), Onges des îles Andaman, Amis (aborigène de Taïwan) et amérindiens Surui du Brésil. Le modèle dessiné ci-dessous est basé sur environ 123.000 SNPs autosomaux. Il incorpore sept populations contemporaines, trois anciens hommes modernes, deux hommes archaïques et un Chimpanzé. Il y a neuf événements de mélange génétique dont six sont issus des hommes archaïques:
2017_Lipson_Figure1.jpg

L'homme de Denisova reçoit un flux génétique issu d'un homme archaïque inconnu correspondant à environ 3% de son génome. Toutes les populations d'homme moderne non Africain reçoivent environ 3% de gènes issus de l'homme de Neandertal. Les anciens individus Ust’-Ishim et K14 ont reçu des gènes supplémentaires en provenance de Neandertal (environ 1,5%). Cependant une étude récente a montré que la proportion de gènes de Neandertal a diminué chez les hommes modernes au cours du temps. Il n'est donc peut-être pas nécessaire d'ajouter un flux de gènes supplémentaire en provenance de Neandertal chez les deux individus: Ust’-Ishim et K14. Les aborigènes d'Australie, les papous de Nouvelle-Guinée et les negritos des Philippines reçoivent un flux de gènes issu de l'homme de Denisova (environ 4%). L'homme de Malt'a reçoit également un flux de gènes issu de l'homme de Denisova.

Les aborigènes d'Australie et les papous de Nouvelle-Guinée forment deux groupes frères dont l'ascendance vient principalement des anciens Est Asiatiques. Les negritos des Philippines montrent trois composantes ancestrales: les anciens Australasiens d'avant la divergence entre aborigènes et papous, une issue des anciens Est Asiatiques (interprétée comme issue de la migration Austronésienne) et une issue de l'homme de Denisova. Les Onges forment un groupe frère avec les anciens Australasiens et les populations d'Asie de l'Est.

L'ancien individu K14 ne semble pas issu d'un mélange génétique en dehors de l'homme de Neandertal, néanmoins le garçon de Malt'a reçoit en plus de la composante correspondant aux anciens occidentaux une proportion de gènes issus des anciens orientaux. Les Européens non indiqués dans la figure ci-dessus, montrent qu'ils sont issus de quatre composantes: par exemple les Français incorporent des gènes des anciens occidentaux (28%), Nord Eurasiens (35%), anciens orientaux (23%) et Basal Eurasian (14%).

Les Amérindiens du Brésil sont issus d'un mélange entre Est Asiatiques (73%) et Anciens Nord Eurasiens (27%). Ils incorporent également un peu d'ascendance issue d'une population inconnue, nommée population Y, reliée aux Onges et aux anciens Australasiens.

Dans le modèle ci-dessus, après la sortie d'Afrique et la divergence avec la population Dinka, la plus ancienne divergence est entre groupes occidentaux et orientaux. Dans le groupe occidental, la divergence suivante se situe entre Ust’-Ishim et K14. Dans le groupe Oriental la divergence suivante se situe entre anciens Australasiens, Onges et anciens Est Asiatiques.

mardi 10 janvier 2017

Expansions post-glaciaires en Asie du Sud-Ouest

Les changements du climat ont influencé drastiquement l'occupation de l'Asie du Sud-Ouest par l'homme moderne depuis sa première occupation sur les sites de Skhul et Qafzeh au Proche-Orient il y a environ 100.000 ans. Ces impacts climatiques sur les mouvements de population et sur le développement des différentes cultures ont été fortement débattus. Durant le dernier maximum glaciaire, les conditions ont poussé les populations à occuper différents refuges autour de la Méditerranée, la Mer Noire et le Sud de la péninsule Arabique. Ensuite, le réchauffement post-glaciaire et la révolution Néolithique ont permis l'expansion de ces différentes populations en Asie du Sud-Ouest.

Les dernières études d'analyse de l'ADN ancien ont identifié une population ancestrale nommée "Basal Eurasians" qui a injecté une quantité significative de gènes dans la population Européenne. Cette ascendance est distincte de la signature génétique des premiers fermiers du Proche-Orient. Ces études ont également montré que la population Yamnaya des Steppes a été à l'origine de la culture Cordée et d'une expansion de population en Europe à la fin du Néolithique et au début de l'Âge du bronze.

Des analyses récentes sur les populations contemporaines ont également identifié des signatures génétiques d'un possible refuge glaciaire dans le sud de la péninsule Arabique. Ces populations se sont ensuite dispersées dans le Croissant Fertile, au Levant et dans la corne de l'Afrique. Ainsi l'haplogroupe du chromosome Y J1 est commun en Arabie Saoudite et a marqué l'expansion Islamique, alors que J2 semble correspondre à une expansion post-Néolithique.

Daniel E. Platt et ses collègues viennent de publier un papier intitulé: Mapping Post-Glacial expansions: The Peopling of Southwest Asia. Ils ont cherché à identifier et dater l'isolation des populations avant leur expansion, puis à tracer leur routes de dispersion en Asie du Sud-Ouest, à partir de tests de l'ADN du chromosome Y et autosomal de populations contemporaines en Eurasie et en Afrique.

Un total de 8515 échantillons a été analysé sur leur ADN du chromosome Y. Des marqueurs STR et SNP ont été testés. L'étude s'est notamment focalisée sur l'haplogroupe J du chromosome Y. Ensuite 994 échantillons ont été testés sur leur ADN autosomal sur un total de 500.000 SNPs environ.

Les haplogroupes du chromosome Y: J1, J2 et E1b1b sont les lignages paternels les plus fréquents en Asie du Sud-Ouest et en Afrique du Nord totalisant à eux trois 50,9%:
2016_Platt_FigureS1.jpg

La figure ci-dessus indique la fréquence des principaux haplogroupes, et l'encart en bas à gauche indique la fréquence des différentes sous-clades de l'haplogroupe J. Ces résultats montrent de fortes différentiations régionales.

Les auteurs se sont ensuite focalisés sur les haplogroupes du chromosome Y: J*(xJ2) et J2. La figure ci-dessous montre la fréquence de ces haplogroupes respectivement en A et B:
2016_Platt_FigureS2.jpg

La diversité de J*(xJ2) est maximale dans le Caucase et celle de J2 est maximale en Arménie. Elle est indicative d'une possible origine de ces populations. La figure ci-dessous indique la variance des deux haplogroupes J*(xJ2) en A et J2 en B:
2016_Platt_FigureS3.jpg

Les mesures de TMRCA pour les haplogroupes montrent une plus grande ancienneté des haplogroupes J*, J1, J2 en Turquie et dans le Caucase, et une grande différentiation de E1b entre l'Afrique du Nord et l'Asie. L'estimation du temps de divergence des différentes populations est indiquées pour les trois haplogroupes J1, J2 et E1b dans la figure ci-dessous:
2016_Platt_Figure2.jpg

J1 est en a, J2 en b et E1b en c. Ces résultats confirment les estimations de TRMCA et indiquent que J1 et J2 sont probablement originaire du Caucase.

Les auteurs ont ensuite fait une analyse avec le logiciel ADMIXTURE à partir de l'ADN autosomal. La figure ci-dessous indique les résultats pour des valeurs de K allant de 2 à 5:
2016_Platt_Figure3.jpg

Pour K=3, l'analyse identifie des composantes qui caractérisent la Géorgie dans le Caucase en bleu foncé, la Palestine en violet et l'Arabie Saoudite en rouge.

L'Analyse en Composantes Principales identifie également ces trois centres d'origine:
2016_Platt_Figure4.jpg

Les auteurs supposent que ces trois centres d'origines correspondent à trois refuges pour les populations pendant le dernier maximum glaciaire. Le refuge du Caucase aurait ainsi abrité les populations porteuses des haplogroupes J1 et J2. Celles-ci se sont ensuite dispersées vers le Sud en Mésopotamie, puis dans la péninsule Arabique.

mardi 13 décembre 2016

Analyse génomique de la population Sarde

Un point clef de l'histoire de la Sardaigne réside dans sa différentiation avec les populations continentales au niveau culturel, linguistique et archéologique. Les premières études génétiques ont également montré que la population Sarde était isolée génétiquement. Un des points caractéristiques de l'histoire démographique de la Sardaigne est son affinité génétique avec les anciennes populations Néolithiques Européennes. Dans ce modèle, la Sardaigne a été colonisée par les premiers fermiers Européens au début du Néolithique avec une faible contribution des groupes de chasseurs-cueilleurs. Ensuite la Sardaigne est restée largement isolée des migrations successives du continent notamment les expansions de l'Âge du Bronze en provenance des Steppes. Ce point se retrouve notamment au niveau mitochondrial qui montre que l'haplogroupe U, caractéristique des populations de chasseurs-cueilleurs, est relativement faible en Sardaigne par rapport au continent. Au niveau archéologique, ce modèle est aussi conforté par le faible nombre de sites pré-Néolithiques suivi par un grand nombre de sites Néolithiques, et le développement d'une culture spécifique locale à l'Âge du Bronze: la culture Nuragique.

Charleston Chiang et ses collègues viennent de publier un papier intitulé: Population history of the Sardinian people inferred from whole-genome sequencing. Ils ont séquencé le génome complet de 3514 individus Sardes:
2016_Chiang_Figure1.jpg

Les auteurs ont ensuite extrait de l'ensemble des échantillons, un sous-ensemble de 1577 individus non reliés généalogiquement entre eux dont au moins trois grands-parents sont issus de la même région de Sardaigne, afin de s'affranchir des migrations récentes. Les auteurs ont ensuite réalisé une Analyse en Composantes Principales:
2016_Chiang_Figure2A.jpg

Dans la figure ci-dessus, les individus de la région montagneuse de Ogliastra (à droite) sont séparés des autres Sardes (à gauche) par la première composante. Les Sardes, en dehors de Ogliastra, sont très peu différenciés que ce soit par distance génétique ou par partage d'allèles, malgré leur plus grande distance géographique entre populations.

L'analyse avec le logiciel ADMIXTURE est optimal pour K=2 composantes:
2016_Chiang_Figure2B.jpg

Il permet ainsi de séparer une composante rouge caractéristique de la région de Ogliastra, d'une composante bleue majoritaire en dehors de cette région. Ces résultats permettent de montrer que la région montagneuse de Gennargentu située au sein de Ogliastra est une région qui est restée isolée du reste de l'île.

Les auteurs ont ensuite comparé les échantillons Sardes avec des individus de la région Méditerranéenne. Ils ont réalisé une Analyse en Composantes Principales:
2016_Chiang_Figure4A.jpg

La figure ci-dessus montre une isolation génétique par la distance entre les populations Nord Africaines (en marron), du Proche-Orient (en violet) et d'Europe (en bleu).

L'analyse avec le logiciel ADMIXTURE est optimal pour K=4 composantes:
2016_Chiang_Figure4C.jpg

La composante rouge est associée à la Sardaigne et aux Européens du Sud, la bleue à l'Afrique du Nord, la violette au Proche-Orient et au Caucase et la verte aux Européens du Nord. Les individus du village de Arzana dans les montagnes de Gennargentu possèdent 100% de composante rouge, alors que les Sardes de Cagliari en possèdent 93%.

L'analyse du partage des allèles rares montre que la Sardaigne est très isolée des autres populations. Les auteurs ont utilisé plusieurs méthodes pour estimer le temps de divergence entre la population Sarde des autres populations. Ils ont ainsi trouvé une valeur de 327 générations (environ 8000 ans) entre les Sardes et les Européens continentaux de l'ouest, supérieure à la valeur qui sépare les Toscans et les Européens de l'ouest: 190 générations (environ 4500 ans).

A cause de leur faible taille effective de population, les Sardes sont supposés avoir subi une dérive génétique importante. En utilisant la statistique f3, les auteurs ont montré que les Sardes se rapprochent le plus de la population Basque:
2016_Chiang_FigureS6A.jpg

La statistique D permet de confirmer ces résultats:
2016_Chiang_FigureS6C.jpg

Les Basques sont connus pour avoir également une forte proportion d'ascendance fermier Néolithique. De plus certains ont avancé que certain lieu Sarde avaient un nom d'origine non Indo-Européenne et proche du Basque. Si on associe la diffusion des langues Indo-Européennes aux migrations de l'Âge du Bronze en provenance des Steppes, il est tentant d'associer le Basque à la langue parlée par les premiers fermiers Néolithiques.

Les individus de Cagliari possèdent environ 7% de composante violette que l'on retrouve dans différentes populations d'Europe du Sud, du Proche-Orient, du Caucase et d'Afrique du Nord. Le logiciel ADLER indique que les populations Sardes en dehors de la région de Ogliastra ont subi un mélange génétique issu d'Eurasie, mais également d'Afrique Sub-Saharienne qui semble un meilleur proxy que l'Afrique du Nord. Ce mélange Sub-Saharien est estimé entre 1 et 4% et remonte entre 59 et 109 générations, soit environ 2500 ans.

Les études d'ADN ancien ont montré que les Sardes possèdent le plus haut niveau d'ascendance des premiers fermiers Néolithiques, parmi les Européens. Ces résultats sont confirmés par la statistique f3 avec les échantillons de cette étude comme le montre la figure ci-dessous qui donne les valeurs f3(San; Stuttgart, X) dans lequel Stuttgart est le génome d'un individu du Néolithique Ancien:
2016_Chiang_Figure6A.jpg

Cependant, un point surprenant est que plus l'ascendance Gennargentu augmente dans l'échantillon Sarde, plus l'affinité génétique avec un fermier Néolithique mais aussi avec un chasseur-cueilleur augmente, alors qu'il n'y a pas de corrélation avec l'ascendance issue des Steppes:
2016_Chiang_Figure6C.jpg

Ce point est confirmé par l'estimation des proportions entre chasseurs-cueilleurs, fermiers du Néolithique et pasteurs des Steppes dans les différents échantillons Sardes:
2016_Chiang_FigureS10.jpg

La proportion d'ascendance des Steppes diminue dans la région Gennargentu alors que la proportion d'ascendance néolithique et chasseur-cueilleur augmente. Il est probable que ce mélange fermier néolithique/chasseur-cueilleur dans la région Gennargentu soit représentatif de la population initiale de l'île au début du Néolithique, même s'il est difficile de savoir si ce mélange a eu lieu sur l'île ou sur le continent.

Ainsi ces résultats indiquent que si les Sardes hébergent la plus forte proportion d'ascendance Néolithique parmi les Européens, il y a cependant des variations sensibles parmi ces proportions selon la population de l'île considérée.

Les auteurs ont ensuite estimé le biais selon le sexe en comparant les résultats génomiques entre le chromosome X et le reste des autosomes. Ainsi la comparaison des résultats du logiciel ADMIXTURE montre qu'il y a plus de composante Gennargentu dans le chromosome X que dans les autosomes. Ces résultats indiquent donc que les ascendances chasseurs-cueilleurs et néolithiques sont plus maternelles alors que l'ascendance des pasteurs des Steppes est plus paternelle. Ces résultats sont confirmés par la statistique D comme le montre la figure ci-dessous:
2016_Chiang_Figure7.jpg

Ci-dessus, Bichon et Loschbour sont des chasseurs-cueilleurs alors que Stuttgart et NE1 des fermiers Néolithiques.

- page 1 de 4