Généalogie génétique

Aller au contenu | Aller au menu | Aller à la recherche

Génétique des populations

Fil des billets - Fil des commentaires

jeudi 17 janvier 2019

Le génome des populations de chasseurs-cueilleurs en Afrique de l'est révèle diverses trajectoires suite à l'arrivée de l'agriculture

Depuis le début de l'holocène, le mode de subsistance de la majorité des populations est passé de la chasse et la cueillette à l'agriculture et au pastoralisme. Ce changement a pu être associé à des migrations ou à des changements culturels des populations locales selon les régions. En Europe, une nouvelle population est arrivée en provenance d'Anatolie. Elle a remplacé ou s'est mélangé avec la population locale selon la période ou la région. En Afrique, l'agriculture est associée notamment avec l'expansion de la population Bantoue. Cependant quelques populations actuelles ont conservé le mode de vie des chasseurs-cueilleurs.

Shyamalika Gopalan et ses collègues viennent de publier un papier intitulé: Hunter-gatherer genomes reveal diverse demographic trajectories following the rise of farming in East Africa. Ils ont séquencé le génome d'une population de chasseurs-cueilleurs actuelle d'Afrique de l'Est: les Chabu. Ils habitent les forêts des hauts plateaux à la frontière des états de Oromia et Gambella et la Région des nations, nationalités et peuples du Sud, au sud-est de l'Éthiopie. Le dernier recensement indique une population comprise entre 1700 et 2500 individus. Cette population affirme qu'elle est originaire de la région, propos confirmés par les populations voisines d'agriculteurs: les Majangir et Shekkacho. Les Chabu parle une langue isolat, alors que les Majangir parlent une langue Nilo-Saharienne et les Shekkacho une langue Afro-Asiatique.

Les auteurs ont comparé ces génomes à ceux des populations voisines d'Afrique de l'Est et à celui de l'ancien chasseur-cueilleur de Mota vieux de 4500 ans. Ils ont réalisé une analyse avec le logiciel ADMIXTURE dont les résultats sont optimaux pour K=5. Les composantes identifiées sont associées aux ascendances Nilo-Saharienne (en bleu), Afro-Asiatique (en bistre), Éthiopie du sud-ouest (en violet), Niger-Congo (en vert) et Proche-Orientale (en bleu-vert):
2019_Gopalan_Figure1.jpg

Les Chabu et leurs voisins agriculteurs (Majangir et Gumiz) ne possèdent que les trois premières composantes. De manière importante l'ancien individu de Mota possède une très forte proportion de composante d’Éthiopie du sud-ouest, suggérant que cette composante caractérise cette région depuis au moins 4500 ans. La population Chabu est la population actuelle qui possède également le plus de cette composante, suivie par les populations Aari, Majangir et Gumiz.

La carte des migrations ci-dessus montre les corridors de migration et les barrières. Ces dernières correspondent souvent à des motifs géographiques comme les déserts, les montagnes et les cours d'eau.

Les auteurs ont également fait une Analyse en Composantes Principales. Dans la figure ci-dessous les Espagnols sont à gauche, les Africains de l'ouest en bas à droite et les Chabu (carrés verts) en haut à droite à proximité de l'ancien individu de Mota (lozange violet), des Majangir (ronds rouges) et Gumuz (ronds oranges):
2019_Gopalan_FigureS1.jpg

Ainsi les Chabu sont probablement les descendants directs des anciens chasseurs-cueilleurs de la région. Les Aari, quoique situés à proximités sur la PCA, ont un profil génétique un peu différents des Chabu. Ils sont situés davantage vers les Wolaytas, un groupe Afro-Asiatique.

Les auteurs ont également étudié les segments d'homozygotie. Ainsi les Chabu sont la population avec les plus longs segments par rapport à leurs voisins indiquant ainsi une plus forte consanguinité et donc une isolation plus grande. Cependant les Hadza, population de chasseurs-cueilleurs de Tanzanie, ont des segments encore plus longs que les Chabu. En fait les populations actuelles de chasseurs-cueilleurs en Afrique ont des longueurs de segments d'homozygotie variable, suggérant différents niveaux d'isolement et de déclin de la taille de la population. Certaines populations de chasseurs-cueilleurs comme les Biaka, pygmées d'Afrique Centrale, ont des niveaux équivalents aux populations d'agriculteurs.

Les auteurs ont estimé un récent déclin de la population des Chabu mais aussi des Majangir et Aari forgerons, alors que les Aari cultivateurs, les Gumuz et les Shekkacho ont vu leur population augmentée. Ce déclin a commencé il y a environ 40 à 50 générations.

En Afrique l'expansion Bantoue a résulté en l'assimilation ou l'extinction des populations de chasseurs-cueilleurs locales. En fait il y a une diversité dans le destin de ces populations. Ainsi les Majangir et les Gumuz sont d'anciennes populations de chasseurs-cueilleurs acculturées à l'agriculture. Ils ont un profil génétique similaire. Cependant les Gumuz ont prospéré alors que les Majangir ont décliné, sans flux de gènes extérieur notable. Les Sandawe, parlant une langue à clics, ont eu un destin similaire aux Majangir.

vendredi 21 décembre 2018

Structure génétique des Italiens

Les analyses d'ADN ancien ont montré que les populations actuelles d'Europe ont reçu des contributions génétiques des chasseurs-cueilleurs locaux, des fermiers d'Anatolie du Néolithique et des pasteurs des steppes de l'Âge du Bronze. Ces derniers sont issus d'un mélange génétique entre les chasseurs-cueilleurs de l'est et les chasseurs-cueilleurs du Caucase. Cependant l'analyse de l'ADN ancien dans le sud-est de l'Europe a montré une contribution génétique supplémentaire venue du Caucase.

Alessandro Raveane et ses collègues viennent de publier un papier intitulé: Population structure of modern-day Italians reveals patterns of ancient and archaic ancestries in Southern Europe. Ils ont analysé le génome de 1616 individus issus des 20 régions administratives d'Italie, ainsi que plus de 140 populations actuelles du monde.

Les auteurs ont dessiné un arbre phylogénétique à l'aide des logiciels ChromoPainter et fineStructure:
2018_Raveane_Figure1A.jpg

Les Italiens se regroupent en trois clusters: la Sardaigne, l'Italie du nord et du centre-nord proches de l'Europe de l'ouest et l'Italie du sud et du centre-sud proche du Moyen-Orient. La répartition des différents clusters dans chaque région de l'Italie indique également bien la structure génétique du pays et notamment la séparation nord-sud:
2018_Raveane_Figure1B.jpg

Enfin l'affinité génétique des Italiens du nord avec l'Europe de l'ouest et l'affinité génétique des Italiens du sud avec le Moyen-Orient apparaissent également dans l'Analyse en Composantes Principales:
2018_Raveane_Figure1C.jpg

et dans l'analyse avec le logiciel ADMIXTURE:
2018_Raveane_FigureS4.jpg

Les auteurs ont ensuite décomposé les génomes en fonctions des anciennes ascendances selon deux sources différentes plus ou moins anciennes. Ci-dessous, la figure du haut décompose les génomes en fonction des ascendances chasseur-cueilleur de l'ouest (en rouge), de l'est (en bleu), du Caucase (en vert), fermier Néolithique d'Anatolie (en jaune), fermier d'Iran (en noir), Afrique du nord (en rose) et Asie de l'est (en violet), la figure du bas décompose les génomes en fonction des ascendances chasseur-cueilleur de l'ouest (en rouge), fermier Néolithique d'Europe (en jaune), pasteur des steppes de l'Âge du Bronze (SBA en orange), anatolien de l'Âge du Bronze (ABA en bleu clair), Afrique du nord (en rose) et Asie de l'est (en violet):
2018_Raveane_Figure2A.jpg

Dans la figure du haut, les Italiens sont caractérisés par une proportion importante d'ascendance du Néolithique (56 à 72% pour la péninsule et plus de 80% en Sardaigne). L'ascendance restante se partage essentiellement entre WHG et CHG prépondérantes en Italie du sud et EHG prépondérante en Italie du nord. L'ascendance fermier d'Iran est détectée uniquement en Italie du sud.

Les différences entre le nord et le sud de l'Italie sont aussi détectées dans la figure du bas. Ainsi l'âge du bronze des steppes atteint 33% dans le nord et seulement 6% dans le sud, alors que l'âge du bronze d'Anatolie montre un gradient opposé important dans le sud et plus faible dans le nord:
2018_Raveane_Figure2B.jpg

Cependant la distribution de CHG ne suit pas la distribution de SBA, bien que les pasteurs des steppes soient issus d'un mélange génétique EHG et CHG. En effet l'excès de CHG dans le sud de l'Europe est frappante. De plus les groupes du nord de l'Italie ont plus d'ascendance Néolithique que ceux du sud. Ces derniers ont eux plus d'ascendance ABA. Ces résultats sont confirmés par l'Analyse en Composantes Principales qui inclue les anciens individus:
2018_Raveane_Figure2I.jpg

Les ascendances SBA et ABA ont une distribution très différentes en Europe. La première est largement diffusée en Europe alors que la seconde est plus localisée dans le sud. D'autre part, la contribution d'Afrique du nord varie de 3,8% en Italie du centre-sud à 14,5% en Italie du sud.

L'homme des glaces (Iceman) et les individus de la culture de Remedello se regroupent avec les individus du Néolithique, ainsi qu'avec un Campaniforme du nord de l'Italie. Les deux autres Campaniformes du nord de l'Italie se regroupent avec les Italiens actuels du nord, alors que les Campaniformes de Sicile sont en position intermédiaire entre les fermiers du Néolithique, les individus de l'Âge du Bronze du sud de l'Europe et les Italiens actuels.

L'utilisation du logiciel Globetrotter montre que les ascendances SBA et ABA sont arrivées en Italie principalement pendant la période historique, la seconde principalement en provenance du sud des Balkans, bien qu'elles étaient déjà présentes auparavant. En effet, l'ascendance SBA arrive d'abord en Italie avec les Campaniformes. Les ascendances ABA et CHG devaient être également présents en Italie du sud à l'Âge du Bronze.

On sait que la quantité d'ADN de Néandertal est supérieure en Asie et dans le nord de l'Europe par rapport au sud de l'Europe. De la même façon les auteurs de cette étude ont montré que la quantité d'ADN de Néandertal est supérieure dans le nord de l'Italie par rapport au sud. Ceci est également vrai lorsqu'on enlève les populations avec une forte contribution nord Africaine.

lundi 22 octobre 2018

L'héritage génétique des populations Austro-asiatiques d'Inde

L'Inde héberge plus d'un million de personnes qui appartiennent à des milliers de groupes ethniques ou culturels. Ces groupes parlent des langues de quatre familles différentes: Indo-européenne, Dravidienne, Austro-asiatique et Tibéto-birmane. Les études génétiques précédentes ont montré que la majorité de ces populations descendent de deux populations ancestrales: les Anciens Indiens du Nord (ANI) et les Anciens Indiens du Sud (ASI). Les Indiens Munda qui parlent une langue Austro-asiatique ont en plus une faible quantité d'ascendance du Sud-Est Asiatique. Dans le monde, plus de cent millions de personnes parlent une langue Austro-asiatique dont la plupart sont situées dans le Sud-Est Asiatique. Cependant plus de dix millions d'entre elles vivent en Inde du Centre ou de l'Est.

Le vocabulaire important lié à la culture du riz suggère que ces langues Austro-asiatiques ont accompagné l'expansion de l'agriculture. De plus les études génétiques uniparentales ont montré que 100% des lignages maternels des Mundas sont originaires d'Inde alors que 65% de leurs lignages paternels sont originaires d'Asie du Sud-Est.

Kai Tätte et ses collègues viennent de publier un papier intitulé: The genetic legacy of continental scale admixture in Indian Austroasiatic speakers. Ils ont étudié le génome de 102 Mundas, qu'ils ont comparé ensuite au génome de 978 individus appartenant à 72 populations d'Inde, d'Asie du Sud-Est et d'Asie de l'Est.

Les auteurs ont réalisé une analyse avec le logiciel ADMIXTURE:
2018_Tatte_Figure1.jpg

La figure ci-dessus montre que les Mundas partagent les trois quarts de leur ascendance (composantes k3, k4 et k5) avec les populations Indo-européennes et Dravidiennes d'Inde. De manière intéressante, les populations Indiennes ont également une composante rose (k2) qui est fréquente chez les Européens, les Ouest Eurasiens et les Pakistanais. Cependant cette composante rose est absente chez les Mundas. Enfin, environ un quart de l'ascendance (composantes k6 à K12) des populations Munda est partagé avec les populations du Sud-Est Asiatique. Il y a deux populations Indiennes avec un profil génétique similaire aux Mundas: les Gonds qui parlent une langue Dravidienne et les Nihali. Les Gonds sont connus pour avoir reçu un flux de gènes important des populations Munda, et les Nihali sont sensés être issus des Mundas.

Les auteurs ont également effectué une Analyse en Composantes Principales. Dans la figure ci-dessous les Africains sont situés en bas à gauche (en rose), les Européens en haut à gauche (en bleu clair), les Est Asiatiques (en bistre) et les Sud-Est Asiatiques (en orange) à droite. Les Indiens s'étendent entre les Européens et les Est Asiatiques, et les Mundas sont en rouge:
2018_Tatte_FigureS4.jpg

Ainsi les Mundas du Sud (en rouge foncé) sont les populations Indiennes les plus proches des populations de l'Est et du Sud-Est Asiatique, alors que les Mundas du Nord (en rouge clair) sont plus proche des populations Dravidiennes.

Ces résultats confirment que les Mundas sont le fruit d'un mélange génétique entre une population Indienne et une population du Sud-Est Asiatique.

Les auteurs ont ensuite utilisé la statistique f3 pour rechercher les populations actuelles les plus proches des populations qui sont à l'origine du mélange génétique chez les Mundas. Ainsi ils ont trouvé que la source du Sud-Est Asiatique est proche des Lao du Laos, des Dai de Chine ou des Murut de Bornéo. La source Indienne est proche des Paniya et des Pulliyar du Kerala. De plus, pour les Mundas du Nord on trouve également les Chamar qui parle une langue Indo-européenne et pour les Mundas du Sud les Jarawa et Onge des îles Andaman.

Les auteurs ont ensuite étudié les segments identiques par descente (IBD). Ainsi les Mundas partagent le plus grand nombre de segments IBD avec les Chenchus qui parle une langue Dravidienne et les Chamars, en dehors des Gonds et des Nihali. En Asie du Sud-Est, les populations qui partagent le plus de segments IBD avec les Mundas sont les Mah Meri et les Temuan de la péninsule Malaisienne. De manière intéressante, les populations du Sud-Est Asiatique partagent plus de long segments et les populations Indiennes plus de courts segments avec les Mundas:
2018_Tatte_Figure2.jpg

De manière surprenante on trouve des populations Dravidiennes, mais aussi des populations Indo-européennes qui partagent des segments IBD avec les Mundas, alors que ces derniers n'ont pas la composante rose Ouest-Eurasienne.

Les auteurs ont ensuite utilisé le logiciel ADLER pour estimer les dates de mélange génétique chez les Mundas. Les résultats donnent une valeur de 3850 ans pour les Mundas du Sud et 2850 ans pour les Mundas du Nord. Ces derniers ont subi plus de mélanges génétiques que les Mundas du Sud, probablement à une date ultérieure.

De manière intéressante, les Mundas n'ont pas la composante rose Ouest Eurasienne qui a été apportée par les migrations Indo-aryennes. Ainsi le mélange génétique qui a formé la population Munda précède l'arrivée de cette composante en Inde du Centre et de l'Est. Cependant la date estimée par le logiciel ADLER de 3850 ans pour le premier événement de mélange génétique, est plus ou moins contemporaine de ces migrations Indo-aryennes. Ainsi les populations Indo-européenne et Austro-asiatique sont arrivées plus ou moins en même temps en Inde, les premières au Nord-Ouest et les secondes à l'Est.

lundi 24 septembre 2018

Histoire génétique des populations Ouraliennes

Le paysage linguistique du nord de l'Eurasie est dominé par trois familles: Turque, Indo-Européenne et Ouralienne. Une étude précédente a montré que la diffusion des langues Turques a été accompagnée d'un flux de gènes en provenance du sud de la Sibérie. De la même façon les études d'ADN ancien ont montré que la diffusion des langues Indo-Européennes en Europe et en Asie a été accompagnée par des migrations en provenance des steppes Ponto-Caspiennes.

La famille Ouralienne comprend entre 40 et 50 langues différentes et couvre un vaste territoire qui s'étend entre les côtes de la Baltique à l'ouest aux plaines de l'ouest de la Sibérie et à la péninsule de Taïmyr en Asie:
2018_Tambets_Figure1A.jpg

La famille Ouralienne dérive d'une proto-langue qui s'est scindée en deux branches principales il y a entre 6000 et 4000 ans: la branche Finno-ougrienne et la branche Samoyède. Les hypothèses actuelles place la région d'origine sur les rives de la Volga et de ses affluents: Oka et Kama, bien que certains placent cette origine en Sibérie.

Les études génétiques précédentes sur les marqueurs uniparentaux ont montré que la distribution des haplogroupes mitochondriaux est corrélée avec la géographie, alors que la distribution des haplogroupes du chromosome Y est largement dominée par l'haplogroupe N3a prépondérant en Sibérie et en Asie de l'est:
2018_Tambets_Figure1B.jpg

Kristiina Tambets et ses collègues viennent de publier un papier intitulé: Genes reveal traces of common recent demographic history for most of the Uralic-speaking populations. Ils ont séquencé le génome de 15 populations Ouraliennes.

Les auteurs ont réalisé une Analyse en Composantes Principales:
2018_Tambets_Figure2A.jpg

Les variations des populations dans la figure ci-dessus rappellent la distribution géographique des différents groupes. Les populations Ouraliennes sont en couleur et s'étendent le long de la première composante en haut du schéma ci-dessus. Les populations Baltiques sont en haut à gauche et les populations Sibériennes en haut à droite. Les Hongrois se différencient des Estoniens le long de la seconde composante sur la gauche. De plus la distance génétique Fst entre populations s’accroît avec la distance géographique.

Les auteurs ont ensuite réalisé une analyse avec le logiciel ADMIXTURE:
2018_Tambets_Figure3A.jpg

Aux faibles valeurs de K, la composition génétique des populations Ouraliennes ressemble à celle de leurs voisins géographiques, à l'exceptions des Saami et des Mansi. Cependant à partir de K=9, il y a une composante k9 en magenta qui est spécifique aux populations Ouraliennes. La distribution géographique de cette composante montre un pic parmi les populations parlant une langue Ob-ougrienne ou Samoyède:
2018_Tambets_Figure3B.jpg

Cette composante représente environ 40% de la composition génétique des populations Finno-ougriennes de la région Volga-Oural et seulement 20% de leurs voisins Turques. Elle représente également 40% de la composition génétique des Saami, ce qui est exceptionnel dans leur contexte géographique. Il est aussi notable que les russes du nord ont une forte proportion de cette composante contrairement aux autres russes. Cependant les Estoniens et les Hongrois n'ont pas cette composante magenta.

Les haplogroupes mitochondriaux des populations Ouraliennes sont essentiellement d'origine ouest Eurasienne. Seuls les Nenets et Nganasans de Sibérie ont plus d'haplogroupes mitochondriaux d'origine est Asiatique. A l'inverse, les lignages du chromosome Y sont essentiellement de l'haplogroupe est Asiatique N, à l'exception des Hongrois et des Selkups. L'haplogroupe dominant chez les Selkups est Q, mais R1a d'origine Est Européenne est également important.

La statistique D montre que les Ouraliens de l'ouest (Saami, Finnois, Estoniens, Hongrois) partagent plus d'allèles avec les Ouraliens de Sibérie que les autres populations d'Europe. De plus les Finnois partagent plus d'allèles avec les Sibériens que les Estoniens, mais les Estoniens ne partagent pas plus d'allèles avec les Sibériens que leurs voisins Lettons. Aucune population Ouralienne n'a plus d'affinité génétique avec les Hongrois qu'avec toute autre population non Ouralienne du nord-est de l'Europe.

Les auteurs ont ensuite testé les segments identiques par descente (IBD). Ainsi les Saami et les Finnois partagent plus de segments IBD avec les populations Ouraliennes éloignées qu'avec les Européens du nord-est. Les Nganasans Samoyèdes partagent également plus de segments IBD avec les populations Ouraliennes de Sibérie, les populations Ouraliennes de la région Volga-Oural et même les Saami et les Caréliens, qu'avec leurs voisins non Ouraliens. Ces résultats attestent d'un substrat génétique commun parmi les populations Ouraliennes.

Le logiciel fineStructure permet de construire un arbre en fonction des affinités dans le partage d'allèles entre populations. Cet arbre permet ainsi de déterminer des groupes de populations qui se rapprochent génétiquement le plus. Certains groupes comprennent uniquement des populations Ouraliennes, alors que d'autres groupes comprennent des populations Ouraliennes et des populations non Ouraliennes comme les Hongrois associés aux Slaves et aux Germains, et les Estoniens associés aux Lettons et Lituaniens. Les auteurs ont ensuite utiliser le logiciel Globetrotter pour analyser les mélanges génétiques à partir des groupes définis par fineStructure. Pour cela les auteurs ont défini trois groupes principaux: Europe, région Volga-Oural et Sibérie de l'ouest. Les événements de mélange génétique déduits pour les populations d'Europe invoque essentiellement d'autres populations Européennes à l'exception des Saami qui invoque des populations de la région Volga-Oural. La plupart des mélanges génétique des populations de la région Volga-Oural invoquent des populations d'Europe sauf les Maris et Udmurts. La plupart des mélanges génétique des populations de Sibérie de l'ouest invoquent des populations de Sibérie, d'Asie de l'est et d'Asie Centrale, sauf les Mansis qui invoquent des populations de la région Volga-Oural et d'Europe.

Les auteurs ont ensuite fait une analyse plus fine en masquant les mélanges génétiques qui invoquent une population voisine. Ainsi, dans les populations Européennes, les Finnois et les Saami ont subi des mélanges génétiques avec des populations de Sibérie de l'ouest. Les populations de la région Volga-Oural ont des contributions génétiques des populations Ouraliennes de Sibérie. L'estimation des dates de ces différents événements de mélange génétique est relativement récent puisque compris entre les années 500 et 1900. Les plus anciens événements sont situés en Europe du Nord-Est et dans la région Volga-Oural (vers les années 800 ou 900 ou avant). Les populations Turques de la région Volga-Oural ont subi des mélanges génétiques vers les années 1200 et 1300 alors que les mélanges génétiques dans les populations de Sibérie de l'Ouest sont datés après l'année 1500.

Enfin les auteurs ont étudié la corrélation entre les distances génétique, linguistique et géographique parmi les populations Ouraliennes. Ils ont ainsi mis en évidence une corrélation positive entre la distance lexicale et la distance génétique, mais aussi entre les distances lexicale et géographique, puis génétique et géographique. Ainsi la diffusion des langues Ouraliennes est associée aux mouvements de populations, au moins à un certain degré. La découverte de la composante Sibérienne dans la plupart des populations Ouraliennes indique également qu'il faut en tenir compte dans certaines populations Européennes du nord-est.

jeudi 23 août 2018

Le génome de la population négrito du Sud-Est Asiatique

Il est connu que l'homme moderne est arrivé dans le sud-est Asiatique il y a entre 50.000 et 40.000 ans. En effet, les restes humains trouvés dans la grotte Niah à Bornéo, dans la grotte Callao aux Philippines et à Tam Pa Ling au Laos datent de cette période. A cette époque, les îles de Sumatra, Java et Bornéo étaient rattachées au continent pour former le Sunda, séparé par un bras de mer du Sahul incluant notamment l'Australie et la Nouvelle-Guinée. Un certain nombre de populations du Sud-Est Asiatique sont supposées descendre directement des premiers habitants du Sunda. Ce sont les négritos que l'on trouve dans les îles Andaman, la péninsule Malaisienne et plusieurs îles des Philippines. Elles sont généralement associées à un mode de subsistance de chasseurs-cueilleurs et montrent des caractéristiques physiques spécifiques comme leur petite taille, les cheveux frisés et la peau sombre. Ces observations ont laissé pensé que les négritos étaient apparentés aux pygmées d'Afrique qui montrent des phénotypes identiques. Cependant ces traits physiques ont pu être obtenus indépendamment par convergence de l'évolution.

Timothy Jinam et ses collègues viennent de publier un papier intitulé: Discerning the Origins of the Negritos, First Sundaland People: Deep Divergence and Archaic Admixture. Ils ont génotypé l'ADN de quatre groupes négritos (Aeta, Agta, Batak et Mamanwa) et trois groupes non négritos (Tagalog, Visayan et Manobo) des Philippines. Ces résultats ont été comparés à ceux obtenus pour les négritos des îles Andaman (Onges et Jarawa) et de Malaisie (Jehai, Kintak et Batek) ainsi qu'à d'autres groupes non négritos (Temuan et Bidayuh) de la région:
2018_Jinam_FigureS1.jpg

Les auteurs ont réalisé une Analyse en Composantes Principales. Dans la figure ci-dessous la première composante sépare les négritos des îles Andaman (à gauche) des autres populations alors que la seconde composante sépare les populations de Malaisie (en bas), des populations des Philippines (en haut):
2018_Jiman_Figure1A.jpg

Si les papous et les Mélanésiens étaient inclus dans cette figure, les négritos des Philippines seraient situés entre les papous et les négritos de Malaisie le long de la seconde composante. Si on supprime les négritos des îles Andaman, la première composante sépare les Aeta, Agta et Batak des autres populations. Ces populations s'étirent le long de la première composante indiquant différents niveaux de mélanges génétiques avec les populations voisines non négritos:
2018_Jiman_Figure1B.jpg

De la même façon les Mamanwa s'étirent le long de la seconde composante et se rapprochent de leurs voisins non négritos: Manobo.

Les auteurs ont également fait une analyse avec le logiciel ADMIXTURE:
2018_Jinam_Figure2.jpg

Pour K=7, la composante orange est majoritaire dans les groupes Austronésiens non négritos, avec des proportions diverses dans les groupes négritos Philippins indiquant différents degrés de mélange génétique. Ainsi les Bataks ont le plus de composante orange en accord avec la PCA dans laquelle ils étaient proches des populations non négritos des Philippines. Pour K=6 les Mamanwa ont leur propre composante blanche et pour K=7 les Batek ont leur propre composante jaune, indiquant ainsi pour ces deux populations l'existence d'une dérive génétique.

L'utilisation de la statistique D confirme des mélanges génétiques entre les populations négritos des Philippines et leurs voisins non négritos.

Les auteurs ont ensuite construit un arbre phylogénétique pour estimer les temps de divergence entre les différentes populations. Ainsi les résultats montrent que les populations du Sud-Est Asiatique se sont d'abord séparées des Ouest Eurasiens. Ensuite les papous et les Mélanésiens se sont séparées des autres populations du Sud-Est Asiatique, suivis des négritos des îles Andaman, des négritos de Malaisie, des négritos des Philippines et enfin des populations non négritos:
2018_Jinam_Figure3.jpg

Ils ont ensuite utilisé le logiciel TreeMix pour estimer les différents flux de gènes. Ainsi il y a un flux de gènes des Dénisoviens vers les papous (4,6%), mais aussi des Dénisoviens vers certains négritos des Philippines (Agta et Aeta) (1,4%). Il y a également un flux de gènes important des Malaisiens non négritos vers les négritos Malaisiens (47%).

La statistique f4 confirme que le flux de gènes des Dénisoviens est plus important chez les papous, puis les négritos Philippins:
2018_Jinam_Figure4.jpg

Enfin l'estimation des dates de divergence entre populations montre que les Européens se sont séparés des Asiatiques du Sud-Est il y a entre 38.000 et 30.000 ans et les négritos Malaisiens se sont séparés des négritos Philippins il y a entre 15.000 et 13.000 ans.

Ensuite les auteurs ont recherché les différents gènes similaires parmi les différentes populations négritos. Ainsi ils ont mis en évidence certains gènes associés à la couleur de la peau (OCA2 et SLC45A2), à la taille (ACAN et ADAMTS17), à la forme du visage (PAX3, PREP et GRID1) et à la résistance contre la malaria (IL4 et CDH13).

En conclusion cette étude a montré que les négritos des îles Andaman, de Malaisie et des Philippines représentent une des plus anciennes branches du Sud-Est Asiatique qui se sont séparées des autres populations juste après les aborigènes Australiens et les papous.

lundi 6 août 2018

Génome des pygmées de Flores en Indonésie

Les îles du Sud-Est Asiatique sont une région clef dans l'évolution et les interactions entre groupes humains. Les habitants actuels possèdent de l'ADN de Néandertal et de Denisova. De plus les restes fossiles indiquent la présence d'Home erectus à Java depuis environ 1,7 millions d'années jusqu'à 53.000 à 27.000 ans, celle d'Homo floresiensis sur l'île de Flores entre 700.000 et 60.000 ans et celle d'Homo sapiens en Sulawesi à partir de 40.000 ans. D'autre part les plus fortes proportions d'ascendance Denisovienne sont trouvées dans la région à l'Est de la ligne Wallace qui sépare les anciens continents Sunda et Sahul. La plupart de l'ascendance des habitants actuels de la région vient de l'expansion Austronésienne qui s'est produite entre 4000 et 3000 ans depuis l'Asie du Sud-Est vers l'Océanie.

L'histoire humaine sur l'île de Flores est particulièrement énigmatique. Cette île est localisée à environ 400 km à l'Est de la ligne Wallace, et abrite les restes d'Homo floresiensis, une espèce humaine de petite taille dont la taille moyenne est estimée à environ 1,06m qui a habité la région entre 700.000 et 60.000 ans. Cependant les plus anciens restes humains sur l'île de Flores remontent à 1 million d'années. Enfin la population actuelle de cette île inclut une population pygmée vivant dans le village de Rampasasa à proximité de la grotte de Liang Bua qui héberge les restes d'Homo floresiensis et dont la taille moyenne fait environ 1,45m:
2018_Tucci_Figure1A.jpg

Serena Tucci et ses collègues viennent de publier un papier intitulé: Evolutionary history and adaptation of a human pygmy population of Flores Island, Indonesia. Ils ont génotypé l'ADN de 32 individus de Rampasasa. Ils ont ensuite séquencé le génome complet de dix de ces individus. Ces résultats ont été ensuite comparés avec le génome de 2507 individus appartenant à 225 populations différentes.

Les auteurs ont réalisé une Analyse en Composantes Principales. Les pygmées de Flores se situent à proximité des populations des îles du Sud-Est Asiatique et des populations du continent du Sud-Est Asiatique. Les populations les plus proches sont les Lebbo de Bornéo et les Mamanwa des Philippines:
2018_Tucci_Figure1B.jpg

Les auteurs ont également effectué une analyse avec le logiciel ADMIXTURE. L'ascendance des pygmées de Flores est issue d'un mélange génétique entre une population Est-Asiatique et une population de Nouvelle-Guinée, mélange issu de l'expansion Austronésienne. La composante de Nouvelle-Guinée représente environ 23% de l'ascendance totale des pygmées de Flores:
2018_Tucci_Figure1C.jpg

Les auteurs ont ensuite utilisé une analyse en Composantes Principales pour décrire les ascendances archaïques (Néandertal et Denisova) des pygmées de Flores:
2018_Tucci_Figure2A.jpg

Les pygmées de Flores possèdent donc de l'ADN de Néandertal et de Denisova. Leur proportion de 0.8% d'ADN de Denisova est supérieure à celle des populations des îles du Sud-Est Asiatiques, mais inférieure à celle des Mélanésiens. En fait cette valeur est proportionnelle à leur taux d'ascendance de Nouvelle-Guinée.

Les auteurs ont déterminé l'ADN hérité d'une population humaine archaïque à l'aide de la statistique S*:
2018_Tucci_Figure2B.jpg

Il atteint 53,5 Mb par individu chez les pygmées de Flores dont 47,5 Mb viennent de Néandertal et 4,2 Mb viennent de Denisova. La quantité restante est classifiée ambiguë car les auteurs ne savent pas si cet ADN vient de Néandertal ou de Denisova. La statistique S* n'a pas besoin de génome de référence d'une population archaïque et ainsi peut potentiellement identifier de l'ADN issue d'une population archaïque inconnue. Cependant les auteurs n'ont pas trouvé dans le génome des pygmées de Flores une signature archaïque différentes de Néandertal et de Denisova. Il semble ainsi que les populations ancestrales aux pygmées de Flores ne se soient pas mélangés génétiquement avec des Homo erectus ou des Homo floresiensis.

Les auteurs ont ensuite recherché des gènes soumis à la sélection naturelle chez les pygmées de Flores. Une des régions identifiées correspond aux HLA (Human leukocite antigen) liés aux réponses immunitaires de l'organisme. Une autre correspond aux FADS (Fatty acid desaturase) liés à l'alimentation. Chez les pygmées de Flores, l'haplotype de ce gène est fixé à l'allèle ancestrale comme c'est le cas également pour un certain nombre de populations des îles du Sud-Est Asiatique, mais aussi chez les inuits du Groenland potentiellement en réponse au climat et à une alimentation marine riche en acide gras oméga 3:
2018_Tucci_Figure3B.jpg

Les auteurs ont également recherché les gènes responsables de la taille des individus. Ils ont ainsi remarqué que ces gènes identifiés dans les populations Européennes sont également différenciés chez les pygmées de Flores par rapport aux populations voisines:
2018_Tucci_Figure4A.jpg

Les pygmées de Flores possèdent ainsi plus d'allèles correspondant à une diminution de la taille, que leur voisins. Ainsi la sélection naturelle a conduit à une diminution de la taille des pygmées de Flores.

vendredi 12 janvier 2018

Analyse génomique des Comoriens

Le développement économique du réseau commercial de l'océan Indien a conduit à l'émergence de pouvoirs régionaux géopolitiques dont le couloir Swahili représente le pôle Africain. Cette zone est composée d'un ensemble de cité-états disposées le long de la côte Est Africaine ainsi que d'îles entre le sud de la Somalie au nord, l'archipel des Comores, Madagascar et le centre de la Mozambique au sud. Elle a été une région de contact entre des populations d'Afrique, du Moyen-Orient, d'Asie du Sud et des îles du Sud Est Asiatique.

La culture Swahili émerge durant le premier millénaire av. JC. à partir des communautés Bantoues engagées dans l'agriculture, la pêche, la chasse, la poterie, la production de fer et dans le commerce sur l'océan Indien. L'intensité des échanges entre les villages Swahili et les villes commerciales sur plusieurs siècles a été un moteur pour la formation d'une unité culturelle dans le couloir Swahili. Les populations locales ont alors cohabité avec des populations du Moyen-Orient et d'Asie.

Ainsi Madagascar a été touchée par des contacts avec le monde Austronésien. Originaire des îles du Sud-Est Asiatique, la dispersion Austronésienne à travers l'océan Indien a été conduite principalement par des commerçants, notamment à l'époque de l'empire Srivijaya entre les 6ème et 13ème siècles. Une étude précédente a montré que les Banjars, du sud de Bornéo, représentent la population la plus proche des ancêtres Asiatiques des populations Malgaches. Cette migration se retrouve également dans la langue Malgache qui est proche de la langue Ma'anyan de Bornéo. De plus les traces archéologiques indiquent une présence des îles du Sud-Est Asiatique à Madagascar et dans les Comores, à travers notamment de la présence du riz dans les vestiges retrouvés. Cependant sur l'archipel des Comores, la langue utilisée est une langue Bantoue.

Nicolas Brucato et ses collègues viennent de publier un papier intitulé: The Comoros Show the Earliest Austronesian Gene Flow into the Swahili Corridor. Ils ont analysé le génome de 276 échantillons issus de six populations du Kenya (Mombasa, Kilifiet et l'archipel Lamu) et des îles du Comores (Anjouan, Grande Comore et Moheli). Ces données ont ensuite été comparées avec des génomes de différentes populations mondiales.

Les auteurs ont d'abord réalisé une Analyse en Composantes Principales:
2017_Brucato_Figure1A.jpg

La figure ci-dessus montre que les Swahilis du Kenya se superposent avec les autres groupes Sub-Sahariens et que les communautés Swahilis ne se distinguent pas l'une de l'autre à part quelques individus. Les individus des Comores se regroupent entre les Swahilis et les Malgaches (ces derniers sont séparés des groupes Sub-Sahariens à cause de leur ascendance des îles du Sud-Est Asiatique (ronds rouges)).

L'analyse des haplogroupes uni-parentaux montre que la grande majorité d'entre eux sont Africains (L pour les haplogroupes mitochondriaux et E et B pour les haplogroupes du chromosome Y). Il y a seulement un nombre limité de lignages Asiatiques (haplogroupe mitochondrial F3b1b et haplogroupe du chromosome Y O2a).

L'analyse avec le logiciel fineStructure identifie 70 groupes distincts pour la population mondiale dont un groupe pour les Swahilis et un groupe pour les Comoriens. Neuf individus Swahilis se situent à part et se regroupent plutôt avec une population de Somalie. Ils reflètent peut-être une migration récente.

L'analyse des segments IBD indique un partage génétique important entre les populations Malgaches, Comorienne et Swahili. Notamment les Swahilis partagent plus de gènes avec les Comoriens qu'avec les autres populations Africaines du continent. Il y a également de nombreux haplotypes mitochondriaux partagés entre Swahilis et Comoriens.

Les auteurs ont ensuite réalisé une analyse avec le logiciel ADMIXTURE. Le meilleur résultat est obtenu pour une valeur K=26:

2017_Brucato_Figure2.jpg

Les Swahilis ont une composante majeure en vert foncé présente également chez les groupes Bantous. D'autres ascendances mineures (en marron) sont partagées avec les populations d'Afrique de l'Est. Cependant il n'y a pas d'ascendance du Moyen-Orient (en violet) et d'Asie (en orange et rouge) chez les Swahilis, indiquant ainsi leur origine purement Africaine. Cette absence représente la différence principale avec la population Comorienne qui possède 6 à 7% d'ascendance du Moyen-Orient et 8 à 9% d'ascendance des îles du Sud-Est Asiatique. Les Comoriens possèdent plus d'ascendance du Moyen-Orient et moins d'ascendance du Sud-Est Asiatique que les Malgaches. L'ascendance vert foncé majoritaire chez les Swahilis est également majoritaire chez les Comoriens et les Malgaches.

Les auteurs ont ensuite utilisé les logiciels GlobeTrotter et Malder pour estimer les dates des mélanges génétiques. Ainsi la population Swahili a subi un premier mélange génétique il y a 2193 ans entre une population Bantoue Sud-Africaine (38%) et une population Bantoue Centre Africaine (62%), puis un second mélange génétique il y a 577 ans entre une population Bantoue (88%) et une population Éthiopienne (12%). De plus les populations Comoriennes ont subi un mélange génétique entre une population Swahili (80 à 87%) et une population des îles du Sud-Est Asiatique proche des Banjars (13 à 20%) il y a entre 792 et 1197 ans. Cependant les Comoriens de Anjouan montrent un second mélange génétique entre une population Swahili (74%) et une population du Moyen-Orient (26%) daté de 459 ans. Les Comoriens de Moheli ont subi un mélange génétique il y a environ 150 ans, entre une population Swahili (74%) et une population Malgache (26%) :

2017_Brucato_Figure3.jpg

Enfin les Malgaches sont issus d'un mélange génétique entre une population Swahili (65%) et une population des îles du Sud-Est Asiatique (35%) daté entre 742 et 876 ans.

Les mélanges génétiques dans la population Swahili ne sont pas sexuellement biaisés, alors que la communauté Comorienne montre plus de femmes d'origine Africaine ou Asiatique et plus d'hommes d'origine du Moyen-Orient. Ce scénario est différent de Madagascar où on observe plus d'hommes d'origine Africaine et plus de femmes d'origine Asiatique.

Ces différents résultats suggèrent des dynamiques de populations différentes entre les Comores et Madagascar. Ainsi le contact entre Africains et Austronésiens est plus ancien aux Comores qu'à Madagascar. La plus faible proportion d'ascendance Austronésienne aux Comores (20%) qu'à Madagascar (37 à 64%) est probablement liée à de plus nombreux flux de gènes en provenance des populations Swahili aux Comores qu'à Madagascar.

mardi 12 décembre 2017

Structure génétique de l'Irlande

Les études d'ADN ancien suggèrent que le paysage génomique de l'Irlande a été établi il y a environ 3500 ans durant l'Âge du Bronze. Il y a eu plusieurs migrations historiques significatives en Irlande dont les Vikings à la fin du premier millénaire, l'invasion Normande du 12ème siècle et les Plantations Britanniques en Ulster des 16ème et 17ème siècles. L'impact de ces migrations sur le génomes des Irlandais actuels reste inconnu.

Edmund Gilbert et ses collègues viennent de publier un papier intitulé: The Irish DNA Atlas: Revealing Fine-Scale Population Structure and History within Ireland. Ils ont analysé le génome de 536 Irlandais, 101 Ecossais, 131 Gallois, 96 Orcadiens et 1239 Anglais. Les auteurs ont utilisé le logiciel fineStructure pour mettre en évidence des clusters génétiques dans la population étudiée. Ils ont ainsi détecté 30 groupes dans les Îles Britanniques dont sept groupes essentiellement Irlandais (dénommés groupes Gaéliques) et trois groupes mélangés entre Irlandais du Nord, Écossais et Anglais (dénommés groupes Nord Irlandais).

Dans l'arbre ci-dessous, les clusters Gaéliques se regroupent entre eux et sont reliés aux Orcadiens. La branche Irlandaise est séparée en trois sous-clades. La première contient uniquement l'Irlande du Nord (Ulster), la seconde l'Irlande du Sud (Munster Nord et Sud) et la troisième l'Irlande Centrale (Connacht, Dublin, Irlande Centrale et Leinster). Cette distribution suit donc la géographie et les limites des entités historiques et politiques de l'Irlande:
2017_Gilbert_Figure1.jpg

Les groupes Nord Irlandais sont inclus dans la branche Britannique (voir ci-dessus). Ils sont donc issus d'un mélange génétique entre Irlandais et Britanniques. D'ailleurs un certain nombre des Irlandais de ces groupes ont des patronymes Anglais ou Écossais.

Les auteurs ont également effectué une Analyse en Composantes Principales:
2017_Gilbert_FigureS2.jpg

La première composante sépare les Irlandais en bas à gauche des Anglais à droite, et la seconde composante sépare les Orcadiens en haut à gauche, des autres populations.

Les auteurs ont comparé les anciens individus Irlandais de l'Âge du Bronze avec les différents échantillons actuels. La majorité des groupes génétiques Irlandais a la même affinité génétique avec ces deux anciens individus, sans différence significative. Il y a donc eu une contribution homogène de ces anciens individus aux différentes populations contemporaines Irlandaises.

Les auteurs ont ensuite comparé les échantillons Irlandais à 6021 échantillons Européens. Ils ont estimé alors la proportion d'ascendance continentale pour chacun des pays Européens chez les individus Irlandais. Le résultat est le suivant:
2017_Gilbert_Figure3b.jpg

Ainsi pour les sept groupes Gaéliques, 80% de l'ascendance continentale vient de France, Belgique, Danemark et Norvège. La plus grande proportion vient de France, notamment du cluster FRA1 dont les individus sont du Nord-Ouest de la France. Cette ascendance est probablement liée à l'ascendance Celtique de la population Irlandaise. Les groupes Norvégiens contribuent également de manière significative à l'ascendance des groupes Irlandais. Cette ascendance est probablement liée aux migrations Viking du Moyen-Âge.

Les auteurs ont ensuite utilisé le logiciel Globetrotter pour estimer les dates des mélanges génétiques dans la population Irlandaise. L'arrivée des ascendances Danoise et Norvégienne est ainsi estimée entre 788 et 1052 de notre ère correspondant bien aux incursions Viking. D'autre part le mélange génétique entre ascendance Irlandaise et Britannique est estimé entre 11 et 7 générations et correspond probablement aux Plantations Britannique en Irlande du Nord.

mercredi 15 novembre 2017

Ascendance génomique des communautés Noir Marron de Guyane Française et du Suriname

Entre 1526 et 1875 environ 7 millions d'Africains ont été transportés en Amérique du Sud. D'après les archives, ils ont embarqué dans différentes régions côtières d'Afrique. Ainsi les populations d'origine Africaine de Guyane Française et du Suriname venaient principalement de la Côte de l'Or, du Golfe du Bénin et d'Afrique du Centre Ouest.

Les précédentes études génétiques des populations d'Amérique d'origine Africaine ont révélé des différences dans leurs proportions d'ascendance Africaine, Européenne et Amérindienne, leurs dates de mélanges génétiques et leur flux génétique biaisé en fonction du sexe.

Les communautés Noir Marron sont des descendants d'esclaves Africains qui se sont échappés et ont formé des villages d'hommes libres. Ainsi la communauté Noir Marron du Suriname et de Guyane Française est l'une des plus importantes en Amérique du Sud. Ils sont les descendants des esclaves Africains qui se sont échappés des plantations Hollandaises du Suriname durant les 16ème et 17ème siècles.

Cesar Fortes-Lima et ses collègues viennent de publier un papier intitulé: Genome-wide Ancestry and Demographic History of African-Descendant Maroon Communities from French Guiana and Suriname. Ils ont analysé le génome de 107 Sud Américains d'origine Africaine dont 71 Noir Marrons de Guyane Française et du Suriname (23 Aluku, 23 Ndjuka, 19 Saramaka et six Paramaka), 16 Afro-Brésiliens et 20 Afro-Colombiens:
2017_FortesLima_FigureS1.jpg

Ils ont également analysé le génome de 124 Ouest Africains dont 19 Fon, 24 Bariba et 24 Yoruba du Bénin, 20 Ahizi et 17 Yacouba de Côte d'Ivoire et 20 Bwa du Mali. Ces résultats ont été fusionnés avec deux ensembles de génomes préalablement obtenus dont 157 individus des Caraïbes (ACB) et d'Amérique du Nord (ASW).

Les auteurs ont réalisé une analyse avec le logiciel ADMIXTURE. La figure ci-dessous donne le résultat obtenu pour une valeur de K=4:
2017_FortesLima_FigureS3.jpg

Les Noir Marrons représentent la population Afro-Américaine qui contient le plus d'ascendance Africaine (98%). Elle est équivalente dans les quatre communautés à l'exception d'un individu Saramaka (90%) et un individu Ndjuka (79%). De plus cette population a un haut coefficient de consanguinité et un grand nombre de segments homozygotes, signes d'une forte isolation.

A l'inverse les Afro-Brésiliens ont 23% d'ascendance Européenne et 5% d'ascendance Amérindienne et les Afro-Colombiens ont 12% d'ascendance Amérindienne et 11% d'ascendance Européenne. Ils se sont donc mélangés beaucoup plus que les Noir Marrons.

Ces résultats se retrouvent également dans l'Analyse en Composantes Principales. Dans la figure ci-dessous les populations Africaines sont en rouge à gauche, les populations Européennes en bleu foncé en bas à droite et les populations Est Asiatiques en violet en haut à droite:
2017_FortesLima_FigureS6.jpg

PEL sont les Péruviens de Lima, MXL les Mexicains de Los Angeles, CLM les Colombiens de Medellin et PUR les Portoricains. Les Noir Marrons représentés par des cercles gris sont bien la population la plus proche des populations Africaines.

D'autre part l'analyse avec le logiciel ADMIXTURE pour K=12 permet de mettre en évidence 12 ascendances distinctes. La figure ci-dessous donne le résultat pour les différentes populations d'ascendance Africaines:
2017_FortesLima_Figure2B.jpg

La population Noir Marron (NM) est similaire à la population Africaine du Golfe du Bénin (population 5 Africaine ci-dessus).

Les auteurs ont ensuite masqué les ascendances Européenne et Amérindienne dans les populations Afro-Américaines et construit une nouvelle Analyse en Composantes Principales:
2017_FortesLima_Figure2C.jpg

Les résultats montrent que les populations Noir Marron et Afro-Colombienne se superposent avec les populations du Golfe du Bénin et du Ghana. A l'inverse la population Afro-Brésilienne se superpose avec les populations Bantoues du Cameroun, du Gabon et d'Angola en Afrique du Centre Ouest. Ces résultats sont confirmés par une analyse des segments IBD.

Les auteurs ont ensuite utilisé le logiciel GLOBETROTTER pour estimer les dates de mélanges génétiques. Ainsi plusieurs vagues de mélanges ont été identifiées au 18ème siècle dans les différentes populations. Les Noir marrons ont reçu un flux de gènes Amérindien vers 1750 suivi d'un flux de gènes Européen vers 1775. Les Afro-Brésiliens ont reçu un flux de gènes Amérindien vers 1756 suivi d'un flux de gènes Européen vers 1796. Enfin les Afro-Colombiens ont reçu un flux de gènes Amérindien vers 1731 suivi d'un flux de gènes Européen vers 1749.

Ces flux de gènes sont biaisés sexuellement. Ainsi dans la population Afro-Brésilienne l'ascendance Européenne est plus masculine alors que les ascendances Africaine et Amérindienne sont plus féminine. Dans la population Afro-Colombienne les ascendances Européenne et Amérindienne sont plus masculine alors que l'ascendance Africaine est plus féminine.

jeudi 9 novembre 2017

Histoire génomique des Amérindiens du Mexique

La population des Amériques est originaire de l'Asie du Nord-Est il y a environ 23.000 ans, franchissant ensuite le détroit de Béring avant de se répandre sur tout le continent. La population actuelle est le résultat de plusieurs migrations, mélanges génétiques et processus d'adaptation. Au quinzième siècle, avant la conquête du Mexique par les Européens, le territoire est occupé par plusieurs groupes Amérindiens nomades ou semi-nomades. Après la conquête Espagnole, de nombreux processus de mélanges génétiques ont eu lieu, d'abord entre Amérindiens et Espagnols, puis avec une population Africaine venue avec le commerce des esclaves. Actuellement il y a 68 langues Amérindiennes connues au Mexique. Environ 21% de la population s'identifie à l'un des groupes Amérindiens, et 7% (soit environ 7 millions d'individus) parle une des langues Amérindiennes.

Sandra Romero-Hidalgo et ses collègues viennent de publier un papier intitulé: Demographic history and biologically relevant genetic variation of Native Mexicans inferred from whole-genome sequencing. Ils ont séquencé le génome complet de 12 Amérindiens du Mexique appartenant à six groupes ethniques différents (TAR: Tarahumara, TEP: Tepehuano, NAH: Nahua, TOT: Totonaca, ZAP: Zapoteca et MAY: Maya) et trois Mexicains métisses (MES: Mestizo). L'ascendance Amérindienne est estimée supérieure à 98% pour tous les individus Amérindiens sauf les Tepehuanos du Nord dont l'ascendance Amérindienne est estimée à 91%:
2017_RomeroHidalgo_Figure1.jpg

Ils ont également analysé l'ADN autosomal de 312 Amérindiens du Mexique, obtenu par puces à ADN. Les individus se regroupent en trois clusters: Nord, Sud et Maya.

Les auteurs ont réalisé une Analyse Multi-échelles. La figure a ci-dessous représente les deux premières composantes qui séparent bien les Africains en vert foncé, les Européens en rouge et les Amérindiens à gauche (les 12 individus séquencés sont en noir et gris):
2017_RomeroHidalgo_Figure2a.jpg

Enfin la troisième composante visible dans la figure b ci-dessus permet de séparer les Amérindiens. Les Seri (SER) sont en haut à gauche (croix bleu foncé) alors que les Lacandona (LAC) sont en bas à gauche (croix jaunes).

Les auteurs ont également réalisé une analyse avec le logiciel ADMIXTURE. Les individus séquencés sont représentés à la figure d ci-dessous. L'analyse est optimale pour une valeur de K=10. La composante Africaine est représentée en vert foncé, la composante Européenne en rouge:
2017_RomeroHidalgo_Figure2c.jpg

L'analyse permet ainsi d'identifier une composante Seri en bleu foncé, Huichol en gris bleu, Nahua en bleu, Totonaca en violet, Zapoteca en vert clair, Maya en orange, Tojolabal en marron et Lacandona en jaune. Parmi les Amérindiens séquencés, les Tarahumara et Tepehuano possèdent la plus forte proportion d'ascendance du Nord en gris bleu. Les Nahua et Totonaca montrent le plus de mélange de composantes. La diversité des individus Nahua est probablement une conséquence de l'expansion de l'empire Aztèque au 15ème et début du 16ème siècles.

Les auteurs ont déterminé les haplogroupes mitochondriaux et du chromosome Y des individus séquencés:
2017_RomeroHidalgo_Table1.jpg

Il y a 6 hommes. Les cinq hommes Amérindiens sont de l'haplogroupe Q1a2a spécifique des populations Amérindiennes, alors que l'homme métisse est R1b commun dans la péninsule Ibérique. Tous les individus ont un haplogroupe mitochondrial typique des populations Amérindiennes. Ces données confirment l'hypothèse selon laquelle la contribution Européenne est essentiellement masculine.

Les auteurs ont également construit un arbre avec le logiciel TreeMix à partir des 12 génomes Amérindiens, 11 génomes de la population mondiale et 4 anciens individus: Néandertal, Denisova, un ancien Amérindien: Anzick et un ancien Sibérien de Mal’ta:
2017_RomeroHidalgo_FigureS2.jpg

L'arbre ci-dessus sépare bien les groupes Amérindiens du Nord (Tarahumaras et Tepehuanos) de ceux du Sud (Totonacas, Zapotecas, Nahuas, Mayas et Karitiana). Le flux de gènes issu de la population Sibérienne liée au garçon de Mal’ta vers toutes les populations Amérindiennes est également représenté (flèche orange).

La reconstruction démographique avec des méthodes PSMC et MSMC montre que les populations non Africaines ont subi une goulet d'étranglement génétique entre 60.000 et 50.000 ans correspondant à la sortie de l'Afrique. De plus les populations Amérindiennes montrent ensuite une faible valeur de la population effective de l'ordre de 2000 individus jusqu'à 20.000 ans, date correspondant à la position de la population en Béringie avant de se diffuser aux Amériques. Cette population reste faible jusqu'à 10.000 ans. Ensuite la population d'Amérique du Sud augmente constamment à l'inverse de la population d'Amérique du Nord qui décroit jusqu'à 4000 ans.

mercredi 11 octobre 2017

Structure génétique en Indonésie

L'Indonésie est le quatrième pays le plus peuplé du monde. Elle est formée par un archipel qui comprend plus de 900 îles habitées et abrite une très forte diversité humaine. La plupart des plus de 700 langues parlées dans ce pays, appartiennent à la famille Austronésienne. L'archipel d'Indonésie, avec les Philippines et Taïwan forment les Îles du Sud-Est Asiatique (ISEA), une région maritime unique pour son rôle clef dans la dispersion et l'évolution de l'homme. Elle est au départ de la diffusion Néolithique qui a propagé la culture Austronésienne, puis a permis également la colonisation de Madagascar et de l'Océanie lointaine. Cette diffusion Néolithique Austronésienne prend sa source sur l'île de Taïwan entre 2500 et 2000 av. JC, atteint les Philippines entre 2000 et 1500 av. JC, Bornéo et les Célèbes (Sulawesi) entre 1500 et 1000 av. JC., puis la Mélanésie Occidentale entre 1350 et 750 av. JC.

Cette histoire est cependant plus complexe qu'un simple mouvement de gènes, de langues et de technologies à partir de Taïwan. Le substrat pré-Austronésien en Indonésie montre des influences continentales à partir du Sud-Est Asiatique. La Nouvelle-Guinée représente également un centre de domestication indépendant focalisé sur les fruits et les tubercules qui se sont propagés d'est en ouest. Le débat reste ouvert pour savoir si cette révolution Néolithique s'est effectuée par un mouvement de population et/ou par un transfert de langues, culture et technologie.

Georgi Hudjashov et ses collègues viennent de publier un papier intitulé: Complex Patterns of Admixture across the Indonesian Archipelago. Ils ont séquencé le génome de 498 individus appartenant à 25 populations de cette région. Ces données ont été fusionnées avec les génomes préalablement disponibles de cette région. Dans la figure ci-dessous, les échantillons du continent Asiatique sont en jaune, de Taïwan et des Philippines en bleu, d'Indonésie Occidentale en rouge, d'Indonésie Orientale en vert, de Mélanésie en violet et de Polynésie en turquoise:
2017_Hudjashov_Figure1A.jpg

Les auteurs ont réalisé une Analyse en Composantes Principales:
2017_Hudjashov_Figure1B.jpg

La première composante sépare les populations suivant un axe corrélé plus ou moins avec la géographie de l'ouest (à gauche) vers l'est (à droite).

Les auteurs ont ensuite réalisé une analyse avec le logiciel ADMIXTURE:
2017_Hudjashov_Figure2.jpg

Dans la région il y a deux composantes principales: une composante continentale en jaune et une composante Papoue en violet. Une troisième composante souvent qualifiée d'Austronésienne apparait en bleu clair à partir de K=5. Il y a une claire différence entre l'Indonésie Occidentale qui comprend une forte proportion d'ascendance Austronésienne et quasiment pas d'ascendance Papoue, et l'Indonésie Orientale qui a peu d'ascendance Austronésienne et une forte proportion d'ascendance Papoue.

Les auteurs ont utilisé le logiciel fineStructure basé sur la similarité des haplotypes. Les échantillons de la région ISEA se regroupent alors suivant un dendogramme:
2017_Hudjashov_Figure3B.jpg

On peut ainsi mettre en évidence cinq groupes:

  • Taïwan, les Philippines, Bornéo et Sulawesi
  • l'Indonésie Occidentale (sans Bornéo et Sulawesi)
  • l'Indonésie Orientale
  • la Mélanésie
  • la Polynésie

Les auteurs ont utilisé le logiciel GLOBETROTTER. Ils ont ainsi mis en évidence un flux de gènes Sud Asiatique dans la région ISEA daté de l'an 1200 à Sumatra, l'an 760 à Bali et de l'an 1060 dans les Philippines. Un flux de gènes Européen apparait dans la population des Philippines non Kankanaey daté de l'an 1710, à Tahiti daté de 1705 et au Tonga et à Samoa en 1820. Toutes les populations d'Indonésie Orientale montrent un signal identique de contact génétique entre une ascendance Papoue et une ascendance des Philippines ou d'Indonésie Occidentale, daté entre 185 av. JC et 360 ap. JC. Ce signal détecté reflète probablement l'interaction entre une population locale Papoue et une population étrangère Austronésienne en provenance des Philippines. Il est notable que cet événement soit daté bien après les preuves archéologiques associées à l'expansion Austronésienne dans la région, comme si les deux populations de chasseurs-cueilleurs et Néolithique étaient restées séparées pendant un certain temps, avant de se mélanger. D'autre part, les populations de Java et Bali montrent un contact supplémentaire avec une population continentale par rapport aux autres populations d'Indonésie Occidentale. Enfin les populations de Nias et Mentawai en Indonésie Occidentale montrent peu d'ascendance continentale ou Austronésienne, mais des preuves d'une forte isolation et d'une faible taille effective.

Les auteurs ont ensuite utilisé le logiciel MALDER pour savoir si la composante continentale a été introduite en Indonésie avec l'expansion Austronésienne ou avec une autre migration. Les résultats montrent qu'en Indonésie Orientale, la composante continentale est arrivée avec l'expansion Austronésienne. Les résultats sont moins nets pour les populations d'Indonésie Occidentale. Cependant la statistique f3 semble montrer que la composante continentale et la composante Austronésienne sont arrivées en même temps partout en Indonésie. D'autre part, la statistique f3 indique également que les populations de Java et Bali montrent des contacts génétiques supplémentaires avec le continent.

Les auteurs ont analysé les segments homozygotes et la diversité génétique des populations d'Indonésie. Le nombre de segments homozygotes est environ 5 fois supérieur aux valeurs trouvées sur le continent Asiatique, alors que la diversité génétique est comparable. Cependant deux populations d'Indonésie Occidentale: les Nias et les Mentawai montrent une faible diversité génétique ainsi qu'un excès de segments homozygotes signes d'une forte dérive génétique.

Enfin les auteurs ont montré que la distance génétique est fortement corrélée avec la distance linguistique en Indonésie.

vendredi 15 septembre 2017

Forte structure génétique en Nouvelle Guinée

L'île de Nouvelle Guinée contient quelques unes des plus anciennes preuves archéologiques de la présence de l'homme moderne en dehors de l'Afrique, datées d'environ 50.000 ans. La culture des plantes a démarré il y a environ 10.000 ans parallèlement et de manière indépendante au Moyen-Orient, à l'Asie de l'Est et aux Amériques. Aujourd'hui la Papouasie Nouvelle Guinée occupe la partie orientale de l'île ainsi que les îles située au nord de la Malaisie. Elle est le pays le plus diversifié linguistiquement avec environ 850 langues parlées. La moitié de celles-ci appartiennent à la famille Trans-Nouvelle-Guinée qui est supposée s'être diffusée pendant le Néolithique.

Le continent Sahul est resté isolé du reste du monde depuis au moins 10.000 ans. Il est intéressant de se demander si la néolithisation de la Nouvelle-Guinée a été déclenchée par des mouvements de populations comme en Eurasie et en Afrique.

Anders Bergström et ses collègues viennent de publier un papier intitulé: A Neolithic expansion, but strong genetic structure, in the independent history of New Guinea. Ils ont séquencé le génome de 381 individus de Papouasie Nouvelle Guinée, parlant 85 langues qu'ils ont fusionné avec le génome de 39 individus de la même région préalablement publiés:
2017_Bergstrom_Figure1A.jpg

L'analyse avec le logiciel ADMIXTURE montre que les individus des montagnes ne possèdent pas de flux de gènes issu d'Asie de l'Est (composante rouge ci-dessous) contrairement aux individus des plaines:
2017_Bergstrom_Figure1B.jpg

La composante Est Asiatique chez les individus des plaines, est plus forte dans les populations parlant une langue Austronésienne. Elle est la plus faible chez les populations parlant une langue Sepik-Ramu.

L'analyse de l'ADN mitochondrial et du chromosome Y confirme que les populations des montagnes n'ont pas d'haplotypes non originaire du Sahul.

La statistique D montre que les papous de Nouvelle-Guinée ont divergé génétiquement des aborigènes Australiens bien avant la séparation des deux régions par la mer il y a environ 8000 ans.

Les auteurs ont réalisé une Analyse en Composantes Principales:
2017_Bergstrom_Figure2A.jpg

A l'intérieur des populations de Nouvelle Guinée, la plus forte séparation génétique apparait entre l'île principale et l'archipel Bismarck (groupe de droite dans la figure B ci-dessus). D'autre part, les populations des montagnes se regroupent en trois clusters différents alors que toutes les populations des plaines se regroupent ensemble (figure A ci-dessus). Cependant, aucun des trois groupes des montagnes n'est plus proche génétiquement des populations des plaines. Cependant, parmi les différentes populations des plaines, les populations des montagnes sont plus proches de la population de la région de la rivière Sepik, alors que les langues Trans-Nouvelle-Guinée ne sont pas reliées aux langues Sepik-Ramu. Il y a cependant des preuves archéologiques de contacts culturels entre les deux populations durant l'holocène.

Les auteurs ont utilisé la méthode MSMC pour estimer les dates de divergence entre les différentes populations de Nouvelle Guinée. Ainsi les populations des montagnes et les populations de la région de la rivière Sepik ont divergé il y a entre 10.000 et 20.000 ans. La divergence entre les différents groupes des populations des montagnes a eu lieu dans les 10.000 dernières années. D'autre part la population des montagnes a augmenté durant les 10.000 dernières années, contrairement à la population de la région de la rivière Sepik probablement à cause de la diffusion de la malaria.

La différentiation génétique est plus forte dans la population de Nouvelle Guinée (2 à 3%) que dans les populations de taille similaire en Eurasie (< 1%). Elle atteint 4 à 5% entre les populations des montagnes parlant Angan et les autres groupes papous (valeur équivalente à la différentiation génétique entre Européens et Sud Asiatiques).

Les résultats de cette étude confirment l'évolution indépendante des populations du Sahul durant les 50.000 dernières années et l'indépendance de la Nouvelle Guinée par rapport à l'Australie pour une bonne partie de cette période. La structure génétique de la Nouvelle Guinée s'est mise en place durant les 20.000 dernières années et la structure des populations des montagnes durant les 10.000 dernières années correspondant à la néolithisation de la région et à la diffusion des langues de la famille Trans-Nouvelle-Guinée. A la différence d'autres régions du monde, la Nouvelle Guinée n'a pas connu d'Âge des métaux. Ceci peut expliquer que la structure génétique actuelle soit due principalement au phénomène de néolithisation de la région.

mardi 5 septembre 2017

Le génome des Africains du Nord-Est

La vallée du Nil et l'Afrique du Nord-Est ont une longue histoire des peuplements humains. La région contient des fossiles des premiers hommes modernes et a abrité certaines des plus anciennes civilisations du monde. L'agriculture est datée autour de 5000 ans av. JC. avec des plantes issues du Moyen-Orient et du sorgho. Les premiers troupeaux sont datés du 5ème millénaire av. JC. et le pastoralisme s'est rapidement diffusé parmi les premières sociétés néolithiques. La première unité politique est le royaume de Kerma qui émerge vers 3000 ans av. JC.

Aujourd'hui la région du Soudan montre une grande diversité linguistique dont les populations appartiennent à trois grandes familles: Afro-Asiatique, Nilo-Saharienne et Niger-Congo.

Nina Hollfelder et ses collègues viennent de publier un papier intitulé: Northeast African genomic variation shaped by the continuity of indigenous groups and Eurasian migrations. Ils ont séquencé le génome de 221 individus appartenant à 18 populations du Soudan et du Sud-Soudan:
2017_Hollfelder_Figure1A.jpg

Ces populations ont été comparées à d'autres populations mondiales. Les auteurs ont ainsi réalisé une analyse basée sur la distance génétique (Fst):
2017_Hollfelder_Figure1B.jpg

et une analyse avec le logicel ADMIXTURE:
2017_Hollfelder_Figure2.jpg

Les résultats montrent certains niveaux de structure et de différentiation dans les différentes populations du Nord-Est de l'Afrique. Certains groupes montrent notamment une forte affinité génétique avec des populations d'Europe, du Moyen-Orient ou d'Afrique de l'Ouest. De plus les variations génétiques sont corrélées davantage avec la géographie qu'avec la linguistique. Ainsi des populations du Nord et de l'Est du Soudan montrent des affinités génétiques avec des populations non Africaines.

Parmi les populations du Soudan, les quatre populations Nilotiques (Dinka, Nuer, Shilluk et Baria) forment un groupe à part. Dans la figure ci-dessus, ils possèdent une composante bleue foncée qui est partagée avec les autres populations d'Afrique du Nord-Est pour de faibles valeurs de K. Ces populations Nilotiques apparaissent donc comme une source ancestrale pour les autres populations du Soudan. La comparaison avec les anciens fermiers Européens montre qu'ils possèdent très peu de gènes non Africains. Ces populations Nilotiques sont essentiellement des pasteurs. Ils sont fortement endogamiques et sont restés longtemps isolés.

Les populations du Soudan montrent très peu d'ascendance Ouest Africaine (en orange ci-dessus) sauf les Hausa. Ainsi les migrations Bantoues n'ont pas causé de flux de gènes importants en Afrique du Nord-Est, contrairement à d'autres régions Sub-Sahariennes. Les Hausa originaire d'Afrique de l'Ouest, ont migré dans la région très récemment il y a environ 300 ans.

Les Nubiens (Danagla, Mahas et Halfawieen) habitent la vallée du Nil dans le désert aride du Nord du Soudan. Ils parlent une langue Nilo-Saharienne. Ils ont une longue histoire dans la région qui remonte aux dynasties Égyptiennes. Ils sont également proche génétiquement des populations Arabes et Beja voisines. Bien que proches linguistiquement des populations Nilotiques, ils en sont différentiés génétiquement à cause de leur fort mélange génétique avec des populations Eurasiennes (proportion entre 39 et 47%).

Toutes les populations du Nord-Est du Soudan montrent des flux de gènes Eurasiens d'une quantité similaire. Les études précédentes historiques et génétiques ont montré que ce flux de gènes était lié à l'expansion de l'Islam à partir de la péninsule Arabique. Cette étude confirme la date de mélange génétique autour de 56 générations, ce qui nous amène proche du 7ème siècle. Cependant une population: les Halfawieen ont reçu le flux de gènes Eurasien plus récemment il y a seulement 19 générations. Il est connu historiquement que les Arabes rencontrèrent les Nubiens au 7ème siècle, mais furent ensuite bloqués jusqu'à la chute de Dongola vers 1315 ou 1316, et l'éclatement du royaume de Makurie. Cette dernière date est consistante avec la date de mélange génétique de la population Halfawieen.

Les Coptes représentent une minorité Chrétienne qui a migré au Soudan il y a environ 200 ans. Ils sont proches génétiquement de la population Égyptienne, et montre, comme cette dernière, plusieurs mélanges génétiques successifs entre une population sub-Saharienne et des populations Eurasiennes. Il semble qu'ils soient restés isolés une fois arrivés au Soudan.

Les Messiria représentent une population parlant Arabe et habitant les régions du Darfour et du Kordofan. Ils sont proches génétiquement des populations voisines géographiquement, et différents des populations Arabes du Nord-Est du Soudan. Ils montrent un mélange génétique entre une population Nilotique (85%) et une population Eurasienne (15%). Ce mélange est daté de seulement 7 générations, soit environ 200 ans.

Les Gemar, une population parlant une langue Nilo-Saharienne du Darfour et du Kordofan, montrent également un mélange génétique avec une population Eurasienne, daté d'environ 13 générations.

Enfin les Zaghawa et les Nuba, autres populations du Darfour et du Kordofan, montrent très peu de flux de gènes Eurasiens. Il sont proches génétiquement des populations Nilotiques ainsi que des Messiria et des Gemar, suggérant ainsi que toutes les populations du Darfour et du Kordofan ont une origine commune proche de celles des populations Nilotiques.

mercredi 2 août 2017

Diversité génomique de la population de Madagascar

Madagascar est un exemple remarquable de contacts intercontinentaux entre une population Austronésienne et une population Africaine. Malgré de nombreuses théories relatives au lieu et à la date de rencontre entre ces deux populations, il n'y a aucun consensus sur le sujet.

Denis Pierron et ses collègues viennent de publier un papier intitulé: Genomic landscape of human diversity across Madagascar. Ils ont étudié le génome de 2704 individus appartenant à 257 villages Malgaches. Ils ont analysé la séquence mitochondriale complète de 2691 individus, l'ADN du chromosome Y de 1554 hommes et le génome complet de 700 individus.

Les résultats mitochondriaux montrent que tous les lignages Malgaches sont originaires d'Asie de l'Est ou d'Afrique à l'exception de l'haplogroupe M23 qui est détecté uniquement à Madagascar. Les fréquences des haplogroupes Asiatiques et Africains sont sensiblement identiques bien qu'inégalement réparties géographiquement. Tous les lignages Africains sont associés à des populations Bantoues, à l'exception de la sous-clade L2a1b1a associée à une population Est Africaine. Bien que M23 soit spécifique à Madagascar, sa date de diffusion est récente autour de 1200 ans seulement. Ainsi cet haplogroupe n'est pas le signal d'un ancien peuplement pré-Austronésien à Madagascar. Les fréquences des haplogroupes mitochondriaux sont indiquées dans la figure A ci-dessous. Les haplogroupes Africains sont en rouge et les haplogroupes Asiatiques en bleu:
2017_Pierron_Figure2.jpg

Les fréquences des haplogroupes du chromosome Y sont indiquées dans la figure B ci-dessus. Les lignages Africains (en rouge) sont beaucoup plus fréquents que les lignages Asiatiques (en bleu). Quelques lignages d'origine Européenne ou Proche-Orientale sont également présents (R, J, T et G) à faible fréquence.

Les auteurs ont ensuite fait une analyse avec le logiciel ADMIXTURE à partir des génomes complets comparés aux génomes d'autres populations mondiales. Pour K=3, les résultats montrent une nette distinction entre une ascendance Africaine (59%), une ascendance Est Asiatique (37%) et une ascendance Ouest Eurasienne (4%). De plus le partage de segments IBD (identical by descent) indique que les populations Bantoue d'Afrique du Sud et Indonésienne du Sud de Bornéo partagent le plus de génome avec les populations Malgaches. La séparation avec la population du Sud de Bornéo est survenue entre 3000 et 2000 ans, alors que la séparation avec la population Bantoue d'Afrique du Sud remontent à environ 1500 ans.

La répartition géographique des ascendances Africaine et Asiatique présentent des différences notables d'une région à une autre:
2017_Pierron_Figure1B.jpg

Les lignages maternels Africains sont fréquents principalement dans le Nord de l'île, alors que les lignages maternels Est Asiatiques sont fréquents dans le Centre et le Sud de l'île. Les lignages paternels Est Asiatiques sont plus fréquents dans le centre, et les lignages paternels Africains sont présents surtout sur la côte et le Nord de l'île.

Les auteurs ont ensuite réalisé une analyse avec le logiciel fineSTRUCTURE. Pour k=2, le logiciel sépare les populations des Montagnes (avec une forte ascendance Asiatique) de celles des régions côtières (avec une forte ascendance Africaine). Pour des valeurs de k plus élevées, le logiciel révèle une structure génétique plus complexe corrélée fortement à la géographie. Cependant, quel que soit le nombre de clusters, tous ces groupes sont plus proches des mêmes populations d'origine, à savoir une population Bantoue d'Afrique du Sud et une population Indonésienne du Sud de Bornéo. Cette structure génétique est donc liée à l'histoire récente de la population Malgache.

Les auteurs ont ensuite étudié les événements de mélange génétique pour chacun des clusters identifiés précédemment, avec les logiciels GLOBEtrotter et ALDER. Les résultats montrent pour tous les groupes identifiés une source Bantoue Sud Africaine et une source Indonésienne du sud de Bornéo. Cette dernière correspond à la population Banjar pour un groupe et à la population sud Dayak pour les autres. Pour tous les groupes sauf un, il n'y a qu'un seul événement de mélange génétique daté entre 900 et 500 ans. Le dernier groupe montre deux événements de mélange génétique: le premier il y a 28 générations et le dernier il y a seulement quatre générations. La différence de date de mélange génétique d'un groupe à l'autre ainsi que la différence de proportions d'ascendance Africaine et Asiatique d'un groupe à l'autre, suggèrent des événements indépendants d'une région à l'autre de l'île de Madagascar. Enfin les études démographiques menées à partir des partagent de segments IBD suggèrent une expansion de la population commençant entre 1250 et 1000 ans d'abord dans le Nord de l'île:
2017_Pierron_Figure6.jpg

Le scénario correspondant à l'arrivée de la population Africaine dans le Nord de l'île est en accord avec les données archéologiques. Cette étude a montré que cette population Africaine était composée de plus d'hommes que de femmes. La population Africaine arrive donc dans une île préalablement peuplée par une population Est Asiatique qui semble se réfugier dans les montagnes du centre de Madagascar. Cette population du Centre décroit fortement en nombre pas forcément à cause d'une raison dramatique comme les maladies ou la famine, mais peut-être simplement à cause d'une migration d'un petit nombre d'individus.

samedi 20 mai 2017

Histoire génomique de la Sicile et de l'Italie du Sud

La mer Méditerranée a joué un rôle primordial dans les migrations humaines à partir du Levant et du Proche-Orient, notamment durant le Néolithique. Cependant des événements démographiques plus récents ont pu modifier la structure génétique des populations de Sicile et d'Italie du Sud, notamment dans les deux minorités ethnolinguistiques d'Italie: les Arberèches parlant Albanais et situés en Sicile dans la province de Palerme et en Calabre dans la province de Cosenza. Ils ont fui l'Albanie aux 15ème et 16ème siècles, suite à l'invasion Ottomane des Balkans. L'autre minorité est constituée des populations parlant le Grec dans la province de Lecce en Apulie et dans la province de Reggio Calabria en Calabre. Leur origine est incertaine: soit au temps des colonies Grecques, soit durant l'empire Byzantin.

Stefania Sarno et ses collègues viennent de publier un papier intitulé: Ancient and recent admixture layers in Sicily and Southern Italy trace multiple migration routes along the Mediterranean. Ils ont séquencé le génome de 511 échantillons appartenant à 23 populations différentes de Sicile, d'Italie du Sud, d'Albanie et de Grèce:
2017_Sarno_Figure1.jpg

Ces individus ont été comparés à un ensemble de 1469 échantillons issus de 68 populations contemporaines et à 263 anciens génomes. Les auteurs ont réalisé une Analyse en Composantes Principales et une analyse avec le logiciel ADMIXTURE. La figure A ci-dessous montre la PCA dans son ensemble et la figure B indique uniquement les populations Méditerranéennes étudiées dans ce papier:
2017_Sarno_Figure2.jpg

Les populations d'Italie du Sud et des Balkans se situent au centre de la PCA formant un pont ininterrompu entre les populations du Proche-Orient et du Caucase (à droite) et les populations Européennes (au centre). Notamment les populations d'Italie du Sud et de Sicile se regroupent avec les populations des Îles Méditerranéennes (Chypre, Crète, Îles de la mer Égée et Îles Anatoliennes). A l'inverse les populations de Grèce continentale et du Péloponnèse se regroupent avec les autres populations du Sud des Balkans: Albanie et Kosovo, et les populations du Nord des Balkans avec les populations Est Européennes.

L'analyse ADMIXTURE montre les populations étudiées comme un mélange de composantes issues de la région Méditerranéenne: Europe, Caucase, Sardaigne et Proche-Orient. Trois d'entre elles correspondent à d'anciennes populations Européennes: chasseurs-cueilleurs de l'Ouest, chasseurs-cueilleurs du Caucase et premiers fermiers d'Europe. Toutes les populations d'Italie du Sud, de Grèce et du Sud des Balkans montrent une majorité de composante premiers fermiers du Néolithique (en vert ci-dessous), suivie par la composante du Caucase (en jaune ci-dessous). La composante du Proche-Orient (en rouge ci-dessous) est plus importante chez les populations du Sud de l'Italie et des Îles Grecques, alors que la composante Européenne (en bleu ci-dessous) est plus présente chez les populations du Sud des Balkans:
2017_Sarno_FigureS2B.jpg

Les auteurs ont ensuite utilisé le logiciel fineStructure pour mettre en évidence des regroupements à l'intérieur des populations étudiées. Les meilleurs résultats sont obtenus pour un ensemble de 14 groupes:
2017_Sarno_Figure3.jpg

Ainsi la figure ci-dessus montre que les populations de Grèce continentale se regroupent entre elles (cluster bleu clair). Cette couleur est absente dans les populations des Îles Grecques et dans le sud de l'Italie sauf chez les Arberèches de Calabre. Les individus d'Italie du Sud, de Crète et des Îles Égées sont assignés à deux autres groupes. Le premier en vert clair est dominant en Sicile et en Calabre, mais également présent dans les îles Grecques. Le second en violet est présent en Apulie et en Sicile de l'ouest, mais aussi dans le Péloponnèse et dans les îles Grecques. Enfin, les population de Chypre et les grecs d'Italie possèdent leur propre cluster.

Les populations Albanaises d'Italie montrent un partage récent d'ascendances avec les populations des Balkans, mais aussi un échange de gènes avec les populations Italiennes qui les entourent. A l'inverses les populations Grecques d'Italie ne montrent pas de partage récent d'ascendances avec les populations Grecques continentales. Ils se rapprochent davantage des populations du Sud de l'Italie et des îles Grecques. L'arrivée de ces populations remontent donc à l'antiquité. Elles se sont ensuite mélangées génétiquement et culturellement avec les populations voisines dans le sud de l'Italie. De plus ces populations Grecques d'Italie ne présentent pas la composante du Sud des Balkans détectée en Grèce continentale, en Albanie et chez les Arberèches de Calabre (en bleu clair). Ainsi leur arrivée en Italie du Sud précède l'arrivée de cette composante dans les Balkans, probablement au début du Moyen-Âge.

Les auteurs ont ensuite utilisé le logiciel ADLER et la statistique f3 pour mettre en évidence des mélanges génétiques récents. Ainsi les populations des Balkans et du Sud de l'Italie ont vu l'arrivée de populations Européennes, il y a environ 3000 ans (Âge du Fer) et 1500 ans (début du Moyen-Âge). Ces derniers événement peuvent être reliés aux migrations Slaves du Moyen-Âge. La présence de la composante du Caucase dans les populations Méditerranéennes est cependant plus faible que dans les populations du Nord-Est de l'Europe, indiquant probablement une origine différente que celle des migrations Yamnaya. Les auteurs proposent des migrations spécifiques plus tardives, le long des côtes Méditerranéennes, et qui ont pu également apporté les langues Indo-Européennes dans la région.

vendredi 5 mai 2017

Dispersion et adaptation génétique des populations Bantoues en Afrique et en Amérique du Nord

Les preuves linguistiques et archéologiques montrent que les langues Bantoues se sont diffusées avec l'agriculture il y a entre 5000 et 4000 ans de l'Ouest de l'Afrique vers l'Est et le Sud.

Etienne Patin et ses collègues viennent de publier un papier intitulé: Dispersals and genetic adaptation of Bantu-speaking populations in Africa and North America. Ils ont séquencé le génome de 1318 individus issus de 35 populations Bantoues d'Afrique de l'Ouest qu'ils ont fusionnés avec le génome d'autres populations Africaines Bantoues ou non pour former un ensemble de 2055 échantillons issus de 57 populations différentes. Dans les figures ci-dessous, BSP (Bantu-speaking populations) est indiqué pour les populations Bantoues de l'Ouest (wBSP), de l'Est (eBSP), du Sud-Ouest (swBSP) et du Sud-Est (seBSP). RHG (Rainforest Hunter-Gatherer) est utilisé pour les chasseurs-cueilleurs des forêts de l'Ouest (wRHG) et de l'Est (eRHG):
2017_Patin_Figure1A.jpg

Les auteurs ont réalisé une analyse avec le logiciel ADMIXTURE:
2017_Patin_Figure1B.jpg

La figure ci-dessus, indique que toutes les populations Bantoues se regroupent entre elles, avec une majorité d'ascendance rouge. Cette homogénéité reflète la récente dispersion de ces populations en Afrique Sub-Saharienne. Elles possèdent de faibles proportions d'ascendance chasseur-cueilleur des forêts (16% en vert clair), Afro-asiatique (17% en rose), et chasseur-cueilleur San (23% en jaune pâle).

Le logiciel GLOBETROTTER a permis de mettre en évidence des événements de mélange génétique. Ainsi un mélange génétique a eu lieu il y a entre 1500 et 1000 ans, puis entre 400 et 150 ans entre des Bantous de l'Ouest d'Angola et des populations Afro-asiatiques d’Éthiopie (10%) (Figure A ci-dessous). En Afrique du Sud, un mélange génétique a eu lieu il y a environ 700 ans entre une population Bantoue d'Angola mais aussi de l'Est, et des chasseurs-cueilleurs San de Namibie (23%) (Figure B ci-dessous):
2017_Patin_Figure2.jpg

Il y a environ 800 ans un mélange génétique a eu lieu entre une population Bantoue de l'Ouest et des chasseurs-cueilleurs des forêts.

Ces données renforcent le modèle selon lequel l'expansion Bantoue s'est effectuée d'abord vers le sud depuis le lieu d'origine situé à la frontière entre le Nigeria et le Cameroun, jusqu'en Angola à travers la zone forestière, puis vers l'Est et vers le Sud en deux mouvements séparés.

Les auteurs ont ensuite recherché des signes de sélection naturelle durant la dispersion des populations Bantoues. Ils ont ainsi mis en évidence 8, 5 et 7 régions du génome présentant une forte sélection dans les populations Bantoues de l'Ouest, de l'Est et du Sud-Est respectivement:
2017_Patin_Figure3.jpg

Ainsi, les gènes HLA qui transmettent la réponse immunitaire, présentent les plus forts signaux de sélection. Ensuite le gène CD36 associé à la réponse à la malaria présente le second signal. Le gène LCT qui code la réaction au lactase présente un signal fort chez les populations Bantoues de l'Est.

Les auteurs ont ensuite estimé la contribution Bantoue dans la population Afro-Nord Américaine en analysant 5244 échantillons. Ainsi le logiciel ADMIXTURE estime que les Afro-Américains possèdent entre 73% et 78% d'ascendance Africaine dont 13% issue de Sénégambie, 7% de Côte d'Ivoire, 50% du Golfe du Bénin et 30% d'Afrique Centrale de l'Ouest:
2017_Patin_Figure4.jpg

mardi 25 avril 2017

L'héritage génétique des Zoroastriens d'Iran et d'Inde

Le Zoroastrisme est une religion de différentes tribus d'Iran et d'Inde du Nord, supposée fondée par le prophète Zarathoustra qui vivait autour de 1200 av. J.C. Cette religion est devenue la religion d'état de trois grand Empires Iraniens: les Achéménides entre 559 et 330 av. J.C., les Parthes entre 247 av. J.C. et 224 ap. J.C. et les Sassanides entre 224 et 651 ap. J.C. jusqu'aux conquêtes Arabes.

D'après la tradition, un groupe de Zoroastriens d'Iran a navigué vers les côtes de l'Inde du Nord pour échapper aux persécutions Musulmanes. Ils ont débarqué dans le Gujarat où ils ont pu s'installer et pratiquer leur religion. La date de cette arrivée est sujette à débat et varie entre 785 et 936 ap. J.C. Les Zoroasriens d'Inde (appelés Parsis) ont toujours gardé le contact avec les Zoroastriens d'Iran. Aujourd'hui, les communautés Zoroastriennes sont concentrées en Inde (61.000 individus), dans le Sud du Pakistan (1675 individus) et en Iran (14.000 individus). Cependant durant les 200 dernières années, des communautés se sont formées aux États-Unis (14.300), au Canada (6400), au Royaume-Uni (5000), en Australie (3808) et au Moyen-Orient (2030). Le Zoroastrisme est une religion non prosélyte avec une hérédité masculine chez les prêtres.

Saioa López et ses collègues viennent de publier un papier intitulé: The genetic legacy of Zoroastrianism in Iran and India: Insights into population structure, gene flow and selection. Ils ont analysé le génome de 526 hommes d'Inde, Iran, des Émirats Arabes Unis et du Royaume Uni. Ces données ont été comparées à différentes populations mondiales et à quelques génomes anciens d'Europe, d'Asie et d'Afrique.

Les auteurs ont réalisé une Analyse en Composantes Principales:
2017_Lopez_FigureS3.jpg

La plupart des Zoroastriens Iraniens (points vert clair) se regroupent avec les autres échantillons Iraniens (points vert). Les Parsis (points bleu clair) s'étirent le long de la composante PC1 entre les Iraniens et les échantillons Indiens (points bleu).

Le logiciel fineStructure permet de regrouper les échantillons Indiens et Iraniens en 51 groupes différents. Un de ces groupes comprend les 13 Parsis et un autre 27 des 29 Zoroastriens d'Iran plus un autre Iranien:
2017_Lopez_Figure1A.jpg

Les mesures de distance génétique montrent que les Zoroastriens sont fortement génétiquement différentiés des échantillons non Zoroastriens. Ces résultats indiquent une forte isolation génétique des groupes Zoroastriens. Cependant les Parsis montrent davantage de mélange génétique avec les groupes non Zoroastriens d'Inde.

Les analyses des haplogroupes mitochondriaux et du chromosome Y montrent également moins de diversité génétique chez les Zoroastriens que chez les non Zoroastriens.

L'analyse de la statistique f3 montre que les Parsis sont composés d'une ascendance Indienne et d'une ascendance proche des anciens Néolithiques d'Anatolie ou des populations actuelles du Proche-Orient. Par contre pour les Zoroastriens d'Iran, aucun mélange génétique n'est détecté.

L'analyse avec le logiciel GLOBETROTTER permet d'identifier un mélange génétique chez les Parsis entre une population actuelle d'Inde (30%) et une population actuelle d'Iran (70%) qui remonte entre 27 et 32 générations. Chez les Zoroastriens d'Iran un mélange génétique entre une population actuelle de Croatie ou de Chypre et une ancienne population Néolithique d'Iran et qui remonte à environ 66 générations, est détectée.

L'haplogroupe du chromosome Y principal chez les Zoroastriens (Iraniens ou Indiens) est J alors que chez les non Zoroastriens d'Inde et du Pakistan l'haplogroupe dominant est R. A l'inverse, tous les groupes d'Inde et du Pakistan ainsi que les Parsis ont un haplogroupe mitochondrial principal qui est M, différent des Zoraostriens d'Iran. Les Parsis sont très proches des Zoroastriens d'Iran concernant le chromosome Y, alors qu'ils en sont éloignés concernant l'ADN mitochondrial. Ainsi la contribution des Zoroastriens Iraniens aux Parsis est de 96% sur le chromosome Y, alors qu'il est seulement de 8% sur l'ADN mitochondrial. Ces résultats indiquent que la migration des Zoroastriens d'Iran vers l'Inde a été essentiellement composée d'hommes qui ont pris des femmes localement en Inde.

De plus, l'étude des haplogroupes du chromosome Y des prêtres Parsis montre qu'ils descendent de seulement deux ascendants fondateurs dont l'âge remonte à 37 (1036 ans environ) et 31 (868 ans environ) générations respectivement.

Mise à jour

Ce papier a été définitivement publié en août 2017: The Genetic Legacy of Zoroastrianism in Iran and India: Insights into Population Structure, Gene Flow, and Selection

mercredi 29 mars 2017

Histoire génétique du sous-continent Indien

A la suite de la migration hors d'Afrique, l'Asie du Sud a probablement été l'un des premiers territoires colonisés par les hommes modernes. Ce point est conforté par la forte diversité génétique de cette région. Quoique les premiers fossiles humains remontent seulement entre 36.000 et 28.000 ans, les estimations génétiques et archéologiques suggèrent une arrivée de l'homme moderne il y a environ 50.000 ans, soit après l'éruption volcanique du mont Toba.

L'Inde est composé de différents groupes de populations associés à différentes religions et différentes langues. Les langues Indo-Européennes sont plus souvent parlées dans le Nord de l'Inde, le Pakistan et le Bangladesh. On suppose que leur arrivée dans la région remonte aux invasions Indo-Aryennes datées d'environ 3500 ans. Le Sud de l'Inde est dominé par les langues Dravidiennes souvent associées aux dispersions Néolithiques à partir de l'Asie du Sud-Ouest. De manière générale, l'Inde montre un haut niveau d'endogamie lié à des barrières sociales strictes et une dérive génétique importante consécutive à l'isolation de certaines de ces populations.

Marina Silva et ses collègues viennent de publier un papier intitulé: A genetic chronology for the Indian Subcontinent points to heavily sex-biased dispersals. Ils ont réuni les séquences complètes mitochondriales disponibles dans la littérature, le projet des 1000 génomes et le projet Human Genome Diversity, relatives aux populations d'Asie du Sud. Ils ont également analysé le génome complet à partir des données disponibles, ainsi que l'ADN du chromosome Y.

Les auteurs ont d'abord construit un arbre phylogéographique mitochondrial en se concentrant sur les lignages originaires d'Asie du Sud à partir de 1478 échantillons. Ils ont également estimé l'âge des principales sous-clades:

2017_Silva_Figure1.jpg

Il y a deux haplogroupes principaux en Asie du Sud: M et R. L'haplogroupe N reste lui rare dans la région. L'âge de M est estimé à environ 50.000 ans en Asie du Sud et l'âge de R à environ 64.500 ans. Les plus anciennes sous-clades de R sont plus fréquentes dans l'ouest et le sud de la région, supportant ainsi une route côtière sud de colonisation de l'Asie. La phylogéographie de l'haplogroupe M est plus complexe montrant à priori des âges équivalents dans les différentes régions de l'Asie du Sud. Cependant si les auteurs tiennent compte de l'origine probable de chaque sous-clade, l'âge de l'haplogroupe M dans l'ouest est plus ancien que dans les autres régions, supportant également une route côtière sud de colonisation de l'Asie. Ce résultat suggère des ré-expansions de certaines sous-clades de M à une date plus récente à l'intérieur du sous-continent Indien. Ainsi plusieurs branches: M38, M65, M45, M5b, M5c, M34, M57 et M33a montrent une diffusion autour de 38.000 ans. Ces résultats sont supportés par une analyse Bayesian Skyline Plots avec le logiciel BEAST qui montre un accroissement de la population effective portant l'haplogroupe M à cette période:
2017_Silva_FigureS1.jpg

La figure ci-dessus montre une seconde expansion autour de 12.000 ans correspondant au réchauffement climatique à la suite du Dernier Maximum Glaciaire. C'est le cas des sous-clades suivantes: M6a1a (11.4 ka), M18a (9.2 ka), M30d (12.1 ka), R8b1 (11.6 ka) et U2b2 (9.2 ka) à partir du Sud et de R30c + 373 (12.4 ka) à partir de l'Ouest.

L'analyse phylogéographique indique également que certaines clades arrivent en Asie du Sud en provenance du Proche-Orient autour de 21.000 ans: N1a1b1, pre-HV2, HV + 146!, HV + 9716, HV + 73!, pre-U1c, U1a1, J1d et une clade de T2. Autour de 12.000 ans, plusieurs clades arrivent d'Asie du Sud-Ouest: T2e2, T2 + 195 + 4225, W3a1 + 143, W3a1b, U1a3 + 10253, N1a2, U7a + 12373 et U7a3a + 6150. Ensuite plusieurs lignages mitochondriaux semblent arriver avec le Néolithique en provenance d'Anatolie, du Caucase ou d'Iran: K2a5 + 2831 + 189, HV14 + 150, H13a2a + 8952, K2a5 + 2831, X2 + 153! + 7109 et U1a3a ou d'Arabie Saoudite: R0a2 + 11152. A l'Âge du Bronze, il y a également l'arrivée de H29 + 9156 + 4689, R2a + 7142 et U1a1a2a.

Les auteurs ont ensuite analysé le génome complet de la population d'Asie du Sud avec le logiciel ADMIXTURE:
2017_Silva_Figure2a.jpg

La figure ci-dessus montre que les ascendances occidentales (en marron, jaune et bleu foncé) sont plus fréquentes dans l'Ouest de l'Asie du Sud notamment au Pakistan. La composante marron correspondant aux chasseurs-cueilleurs du Caucase (mais aussi au Mésolithique et Néolithique d'Iran) atteint ainsi 35% au Pakistan et dans le Gujarat. Cette composante correspond également à environ 50% de l'ascendance des pasteurs nomades de la culture Yamnaya des Steppes.

La composante jaune correspondant aux populations de la péninsule Arabique, se retrouve avec une proportion d'environ 15% chez certaines populations Musulmanes du Pakistan: Baloutches, Brahouis et Makranis.

Les auteurs ont également construit une Analyse en Composantes Principales:
2017_Silva_Figure2b.jpg

La figure ci-dessus montre que les populations d'Asie du Sud sont plus proches des populations d'Asie Centrale et du Caucase que des populations du Proche-Orient ou d'Arabie. Les populations Pakistanaises se retrouvent dans une position intermédiaire. L'analyse classique pour expliquer la structure génétique des populations d'Asie du Sud est de considérer qu'elle dérive de deux populations ancestrales: Ancient North Indians (ANI) et Ancient South Indians (ASI). La composante ANI (importante dans le Nord-Ouest) serait arrivée dans la région en deux vagues (Néolithique et Âge du Bronze). Les résultats mitochondriaux suggèrent que la réalité a été plus complexe avec au moins quatre vagues d'arrivée entre la Dernière Glaciation et l'Âge du Bronze.

Les résultats mitochondriaux montrent une proportion de lignages autochtones située entre 70 et 90%. Elle est supérieure à la proportion d'ascendance autosomale autochtone (entre la moitié et deux tiers). Les auteurs ont ensuite analysé les lignages paternels issus de l'ADN du chromosome Y. La proportion de lignages occidentaux se situe entre 50 et 90% selon les régions d'Asie du Sud:
2017_Silva_Figure3.jpg

La figure ci-dessus résume ces résultats pour différentes régions: Penjab (PJL), Gujarat (GIH), Telugu (ITU), Sri Lanka (STU) et Bengale (BEB). La figure b montre les proportions des différentes origines (Africaine en orange, Est Asiatique en gris, Occidentale en noir et autochtone en vert) pour les lignages maternels. La figure c montre les proportions pour les lignages paternels et la figure d pour les lignages autosomaux. De manière générale les lignages paternels occidentaux sont beaucoup plus fréquents que les lignages maternels occidentaux.

Ainsi les lignages maternels sont principalement autochtones à l'Asie du Sud et permettent de remonter à la première colonisation de la région par l'homme moderne il y a environ 55.000 ans. Ensuite plusieurs lignages mitochondriaux arrivent d'Asie du Sud-Ouest durant et après le Dernier Maximum Glaciaire. Ces mouvements ont dû commencer à contribuer à la proportion d'ANI dans la population d'Asie du Sud, au niveau génomique.

2017_Silva_Figure4.jpg

Les premiers sites Néolithiques de la vallée de l'Indus datent d'environ 9000 ans. De nombreux lignages mitochondriaux datent de cette période. Certaines hypothèses attribuent l'arrivée des langues Indo-Européennes à cette époque, bien que d'autres suggèrent plutôt l'arrivée des langues Dravidiennes. Ainsi l'hypothèse de la dispersion des langues Indo-Européennes la plus largement acceptée est celle des Steppes de l'Âge du Bronze. Elle a reçu des supports des dernières études d'ADN ancien sur les populations de la culture Yamnaya et les anciennes populations d'Europe. Une arrivée de tels migrants en Asie du Sud a probablement contribué à l'augmentation de la composante marron dans l'ADN autosomal. Les preuves archéologiques suggèrent que les descendants de la culture d'Andronovo et de la culture de Sintashta ont d'abord infiltré l'Asie Centrale (BMAC) avant d'entrer en contact avec la civilisation de l'Indus il y a environ 4000 à 3500 ans.

Notamment des analyses récentes du chromosome Y suggèrent que l'haplogroupe R1a s'est dispersé à la fois vers l'ouest et vers l'est en Eurasie à la fin du Néolithique et à l'Âge du Bronze. La clade R1a-M17 représente environ 17,5% des lignages paternels en Inde et montre de plus hautes fréquences dans les groupes Indo-Européens que dans les groupes Dravidiens. Notamment, l'âge des sous-clades R1a-Z93 et R1a-Z94 sont trop récents pour correspondre à l'arrivée du Néolithique:
2017_Silva_Figure5.jpg

De plus tous les individus des cultures Andronovo et Sintashta actuellement analysés appartiennent à l'haplogroupe R1a. Tous ces résultats suggèrent que l'haplogroupe R1a est le marqueur de la diffusion des Indo-Aryens en Asie du Sud. Ces résultats doivent cependant être validés par des test d'ADN ancien en Asie du Sud.

Les auteurs ont également mis en évidence que l'haplogroupe mitochondrial H2b semble également lié à la diffusion des Indo-Européens en Asie du Sud:
2017_Silva_Figure6.jpg

Cette clade est datée d'environ 6200 ans avec une probable origine en Europe de l'Est. Elle inclut notamment des individus Sud Asiatiques, ainsi que deux individus anciens des cultures Yamnaya et Srubnaya.

Finalement le schéma général du peuplement de l'Asie du Sud ressemble par certains côtés à celui de l'Europe avec plusieurs vagues de migrations au Paléolithique, au Mésolithique, au Néolithique et à l'Âge du Bronze. Ainsi l'haplogroupe R1b semble avoir joué le rôle en Europe de l'haplogroupe R1a en Asie du Sud avec une migration conduite principalement par des hommes porteurs des langues Indo-Européennes. Cependant l'influence sur l’Europe a été plus importante qu'en Asie du Sud avec une plus grande fréquence de l'haplogroupe R1b en Europe que celle de l'haplogroupe R1a en Asie du Sud et une plus grande influence des langues Indo-Européennes en Europe qu'en Asie du Sud.

mardi 14 mars 2017

Histoire génomique de la population du Péloponnèse

Le Péloponnèse a été peuplé par une série de migrations depuis des millénaires. Les premiers fermiers du Néolithique ont quitté l'Anatolie pour s'installer dans la péninsule vers 9000 av. JC. Plus tard les Mycéniens ont développé une civilisation de l'Âge du Bronze importante. Le débat reste ouvert pour savoir s'ils sont arrivés du Nord vers 2200 av. JC ou s'ils ont émergé des sociétés Néolithiques locales. Au début du premier millénaire av. JC, les Doriens ont envahi le Péloponnèse. Les quatorze siècles suivants ont été marqués par des changements suite à des guerres ou à des épidémies. Durant la période Médiévale, la migration des Slaves dans les Balkans a pu influencer le Péloponnèse. L'importance de cette influence fait débat depuis 170 ans lorsque l'historien Allemand Jacob Philipp Fallmerayer a présenté une théorie dans laquelle il suppose que la totalité de la population du Péloponnèse a été remplacée par des Slaves.

George Stamatoyannopoulos et ses collègues viennent de publier un papier intitulé: Genetics of the peloponnesean populations and the theory of extinction of the medieval peloponnesean Greeks. Ils ont analysé le génome de 241 individus du Péloponnèse:
2017_Stama_Figure1a.jpg

Les auteurs ont réalisé une Analyse en Composantes Principales:
2017_Stama_Figure1b.jpg

Les habitants de la Tsakonie se situent dans la partie en haut à gauche, alors que ceux de la péninsule de Mani dans le sud du Péloponnèse se situent à droite. Tous les autres habitants du Péloponnèse se regroupent ensemble, dans le bas de la figure. Les Tsakoniens sont la population du Péloponnèse la plus éloignée des autres. De plus ils parlent un dialecte d'origine Dorienne qui n'est pas compris par les autres populations du Péloponnèse.

L'analyse avec le logiciel ADMIXTURE confirme que les habitants de Tsakonie et de Mani se situent à part:
2017_Stama_Figure1e.jpg

L'analyse des segments IBD (Identity by descent) confirme l'existence d'une structure génétique dans la population du Péloponnèse. Ainsi les Maniots partagent plus de segments entre eux qu'avec les autres populations, de même que les Tsakoniens.

Les auteurs ont ensuite comparé la population du Péloponnèse (en rouge ci-dessous) à d'autres populations Européennes:
2017_Stama_Figure2a.jpg

La figure ci-dessus montre que les habitants du Péloponnèse sont proches des Siciliens (triangles verts) et des Italiens (carrés violets, disques bleu clair et carré noirs). L'analyse par réseau ci-dessous indique également qu'ils sont par contre éloignés des Slaves:
2017_Stama_Figure2c.jpg

Les habitants du Péloponnèse sont connectés aux populations du Proche-Orient via les Crétois et les habitants du Dodécanèse.

Une Analyse en Composantes Principales spécifique avec les populations Slaves, montrent que les habitants du Péloponnèse en sont très éloignés:
2017_Stama_Figure3a.jpg

Ces résultats vont à l'encontre de l'hypothèse de Fallmerayer qui proposait que la population du Péloponnèse a été remplacée par des tribus Slaves à l'époque Médiévale. L'ascendance Slave dans cette population varie de 0 (ches les Maniots) à 15% (chez les Messéniens). Il est cependant clair que des tribus Slaves ont bien séjourné dans le Péloponnèse, mais ils devaient être peu nombreux et ont été assimilés par la population locale.

lundi 20 février 2017

Histoire génétique des populations Sibériennes

L'histoire des populations Sibériennes est importante pour éclairer l'origine des populations Eurasiennes et Amérindiennes. La Sibérie est peuplée depuis des centaines de milliers d'années. En effet l'homme de Neandertal est identifié dans la région entre 260.000 et 40.000 ans. De plus, une nouvelle espèce: l'homme de Denisova a été détecté récemment en Sibérie. Les traces de l'homme moderne remontent à 45.000 ans dont notamment l'os découvert récemment à Ust’-Ishim, et qui a été séquencé. Il présente des traces d'ADN de Neandertal. D'autres anciens restes humains ont produit de l'ADN ancien comme le garçon de Mal’ta vieux de 24.000 ans et le Sibérien de Afontova Gora vieux de 17.000 ans. Les analyses ont montré que 42% de l'ascendance des Amérindiens était issu de cette ancienne population Nord Eurasienne.

Les populations actuelles de Sibérie montrent une forte diversité génétique et culturelle. Dans la région de l'Oural, elles parlent des langues Ouraliennes divisées en langues Ougriennes et Samoyèdes. Dans la région Centrale et Orientale, elles parlent des langues Altaïques divisées en langues Mongoles, Toungouses et Turques:
2017_Wong_FigureS1.jpg

Emily HM. Wong et ses collègues viennent de publier un papier intitulé: Reconstructing Genetic History of Siberian and Northeastern European Population. Ils ont séquencé le génome de 28 individus appartenant à 14 groupes ethniques de Sibérie et d'Europe de l'Est, ainsi que de 45 individus Mansi et 37 individus Khanty:
2017_Wong_Figure1a.jpg

Les auteurs ont comparé ces échantillons à 892 individus d'Asie, d'Europe, de Sibérie et Amérindiens en effectuant une analyse en composantes principales:
2017_Wong_Figure1b.jpg

La première composante permet de séparer les populations Européennes des populations Est Asiatiques. La seconde composante sépare les populations du Nord des populations du Sud.

Les auteurs ont ensuite utilisé le logiciel TreeMix:
2017_Wong_Figure2.jpg

Les populations de l'Ouest de la Sibérie: Khantys, Mansis et Nénètses apparaissent comme un groupe relié aux Européens, bien qu'ayant divergé précocement. De plus 43% de l'ascendance de ces populations est attribué aux Evenkis de Sibérie Orientale, et 38% de l'ascendance des Nénètses est issu des Evènes également de Sibérie Orientale. Ces résultats sont confirmés par la statistique D. Enfin 6% des populations de Sibérie Occidentale vient des Amérindiens. Ce résultat s'explique par un lignage Ancien Nord Eurasien (ANE) commun entre les Sibériens Occidentaux et les Amérindiens.

Ensuite les auteurs ont utilisé une méthode MSMC pour estimer les temps de divergence entre les différentes populations. Ainsi les résultats suggèrent que les populations de Sibérie Occidentale se sont séparées récemment il y a environ 4800 ans, donc après le mélange génétique avec les Evenkis estimés autour de 6800 ans. La séparation entre Français et les populations de l'Europe de l'Est remonte entre 7000 et 2300 ans.

Les Sibériens, les Amérindiens, les Est Asiatiques et les Kalmouks du bassin de la Volga en Russie, forment un groupe séparé. Ainsi les Bouriates, Iakoutes, Évènes, Evenkis et Altaïens forment une clade spécifique après leur divergence des Est Asiatiques il y a environ 8800 ans.

Les auteurs ont ensuite étudié les haplogroupes du chromosome Y et mitochondriaux à partir de 54 individus actuels et 8 anciens individus:
2017_Wong_Figure4a.jpg

La divergence la plus ancienne correspond à la séparation de l'haplogroupe A il y a environ 131.000 ans. Ensuite l'haplogroupe Africain E diverge il y a environ 69.000 ans, fournissant une limite supérieure à la date de l'Out Of Africa.

L'arbre mitochondrial montre que la plus ancienne divergence correspond à celle de l'haplogroupe L0 à une date voisine de 124.000 ans:
2017_Wong_Figure4b.jpg

Les trois premières divergences séparent des groupes Africains. Le plus récent est L2 daté d'environ 85.000 ans qui fournit là aussi une limite supérieure à l'Out Of Africa.

La divergence des haplogroupes Amérindiens est consistante avec la première colonisation des Amériques autour de 15.000 ans.

Les haplogroupes principaux Européens du chromosome Y sont I, J, R et N. Parmi ceux-ci, I est le plus ancien. Il diverge de sa clade sœur: J il y a environ 44.000 ans et se diffuse en Europe il y a au moins 29.000 ans. Ensuite K2 qui diverge de IJ, est ancestral à NO et à QR. L'ancien individu Ust’-Ishim est ancestral à la clade NO. L'haplogroupe Européen R se sépare en deux clades: R1a et R1b il y a environ 23.000 ans. R1b se retrouve principalement en Europe Occidentale, alors que R1a se retrouve en Europe de l'Est, mais aussi dans la région de l'Altaï et dans le Nord de l'Inde et au Pakistan. Ces derniers ont un ancêtre commun vieux de 5100 ans. L'haplogroupe du chromosome Y N s'étend de la Sibérie à l'Europe de l'Est, mais est le plus fréquent parmi les Iakoutes, les Nénètses et les Nganassanes. La divergence entre les haplogroupes N et O est estimée autour de 38.000 ans.

Les auteurs ont ensuite comparer les génomes Sibériens avec quinze ancien génomes. Notamment le logiciel TreeMix place l'individu de Ust’-Ishim avant la divergence entre Européen et Est Asiatiques. L'ancêtre commun aux Sibériens et aux Est Asiatiques reçoit 38% d'ADN de l'individu de Ust’-Ishim. Ces résultats sont confirmés par la statistique D. Les Amérindiens reçoivent 41% de leur ADN d'un lignage ANE représenté par les deux individus de Mal’ta et de Afontova Gora. De plus les groupes Sibériens Mansi et Nénètses se regroupent avec ces deux anciens individus. Ces résultats sont encore supportés par la statistique D. Les Mansis reçoivent 43% de leur ADN des Evenkis et des Evènes et 57% d'un lignage ANE. L'ancien individu du Groenland: Saqqaq vieux de 4000 ans est relié aussi bien aux Est Asiatiques et aux Sibériens Orientaux, notamment les Evènes. La statistique D montre également que les Mansis ont de l'ascendance issue des chasseurs-cueilleurs d'Europe de l'Est.

Les résultats de cette étude peuvent être résumé par la figure ci-dessous qui présente un modèle des dispersions des différentes populations Nord Eurasiennes:
2017_Wong_Figure8.jpg

Ce modèle indique que les hommes modernes ont quitté l'Afrique il y a environ 70.000 ans avant de diverger il y a environ 45.000 ans entre l'Europe et l'Asie Orientale. Notamment les Sibériens Orientaux ont divergé des Est Asiatiques il y a environ 10.000 ans. D'autre part, il y a un lien génétique entre les anciens Sibériens de Mal'ta et les Amérindiens, mais aussi avec les Sibériens Occidentaux comme les Mansis et les chasseurs-cueilleurs d'Europe de l'Est. Il faut noter également que les anciens Yamnayas ont une plus grande affinité ANE que les Mansis, mais également une plus grande affinité génétique avec les Mansis qu'avec les Européens Occidentaux, ou les Sibériens Orientaux. Cependant le flux de gènes de Sibérie Occidentale en Europe de l'Est prédate la culture Yamnaya puisque les chasseurs-cueilleurs d'Europe de l'Est ont déjà cette affinité génétique de Sibérie Occidentale.

- page 1 de 4