Généalogie génétique

Aller au contenu | Aller au menu | Aller à la recherche

ADN du chromosome Y

Fil des billets - Fil des commentaires

lundi 20 mars 2017

Différentiation génétique entre les populations des régions montagneuses et des plaines en Asie de l'Ouest

L'Asie de l'Ouest localisée entre l'Afrique, l'Asie et l'Europe a été une région clef dans l'histoire des migrations humaines, concernant notamment l'origine et la dispersion du Néolithique.

Oleg Balanovsky et ses collègues viennent de publier un papier intitulé: Genetic differentiation between upland and lowland populations shapes the Y-chromosomal landscape of West Asia. Ils ont étudié l'ADN du chromosome Y de 598 individus issus de sept populations d'Asie de l'Ouest: trois groupes de Géorgiens et quatre groupes d'Arméniens:
2017_Balanovsky_FigureS1.jpg

Ils ont testé chacun de ces individus sur 40 SNPs appartenant aux principaux haplogroupes et 17 STRs. Les résultats ont été comparés avec ceux issus de 15 papiers précédents. Les auteurs ont alors réalisé une analyse multi-échelles rassemblant 44 populations différentes d'Asie de l'ouest:
2017_Balanovsky2_Figure2.jpg

De manière intéressante, la figure ci-dessus montre deux groupes différents. Le premier inclut des populations situées dans les zones montagneuses et parlant une langue Turque (en orange) ou Indo-Européenne (en rouge): Arméniens, Azéris, Kurdes, Iraniens et Turcs. Le second inclut des populations situées dans les plaines et parlant une langue Sémitique (en vert): Jordaniens, Libanais, Irakiens, Palestiniens, Syriens et Arabie Saoudite.

L'haplogroupe R1b est trouvé à hautes fréquences dans de nombreuses populations d'Europe de l'Ouest mais également de l'Est. Les auteurs ont séquencé le chromosome Y de cinq individus d'Europe de l'Ouest et de cinq individus d'Europe de l'Est. Le résultat obtenu montre que la clade R1b-L23 se sépare en deux branches parallèles: R1b-L51 (Europe de l'Ouest) et R1b-GG400 (Europe de l'Est):
2017_Balanovsky_Figure4A.jpg

Ces deux branches ont un âge similaire d'environ 6000 ans. Les auteurs ont ensuite placé sept anciens individus de la culture Yamnaya sur cet arbre, sachant que tous ces individus appartiennent à l'haplogroupe R1b. Ces anciens individus n'appartiennent pas à la branche occidentale car ils sont L51-, ou P310-, P312-. De plus cinq individus sont positifs pour GG400, Z2103, GG625 ou Z2105. Ils appartiennent donc à la branche orientale. Les deux autres individus pourraient appartenir à une troisième branche parallèle à L51 et GG400, mais maintenant éteinte ou très rare.

La divergence entre populations des montagnes et des plaines est également confortée par les études d'ADN ancien qui ont montré que les populations Néolithiques d'Anatolie et d'Iran (zones montagneuses) sont dominées par les haplogroupes G2a et J, alors que les populations Néolithiques du Levant (plaines) sont dominées par l'haplogroupe E1b.

mercredi 15 février 2017

Phylogéographie de l'haplogroupe du chromosome Y: Q3-L275

Peu d'études génétiques ont été consacrées à l'haplogroupe du chromosome Y: Q. Cet haplogroupe est bien connu parce qu'il compose 90% des haplogroupes du chromosome Y des Amérindiens, mais il est aussi présent dans le nord de l'Eurasie. Une rare sous-clade: Q3-L275 a été détectée et est trouvée à faible fréquence en Irak, Iran, Israël et en Inde.

Oleg Balanovsky et ses collègues viennent de publier un papier intitulé: Phylogeography of human Y-chromosome haplogroup Q3-L275 from an academic/citizen science collaboration. Ils ont combiné les efforts des généticiens des populations et des généalogistes génétiques pour construire une phylogéographie de l'haplogroupe Q3-L275 et suggérer des liens avec des événements démographiques.

Les auteurs ont commencé par construire une carte de la fréquence de l'haplogroupe Q-M242:
2017_Balanovsky_Figure1a.jpg

Cet haplogroupe est ainsi le plus fréquent aux Amériques et en Sibérie Centrale. La phylogénie indique que cet haplogroupe est constitué de trois branches principales: Q1, Q2 et Q3:
2017_Balanovsky_Figure1b.jpg

Les clades Q1 et Q2 se séparent en de nombreux groupes qui peuvent être Asiatique ou Amérindien. Peu de chose est connu au sujet de la distribution géographique de la clade Q3.

Les auteurs ont ensuite construit la carte de fréquence de l'haplogroupe Q3-L275 à partir des données académiques (figure A ci-dessous) et des données issues de la généalogie génétique (figure B):
2017_Balanovsky_Figure2.jpg

La carte en A révèle que Q3-L275 est confiné en Asie de l'Ouest et ses régions voisines en Asie Centrale et du Sud, principalement au Pakistan. La carte en B révèle également sa présence en Europe, notamment parmi les Juifs Ashkénazes.

Le séquençage de 47 échantillons appartenant à cet haplogroupe a permis la construction d'un arbre phylogénétique calibré avec un taux de mutation de 0.78 × 10 −9 mutations par paire de base et par an:
2017_Balanovsky_Figure3.jpg

La première divergence dans l'arbre se produit il y a environ 15.000 ans dans le Paléolithique Supérieur. Elle donne naissance à la branche Q3e présente principalement en Inde, mais également en Pologne et chez un Tatar. La divergence suivante apparait il y a environ 10.000 ans et donne naissance à la branche Q3d située en Mongolie. Puis il y a environ 7000 ans, apparait la divergence entre les branches Q3a, Q3b et Q3c. Q3c est situé en Pologne alors que Q3b est présent de l'Inde au Portugal. Enfin, il y a environ 4000 ans, apparait une divergence à l'intérieur de la branche Q3a. Notamment Q3a1 apparait il y a 2700 ans et diverge il y a 1600 ans pour donner une branche Juive Ashkénaze spécifique.

Les auteurs ont ensuite étudié un ensemble de 368 échantillons de l'haplogroupe Q3, issus de différents projets de généalogie génétique en affectant à chaque sous-clade son origine géographique:
2017_Balanovsky_Figure4.jpg

Ainsi la branche Q3e (en vert) est située principalement en Inde et au Pakistan, mais également en Europe et en Asie du Nord. La branche Q3b (en rouge) est située principalement en Asie de l'Ouest. La branche Q3a6 (en bleu) se situe en Asie et en Europe. La branche Q3a5 (en jaune) se situe en Europe, notamment en Allemagne et aux Pays-Bas. Enfin, la branche Q3a1 (en marron) se trouve chez des Juifs Ashkénazes d'Europe.

jeudi 15 décembre 2016

Influence de la transition Néolithique en Asie du Sud-Est sur les haplogroupes du chromosome Y

Les hommes modernes ont quitté l'Afrique il y a environ 60.000 ans, avant de coloniser toute la planète. Jusqu'il y a environ 10.000 ans, le climat froid a limité l'espace de vie des hommes modernes à des latitudes relativement faibles, tout en abaissant le niveau de la mer, ce qui a ainsi dégagé plus d'espace. A partir d'il y a environ 15.000 ans, les glaciers ont reculé et le climat s'est stabilisé il y a environ 10.000 ans. Cette période a été florissante pour l'expansion des hommes modernes. Les premiers développements de l'agriculture ont eu lieu dans le croissant fertile au Proche-Orient avec la domestication de quelques plantes et animaux. Dans la période qui a suivi, l'agriculture est apparue à différents endroits du globe sauf en Australie. Cette transition Néolithique a eu de nombreuses conséquences comme la sédentarisation des populations, la croissance de la population et la diffusion de maladies infectieuses. Elle correspond à un tournant majeur de la préhistoire humaine.

L'Asie du Sud-Est est une des régions les plus importantes pour l'étude des migrations humaines au carrefour des routes vers l'Amérique et les îles du Pacifique. Shao-Qing Wen et ses collègues avaient proposé précédemment deux vagues de migration suivant deux routes continentale et côtière pour expliquer la colonisation du Sud-Est Asiatique. La première vague est arrivée il y a environ 60.000 ans et a permis la colonisation de l'Australie et a contribué à environ 10% des Est-Asiatiques continentaux. La seconde vague est arrivée il y a environ 30.000 ans et a contribué à l'essentiel de la population Sud-Est Asiatique. Ils viennent de publier un papier intitulé: Y-chromosome-based genetic pattern in East Asia affected by Neolithic transition. Ils étudient les différentes périodes qui ont vu l'expansion des principaux haplogroupes du chromosome Y dans le Sud-Est Asiatique.

Le Néolithique Chinois est divisé entre le Nord et le Sud avec deux centres d'origine indépendants. Au sud le long du fleuve Yang-Tsé, le Néolithique est caractérisé par la culture du riz, au nord le long du fleuve jaune, le Néolithique est caractérisé par la culture du millet. Ce développement est divisé en trois phases: une phase initiale autour de 10.000 ans, une phase de transition entre 9000 et 7000 ans et une phase finale entre 7000 et 6000 ans. Durant la phase initiale, les premières cultures commencent dans les deux foyers Nord et Sud alors que les moyens de subsistance sont essentiellement basés sur la chasse et la cueillette. Durant la phase de transition, la population se sédentarise et subit une transition économique Néolithique avec un mélange de ressources sauvages et domestiques. Durant la dernière période, la subsistance est basée essentiellement sur l'agriculture. Des sociétés relativement complexes basées soit sur le riz, soit sur le millet existent alors dans cinq régions de la Chine: Ce sont les sociétés Hongshan, Yangshao, Dawenkou, Daxi et Songze:
2016_Wen_Figure1.jpg

Une série d'études génétiques récentes a montré que la majorité des haplogroupes du chromosome Y ont suivi une expansion après l'émergence du Néolithique. Une sélection sociale importante a probablement eu lieu durant le Néolithique. Certains hommes du Néolithique possédaient un prestige social important. Ils ont eu plus de succès reproducteur que les autres car les femmes préféraient les hommes avec une forte puissance militaire et un haut statut social. En conséquence, seuls quelques lignages paternels ont prospéré dans la population. Ce résultat a eu une forte influence sur les haplogroupes du chromosome Y:
2016_Wen_Figure2.jpg

Certains haplogroupes ont ainsi prospéré. Il s'agit de O3-F5, O3-F46, O3-F11, O1-F78, C3-F2613 et Q1-M120. Environ 65% des Chinois actuels descendent d'un de ces six ancêtres paternels. Les dates d'expansion sont estimées entre 5000 et 6800 ans. Une des questions qui reste est de savoir qui étaient ces six ancêtres. Étaient-ils les fondateurs des premières sociétés complexes chinoises ? Ces expansions Néolithiques étaient-elles reliées à l'expansion des langues actuelles: Austro-asiatiques, Taï, Sino-tibétaines et Austronésiennes ? Par example l'haplogroupe O3-M134 est majoritaire chez les locuteurs des langues Sino-tibétaines, O2-M95 et O3-M7 sont majoritaires chez les locuteurs de langues Hmong-Mien et Austro-asiatiques, O1-M119 chez les locuteurs des langues Taï-Kadai et Austronéesiennes, et N-Tat chez les locuteurs de langue Ouralique.

Les études d'ADN ancien sont encore rares. Elles nous ont montré néanmoins que l'haplogroupe O3-M7 a été trouvé dans la culture Daxi dans la vallée du Yang-Tsé. Cet haplogroupe est caractéristique des peuples Mon-Khmer et Hmong-Mien. L'haplogroupe O1-M119 a été trouvé dans la culture Liangzhu qui succède à la culture Songze dans le delta du Yang-Tsé. Cet haplogroupe est important chez les populations Daic et les aborigènes de Taïwan suggérant que ces cultures pourraient être à l'origine des populations Austronésiennes et Daic. L'haplogroupe O3-M122 a été retrouvé dans la culture Longshan et est maintenant commun dans les populations Sino-tibétaines. Enfin, l'haplogroupe N-M231 est très fréquent dans la culture Hongshan dans la vallée de la rivière Liao. Il est fréquent aujourd'hui dans les populations du Nord de l'Eurasie, les populations Tibéto-birmanes et les populations Chinoises. Ces résultats relient les anciennes cultures Yangshao, Longshan, Dawenkou et Hongshan aux populations modernes Sino-tibétaines. Cependant, plus de résultats d'ADN ancien sont encore nécessaires.

samedi 23 juillet 2016

Héritage génétique paternel des Croates

L'Europe du Sud-Est est habitée depuis le Paléolithique Moyen d'après les traces archéologiques de la grotte Bulgare de Bacho Kiro, appartenant à la culture proto-Aurignacienne datée entre 43.000 et 37.000 ans. De nombreuses études génétiques du Sud-Est de l'Europe ont montré la complexité démographique de la région au cours du temps. Il a été ainsi suggéré que cette région a joué un rôle important dans la recolonisation de l'Europe à partir d'un refuge glaciaire après le Dernier Maximum Glaciaire, ainsi que dans la Néolithisation du continent à partir du Proche-Orient.

Jelena Šarac et ses collègues viennent de publier un papier intitulé: Genetic heritage of Croatians in the Southeastern European gene pool - Y chromosome analysis of the Croatian continental and Island population. Ils ont étudié la diversité de l'ADN du chromosome Y de la population Croate. Ils ont testé un ensemble de 720 individus issus du continent ou des îles sur 66 marqueurs SNP:
2016_Sarac_Figure1.jpg

Les résultats obtenus sont synthétisés dans la figure ci-dessous:
2016_Sarac_Figure2.jpg

Les principaux haplogroupes sont I, R, E, J et G qui représentent à eux tous 96% des échantillons. Les trois principales sous-clades sont I2a-M423 (33,2%), R1a-M558 (19,3%) et E1b-V13 (8,75%). Ces résultats ont été comparés à d'autres populations Européennes en réalisant une Analyse en Composantes Principales:
2016_Sarac_Figure3.jpg

Les échantillons Croates se regroupent avec les individus du Sud-Est de l'Europe. La première composante permet de différentier les populations en fonction de la fréquence de l'haplogroupe R1a, alors que la seconde composante permet de les différentier en fonction de la fréquence de l'haplogroupe I2a.

Les auteurs ont ensuite tracé les cartes de distribution géographique de la fréquence des trois principaux haplogroupes:
2016_Sarac_Figure4.jpg 2016_Sarac_Figure5.jpg 2016_Sarac_Figure6.jpg

Ainsi les haplogroupes I2a et E1b ont leur plus hautes fréquences dans le Sud-Est de l'Europe. Par contre, R1a obtient ses plus hautes fréquences en Biélorussie et en Ukraine, mais reste important en Croatie et en Europe Centrale.

Les auteurs ont ensuite testé 126 échantillons appartenant aux trois principaux haplogroupes: I2a, R1a et E1b sur 17 marqueurs STR. Ils ont ainsi été comparés avec d'autres populations Européennes en traçant des réseaux. Ainsi la diversité des haplotypes I2a Croate est importante, comme celle des haplotypes I2a du Sud-Est de l'Europe. Deux groupes principaux en forme d'étoile prédominent, montrant ainsi une diffusion rapide de cet haplogroupe dans le Sud-Est de l'Europe. Le groupe le plus important dans le réseau R1a montre une diversité d'haplotypes avec peu d'individus du Sud-Est de l'Europe. Son motif en forme d'étoile avec des branches courtes indique une récente expansion. A l'inverse, le réseau E1b indique une forte diversité dans le Sud-Est de l'Europe.

Il est important de préciser que les estimations d'âge ancien obtenues dans des études précédentes à partir des marqueurs STR pour les haplogroupes I2a et R1a sont surestimées comme le montrent les papiers récents basés sur le séquençage du chromosome Y. Ainsi l'âge de l'expansion de R1a a été estimé à environ 5000 ans seulement.

En conclusion, le lignage paternel I2a est un reliquat de la recolonisation de l'Europe à partir du refuge glaciaire situé dans le sud-est de l'Europe après le Dernier Maximum Glaciaire. Cependant les études précédentes basées sur le séquençage du chromosome Y indiquent une expansion de cet haplogroupe beaucoup plus récente entre 7500 et 5000 ans, durant le Néolithique. La population I2a devait donc être faible et plus ou moins stable durant le Mésolithique en Europe. L'haplogroupe R1a se divise en deux sous-clades: R1a-Z282 situé en Europe et R1a-Z93 situé en Asie. La diffusion de l'haplogroupe R1a en Europe a été associé récemment à la culture de la Céramique Cordée. Sa présence en Croatie peut s'expliquer par plusieurs flux de gènes en provenance de l'Europe Centrale, associé peut-être à la diffusion de la langue Slave entre les 3ème et 6ème siècles. La diffusion de l'haplogroupe E1b-V13 en Europe est généralement associée à la diffusion de l'agriculture. Cependant, sa présence en Europe du Sud-Est pourrait être plus ancienne: au Mésolithique avant son expansion avec les premiers agriculteurs.

mardi 19 juillet 2016

Phylogéographie de l'haplogroupe N du chromosome Y

Le nord de l'Eurasie s'étend de la Scandinavie à l'ouest jusqu'à la Béringie à l'est, et la Sibérie a été peuplée depuis au moins 45.000 ans. Un des lignages paternels les plus fréquents dans cette région est l'haplogroupe N du chromosome Y. Il apparait dans de nombreuses populations dont la culture et la langue sont très différentes. Son haplogroupe frère O présente une distribution très différente, de l'Asie du sud-est à l'Océanie. Leur ancêtre commun (haplogroupe NO) défini par le SNP M214 est distribué également principalement en Asie du Sud-Est. L'ADN ancien permet également d'avoir des informations sur l'haplogroupe N. Il est ainsi prépondérant dans le nord-est de la Chine durant le Néolithique il y a environ 6500 ans, puis décroit graduellement jusqu'à l'Âge du Bronze il y a 2700 ans dans cette même région. On le trouve également en Europe en Hongrie à l'Âge du Fer, et en Russie du nord-ouest dans le bassin de la Dvina au Néolithique Final vers 2500 av. JC. Le processus démographique responsable de la distribution de l'haplogroupe N en Eurasie n'est pas bien élucidé.

Anne-Mai Ilumäe et ses collègues viennent de publier un papier intitulé: Human Y Chromosome Haplogroup N: A Non-trivial Time-Resolved Phylogeography that Cuts across Language Families. Ils ont séquencé le chromosome Y de 43 individus appartenant à l'haplogroupe N. Ces résultats ont été ajouté à 51 séquences du même haplogroupe obtenues dans une étude précédente. 3 séquences appartenant à l'haplogroupe frère O ont également été utilisées pour mieux définir la branche commune de ces deux sous-clades. Les auteurs ont également utilisé 6251 individus appartenant à 56 populations testé sur quelques SNP permettant de discriminer les différentes sous-clades de l'haplogroupe N. Parmi ces individus, 1314 appartiennent à la sous-clade N3 et 323 à la sous-clade N2a. Ces deux sous-clades sont les plus fréquentes de l'haplogroupe N. Parmi ces échantillons, 671 ont été ensuite testés sur 17 marqueurs STR.

Le séquençage à haute couverture des 94 échantillons a permis aux auteurs de raffiner la phylogénie de l'haplogroupe N en identifiant de nouvelles sous-clades (lignes violettes ci-dessous) et en datant les différents nœuds de l'arbre obtenu:
2016_Ilumae_Figure1A.jpg

De plus l'ancien individu de Ust'-Ishim vieux de 45.000 ans a pu être placé sur cet arbre. Le taux de mutation obtenu est de 0,76x10-9 mutation par site et par an. Ce chiffre est similaire à ceux obtenus dans des études précédentes.

La sous-clade N5 définie par le SNP B482 a été déterminée par un échantillon unique d'ascendance mélangée: 80% Européenne et 20% Asie du sud-est. La sous-clade N4 définie par le SNP F2930 est observée au Viet-Nam, Cambodge et Chine, dont des individus anciens. Les sous-clades N3 et N2 sont les plus fréquentes. Elles divergent il y a environ 18.000 ans. L'ancêtre N3 est vieux de 13.000 ans et l'ancêtre N2 de 9000 ans. Ces sous-clades sont bien structurées en Eurasie du Nord. Ainsi N3b-B187 est spécifique à la Sibérie du sud et à la Mongolie, alors que N3a-L708 est plus largement distribué en Eurasie du Nord. N3a1-B211 est particulièrement présent dans la région Volga-Oural et dans l'ouest de la Sibérie. N3a2-M2118 est surtout présent en Yakoutie en Sibérie Centrale. N3a3’6-CTS6967 est lui présent dans l'est de la Sibérie et dans les états Baltiques. La diffusion de ces différents lignages date d'environ 5000 ans. En Europe la diffusion de la sous-clade N3a3-VL29 représente environ un tiers des Estoniens, Lettons et Lituaniens, mais elle est aussi présente chez les Saami, les Karéliens et les Finnois. Parmi les slaves de Biélorussie, Ukraine et Russie, environ trois quart de ceux appartenant à l'haplogroupe N3 appartiennent à la sous-clade N3a3. Il y a cependant une exception parmi les Russes du nord dont les deux tiers appartiennent à la sous-clade N3a4-Z1936. A l'inverse les clades N3a5-B197 et N3a6-B479 sont principalement présents dans l'est de l'Eurasie: près du lac Baïkal pour N3a5-F4205 et en Béringie et dans l'est de la Sibérie pour N3a5-B202. N3a6 prédomine chez les Nanai du bassin de la rivière Amour.
2016_Ilumae_Figure2.jpg 2016_Ilumae_Figure2b.jpg 2016_Ilumae_Figure2c.jpg

La sous-clade mineure N2a2-B520 est représentée en Chine, Viet-Nam et Japon. La sous-clade principale N2a1-B523 s'est diversifiée il y a environ 4700 ans. Sa distribution couvre l'ouest et le sud de la Sibérie, la péninsule de Taïmyr et la région Volga-Oural avec une fréquence comprise entre 10 et 30%. N2a1 se sépare en trous sous-clades: N2a1-B478 en Sibérie, N2a1-B525 en Turquie, Arabie et Afghanistan. La branche Européenne: N2a1-B528 se retrouve dans la région Volga-Oural.

En Eurasie, de manière générale, les haplogroupes du sud (H, C et O) montre une divergence plus ancienne que les haplogroupes du nord. De manière équivalente la sous-clade N4 (d'Asie du sud-est) est plus ancienne que les autres sous-clades de N: N2a et N3 (du nord de l'Eurasie). L'âge de dispersion de la plupart de ces sous-clades autour de 5000 ans coïncide avec un réchauffement climatique important dans le nord de l'Eurasie. Quoique les processus démographiques et socio-économiques qui ont eu lieu durant l'Âge du Bronze dans les Steppes sont principalement reliés à la diffusion des langues Indo-Européennes, l'expansion de la famille linguistique Ouralique a été associée à des événements qui ont eu lieu dans les steppes boisées plus au nord. Ainsi la diffusion de l'haplogroupe N dans l'ouest de l'Eurasie pourrait être liée à cette expansion, notamment celle des langues Finno-Ougriennes.

mercredi 27 avril 2016

Expansions rapides de quelques lignées paternelles déduites de l'analyse du chromosome Y

David Poznik et ses collègues viennent de publier un papier intitulé: Punctuated bursts in human male demography inferred from 1,244 worldwide Y-chromosome sequences. Ils ont analysé les séquences complètes de 1244 chromosomes Y d'hommes contemporains appartenant à 26 populations, issues du projet des 1000 génomes. Ils ont construit un arbre phylogénétique à l'aide des 60.555 variants détectés:
2016_Poznik_Figure2.jpg

Cet arbre suggère des expansions rapides datées entre 55.000 et 50.000 ans, mais également plus récemment. Lorsque l'arbre est calibré avec un taux de mutation de 0,76 x 10-9 mutations par paire de base et par an, l'âge du plus récent ancêtre commun est estimé à environ 190.000 ans. A noter qu'il n'y a pas de séquence appartenant à l'haplogroupe A00 qui aurait largement augmenté l'âge de cet ancêtre commun. Toutes les anciennes branches sont Africaines et l'âge de tous les lignages non Africains est voisin de 76.000 ans. Ensuite on voit une nette expansion en Eurasie entre 55.000 et 50.000 ans probablement liée à la colonisation de ce continent sur de grandes aires géographiques. Le principe de parcimonie indique que l'haplogroupe E a probablement émergé en dehors de l'Afrique, avant de retourner sur ce continent il y a environ 58.000 ans. La découverte d'une séquence rare du Viet-Nam appartenant à l'haplogroupe F* permet de définir un nouveau macro-haplgroupe: GHIJK défini par le SNP: M3658 qui englobe la grosse majorité des sous-clades non Africaines. Les auteurs ont également identifié 12 individus d'Asie du Sud appartenant à une nouvelle sous-clade H0 qui se sépare de H1 il y a environ 51.000 ans. La découverte d'un individu d'Asie du Sud parlant une langue Télougou permet de raffiner la sous-clade K2a et se sépare de la branche conduisant aux haplogroupes N et O peu après deux anciens individus: Ust’-Ishim de Sibérie vieux de 45.000 ans et Oase1 de Roumanie vieux de 40.000 ans.

Les auteurs ont ensuite identifié huit haplogroupes qui présentent des expansions importantes:
2016_Poznik_Figure4.jpg

D'abord aux Amériques, on abserve l'expansion de Q1a-M3 autour de 15.000 ans correspondant à la colonisation de ce continent. La correspondance de cette période avec les données archéologiques atteste du bon choix de la calibration utilisée. Ensuite, en Afrique Sub-Saharienne, il y a l'expansion de deux sous-clades distinctes de E1b-M180 il y a environ 5000 ans correspondant à une période qui précéde de peu l'expansion Bantoue. En Europe, il y a également l'expansion de l'haplogroupe R1b-L11 entre 5500 et 4800 ans. Ces dates correspondent d'une part à la culture Yamnaya dans les steppes pontiques et aux cultures Cordée et Campaniforme respectivement en Europe Orientale et Occidentale. En Asie du Sud, les auteurs ont identifiés des expansions correspondant aux haplogroupes H1-M52, L1-M11 et R1a-Z93. Cette dernière est particulièrement intéressante. Elle est datée entre 4500 et 4000 ans et précède de peu l'effondrement de la civilisation de la vallée de l'Indus associé aux migrations Indo-Européennes des steppes pontiques vers l'Inde, reflétant ainsi les événements en Europe. L'Asie de l'Est se caractérise par le peu d'expansions identifiées sauf peut-être une associée aux haplogroupes O2b-M176 et O3-M122.

lundi 29 février 2016

Racines anciennes de l'ADN du chromosome Y des aborigènes Australiens

Une grande majorité (environ 70%) des aborigènes d'Australie portent un haplogroupe du chromosome Y d'origine Eurasienne dû aux mélanges génétiques liés à la colonisation Européenne de ces 200 dernières années. Parmi les individus d'haplogroupe indigène, 44% appartiennent à l'haplogroupe C dont 42% de C-M347 et 2% de C*, et 56% appartiennent à l'haplogroupe K dont 27% de S-P308, 2% de M-M186 et 27% de K*.

Anders Bergström vient de publier un papier intitulé: Deep Roots for Aboriginal Australian Y Chromosomes. Il a séquencé le chromosome Y de 13 aborigènes d'Australie de lignée paternelle d'origine indigène, dont 5 d'haplogroupe C, 6 d'haplogroupe K* et 2 d'haplogroupe M. Ces données ont été comparées à 1244 échantillons du projet des 1000 génomes ainsi qu'à 12 papous de Nouvelle Guinée dont les haplogroupes sont également C, M et K*. La correspondance des haplogroupes des papous de Nouvelle Guinée et des aborigènes d'Australie est consistante avec l'origine commune de ces populations.

Les résultats montrent qu'il y a une divergence profonde entre les chromosomes Y des individus de Nouvelle Guinée et d'Australie et des individus des autres populations:
2016_Bergstrom_Figure1B.jpg

Ci-dessus, la figure B donne la phylogénie des haplogroupes K* et M, et la figure C la phylogénie de l'haplogroupe C. Les aborigènes sont en rouge foncé, les papous en rouge clair et les autres populations en vert.

Les auteurs ont utilisé un taux de mutation de 0,76x10-9 par site et par an calibré par un individu ancien d'Eurasie daté au radiocarbone d'environ 45.000 ans. Les résultats montrent une divergence de 54.300 ans entre les aborigènes, les papous et les autres populations au sein de l'haplgroupe K (entre K* et M d'une part et Q et R d'autre part), et une divergence de 54.100 ans entre ces mêmes populations au sein de l'haplogroupe C.

Ces résultats sont en accord avec les données archéologiques qui indiquent l'apparition des premiers hommes en Australie aux environ de 47.000 ans. Il n'y a par contre aucune preuve d'un influx génétique plus récent en Australie jusqu'à l'arrivée des Européens.

La séparations entre les aborigènes d'Australie et les papous de Nouvelle Guinée semble moins claire. En effet si cette séparation est ancienne (autour de 50.000 ans) au sein des haplgroupes C et K*, elle est beaucoup plus récente au sein de l'haplogroupe M (10.400 ans). Si l'haplogroupe M est très fréquent chez les populations de Nouvelle Guinée et de Mélanésie, il l'est beaucoup moins chez les aborigènes d'Australie (moins de 1%). Bien que cette date de 10.400 corresponde plus ou moins à la séparation entre l'Australie et la Nouvelle Guinée suite à la montée des eaux liée au réchauffement climatique après le dernier Maximum Glaciaire, les deux aborigènes d'haplogroupe M sont originaire des Îles du Détroit de Torrès entre l'Australie et la Nouvelle Guinée. Il est donc probable que la présence de l'haplgroupe M en Australie soit très récent. Une nouvelle étude comprenant plus d'échantillons devrait permettre d'éclaircir ce point.

samedi 13 février 2016

Analyse du chromosome Y de la population de Chypre

L'île de Chypre est localisée à environ 100 km au large du Nord du Levant et de l'Anatolie. La présence humaine est attestée dès 13.000 ans par des chasseurs-cueilleurs du Mésolithique. Elle a ensuite constitué une première étape dans la colonisation Néolithique du bassin Méditerranéen et du sud-est de l'Europe, il y a environ 11.000 ans. Ensuite les peuplements de l'île correspondent à la phase de la poterie Néolithique entre 7200 et 6000 ans, puis à l'Âge du Bronze Ancien entre 4400 et 3700 ans qui ont laissé des traces archéologiques au Nord-Ouest, à l'Ouest et au Sud de l'île. Ensuite les traces de la fin de l'Âge du Bronze reflètent le commerce maritime de l'Est de la Méditerranée qui s'effondre il y a environ 3200 ans.

Konstantinos Voskarides vient de publier un papier intitulé: Y-chromosome phylogeographic analysis of the Greek-Cypriot population reveals elements consistent with Neolithic and Bronze Age settlements. Il a analysé l'ADN du chromosome Y de 629 individus de l'île de Chypre:
2016_Voskarides_FigureS1.jpg

Les échantillons ont été testés sur 92 SNPs représentatifs des principaux haplogroupes et sur 19 marqueurs STR. J2a-M410 est l'haplogroupe le plus fréquent sur l'île de Chypre (26%). L'haplogroupe J2b-M102 est séparé en deux sous-clades: J2b-M205 (5,9%) fréquent au sud Levant et J2b-M241 (0,6%) fréquent en Grèce et dans les Balkans. L'haplogroupe E-M35 totalise 23,1% et inclut E-V13 (7,3%) commun en Grèce, E-V22 (3,5%) présent en Égypte et au Soudan et E-M34 (10,3%) aussi observé au sud du Levant. G2a-P15 (12,9%) est largement distribué et reflète la colonisation Néolithique de l'Europe. L'haplogroupe J1-M267 (6,5%) se retrouve au Proche et Moyen-Orient chez les Palestiniens, les Jordaniens et les Bédouins. L'haplogroupe I2a (3,5%) reflète la colonisation post Glaciaire de l'Europe. Il est présent aujourd'hui principalement dans les Balkans, en Sardaigne et dans le Nord-Ouest de l'Europe Continentale. En tout, l'haplogroupe R1 se retrouve à une fréquence de 15,1% sur l'île de Chypre, et se divise entre R1a-M449 (4,5%) et R1b-M415 (10,7%). La sous-clade R1b-M269 se divise entre R1b-M269*(xL23) (2,5%), R1b-L51 (2,2%) qui est très fréquent en Europe Centrale et Occidentale, et R1b-Z2105 (5,4%) que l'on retrouve en Asie de l'Ouest, Centrale et du Sud. De la même manière R1a se divise entre R1a-Z282 (3%) fréquent en Europe de l'Est et R1a-Z93 (1,1%) fréquent en Asie. Enfin on trouve sur l'île de Chypre des traces d'haplogroupes plus exotiques comme B-M60, C-M130, L-M20 et Q-M346.

Une Analyse en Composantes Principales basée sur la fréquence des haplogroupes du chromosome Y a été réalisée pour comparer la population Chypriote avec des populations voisines:
2016_Voskarides_Figure3.jpg

La première composante sépare les populations de Bulgarie, de République Tchèque, des Balkans, de Hongrie, et de Grèce des populations du Caucase et du Proche-Orient, alors que la seconde composante sépare la population Italienne des groupes du Proche-Orient. La population de Chypre se retrouve en position centrale sur la figure proche des populations de Crète, du Caucase, d'Italie du Sud, d’Égypte et d’Irak.

Les auteurs ont ensuite estimé la contribution génétique paternelle des régions voisines: Anatolie, Balkans, Grèce et Levant à la population Chypriote à l'aide du logiciel ADMIX95:
2016_Voskarides_Table2.jpg

Les résultats révèlent une forte influence de l'Anatolie (66%), suivie par le Levant (24%) et les Balkans (13%). Aucune contribution Romaine issue d'Italie ou de Sicile est discernable. La contribution Anatolienne se retrouve essentiellement dans l'haplogroupe G2a-P15 (83%), et autour de 25% dans les haplogroupes J2a-M67, J2b-M12 et R1b-M269. Les Balkans avec la région du Danube ont apporté J2b-M12 (67 %) et presque tous les échantillons I2-M423 (99 %). La contribution Grecque se retrouve dans E-V13 (87 %), J2a-M67 (74 %), R1b-M269 (48 %) et G-P15 (17 %). Enfin le Levant apporte 30 % des R1b-M269 et un peu des lignages J (3 à 8 %). Ces contributions reflètent des arrivées sur l'île de Chypre à différentes périodes entre le Néolithique Ancien et l'Âge du Bronze.

La détermination de l'époque où sont arrivés les différents lignages est compliquée du fait que d'anciens haplogroupes ont pu arriver durant des migrations récentes. Les récents résultats d'ADN ancien ont montré que l'haplogroupe G2a-P15 s'est largement diffusé avec les premiers fermiers Néolithiques en Europe. Il a d'autre part été proposé que les haplogroupes J2a-M410 et J2b-M12 se sont également diffusés avec le Néolithique.

D'autres résultats d'ADN Ancien ont montré que J2a-M67 a également été retrouvé durant l'Âge du Bronze en Europe Centrale. Il a été proposé que cet haplogroupe pourrait être lié à la diffusion du Néolithique en Anatolie Centrale et également à l'expansion de la culture maritime de Troie dans le Nord-Ouest de l'Anatolie. La distribution de cet haplogroupe sur l'île de Chypre correspond bien à la localisation des vestiges de l'Âge du Bronze de la culture Philia.

Les haplogroupes E-V13, I2-M423 et I2-M436 sont fréquents dans les Balkans et peuvent refléter l'influx Grecque dans l'île de Chypre à la fin de l'Âge du Bronze. L'haplogroupe R1b-L23 se divise entre la sous-clade Asiatique R1b-Z2105 et la sous-clade Européenne R1b-L51 datées toutes les deux entre 6000 et 5000 ans. Leur arrivée à Chypre doit également dater de l'Âge du Bronze. Notamment R1b-Z2105 a été récemment détecté dans des squelettes des Steppes Eurasiennes de l'Âge du Bronze il y a environ 5000 ans. A Chypre, la distribution de R1b-Z2105 est opposée à celle de J2a-M67 et J2b-M205, se concentrant dans l'Est et le Nord-Est de l'île. D'autre part la sous-clade R1b-M589 de R1b-Z2105 est également informative. Si R1b-Z2105 se retrouve à la fois à l'extrême ouest et à l'extrême est de l'île, R1b-M589 se retrouve uniquement dans l'est. L'absence de R1b-M589 dans les Balkans et en Crète et sa présence en Asie mineure est compatible avec une influence à Chypre de l'Anatolie davantage que de la Grèce à la fin de l'Âge du Bronze.

lundi 18 janvier 2016

Expansion de l'haplogroupe J2-M172 du chromosome Y et diffusion du Néolithique en Inde

L'histoire du peuplement de l'Inde commence avec l'arrivée des premiers hommes ayant quitté l'Afrique il y a 70.000 à 60.000 ans, et se poursuit par différents épisodes démographiques en Eurasie d'abord de chasseurs-cueilleurs puis des premiers fermiers du Néolithique en provenance du croissant fertile ou d'Asie du sud.

Des études précédentes ont proposé que les deux sous-clades J2a-M410 et J2b-M102 représentent une composante associée à la diffusion des premiers fermiers Néolithique en Eurasie et en Afrique du Nord à partir de la Mésopotamie (Irak et Syrie). Ainsi leur présence en Inde a été considérée comme le résultats de flux de gènes à partir de l'Asie de l'ouest.

Sakshi Singh vient de publier un papier intitulé: Dissecting the influence of Neolithic demic diffusion on Indian Y-chromosome pool through J2-M172 haplogroup. Il a étudié 3023 échantillons appartenant à 77 populations de différentes familles linguistiques en Inde. Parmi eux, 355 appartiennent à l'haplogroupe J2-M172. Le sous-groupe Indien J2a-M410 est spécifique car il ne contient aucun échantillon J2a1b-M67 pourtant majoritaire ailleurs en Eurasie. Il ne contient pas non plus d'échantillons J2a1a-M47 ou J2a1h1-M158 présents également ailleurs, quoique minoritaires.

Les fréquences de J2a-M410 et J2b-M102 varient entre 0 et 8% dans les différentes populations Indiennes. Ces fréquences sont cependant plus élevées dans certaines populations: 17 à 50% de J2a chez les Toda, Chenchu, Banjara, Kamboj, Lohana et les musulmans Kashmiri, 15 à 35% de J2b chez les Asur, Narikuravar, Pichakuntla, Shikari et Mondi. J2a est plutôt concentré vers les frontières du nord-ouest de l'Inde notamment au Gujarat et au Rajasthan:
2016_Singh_Figure1A.jpg

La figure (a) ci-dessus montre qu'il y a un fort déclin de la fréquence de J2a vers l'est de l'Inde.

A l'inverse, J2b est concentré dans l'est de l'Inde, comme le montre la figure (b) ci-dessous:
2016_Singh_Figure1B.jpg

En fait, la plupart des échantillons J2b appartiennent à la sous-clade J2b2-M241 avec une minorité de J2b1-M205 dans le nord-ouest de l'Inde. La figure ci-dessous donne la fréquence de l'haplogroupe J2b1-M205 en (b) et la fréquence de l'haplogroupe J2b2-M241 en (c):
2016_Singh_Figure2.jpg

Les plus fortes variances et les plus anciens TMRCA (âge du plus récent ancêtre commun) de J2a se trouvent au nord-ouest et au sud de l'Inde. Les TMRCA les plus récents sont dans le centre, le nord et dans l'ouest de l'Inde. De même J2b a les plus anciens TMRCA dans le nord-ouest de l'Inde, et les plus jeunes dans le centre, le sud, le nord et l'est. Ainsi la variance de J2b est à l'opposé de sa fréquence indiquant ainsi un fort effet fondateur dans l'est de l'Inde.

L'arrivée de J2a et J2b chez les Indo-Européens et les Dravidiens semble dater de la même époque, par contre son arrivée chez les Austro-Asiatiques est plus récente.

La distribution spatiale de J2a au Moyen-Orient et en Asie Centrale correspond à la présence de vestiges Néolithiques comme la poterie peinte et la culture céramique. Les plus anciennes traces de la civilisation de l'Indus située dans l'actuel Pakistan, correspondent aux plus anciens témoins de l'agriculture dans cette région. Ainsi il est intéressant de noter que les concentrations de l'haplogroupes J2a se superposent aux principaux centres du Néolithique. Dans cette étude, les auteurs ont également montré qu'il y avait de fortes fréquences de J2a ou de J2b parmi des populations qui étaient encore récemment des chasseurs-cueilleurs comme les Asur et les Chenchu, des pasteurs comme les Toda ou des tribus nomades comme les Banjara ou les Bahelia. Beaucoup de ces tribus nomades sont originaires du nord-ouest de l'Inde et ont migré vers le sud. On peut les considérer comme des reliques des premières communautés agropastorales.

Cependant, la présence de J2 en Inde n'est pas seulement liée à la diffusion de l'agriculture. Ainsi l'absence des sous-clades J2a1b-M67 et J2a1a-M47 qui sont prépondérantes en dehors de l'Inde, impliquent une diffusion de de J2a plus ancienne que l'émergence de ces sous-clades associées à la diffusion de l'agriculture en Anatolie, dans le sud-est de l'Europe et dans le bassin Méditerranéen. De plus la présence négligeable de G2a-P15 ou de E1b-V13 traditionnellement associés à la diffusion de l'agriculture en Europe, est à prendre en compte et semble indiquer un processus plus complexe de la diffusion de J2-M172 en Inde. Cette dernière pourrait être la combinaison d'une première diffusion de chasseurs-cueilleurs à la fin de l'ère glaciaire suivie d'une diffusion associée au Néolithique durant l'holocène, et enfin à des migrations plus tardives aux âges du Bronze et du Fer.

Commentaires

On peut expliquer l'absence de J2a1b et J2a1a en Inde autrement que par une diffusion antérieure à l'émergence de ces sous-clades. Cela peut-être du à une expansion du Néolithique vers l'Inde depuis une région différente de la région qui est à l'origine de l'expansion du Néolithique vers l'ouest. Cette région d'origine du Néolithique vers l'Inde n'avait peut-être pas ces sous-clades situées peut-être dans une autre région du Croissant fertile.

vendredi 6 novembre 2015

Antiquité et diversité des chromosomes Y des aborigènes Australiens

Selon la plupart des scénarios l'Australie est vue comme un continent qui fut colonisé juste après l'expansion humaine en dehors de l'Afrique il y a entre 60 et 100.000 ans. Les preuves génétiques et archéologiques suggèrent que les ancêtres des aborigènes d'Australie sont arrivés il y a au moins 45.000 ans. Bien qu'il y ait un consensus sur la date d'arrivée des premiers hommes modernes dans le Sahul, il y a encore une controverse sur la route prise par cette première migration. Il y a également une controverse pour savoir si l'Australie et la Nouvelle Guinée ont été colonisées en même temps ou non et sur d'éventuelles migrations supplémentaires en Australie avant l'arrivée des Européens.

Les analyses d'ADN mitochondrial ont démontré une forte affinité entre les aborigènes d'Australie et les populations de Nouvelle-Guinée et ont suggéré également une affinité avec des populations d'Inde. Les analyses d'ADN autosomales supportent l'hypothèse que les aborigènes d'Australie représentent l'une des plus anciennes populations non Africaines, avec peu d'introgression de populations extérieures jusqu'aux époques historiques.

Nano Nagle vient de publier un papier intitulé: Antiquity and Diversity of Aboriginal Australian Y-Chromosomes. Il a étudié la diversité du chromosome Y sur un ensemble de 657 aborigènes d'Australie en testant 17 marqueurs STR et 47 marqueurs SNP.

Parmi l'ensemble de la population étudiée, 55,6% ont un ADN du chromosome Y qui n'est pas indigène à l'Australie. La grosse majorité d'entre eux sont d'origine Européenne:
2015_Nagle_Table1.jpg

C'est la région Victoria qui à la plus grande proportion d'haplotypes non indigène, et les territoires du nord la plus faible. Il y a ainsi globalement 32,4% d'haplogroupe R et 8,2% d'haplogroupe I. On trouve également l'haplogroupe O d'origine Asiatique (5,8%).

292 individus possèdent un haplogroupe indigène à l'Australie: C-M347, K-M526*, S-P308 ou M-M186. Cinq d'entre eux sont de l'haplogroupe C-M130* et sont dispersés sur toute l'Australie: 1 en Queensland, 1 en Australie du sud et 3 dans les territoires du nord. Six sont de l'haplogroupe M-M186: 3 en Queensland, 2 en Australie du sud et 1 dans les territoires du nord.
2015_Nagle_Figure1.jpg

L'haplogroupe aborigène le plus fréquent est K-M526* et sa sous-clade S-P308 (54%):
2015_Nagle_Figure2.jpg

Tous les échantillons S-P308 de Victoria se regroupent à part (points verts).

L'haplogroupe C-M347 regroupe 122 échantillons, soit 41,8% des haplotypes indigènes à l'Australie. Sa plus haute fréquence se retrouve dans les territoires du nord et sa plus faible dans la région Victoria. 3 sous-clades de C-M347 ont été identifiées: C-DYS390.1 del, C-M210 et C-M347*:
2015_Nagle_Figure3.jpg

La diversité des haplotypes est très importante suggérant que ces haplogroupes sont très anciens. Il y a ainsi 210 haplotypes parmi les 278 échantillons indigènes complets. Parmi ceux-ci, 164 sont des singletons, 25 sont partagés à l'intérieur de la même région et seuls 21 haplotypes sont partagés dans plusieurs régions, essentiellement entre l'Australie du sud et les territoires du nord.

L'estimation de l'âge de l'ancêtre commun le plus récent (TMRCA) pour différents haplogroupes a été faite à l'aide de trois méthodes différentes: la statistique rho, la statistique ASD et l'algorithme BATWING. Sachant la différence d'un facteur 3 entre le taux de mutation généalogique (OMR) et le taux de mutation évolutionnaire (EMR), les résultats obtenus diffèrent d'un facteur équivalent:
2015_Nagle_Table3.jpg

Ainsi, en utilisant le taux généalogique, le TMRCA de C* estimé varie entre 6.800 et 22.000 ans entre la statistique rho et la méthode BATWING. Si on suppose que la méthode BATWING donne la meilleure estimation, l'âge de C-M347 est de 14.000 ans, celui de C-M347* de 8.000 ans, celui de C-DYS390.1 del de 11.000 ans et celui de C-M210 de 5.000 ans. Enfin l'âge de K-M526* est de 16.000 ans et celui de S-P308 est de 11.000 ans. En utilisant le taux évolutionnaire, l'âge de C* est d'environ 76.000 ans, l'âge de C-M347 est de 49.000 ans, l'âge de C-M347* est de 27.000 ans, celui de C-DYS390.1 del de 40.000 ans, celui de C-M210 de 20.000 ans. L'âge de K-M526* est de 57.000 ans et celui de S-P308 de 37.000 ans.

La très forte proportion d'haplogroupes Européens chez les aborigènes d'Australie montre qu'il y a eu une perte considérable de la diversité du chromosome Y dans cette population depuis le 18ème siècle. On a ainsi estimé qu'au moins 50% de la population indigène est décédée peu après la colonisation Européenne suite à l'introduction de maladies étrangères comme la variole. De plus les lois mises en place par les Européens ont créé des réserves pour les aborigènes et ont interdit aux métisses de rendre visite aux personnes de leur famille mais non métissées. De plus souvent les hommes et les femmes étaient mis dans des réserves séparées. Du coup beaucoup d'indigènes ont perdu la trace de leurs grands-parents et ont une connaissance limitée de leur ascendance aborigène.

L'haplogroupe K* avait déjà été rapporté en Australie, mais aussi en Nouvelle Guinée, Mélanésie et Micronésie. La découverte de nouveaux marqueurs a permis de raffiner la phylogénie de cet haplogroupe et a mis en évidence notamment la sous-clade S-P308. La présente étude confirme que S-P308 est commun parmi les aborigènes d'Australie. Sachant la large distribution et l'ancienneté de cet haplogroupe, il est difficile de dire si l'arrivée de cette population dans le Sahul représente une seule migration suivie d'une divergence de cet haplogroupe, ou plusieurs événements démographiques à différentes périodes.

L'haplogroupe C-M347* est également largement distribué en Australie et très ancien. La sous-clade C-DYS390.1 del est la plus discutée car certain ont avancé l'idée qu'elle est arrivée en Australie durant l'holocène en provenance d'Inde, en introduisant le dingo et de nouveaux outils à base de microlithes sur ce continent. Cependant l'absence de lignées C-M356, L-M20 ou R-M207 sud-asiatiques dans cette étude indique qu'il n'y a pas de preuve pour un flux de gènes masculins en provenance d'Inde. De plus des études récentes ont montré que le dingo était originaire davantage de Chine du sud que d'Inde. Il est donc probable que la sous-clade C-DYS390.1 del ait évolué sur place à partir d'un vieil ancêtre Australien.

Le fait que l'haplogroupe C-M347 et ses sous-clades soit limité aux aborigènes Australiens a des implications sur les routes de migration de leurs ancêtres il y a environ 50.000 ans. S'ils sont arrivés via la Nouvelle Guinée, il faut expliquer son absence dans cette région aujourd'hui. Il n'y avait pas de barrière géographique entre l'Australie et la Nouvelle Guinée avant l'holocène, cependant il y a pu avoir une barrière culturelle ou linguistique. Il est possible que les fondateurs qui portaient l'haplogroupe C-M130 ont suivi une route le long de la chaîne actuelle Indonésienne et se sont séparés en deux groupes avant d'entrer dans le Sahul. Un groupe est ensuite arrivé dans le nord de l'Australie avant l'émergence de C-M347, alors que l'autre est entré en Nouvelle Guinée avant l'émergence de C-M38 et autres sous-clades de C. Une alternative possible est qu'il y ait eu une seule migration qui soit entré d'abord en Nouvelle Guinée. Une partie des premiers colons auraient ensuite migré vers le sud et l'actuelle Australie. Cette colonisation initiale a pu être suivie d'une longue période d'isolation.

L'haplogroupe K-M526* est présent aujourd'hui en Nouvelle Guinée, Mélanésie et Australie. Il est donc possible que le porteur initial de K-M526 a colonisé d'abord la Nouvelle Guinée avant d'entrer en Australie, comme pour C-M130. Ainsi la sous-clade S-P308 aurait émergé ensuite uniquement en Australie.

lundi 29 juin 2015

Phylogéographie de l'haplogroupe E du chromosome Y

Beniamino Trombetta vient de publier un papier intitulé: Phylogeographic refinement and large scale genotyping of human Y chromosome haplogroup E provide new insights into the dispersal of early pastoralists in the African continent. L'haplogroupe E du chromosome Y est l'haplogroupe le plus fréquent en Afrique. Les auteurs se sont intéressés particulièrement à la sous-clade E-M35 qui a une large distribution géographique de l'Afrique à l'Europe via Asie de l'ouest. En tout 5222 échantillons ont été testés pour les SNPs M40 (qui définit l'haplgoroupe E) et M215 (qui définit une sous-clade de E). Ensuite, ils ont analysé le séquençage à haute couverture de 33 échantillons sur une portion du chromosome Y longue de 1,5 million de paires de base.

729 mutations ont été déterminées pour construire l'arbre phylogénétique de l'haplogroupe E:
2015_Trombetta_Figure1.jpeg

La branche racine de l'haplogroupe E est ici définie par 13 mutations. Une datation a pu être obtenue en se basant sur un taux de mutations de 0.716 × 10-9/site/an. Ainsi l'âge du MRCA (le plus récent ancêtre commun) de l'haplogroupe E est estimé à 57.400 ans. Ensuite 4 bifurcations majeures apparaissent dans les 20.000 années suivantes:

  • la séparation de E-M33 et E-P2 datée de 54.400 ans
  • la séparation de E-V38 et E-M215 datée de 47.500 ans
  • la séparation de E-M2 et E-M239 datée de 45.600 ans
  • la séparation de E-M35 et E-V16 datée de 38.600 ans

Ensuite le SNP M78 émerge entre 20.300 et 14.800 ans. La date du MRCA de V13 est lui estimé à environ 8.100 ans. Il est consistant avec une hypothèse de diffusion Néolithique.

Pour raffiner la sous-clade E-M35, 62 mutations ont été testées sur les 5222 échantillons appartenant à 118 populations différentes. Ainsi 1141 séquences sont apparues appartenir à la sous-clade E-M35. Ce travail à permis de construire l'arbre ci-dessous:
2015_Trombetta_Figure2.jpeg

Ainsi la sous-clade E-M35 se sépare en 2 branches: E-Z827 et E-V68. A l'intérieur de E-Z827 on identifie une nouvelle branche E-V1515 qui inclue toutes les anciennes sous-clades sub-Sahariennes: E-V42, E-M293, E-V92 et E-V6. L'haplogroupe E-V1515 est principalement restreint à l'Afrique de l'Est, sauf la sous-clade E-M293 dont on a proposé antérieurement une migration de l'Afrique de l'Est vers l'Afrique du Sud; et la sous-clade E-V6 que l'on retrouve à basse fréquence en Afrique du Nord-Est.

A l'intérieur de E-V68, tous les échantillons V68* appartiennent maintenant à la sous-clade E-V2009. Les échantillons E-M78* appartiennent à 3 sous-clades: E-V1083, E-V1477 et E-V259.

De plus 3 individus de l'haplogroupe E, n'appartiennent ni à E1-P147 ni à E2-M75. Ces individus sont V3725+, mais V1844- et V1865-. Ils partagent de plus la mutation V44:
2015_Trombetta_FigureS3.jpeg

L'analyse phylogéographique de ces résultats suggère que l'ancêtre E a émergé dans une région sub-Saharienne plus probablement en Afrique de l'Est, l'ancêtre E-M215 a émergé en Afrique de l'Est, l'ancêtre E-M78 a émergé en Afrique du Nord, et l'ancêtre E-M35 a émergé en Afrique de l'Est.

La répartition géographqiue de E-V1515 et de ses sous-clades suggère fortement des mouvements humains du nord de la corne de l'Afrique vers l'Afrique du Sud, notamment des pasteurs non Bantous. Ainsi E-M293 pourrait représenter l'étape finale de cette expansion.
2015_Trombetta_Figure3.jpeg

mercredi 8 avril 2015

Analyse phylogénétique de l'haplogroupe G1 du chromosome Y

L'haplogroupe G1 du chromosome Y a de relative faible fréquence en Asie du sud-ouest avec un maximum dans la population Madiar du Kazakhstan, et son lieu d'origine reste incertain.

L'âge des branches du chromosome Y reste incertain du fait de l'écart important entre les taux de mutation évolutionnaire et généalogique des marqueurs Y-STRs. Les récents progrès du séquençage complet du chromosome Y permet maintenant d'estimer le taux de mutation des marqueurs SNPs et d'obtenir ainsi de meilleures estimations de l'âge de ces branches. Les résultats obtenus jusqu'ici ont estimé ce taux de mutation entre 0,6 et 1x10-9 par paire de bases et par an.

Oleg Balanovsky vient de publier un papier intitulé: Deep Phylogenetic Analysis of Haplogroup G1 Provides Estimates of SNP and STR Mutation Rates on the Human Y-Chromosome and Reveals Migrations of Iranic Speakers. Il a testé 5.346 individus appartenant à 27 populations eurasiennes et identifié parmi ceux-ci 367 échantillons appartenant à l'haplogroupe G1. Chacun de ces échantillons a ensuite été testé sur 17 marqueurs STR. Ensuite, parmi ces 367 échantillons, 19 ont été séquencés sur une bonne partie du chromosome Y à l'aide du test BIGY de la compagnie privée Family Tree DNA. Ceux-ci ont été sélectionnés afin de choisir chacun des principaux clusters identifiés.

La carte de la distribution géographique de la fréquence de l'haplogroupe G1 est présentée dans la figure ci-dessous:
2015_Balanovsky_Figure2.jpeg

Cet haplogroupe est répandu sur une large région qui s'étend de l'Italie à la Mongolie, incluant les steppes d'Asie Centrale et le plateau Irano-Arménien. Deux pics de fréquence apparaissent, l'un au nord du Kazakhstan (> 80%), et le second en Arménie (> 42%). Au Kazakhstan, l'haplogroupe G1 se retrouve essentiellement dans la tribu Argyn (environ 500.000 personnes). En Arménie, l'haplogroupe G1 est particulièrement fréquent chez les Hémichis (environ 150.000 personnes).

Un réseau a été construit à partir des haplotypes STR:
2015_Balanovsky_Figure3.jpeg

Quatre groupes sont mis en évidence: deux sont arméniens, un est Kazakh et le dernier est Bachkir. Le groupe Kazakh correspond à la tribu Argyn, les groupes Arméniens incluent de nombreux Hémichis, enfin le groupe Bachkir inclue la tribu Kangly. Certaines branches du réseau ont de hautes fréquences liées à un effet fondateur.

La diversité des haplotypes pour l'haplogroupe G1 varie de 92% en Iran à 0% en Mongolie. La carte de la diversité ci-dessous révèle un gradient qui décroit de l'ouest de l'Iran vers la partie orientale de l'Asie du sud-ouest.
2015_Balanovsky_Figure4.jpeg

Cette carte permet de supposer que la région d'origine de l'haplogroupe G1 est située à l'ouest du plateau Irano-Arménien.

Les 19 séquençages du chromosome Y ont permi d'identifier 766 SNPs dont 281 sont déjà connus. Deux échantillons indiens de l'haplogroupe G1 séquencés par le projet des 1000 génomes ont été rajoutés à l'analyse. L'arbre obtenu apparait dans la figure ci-dessous:
2015_Balanovsky_Figure5.jpeg

On retrouve les clusters Kazakh, Arméniens et Bachkir. Les deux échantillons indiens forment un autre cluster. Les échantillons Mongoles se rattachent au cluster Kazakh. Les groupes Arménien et Bachkir ont un ancêtre commun séparé des Kazakh. Ce schéma se rapproche du réseau obtenu à partir des haplotypes STR, sauf pour les Arméniens qui formaient 2 groupes dans le réseau des haplotypes STR, n'en forme plus qu'un dans l'arbre phylogénétique.

La tribu Argyn est supposée descendre d'un seul individu. Elle est composée maintenant de 12 clans. Bien qu'il n'y ait pas de preuve historique de l'existence réelle de Argyn, son arrière petit fils Karakhoja est un personnage historique connu pour être un ambassadeur du Khan Tokhtamych, dirigeant de la horde d'or de Tamerlan en 1405.

L'arbre génétique formé par les échantillons Kazakh de l'haplogroupe G1 ressemble beaucoup à l'arbre généalogique des différents clans de la tribu Argyn:
2015_Balanovsky_Figure6.jpeg

Considérant l'écart de temps entre Karakhoja qui avait 50 ans en 1405, et le présent (606 ans), on en déduit un taux de mutation de 0,77 10-9 par paire de bases et par an. Si, maintenant on prend en compte trois nouveaux échantillons qui se réclament descendant de Somdyk, frère de Karakhoja, on obtient un taux de mutation de 0,78 10-9 par paire de bases et par an. En appliquant la même méthode aux marqueurs STR, les auteurs ont obtenu un taux de mutation de 0,0022 par locus et par génération, voisin du taux généalogique, mais éloigné du taux évolutionnaire.

A partir de ces valeurs ont peut estimer l'âge de séparation des groupes Arménien et Bachkir à environ 8000 ans, et l'âge de tous les échantillons G1 sauf les Indiens à environ 10.500 ans.

L'expansion du groupe Arménien est daté de 1150 ans et correspond bien aux données historiques qui nous disent que les Hémichis sont originaires de l'entourage du Prince Shapuh Amatuni qui a émigré en l'an 791 depuis la Perse.

L'expansion du groupe Bachkir est daté du 15ème siècle. La tribu Kangly est originaire des Petchénègues vers le 8ème siècle avant de joindre les Bachkirs. Une expansion plus tardive pourrait être causée par des changements démographiques quand ils participèrent à la Horde d'Or au 14ème siècle, puis à l'état Russe au 16ème siècle.

Malgré la proximité géographique entre les Bachkirs et les Kazakhs, il n'y a pas de relation génétique entre ces deux groupes.

mardi 17 mars 2015

Un effet de goulot récent dans la diversité du chromosome Y coïncide avec un changement global dans la culture

Malgré un taux de mutation plus élevé dans l'ADN mitochondrial, la plus grande longueur du chromosome Y offre une meilleure résolution généalogique. Alors que le rapport des tailles effectives des populations mâle/femelle a été estimé à une valeur inférieure à 1, les facteurs responsables de sa dynamique restent mal compris.

Monika Karmin vient de publier un papier intitulé: A recent bottleneck of Y chromosome diversity coincides with a global change in culture. Elle a utilisé 456 séquences du chromosome Y dont 299 nouvelles pour estimer les temps de coalescence et l'ordre de séparation des différents haplogroupes:
2015_Karmin_Figure1.jpeg

Une séquence de 8,8 Mb par échantillon a été conservé pour l'analyse du chromosome Y. Un total de 35.700 SNP a été utilisé pour l'analyse phylogénétique et pour les estimations de temps de coalescence. Le taux de mutation dans la région utilisée a été estimé à 0,74 10-9 par paire de bases et par an à partir de 2 sequences amérindiennes d'ADN ancien (Anzick et Saqqaq). Cette valeur est proche de celle déterminée par Fu en 2014 (0,76 10-9) à partir d'autres séquences d'ADN ancien.

La racine de l'arbre a été déterminée à partir de 2 séquences de l'haplogroupe A00. L'âge de la séparation entre l'haplogroupe A00 et le reste de l'arbre a été estimé à 254.000 ans. Les auteurs ont trouvé 236 SNPs qui séparent les branches Africaines des branches non Africaines, correspondant ainsi à une durée supérieure à 15.000 ans. Cette séparation intervient vers 70.000 ans, alors que la dispersion des branches non Africaines intervient seulement vers 50.000 ans. Cet écart est même supérieur si les distributions des haplogroupes D (en Asie) et E (en Afrique) peuvent être expliqués par une migration retour vers l'Afrique des lignages DE:
2015_Karmin_FigureS9.jpeg

Les auteurs ont mis en évidence de nouvelles caractéristiques pour les haplogroupes non Africains C et F. Il y a maintenant une séparation entre C3 et tous les autres sous-clades de l'haplgoroupe C. La séparation entre les haplogroupes F et GT est faite par un unique SNP: F1329. Ensuite l'haplogroupe G se sépare de HT par un unique SNP: M578. De la même façon les autres haplogroupes non Africains se sépare de l'arbre principal par des branches courtes indiquant une rapide dispersion des lignages Eurasiens et Océaniens. En Eurasie, beaucoup de branches se dispersent durant les 15.000 dernières années signalant ainsi un réchauffement climatique propice à la prospérité de l'espèce humaine.

Les auteurs ont utilisé des Bayesian Skyline Plots pour estimer l'évolution des tailles effectives des populations mâle et femelle à partir de 320 échantillons mâles et de leur ADN mitochondrial et du chromosome Y:
2015_Karmin_Figure2.jpeg

On voit ainsi une nette augmentation des tailles effectives des populations mâle et femelle entre 60.000 et 40.000 ans. Cependant les 2 courbes diffèrent en plusieurs points. Notamment la taille effective de la population femelle est environ le double de la taille effective de la population mâle. Si les deux courbes montrent un fort accroissement durant l'holocène, la population mâle montre une réduction entre 8000 et 4000 ans, à un moment où la population femelle est environ 17 fois plus importante.

Les dates estimées dans l'arbre Y pour les populations non Africaines correspondent bien avec les preuves archéologiques et les dates de colonisation de l'Eurasie et de l'Australie par l'homme moderne. Cependant le très faible niveau de la taille effective de la population mâle (<100) au moment de la sortie de l'Afrique indique qu'on ne peut pas réfuter complètement le modèle alternatif de sortie de l'Afrique plus tôt (vers 100 à 130.000 ans). Une discrimination entre les deux modèles pourrait se faire cependant à partir de l'ADN autosomal.

La chute de la taille effective de la population mâle durant l'holocène correspond à un changement dans les données archéologiques caractérisé par la diffusion du Néolithique. Ceci se traduit par des changements démographiques ou des changements de comportements sociaux. Cette correspondance avec le Néolithique est plus réelle au Proche-Orient, en Asie de l'Est et en Asie du Sud qu'en Europe. Un changement des structures sociales qui augmente la variance du nombre d'enfants par individu mâle peut expliquer ce résultat, notamment si le succès de reproduction masculine est partiellement hérité culturellement. De même une augmentation de la migration masculine peut contribuer à diminuer la taille effective de la population mâle. Une innovation dans les technologies du transport comme l'invention de la roue, la domestication du cheval ou du chameau, la navigation en pleine mer, peu avoir également contribuer à cet effet.

vendredi 13 mars 2015

Les migrations d'Arabie vers l'Ibérie étudiées par l'ADN du chromosome Y

La péninsule Ibérique est peuplée par l'homme moderne depuis le Paléolithique Supérieur entre 35.000 et 40.000 ans. Pendant le Maximum Glaciaire, elle est devenue un refuge avant de devenir une des sources de la repopulation de l'Europe au moment de la fonte des glaciers. Depuis, elle a reçu un certain nombre de cultures dont les fermiers Néolithiques en provenance des îles de l'est méditerranéen, les Proto-Indo-Européens arrivant des Steppes d'Europe de l'Est, les Tartéssiens qui apparaissent au 9ème siècle av. JC, les Ibères venant de l'est méditerranéen ou d'Afrique du Nord et les Celtes arrivant d'Europe Centrale vers 450 av. JC. Aux temps historiques, ce sont les Phéniciens du Moyen Orient, les Grecs, les Romains, les tribus Germaines d'Europe Centrale, les Vikings de Scandinavie, les Arabes du Golfe Persique et les Berbères d'Afrique du Nord aussi bien que les Roms d'Inde, qui ont contribué à la composition génétique de la péninsule Ibérique.

A la fin du 7ème siècle, les Arabes et les Bédouins sont arrivés dans l'ouest de l'Afrique du Nord en provenance de Damas. En 711, une armée Berbère sous commandement Arabe a traversé le détroit de Gibraltar et en l'espace de 4 ans a conquis presque toute la péninsule Ibérique à l'exception des Asturies, du Pays Basque, de la Cantabrie, de la Galice et d'une bonne partie des Pyrénées. Les occupants sont restés plus de 5 siècles suivi d'un retrait graduel vers l'Andalousie. Le contrôle politique Islamique a quitté définitivement la Péninsule Ibérique à la fin du 15ème siècle. Cependant une part de la population Arabe ou Berbère est restée dans la péninsule Ibérique. Entre 1520 et 1614 les Musulmans ont du choisir entre la conversion au christianisme ou quitter le pays. Pendant ces 800 ans d'occupation un flux de gènes bidirectionnel s'est échangé entre les deux communautés. Au 16ème siècle un certain nombre de musulmans ont été déplacés vers le Nord de l'Espagne, notamment en Galice, et des chrétiens ont été installés en Andalousie dans les régions laissées vacantes.

On pense qu'environ la moitié des musulmans d'Andalousie se sont convertis au christianisme. Certains ont changé leur nom et sont devenus des chrétiens pratiquants, d'autres appelés crypto-Musulmans, ont été baptisés mais ont continué de pratiquer leur ancienne religion en secret. Il est donc probable que l'occupation Islamique a eu un profond impact sur la composition génétique de la péninsule Ibérique.

Des études génétiques précédentes ont montré que les populations Ibériques ne sont pas uniformes. Par exemple, les Basques sont caractérisés par de très hautes fréquences de l'haplogroupe R1b (87,1%) du chromosome Y, et une des plus faibles fréquences de l'haplogroupe E1b-M81 (2%) caractéristique des Berbères. Ce dernier marqueur se retrouve à 11,5% à Malaga, 10,5% en Galice et 8,6% en Cantabrie. Le marqueur E1b-M123 est supposé originaire du Proche-Orient. Ses plus hautes fréquences en Ibérie sont en Galice (5,2%) aussi élevée qu'en Tunisie (5,2%) et Algérie (3,1%). Le marqueur E1b-M78 est originaire d'Afrique de Nord-Est vers l'Egypte ou la Lybie. On le retrouve en Asturie (10%), au sud de l'Espagne (3,2%) et au sud du Portugal (4,1%). Un de ses sous-groupes E1b-V13 est spécifique de l'Europe et supposé diffusé pendant le début du Néolithique en Europe. Un squelette Néolithique de Catalogne appartient à ce sous-groupe. Le marqueur J1a-P58 est originaire du Moyen-Orient. Il est daté d'enviton 10.000 ans et est associé à la diffusion des bergers-chasseurs Sémitiques dans la Péninsule Arabique. Cet haplogroupe est relié notamment à l'arabisation de l'Afrique du Nord. On le retrouve à une fréquence qui varie entre 40 et 75% en Arabie. En Ibérie il a été seulement détecté en Andalousie avec une fréquence de 1,1%.

Du point de vue de l'ADN mitochondrial, l'haplogroupe U6 daté d'envrion 50.000 ans a été seulement observé en Galice (2,2%) et dans le nord du Portugal (4,3%). L'haplogroupe L1 se retrouve à Cordou (8,3%) et en Galice (3,7%).

María Regueiro vient de publier un papier intitulé: From Arabia to Iberia: A Y chromosome prospective. Les auteurs se sont focalisés sur la diffusion Islamique dans la pénisnule Ibérique. Pour cela, ils ont analysé les populations de la péninsule Arabique, de l'Afrique du Nord et de la péninsule Ibérique. Un total de 1233 hommes ont été testés pour leur ADN du chromosome Y. Ils sont de Tunisie, du Maroc, d'Espagne, du Qatar, d'Oman, du Yémen, d'Egypte, des Emirats Arabes Unis et de Bahrein. Un total de 8 marqueurs SNP en aval de J1a-P58 et 4 marqueurs SNP en aval de E1b-M81 ont été testés, ainsi que 17 marqueurs STR.
2015_Regueiro_Figure1_1.jpeg
2015_Regueiro_Figure1_2.jpeg

Sur les 1233 échantillons, 271 appartiennent à l'haplogroupe J1a-P58 et 136 à l'haplogroupe E1b-M81. J1a-L222* est le seul sous-groupe de J1a-P58 identifié en Afrique du Nord-Ouest: 25% à Sfax, 15% à Béja et 17% au Maroc. Cependant aucun échantillon d'Espagne appartient à ce groupe. En Espagne seul le sous-groupe J1a-L147* est détecté. Les plus hautes fréquences de J1a-L222* se retrouvent au Qatar (39%), à Oman (12%), en Egypte (5%), Bahrein (5%), aux Emirats Arabes Unis (2%) et au Yémen (2%). A l'inverse le sous-groupe J1a-L147 diminue du Yémen (59%) à Bahrein (2%). Le sous-groupe J1a-L65 est observé à faible fréquence au Qatar (7%), à Bahrein (2%) et au Yémen (2%), mais il atteint 21% aux Emirats Arabes Unis. Le sous-groupe J1a-L92 est seulement détecté dans 2 populations à basse fréquence dans les Emirats Arabes Unis (4%) et à Oman (3%). Le groupe J1a-P58* est trouvé à basse fréquence au Yémen (6%), à Bahrein (5%), à Oman (2%) et au Qatar (1%).

L'haplogroupe E1b-M81 est absent au Proche-Orient et en Egypte. On le retrouve en Afrique du Nord-Ouest et en Espagne. Le sous-groupe E1b-M183 représente 100% des E1b-M81 à Béja (55%), au Maroc (53%) et à Sfax (27%). Par contre en Espagne on trouve des échantillons E1b-M81*.

La figure ci-dessous représente les cartes de fréquence et de diversité pour les haplogroupes J1-M267 (2a et 2b) et E1b-M81 (2c et 2d):
2015_Regueiro_Figure2.jpeg

La figure ci-dessous représente le réseau des haplotypes appartenant au groupe J1-M267:
2015_Regueiro_FigureS2a.jpeg

La valeur modale (le plus gros cercle) est partagée par 54 individus d'Algérie, d'Egypte, du Maroc, du Qatar, des Emirats Arabes Unis, du Yémen et de Tunisie. On n'en trouve pas en Espagne. Les Berbères de Sened ne possèdent pas non plus cette valeur modale, peut-être dû au fait qu'ils ont une ascendance non Arabe.

Une Etude Multi Dimensionnelle a été réalisée basée sur la distance génétique des haplotypes J1a-P58. Les Galicien se situent à part:
2015_Regueiro_Figure3a.jpeg

La seconde dimension sépare non seulement les populations Tunisiennes (Béja et Sfax), mais aussi les populations Espagnoles (Andalousie et Galice), bien qu'elles se rejoignent par paires dans la première dimension.

Les estimations des âges du groupe J1a-P58 sont de 5300 ans à Oman, 4700 ans en Egypte et 4700 ans en Espagne. L'âge de J1a-L222* est de 2100 ans en Egypte, 1500 ans au Qatar, 1200 ans à Oman, 1800 ans au Maroc et 1800 ans en Tunisie.

Il n'y a pas d'haplotypes STR appartenant à l'haplogroupe E1b-M81 partagés entre l'Afrique du Nord et l'Espagne. La diversité de E1b-M81 est supérieure en Espagne, probablement suite à plusieurs migrations successives en provenance d'Afrique du Nord-Ouest.

La figure ci-dessous représente le réseau des haplotypes appartenant au groupe E1b-M81:
2015_Regueiro_FigureS2d.jpeg

La valeur modale est partagée par 165 individus de Tunisie, d'Algérie, des Touaregs de Lybie, du Maroc, du Portugal et d'Espagne.

L'estimation de l'âge de ces sous-clades a été fait en utilisant les taux de mutation évolutionnaire et généalogique. L'expansion la plus ancienne se retrouve en Espagne (5000 ans) et notamment en Andalousie (7000 ans). Ces valeurs sont probablement gonflées par l'arrivée de multiples migrations à différentes époques.

La présence de l'haplogroupe E1b-M81 dans la péninsule Ibérique peut s'expliquer par le récent influx des troupes Berbères recrutées par les Arabes durant l'expansion Islamique qui a débuté en l'an 711. Cependant de possibles migrations plus anciennes en provenance d'Afrique du Nord-Ouest sont à envisager. La présence de cet haplogroupe dans le nord-ouest de l'Espagne en Galice et en Cantabrie peut s'expliquer par les relocalisations des musulmans convertis à la fin du 16ème siècle. Une autre explication serait donnée par une éventuelle migration européenne dans le sud de l'Espagne qui aurait dilué le signal nord Africain, contrairement au nord de l'Espagne.

La région du croissant fertile est considérée comme la place d'origine la plus probable pour l'haplogroupe J et ses sous-clades J1 et J2. J2 est la sous-clade la plus fréquente en Europe, notamment le long des côtes méditerranéennes. Ce signal peut-être dû à l'expansion Néolithique, mais aussi à l'expansion Phénicienne ou à d'autres expansions maritimes. Des études précédentes de l'haplogroupe J1 ont montré qu'il apparait à hautes fréquences dans les populations parlant Arabe au Moyen-Orient, habituellement interprété comme reflétant l'expansion islamique du premier millénaire. D'autres événements démographiques ont été associés à cet haplogroupe comme la diffusion des chasseurs-cueilleurs ou des bergers-chasseurs Sémitiques d'Arabie. En effet l'âge de la sous-clade J1a-P58 correspond à la date supposée de la diffusion des langues Sémitiques autour de 5750 ans.

La distribution aléatoire dans les réseaux obtenus pour les différents haplogroupes et l'âge estimé équivalent d'une région à l'autre peut être indicatif de dynamiques de mouvements de populations lié à l'expansion islamique entre l'Arabie et l'Ibérie.

La mutation J1a-L65 est récente et montre une intéressante distribution géographique. Il est probable que cette mutation ait émergé après l'expansion islamique dans le Nord de l'Afrique. Sa fréquence est de 20,9% dans les Emirats Arabes Unis, et chute brutalement à 7,3% au Qatar, 2,4% à Bahrein et 1,6% au Yémen. Il est possible que la structure de la famille islamique basée sur plusieurs femmes peut avoir facilité l'expansion de J1a-L65 dans les Emirats Arabes Unis principalement.

La présence des haplogroupes E1b-M81 et J1a-P58 dans la péninsule Ibérique représente la signature de flux de gènes en provenance d'Afrique du Nord-Ouest et de la pénsinule Arabique respectivement. Cette étude a montré que ces données sont compatibles avec de multiples migrations en provenance d'Afrique du Nord-Ouest dont l'expansion islamique du 8ème siècle. Il est intéressant de noter que les plus hautes fréqeunces de ces haplogroupes en Espagne sont dans le nord-ouest et non en Andalousie comme on pouvait s'y attendre. Les auteurs proposent que ce fait soit lié à la relocalisation des musulmans convertis dans le nord ouest de l'Espagne, ou à la migration des crypto-Musulmans vers des régions plus sûres. Des migrations pré-islamiques peuvent également expliquer ces données.

mercredi 4 février 2015

Le peuplement du Groenland vu à travers l'ADN du chromosome Y

La région nord polaire a été colonisée par les hommes durant les 5000 dernières années. Les premiers paléo-eskimos sont arrivés de Béringie le long des côtes nord de l'Alaska et du Canada il y a environ 4500 ans. Ils ont atteint le Groenland il y a 4500 à 4000 ans. Il y a environ 3500 à 3000 ans, la culture Dorset s'est développée dans l'est du Canada autour de la Baie d'Hudson, puis s'est étendue vers l'ouest et le nord pour atteindre le Groenland il y a 2800 ans, et remplacer l'ancienne culture paléo-eskimo. Il y a environ 1000 ans, la culture Thule a émergé le long des côtes nord de l'Alaska, puis s'est répandue dans toute la région nord polaire pour atteindre le Groenland il y a environ 1000 ou 800 ans.

Des controverses existent encore aujourd'hui, au sujet d'un éventuel mélange génétique entre les populations Inuits des cultures Dorset et Thule. Il y a des indices qui montrent que la culture Dorset s'est éteinte avant l'arrivée de la culture Thule. Cependant d'autres études soutiennent que les cultures Dorset et Thule ont coexisté pendant 200 ans.

Les premiers européens sont arrivés au Groenland avec les Vikings de Norvège et d'Islande aux alentours de l'an 985. Ils se sont installés d'abord sur les côtes sud et ouest. Cependant, on pense que la population Viking n'a pas survécue après l'an 1450. Ensuite, en 1721, les Danois et les Norvégiens sont arrivés de nouveau au Groenland. Ils ont installé des comptoirs commerciaux pour échanger des produits avec les communautés locales des côtes du Groenland.

La population actuelle du Groenland est mélangée et contient des gènes Inuits et européens. Cependant les études mitochondriales ont montré que la très grande majorité des lignages maternels est d'origine Inuit. Au contraire les études du chromosome Y ont montré que les lignages paternels sont fortement mélangés, avec une composante européenne allant jusqu'à 45% de la génétique de la population du Groenland. Environ 50% des hommes du Groenland appartiennent à l'haplogroupe Q-M242.

Jill Katharina Olofsson vient de publier un papier intitulé: Peopling of the North Circumpolar Region – Insights from Y Chromosome STR and SNP Typing of Greenlanders. Dans cette étude 227 hommes du Groenland ont été testés sur 73 marqueurs SNP et 17 marqueurs STR. Afin de comparer cette population du Groenland à une population Scandinave, 241 Danois ont également été testés.

21 haplogroupes différents du chromosome Y ont été déterminés dans la population du Groenland:
2015_Olafsson_FigureB.jpeg

Deux sous-clades de Q-M242 sont prédominantes: Q-NWT01* et Q-M3*. Environ 40% des hommes du Groenland ont un haplogroupe européen (I, R1a ou R1b). Ces haplogroupes se retrouvent principalement sur la côte ouest et sud. Ces 3 haplogroupes forment la grande majorité de la population Danoise: I (39%), R1a (17%) et R1b (37%). 11 échantillons du Groenland et 13 échantillons Danois n'ont pu être affecté à un haplogroupe à partir des SNP testés. Cependant une prédiction a pu être obtenue à partir de leurs marqueurs STR. Ainsi 1 échantillon du Groenland a pu être prédit appartenant à l'haplogroupe Q-M242.

La plus grande diversité de la population du Groenland se trouve chez les Sermersooq de l'ouest et la plus faible diversité chez les Sermersooq de l'est. Elle se divise en trois groupes:

  • Les lignages Inuits (Q-NWT01 et Q-M3)
  • Les lignages européens (I, R1a et R1b)
  • Les lignages non déterminés


Il y a une décroisance des lignages Inuits le long de la côte du Groenland, de 82% chez les Sermersooq de l'est à 30% chez les Qeqqata à l'ouest. Les lignages européens croissent à l'inverse de 13% chez les Sermersooq de l'est à 64% chez les Sermersooq de l'ouest et 59% chez les Qeqqata.

Une analyse multidimensionnelle a été réalisée pour comparer les populations du Groenland avec d'autres populations du monde:
2016_Olafsson_Figure2.jpeg

La population des Sermersooq de l'est (croix violette à gauche) se situe à part des autres populations du Groenland, mais le plus proche des Inuvialuit du nord-ouest du Canada. Les autres populations du Groenland sont proches des populations de l'Alaska. Les populations de Qeqqata et des Sermersooq de l'ouest sont les plus proches des populations européennes.

La diversité des lignages européens des populations du Groenland sont similaires à la diversité des Danois, sauf pour l'haplogroupe R1a pour lequel la diversité des populations du Groenland est plus faible que celle des Danois. Les lignages Inuits ont une diversité 2 fois plus faible que les lignages européens. On peut penser, ainsi, que les lignages Inuits sont plus récents que les lignages européens.

La comparaison des haplotypes STR des populations du Groenland appartenant à un lignage Inuit avec les populations du nord-ouest canadien, montre qu'ils ont une origine commune. L'âge de la sous-clade Q-NWT01 est estimée entre 7.000 et 14.300 et l'âge de Q-M3 entre 4.400 et 10.900 ans. Cette dernière est donc plus récente, mais comme il y a un important chevauchement des deux estimations, il est difficile de savoir s'il s'agit d'une colonisation unique par ces deux sous-clades, ou de deux colonisations successives.

L'âge de la sous-clade Q-M3 au Groenland est plus faible que l'âge de cette même sous-clade dans le nord-ouest canadien. Il est donc probable que les porteurs de la sous-clade Q-M3 sont les descendants de la culture Thule qui prend son origine dans le nord de l'Alaska.

A l'inverse, l'âge de la sous-clade Q-NWT01 au Groenland est plus vieux que l'âge de cette même sous-clade dans le nord-ouest canadien. Il se pourrait ainsi que cette sous-clade soit arrivée en Amérique du nord et se soit ensuite diffusée avec la culture Dorset. Selon cette hypothèse, il y aurait donc bien eu un mélange génétique entre les cultures Dorset et Thule.

mardi 23 décembre 2014

Analyse génétique paternelle de la ville côtière de Sousse, Tunisie

Voici un papier de Karima Fadhlaoui-Zid sur la génétique paternelle de la ville de Sousse en Tunisie: Sousse: extreme genetic heterogeneity in North Africa.

Située dans le nord de l'Afrique, entre le Moyen-Orient et l'Europe, la Tunisie est un pays méditerranéen bordé par une côte de 1300 km de long. Grâce a sa situation stratégique, la Tunisie a toujours été à la croisée des chemins de nombreuses migrations depuis le paléolithique. La populations actuelle de Tunisie est donc le résultat de nombreux mélanges génétiques. Il y a environ 10.000 ans la culture mésolithique capsienne s'est étendue dans le nord du Maghreb pour se terminer avec l'arrivée des premiers fermiers néolithiques. Aux temps historiques, la Tunisie a été colonisée successivement par les phéniciens, les romains, les vandales, les byzantins et enfin les arabes à la fin du 7ème siècle de notre ère.

La ville de Sousse a été fondée au 11ème siècle av. JC, par les phéniciens. Depuis, elle a toujours été habitée et est devenue un important centre économique de la région. Dans cette étude, les auteurs ont testé l'ADN du chromosome Y de 220 hommes de la région de Sousse: 17 marqueurs STR et 51 marqueurs SNP ont été étudiés:
2014_FadhlaouiZid_Figure1.jpeg

Les résultats montrent que les haplogroupes dominant dans la population de Sousse sont E (56%) et J (34%). La sous-clade prédominante de l'haplogroupe E est E-M81 (44,6%) qui est le lignage prédominant des populations berbères d'Afrique du Nord. A côté on retrouve les sous-clades E-M78 (5,9%) et E-M123 (1,8%). E-M78 a une large distribution entre le Proche-Orient, l'Afrique du Nord et l'Europe, est représenté à Sousse essentiellement par sa sous-clade E-V65. La sous-clade prédominante de l'haplogroupe J est J-P58 qui est supposée originaire d'Anatolie orientale. Après ces 2 haplogroupes majoritaires, on retrouve l'haplogroupe R dans 5,5% des échantillons dont 0,45% de R1a et 0,9% de R1b-V88. Les autres haplogroupes trouvés: G-M201, L-L20, T-M184 et A-M91 sont insignifiants à moins de 1% chacun.

Ces résultats ont ensuite été comparés à 23 populations testées dans des études précédentes au Proche-Orient, en Afrique du Nord, en Europe et en Afrique sub-saharienne. Des cartes de fréquences ont alors été tracées pour les haplogroupes principaux:
2014_FadhlaouiZid_Figure2.jpg

Ainsi E-M81 est majoritaire en Afrique du nord-ouest, alors que E-M78 et E-M123 sont majoritaires en Afrique du nord-est. J-M267 est important dans toute l'Afrique du Nord et au Levant. J-P58 est important en Afrique de l'est et dans la péninsule arabique.

Ensuite des réseaux ont été construits à partir des haplotypes issus des marqueurs STR pour les haplogroupes majoritaires:
2014_FadhlaouiZid_Figure3.jpg

L'haplogroupe E-M81 se retrouve essentiellement en Afrique du nord-ouest. Le réseau est en forme d'étoile. Son âge est estimé à environ 5.700 ans. Le réseau E-M78 est beaucoup plus diversifié que E-M81. Son âge est estimé à environ 12.200 ans. Le réseau de J-M267 comprend essentiellement des haplotypes du Proche-Orient. Son âge est estimé à environ 7.600 ans. Le réseau J-M172 est également composés d'haplotypes issus majoritairement du Proche-Orient. Son âge est estimé à environ 15.800 ans. Enfin le réseau R-M207 est composé principalement d'haplotypes européens.

Enfin une Analyse en Composantes Principales basée sur la fréquence des haplogroupes a été réalisée:
2014_FadhlaouiZid_Figure4.jpg

Les populations d'Afrique du Nord se regroupent en haut à gauche du schéma ci-dessus à gauche, sauf les égyptiens qui se regroupent avec les palestiniens à la droite du schéma. Ce groupe d'Afrique du nord est caractérisé par les hautes fréquences de l'haplogroupe E-M81. Parmi les populations d'Afrique du nord, la population de Sousse se regroupe avec les tunisiens des villes et des tunisiens andalous, ainsi que des populations plus génériques comme les algériens, les marocains ou les libyens. Les tunisiens berbères se regroupent à part dans le coin supérieur gauche. Une Analyse Multidimensionnelle permet d'obtenir des résultats similaires (schéma ci-dessus à droite).

L'haplogroupe E-M81, majoritaire, en Afrique du Nord et notamment chez les populations berbères, représentent probablement un ancien lignage de cette région. Son âge estimé relativement faible peut être affecté par une importante dérive génétique. Il pourrait être ainsi considérablement plus ancien. Les autres haplogroupes E ou J représentent probablement des migrations plus récentes en provenance du Proche ou du Moyen Orient. Ces migrations peuvent être liées à l'arrivée de la culture néolithique dans la région, mais également à l'invasion arabe de la fin du 7ème siècle de notre ère (notamment pour J-M267). L'haplogroupe J-M172 est représenté à Sousse uniquement par sa sous-clade J-M410. J-M172 a été associé à la migration néolithique, mais également à la dispersion phénicienne.

vendredi 5 décembre 2014

Phylogéographie de l'haplogroupe E1b-M81 au Maroc

Voici un papier intéressant de Ahmed Reguig: Phylogeography of E1b1b1b-M81 Haplogroup and Analysis of its Subclades in Morocco.

L'haplogroupe E du chromosome Y est observé en Afrique, en Europe et au Proche-Orient. Sa sous-clade la plus répandue est E1b-M35 qui se divise en trois groupes: E1b-M78 originaire d'Afrique de l'est, E1b-M123 qui se diffuse au Proche-Orient et E1b-M81 qui est le lignage paternel le plus répandu en Afrique du nord-ouest. Ce dernier groupe se subdivise ensuite en plusieurs sous-clades: E1b-M107, E1b-M183 et E1b-M165:
2014_Reguig_Figure1.jpeg

Les ethnies parlant berbère représentent les ancien habitants d'Afrique du nord-ouest. Au Maroc, les groupes berbères parlent diférents dialectes dont les trois principaux sont le Tarifit, le Tamasight et le Tachelhit parlés respectivement dans le nord, le centre et le sud du pays.

L'objectif de cette étude est de donner une description précise de l'haplogroupe E1b-M81 et de ses sous-clades parmi les populations berbères du Maroc. Pour cela, 295 hommes marocains parlant le berbère ont été testés: 43 sont du nord, 187 sont du centre et 65 sont du sud:
2014_Reguig_Figure2.jpeg

Les résultats sont les suivants:
2014_Reguig_Table2.jpeg

La sous-clade dominante est E1b-M183 avec des fréquences de 65%, 67% et 83% respectivement au nord, dans le centre et au sud du Maroc. Aucun individu de cette étude appartient aux 2 sous-clades E1b-M107 et E1b-M165. Les deux SNPs M107 et M165 ont été trouvés jusqu'ici que dans 1 seul individu et doivent être récents.

On suppose que le lignage E1b-M81 est d'origine paléolithique ou du début du néolithique. La sous-clade E1b-M35 a pu émerger en Afrique de l'est. Ensuite, la sous-clade E1b-M81 a pu se disperser vers l'Afrique du nord-ouest.

Les études précédentes ont montré que E1b-M81 varient entre 23% et 76% au Maroc et atteint 80% parmi les berbères mozabites d'Algérie et 49% parmi les touaregs de Lybie.

Cependant, une fréquence modérée de E1b-M81 apparait aussi parmi les populations arabes d'Afrique du nord, dont 23% à 33% au Maroc, 45% en Algérie, 28% en Tunisie et 9% en Egypte. Au contraire, E1b-M81 est absent en Afrique sub-saharienne, au Moyen-Orient et en Europe du nord. Il est cependant présent en Europe du sud, probablement suite aux influences arabes entre 711 et 1492.
2014_Reguig_Figure3.jpeg

L'âge de l'ancêtre commun de tous les E1b-M81 est estimé entre 8100 et 8600 ans.

mardi 2 décembre 2014

Vagues de migrations néolithiques en Arménie

Anahit Hovhannisyan vient de publier un papier intitulé: Different waves and directions of Neolithic migrations in the Armenian Highland.

Récemment, il a été proposé que les haplogroupes du chromosome Y suivants ont été impliqués dans les migrations néolithiques à partir du croissant fertile: E1b, J2, G et R1b. Ainsi l'haplogroupe R1b qui est le plus fréquent en Europe Occidentale est sujet à de nombreux débats entre les partisans de sa présence en Europe occidentale au paléolithique et les partisans de son arrivée en Europe occidentale seulement au néolithique. Inversement les haplogroupes G et J2 sont largement distribués au Caucase, au Proche-Orient et en Europe du sud, avec leur plus haute fréquence dans le Caucase.

L'objectif de cette étude est d'étudier l'influence de l'Arménie dans ces différentes migrations néolithiques. Pour cela les auteurs ont testé l'ADN du chromosome Y de 757 individus mâle dans différentes régions distinctes des hauteurs d'Arménie. Des résultats d'études précédentes comprenant 413 échantillons ont été joints à ce travail:
2014__Hovhannisyan_Figure1.jpeg

Les fréquences des différents haplogroupes du chromosome Y sont les suivants:
2014__Hovhannisyan_Figure2.jpeg

L'haplogroupe R1b est le plus fréquent pour toutes les populations sauf les Sasun pour lesquels l'haplogroupe T est le plus fréquent. Les autres haplogroupes les plus fréquents sont J2 et G.

Una Analyse en Composantes Principales a été effectuée. Celle-ci sépare les populations du Proche-Orient et de l'est de l'Europe des populations du nord du Caucase d'une part et des populations d'Europe occidentale d'autre part:
2014__Hovhannisyan_Figure3.jpeg

Les populations d'Arménie se regroupent avec les populations du Proche-Orient et de l'est de l'Europe. Les populations d'Europe occidentale sont reliées principalement à l'haplogroupe R1b, les populations du nord du Caucase sont reliées à l'haplogroupe G, et les populations du Proche-Orient sont reliées à l'haplogroupe J2.

La fréquence de l'haplogroupe R1b montre un gradient continu entre le Liban (7%) et l'Irlande (82%). Cet haplogroupe est également fréquent en Arménie. Au contraire, la variance de l'haplogroupe R1b décroit du Proche-Orient vers le nord-ouest, mais aussi vers le nord-est. En fait l'analyse des distances génétiques montre 2 groupes distincts à l'intérieur de l'haplogroupe R1b. Le premier est situé en Europe et le second au Proche-Orient.
2014__Hovhannisyan_Figure5.jpeg

La fréquence de l'haplogroupe J2 est maximale dans le Caucase et au Proche-Orient. Sa variance est maximale au Levant. La fréquence de l'haplogroupe G est maximale dans le Caucase, alors que sa variance est maximale au Levant et en Arménie.

Ces observations indiquent clairement des directions de migrations pour ces différents haplogroupes. L'haplogroupe R1b a ses origines dans la partie occidentale de l'Arménie et se déplace vers l'Europe occidentale. L'haplogroupe G a ses origines au Levant et se dirige vers le Caucase. Enfin l'haplogroupe J2 montre un double mouvement vers l'Europe de l'est et le nord du Caucase. Ces mouvements peuvent être résumés dans la figure ci-dessous:
2014__Hovhannisyan_Figure8.jpeg

On peut regretter que cette étude ne prenne pas en compte les derniers résultats des tests d'ADN ancien. En effet ceux-ci montrent clairement que le mouvement néolithique en Europe a été accompagné par une migration de l'haplogroupe G jusqu'en Europe occidentale en suivant deux routes: une maritime et une continentale. De plus l'haplogroupe R1b ne semble pas arriver en Europe avant la fin du néolithique ou au chalcolithique en suivant probablement les mêmes routes que l'haplgroupe G, mais plusieurs millénaires après.

vendredi 28 novembre 2014

Environnement, langages et lignages paternels dans le Caucase

David Tarkhnishvili vient de publier un papier intérressant intitulé: Human Paternal Lineages, Languages and Environment in the Caucasus.

La diversité des haplogroupes du chromosome Y est le plus souvent utilisée pour analyser l'ascendance de groupes ethniques ou linguistiques. Ceci est du probablement au fait que les femmes ont un taux de dispersion plus élevé que les hommes. Le Caucase est une des régions d'Eurasie, les plus diversifiées linguistiquement et culturellement. Les langues du Caucase se regroupent en trois grandes familles: Caucasienne, Indo-Européenne et Turque. Certaines frontières ethniques correspondent à des frontières linguistiques, mais pas toutes.

La population du Caucase appartient principalement à l'un des haplogroupes suivants du chromosome Y: G2, J2, J1, R1b, et R1a. D'autres haplogroupes comme I2, E1b1b et L existent dans le Caucase, mais sont plus rares. L'haplogroupe G2 domine dans l'ouest et le centre-nord. R1b est fréquent en Arménie et J1 dans le Daghestan. Il y a de hautes fréquences de R1a dans les régions du Nord Caucase parlant le Turc. J2 est également fréquent dans le Caucase comme dans une bonne part de l'Asie de l'ouest.

Dans cette étude, les auteurs ont testé 224 échantillons issus d'hommes de Géorgie, mais ont aussi utilisé des résultats issus d'études précédentes. En tout 20 ethnies différentes d'Arménie, de Turquie, d'Azerbaïdjan, du nord du Caucase et de Géorgie ont été analysées. Pour ces échantillons 23 marqueurs STR du chromosome Y ont été testés.
2014_Tarkhnishvili_Figure1.jpeg

Pour chaque échantillon, le langage et la niche écologique (température, pente, taux de couverture de la canopée) d'origine ont été enregistrés.

La figure ci-dessous montre les fréquences des principaux haplogroupes obtenues dans les différentes régions du Caucase:
2014_Tarkhnishvili_Figure2.jpeg

G2 atteint 80% chez les populations qui parlent le Svane du groupe linguistique Kartvélien, J2 atteint 82% chez les populations qui parlent l'Ingouche du groupe linguistique Vainakh, R1b atteint 50% chez les Georgiens parlant une langue Kartvelienne, proche de l'Arménie. De manière plus globale, R1b est surtout présent en Arménie. L'haplogroupe R1a est le plus fréquent dans le nord-ouest du Caucase dans les populations parlant une langue Kypchak appartenant au groupe linguistique Turc. Enfin, J1 domine dans l'est du Caucase avec un pic à 92% chez les populations parlant le Darghin du groupe linguistique Daghestanien.

Ensuite une étude multivariante proche de l'Analyse en Composantes Principales a été réalisée. D'abord les fréquences des haplogroupes du chromosome Y ont été comparées avec les types de paysage. De manière générale, les haplogroupes se rapprochent davantage des types de paysage que des groupes linguistiques, à l'exception de R1b. En effet, les fréquences de G2 augmentent avec le taux de couverture de la canopée en Montagne. A l'inverse les fréquences de J1 augmentent quand le taux de couverture de la canopée diminue en Montagne.

La figure ci-dessous résume les liens entre les haplogroupes, les langages et les aires géographiques d'origine:
2014_Tarkhnishvili_Figure4.jpeg

J2 prend ses origines dans une zone où les langues hourro-urartéennes étaient parlées à l'Age du Bronze. Ces langages sont reliés aux langues Vainakh et Daghestanien. R1a et R1b sont habituellement associés aux langages Indo-Européens respectivement de l'est et de l'ouest. Ainsi il y a une forte fréquence de R1b en Arménie. R1a est fréquent au nord ouest du Caucase dans une zone parlée aujourd'hui par des populations de langues turques, mais devaient autrefois parler une langue proche du Scytho-sarmate: une langue Indo-Européenne. Bien que l'Ossetien soit une langue proche du Scytho-sarmate, il est parlé aujourd'hui par des populations avec une haute fréquence de G2 et non de R1a. Les langues Adyghéennes sont parlées par des populations à majorité G2.

L'association de G2 avec les zones montagneuses couvertes de forêts, peut provenir de la zone qui a servi de refuge glaciaire à ces populations. Les populations J1 et J2 ont préféré les zones non montagneuses ou sans forêt, avant de coloniser les zones du croissant fertile propices à l'émergence de l'agriculture. Plus tard, les populations R1b en provenance d'Anatolie de l'ouest, et les populations R1a en provenance des plaines d'Europe de l'est sont arrivées dans le Caucase. Ces résulats sont en accord avec d'autres études qui suggèrent que la structure génétique du Caucase s'est mise en place bien avant sa structure linguistique. Ceci est particulièrement vrai pour les haplogroupes G2a et J2. En effet les communautés rurales changent de langages en fonction des circonstances politiques sans changer leur environnement préféré et leur structure génétique. Ainsi l'haplogroupe G2 est fréquemment associé aux montagnes couvertes de forêt non seulement dans le Caucase, mais également dans les Alpes et les provinces iraniennes de Gilan et Mazenderan au sud de la mer Caspienne. Dans les régions où J2 est fréquent on retrouve soit des montagnes non boisées, soit des plaines. J1 se retrouve essentiellement dans les montagnes arides. Seuls les haplogroupes R1a et R1b ne semblent pas avoir d'environnement privilégié, probablement parce qu'ils sont arrivés plus tardivement dans le Caucase, et ont du prendre les places laissées vacantes par les autres populations.

mardi 15 juillet 2014

Variation du chromosome Y à Taïwan et dans les îles de l'Asie du sud-est

Jean A Trejaut vient de publier un papier intitulé: Taiwan Y-chromosomal DNA variation and its relationship with Island Southeast Asia.

La population Taïwanaise comprend 3 types d'habitants: les Hans sont les plus nombreux et descendent d'immigrants qui sont arrivés sur l'île il y a environ 400 ans, les tribus des montagnes incluent 12 des 14 groupes ethniques de l'île et représentent 2% de sa population totale, les tribus des plaines qui se sont beaucoup mélangés avec les Hans représentent 1% de la population totale. Les tribus des montagnes, ainsi que les Philippins et et les Indonésiens parlent des langues austronésiennes. Cette famille linguistique comprend 10 branches à sa base dont 9 sont situées exclusivement sur l'île de Taïwan. La dixième branche est parlée à Madagascar, dans les îles de l'Asie du sud-est et en Océanie jusqu'à l'île de Pâques. On suppose que l'origine des langues Austronésienne est située à Taïwan à cause de sa diversité linguistique.

Les indices archéologiques indiquent que la culture Austronésienne s'est diffusée dans les îles de l'Asie du sud-est via Taïwan il y a environ 4500 ans, avant l'âge de fer. Les études génétiques mitochondriales montrent également que les individus qui parlent l'Austronésien, ont leur origine en Asie du sud-est, via Taïwan. La théorie de la Sortie de Taîwan (Out Of Taïwan) indique qu'une unique migration a propagé les langues Austronésiennes dans les îles de l'Asie du sud-est il y a un peu plus de 4000 ans. Cependant, d'autres études semblent indiquer un mouvement inverse des îles de l'Asie du sud-est vers Taïwan.

Plusieurs études génétiques du chromosome Y ont montré l'importance de l'expansion de l'haplogroupe O-M175 en Asie de l'est et dans les îles de l'Asie du sud-est. Cette expansion prend son origine en Chine du sud-est aux temps pré-néolithiques. Cependant la résolution phylogénétique de cet haplogroupe O reste mal connue. Dans cette étude, les auteurs ont testé 81 SNPs et 17 marqueurs STRs sur 1660 individus appartenant à 35 populations de Taïwan, les Philippines, l'Indonésie, de Thaïlande, du Viet-Nam et de Chine:
2014 Trejaut Figure 1

Pour comparaison, des données issues d'autres populations du sud de la Chine, des îles de l'Asie du sud-est et d'Océanie, ont été prises en compte. La distribution des fréquences des différents haplogroupes a ensuite été déterminée pour chacune de ces populations:
2014_Trejaut_Figure2.jpeg

Dans toutes ces populations, l'haplogroupe O est largement majoritaire. Ensuite, des cartes de distribution ont été tracées pour certains haplogroupes:
2014 Trejaut Figure 3

L'estimation de l'âge des différents haplogroupes a été également déterminée en utilisant le taux de mutation de Zhivotovsky appliqué sur 13 marqueurs STRs:
2014 Trejaut Table 2

Sur l'île de Taïwan, l'haplogroupe O représente environ 90% de l'ensemble de la population Han, 95% des tribus des plaines et plus de 99% des tribus des montagnes. L'haplogroupe O* est très rare: un seul représentant aux Philippines, chez les tribus des plaines et chez les Hans de Chine.

L'haplogroupe O1a-M119* se retrouve à 42% sur l'île de Batan aux Philippines, de 4 à 33% aux Philippines et de 4 à 18% en Indonésie. Il a une distribution éparse de 3 à 33% parmi les tribus des montagnes à Taïwan, bien que les fréquences supérieures à 10% se retrouvent dans le sud. Sa diversité décroit de la Chine vers le sud, bien qu'il y ait un second pic autour des Moluques. L'estimation de son âge est maximale autour de 20.000 ans dans les tribus des montagnes à Taïwan et aux Philippines.

L'haplogroupe O1a1-P203* est le plus fréquent chez les tribus des montagnes du nord et les Tsou avec une fréquence proche de 90%. Chez les tribus des montagnes du sud il est plus faible autour de 50%. Il est également fréquent chez les tribus des plaines. Il est nettement moins fréquent aux Philippines (13,7%) et en Indonésie (16,3%). Il est cependant plus fréquent au Kalimantan à Bornéo (36%). Il est également relativement fréquent parmi les Hans de Chine (22%) ou de Taïwan (14,2%). Il est rare en Thaïlande (2,7%) et inexistant au Viet-Nam. Le réseau des haplotypes est en forme d'étoile. Son âge est maximal chez les tribus des montagnes de Taïwan et aux Philippines avec une valeur voisine de 16.000 ans.

L'haplogroupe O1a2-M50 est fréquent parmi les tribus des montagnes du sud (entre 18 et 28%) et chez les Bunun (61%). Il est variable aux Philippines entre 3 et 16,7%. Il est plutôt rare dans l'ouest de l'Indonésie (5,3%). Cependant une très haute fréquence (80%) a été détectée dans l'île de Nias du sud dans l'océan indien, au large de Sumatra. Il est rare chez les Hans de Taïwan et de Chine, en Thaïlande, au Viet-Nam et en Malaisie. L'estimation maximale de son âge se situe dans les tribus des montagnes avec une valeur de 17.500 ans.

L'haplogroupe O2 se divise en deux branches. La première comprend O2-P31* observé chez les Hans (4%), les tribus des plaines (5,7%), les Philippines (4,7%), et l'Indonésie (3,25%). et O2a-PK4 observé principalement dans le sud de la Chine, en Indochine et en Indonésie. La seconde branche comprend O2b-SRY465 trouvés parmi les coréens, les japonais et les chinois du nord.

Les sous-clades de l'haplogroupe O3 les plus largement distribuées géographiquement sont O3a1c*, O3a2-P201*, O3a2b-M7* et O3a2c-P164*. O3a1c* se retrouve à 25% chez les Hans de Chine, à 13 et 21% chez les Minnan et Hakka de Taïwan, 12% chez les tribus des plaines. Il est très rare chez les tribus des montagnes, aux Philippines et en Indonésie. O3a2-P201* est maximal chez les Puyuma (4,35%), et n'excède pas 2% dans les autres populations. O3a2b-M7* est rare chez les Hans de Chine, à Taïwan, et aux Philippines. Il est cependant plus fréquent en Indonésie (8,54%), en Indochine (12,5% au Viet-Nam et 6,7% en Thaïlande). O3a2c-P164* est fréquent chez les tribus des montagnes de la côte est (entre 5 et 36%), aux Philippines (entre 8 et 50%) et à l'ouest de l'Indonésie (11,8 à 20%). Il est plutôt rare en Indochine et chez les Hans.

Enfin les haplogroupes: C, D, F*, H, K*, N, P*, Q et R sont observés à basse fréquence dans la région avec une distribution éparse.

Une Analyse à l’Échelle Multidimensionnelle a été réalisée:
2014 Trejaut Figure 5

Beaucoup de populations sont localisées au centre du graphe avec des groupes parlant une langue Austronésienne en Indonésie et aux Philippines entourés par des populations du Viet-Nam, de Thaïlande et de Malaisie. La plupart des tribus des montagnes sont situées dans le quart du bas à droite, et les Hans de Chine ou de Taïwan en haut à gauche. Les tribus des plaines s'étendent de la gauche des Hans (Yunlin et Papora) jusqu'à proximité des tribus des montagnes du sud (Pazeh et Siraya). Ces deux derniers groupes sont probablement les moins sinisés. La relation de ce graphe avec les haplogroupes est la suivante. L'haplogroupe O2 se retrouve principalement dans les groupes situés en haut à gauche, alors que l'haplogroupe O1 croit en fréquence lorsque on se rapproche du coin en bas à droite pour être maximal avec les tribus des montagnes du nord.

Les groupes Bunun, Akha, Atayal et Tsou se distinguent par leur faible diversité. Ainsi on ne trouve que 3 haplogroupes parmi les 56 individus Bunun (O1a2-M50 à 61% et O2a1a-M88 à 37.5%). On ne trouve également que 3 haplogroupes parmi les 41 Tsous et 52 Atayal pour lesquels l'haplogroupe O1a1-P203* se retrouve à 90%. Les tribus des montagnes du nord se distinguent par la très haute fréquence de cet haplogroupe O1a1-P203*.

Une simulation de mélange génétique a été réalisée en prenant deux populations source: les Hans ancestraux et les Austronésiens ancestraux. les résultats obtenus sont les suivants:
2014 Trejaut Table 3

Seules les tribus des plaines ont une majorité issue de la population Han ancestrale (62 ou 79% selon le modèle).

La variance moléculaire a également été calculée. Elle est minimale chez les tribus des montagnes ce qui est consistant avec la faible diversité génétique de ces populations.

Discussion

L'haplogroupe O reflète une relation ancestrale des populations contemporaine avec les premières populations d'Asie de l'est. La faible diversité génétique des tribus des montagnes est associée à des variations à l'intérieur de l'haplogroupe O1. Par contraste les populations non originaire de Taïwan, ainsi que les tribus des plaines ont une plus grande diversité génétique qui regroupe 26 branches distribués dans les sous-clades O1,O2 et O3. Ces résultats suggèrent un mélange génétique important chez les tribus des plaines qui n'existe pas chez les tribus des montagnes. Une dérive génétique importante due à une faible taille de la population et à un isolement est l'explication probable de la faible diversité des tribus des montagnes.

Une récente étude de l'ADN mitochondrial à Taïwan a mis en évidence un décroissement de la diversité génétique du nord vers le sud. De manière intéressante cette étude sur le chromosome Y montre une tendance inverse puisque la diversité génétique décroit du sud vers le nord. Cette décroissance est liée avec l'accroissement de la fréquence de l'haplogroupe O1a1-P203*. Ces résulats suggèrent une histoire démographique différente entre les hommes et les femmes des tribus des montagnes. L'haplogroupe O1a1-P203* est observé à hautes fréquences entre 40 et 60% dans toutes les tribus des montagnes du sud et de l'est, et à plus de 87% dans toutes les tribus des montagnes du nord. A l'inverse sa fréquence n'excède pas 20% aux Philippines et en Indonésie. Il est cependant commun dans le sud et l'est de la Chine où il est probablement originaire. Un autre haplogroupe important: O1a2-M50 est fréquent parmi les tribus des montagnes du sud, mais rare chez les Hans de Taïwan. Cette étude supporte une expansion de Taïwan vers les Philippines et l'Indonésie.

Un résultat également intéressant est la haute fréquence de O2a1a-M88 chez les Bunun (37,5%). Les haplotypes de cet haplogroupe chez les Bunun se rapprochent de ceux des groupes parlant une langue daïque et des groupes d'Indochine ou d'Indonésie. Ceci implique une probable origine de l'haplogroupe O2 à Madagascar ou les îles Salomon.

L'haplogroupe O3 est le plus diversifié sur le continent sud-est asiatique. Il représente probablement un flux génétique lié à la migration des Hans.

Le modèle de pince

Il a été proposé qu'après la colonisation initiale de l'Asie du sud-est et de l'Indochine il y a 50.000 ans, apportant les haplogroupes C, M et S, l'origine et la diffusion de plusieurs haplogroupes peuvent être retracées en 4 étapes suivant un modèle démographique paternel. Les étapes B,C et D correspondent à un flux génétique originaire du continent vers les îles de l'Asie du sud-est suivant un modèle de pince. Une branche du nord se diffuse à travers Taïwan et une branche du sud à travers l'Indonésie. Ces deux branches se rejoignent aux Philippines. Les résultats de cette étude sont cohérents avec ce modèle, avec un gradient à faible diversité à travers l'Indonésie et un autre à faible diversité à travers Taïwan. La branche du nord a apporté les haplogroupes O1a-M119*, O1a1-P203* and O1a2-M50, d'abord à Taïwan, puis aux Philippines et en Indonésie. Elle correspond à une dispersion Austronésienne d'agriculteurs. La branche du sud a apporté les haplogroupes O2a1-M95/M88, O3a-M324*, O3a1a-M121, O3a1c*, O3a2-P201*, O3a2a-M159, O3a2b-M7*, O3a2c-P164* et O3a2c1a-M133. Elle correspond à un influx de chasseurs-cueilleurs en provenance du continent asiatique. Les bouts des deux branches se sont croisés aux Philippines.

Il est probable que les deux haplogroupes: O1a2-M50 et O2a1-M95/M88 ont atteint l'Indonésie selon deux migrations différentes. O1a2-M50 est arrivé avec la branche du nord alors que O2a1-M95/M88 est arrivé avec la branche du sud du modèle de pince. Ils se sont rencontrés en Indonésie de l'ouest, à Bornéo ou à Sumatra. Plus tard, de nouvelles migrations, les ont apporté avec O3a2c-P164, vers l'est jusqu'aux îles Salomon et vers l'ouest jusqu'à Madagascar.

Enfin, bien que les tribus des plaines à Taïwan ressemblent génétiquement aux Hans de Taïwan, leur forte diversité des haplotypes non partagés avec les Hans suggèrent une arrivée de ces tribus des plaines à Taïwan avant l'arrivée des Hans, probablement il y a entre 2 et 6.000 ans.

- page 1 de 2