Généalogie génétique

Aller au contenu | Aller au menu | Aller à la recherche

jeudi 27 juillet 2017

Analyse mitochondriale des populations du Nord-Ouest de l'Amazonie

L'Amazonie du Nord-Ouest abrite une forte diversité biologique, linguistique et culturelle qui reflète probablement l'hétérogénéité du paysage notamment le réseau complexe des rivières. Cette région s'étend des contreforts des Andes à l'Ouest jusqu'à la région comprise entre les rivières Orinoco et Rio Negro à l'Est, et jusqu'à la confluence entre le Rio Negro et la rivière Amazone au Sud. Elle abrite des groupes ethnolinguistiques appartenant aux familles Sud Américaines comme les langues arawaks, les langues caribes, les langues tupi et les langues quechua. De plus certaines langues locales sont aussi présentes comme les langues tucanoanes, les langues guahibanes, les langues witotoanes, les langues bora, les langues peba-yaguanes, les langues salivanes et les langues maku-puinaves. Elle a de plus été supposée comme la région d'origine des langues arawaks car elle contient la plus grande diversité linguistique de cette famille. De plus elle comprend toutes les langues de la famille tucanoane. Les langues caribes, tupi et quechua sont probablement arrivées récemment dans la région.

En terme de diversité culturelle, il y a des variations dans les pratiques de subsistance et de mariages. Certains groupes sont des chasseurs-cueilleurs, d'autres des agriculteurs. Cette région abrite un important réseau d'échanges et de commerce. Certains groupes parlant une langue tucanoane de l'Est et leurs voisins arawaks dans les bassins du Rio Negro et de la rivière Vaupés, pratiquent un échange marital basé sur l'exogamie linguistique: les deux mariés parlent une langue différente.

Leonardo Arias et ses collègues viennent de publier un papier intitulé: High Resolution Mitochondrial DNA Analysis Sheds Light On Human Diversity, Cultural Interactions And Population Mobility In Northwestern Amazonia. Ils ont séquencé l'ADN mitochondrial de 439 individus appartenant à 40 groupes ethnolinguistiques d'Amazonie du Nord-Ouest:
2017_Arias_Figure1.jpg

La plupart des échantillons appartiennent aux haplogroupes spécifiques des Amérindiens: A2 (138), B2 (73), C1 (181) et D1 (38). Les neuf derniers échantillons sont des métis. La table suivante donne les fréquences des haplogroupes par groupe ethnolinguistique:
2017_Arias_Table2.jpg

Les auteurs ont ensuite réalisé une analyse en correspondance basée sur la fréquence des haplogroupes:
2017_Arias_Figure2.jpg

La figure ci-dessus ne montre pas de regroupement par famille linguistique, à l'exception des groupes tucanoanes de l'Est (en vert ci-dessus), bien que les Tanimuka se situent à part. De plus les groupes guahibanes (en bleu clair) se regroupent également entre eux. Certains regroupements semblent liés à la proximité géographique ou à l'appartenance au même réseau de rivières.

La diversité mitochondriale de ces groupes est assez importante en moyenne, notamment les groupes tucanoanes de l'Est sauf les Tanimuka. Les chasseurs-cueilleurs Nukak montrent la plus faible diversité génétique avec seulement quatre haplotypes différents sur 16 échantillons. En moyenne les groupes d'agriculteurs ont une plus grande diversité génétique que les groupes de chasseurs-cueilleurs.

En tout, il y a 216 haplotypes différents sur 412 séquences considérées. Parmi eux, 146 sont uniques et 70 sont partagés entre 266 séquences. 52 haplotypes sont partagés dans la même populations, 31 entre des individus de populations différentes et 13 dans la même population et dans plusieurs populations différentes. La quantité d'haplotypes partagés entre des populations différentes est élevée dans cette étude comparée à d'autres études sur des populations d'autres régions du monde. En effet dans ces autres régions, la majorité des haplotypes partagés, le sont à l'intérieur d'une même population. La figure ci-dessous montre la matrice des haplotypes partagés à l'intérieur et entre les différentes populations d'Amazonie du Nord-Ouest:
2017_Arias_Figure4.jpg

Les Sirianos, les Pastos et les Other ET (autres tucanoanes de l'Est) sont les seuls groupes qui ne partagent pas d'haplotypes à l'intérieur de leur population. Les groupes qui partagent le plus d'haplotypes avec d'autres populations sont les arawaks et les tucanoanes de l'Est. Les arawaks partagent des haplotypes avec des groupes situés géographiquement à proximité, alors que les tucanoanes de l'Est partagent des haplotypes avec d'autres groupes tucanoanes de l'Est.

Le réseau des haplotypes permet de mettre en évidence de nouveaux regroupements en fonction des différents haplogroupes:
2017_Arias_FigureS5.jpg

Les auteurs ont ensuite réalisé des analyses de la variance moléculaire avec le logiciel AMOVA dans lesquelles ils ont testé différentes hypothèses en définissant des groupes à priori basés sur la langue, la proximité géographique et la distribution le long des rivières principales. Les résultats ont montré que la structure génétique est davantage liée à la distribution des groupes ethnolinguistiques le long des rivières principales. Ainsi la langue ne constitue pas une barrière au flux de gènes. Les rivières servent de moyen de communication et de subsistance. Elles forment également une distinction entre les groupes qui vivent près d'elles et dont la subsistance est basée sur l'horticulture et la pêche, et les groupes des forêts qui habitent entre les rivières et dont la subsistance est basée sur la chasse et la cueillette. La rivière a également de l’importance dans les croyances et la cosmogonie de ces peuples.

lundi 10 avril 2017

Origine et diffusion de l'haplogroupe mitochondrial U7

Les tests d'ADN ancien sur des squelettes ont largement élargi notre connaissance de la démographie des hommes modernes durant la préhistoire, révélant notamment des migrations majeures en Europe durant l'Holocène mais aussi à la fin du Pléistocène. Ainsi l'haplogroupe mitochondrial U regroupe la très large majorité des mitogénomes d'Europe au Paléolithique et au Mésolithique. Cet haplogroupe est divisé en quatre clades principales: U1, U5, U6 et une quatrième clade qui englobe U2, U3, U4, U9, U7 et U8. U1 et U3 sont principalement restreintes au Proche-Orient, U4 et U5 à l'Europe, U6 au pourtour Méditerranéen avec un pic de fréquence en Afrique du Nord, U8 au Proche-Orient et en Europe, U9 en Arabie, Éthiopie et Inde et U2 en Asie du Sud bien que ses sous-clades U2d et U2e se retrouvent au Proche-Orient et en Europe.

Comparé à ces résultats, la structure phylogénétique et l'origine de la clade U7 restent obscures. Elle est caractérisée par de basses fréquences et de faibles diversités malgré une distribution géographique qui s'étend de l'Europe à l'Inde. Récemment elle a été détectée dans un squelette d'Iran daté d'environ 6000 ans, et dans des restes osseux du Bassin du Tarim dans le Nord-Ouest de la Chine, datés de 4000 à 3500 ans.

Hovhannes Sahakyan et ses collègues viennent de publier un papier intitulé: Origin and spread of human mitochondrial DNA haplogroup U7. Ils ont séquencé 267 mitogénomes de l'haplogroupe U7 sur l'ensemble de sa distribution géographique qu'ils ont ajoutés aux séquences préalablement publiées pour obtenir un arbre phylogénétique de 367 séquences U7. Dans, la figure ci-dessous, les couleurs représentent la région d'origine des séquences: bleu clair pour l'Europe, bleu foncé pour le Proche-Orient, vert pour l'Asie du Sud et orange pour l'Asie Centrale, de l'Est et la Sibérie.
2017_Sahakyan_Figure1.jpg

Les auteurs ont ainsi mis en évidence trois sous-clades principales: U7a, U7b et U7c qui regroupent plus de 96% des échantillons. Ils ont aussi identifié trois autres sous-clades: U7d, U7e et U7f restreintes à l'Iran et au Caucase. Enfin deux séquences également d'Iran et du Caucase ne se regroupent pas dans les six sous-clades précédentes.

La clade U7c est restreinte à l'Asie du Sud. A l'inverse U7a est dominante au Proche-Orient et en Asie du Sud avec des sous-clades spécifiques à l'Asie Centrale et à l'Europe Méditerranéenne et du Sud-Est. U7b est plus fréquente que U7a en Europe notamment en Europe Méditerranéenne et du Sud-Est, mais se retrouve aussi au Proche-Orient et en Asie du Sud.

L'âge de U7 est estimé entre 18.600 et 15.600 ans. Ceci confirme que cette clade est la plus jeune de l'haplogroupe U, puisqu'elle date d'après le Dernier Maximum Glaciaire. Elle émerge probablement d'un sévère goulot d'étranglement durant l'âge glaciaire.

Les calculs de Bayesian skyline montrent également un net signal d'expansion après le Maximum Glaciaire:
2017_Sahakyan_Figure3.jpg

U7a est la sous-clade la plus ancienne à se propager juste après le Maximum Glaciaire au Proche-Orient et en Asie du Sud, alors que U7b se diffuse plus tard entre 8000 et 5000 ans probablement au Néolithique entre le Proche-Orient, l'Europe et l'Asie du Sud.
2017_Sahakyan_Figure2.jpg

L'haplogroupe U7 est probablement originaire du Proche-Orient et montre différentes diffusions. La première juste après le Dernier Maximum Glaciaire la propage en Asie Centrale et du Sud, et la seconde au Néolithique la propage en Europe Méditerranéenne et en Asie.

jeudi 23 mars 2017

L'Europe Méditerranéenne a t-elle contribué au Néolithique Européen ?

Le Néolithique Européen se diffuse à partir du Proche-Orient et aborde la Grèce il y a environ 8500 ans. La génétique sur des anciens squelettes nous a montré que cette diffusion s'est accompagnée d'une forte discontinuité en Europe Centrale, du Nord et de l'Est. Notamment, une nouvelle composante ancestrale, présente chez la plupart des Européens d'aujourd'hui, apparait dans le génome des premiers fermiers Européens. Les analyses d'ADN ancien au Proche-Orient ont montré que la source de cette composante, mais aussi des haplogroupes mitochondriaux et du chromosome Y, était bien située en Anatolie. Cependant il y a très peu de résultats d'ADN ancien issus de squelettes situés le long de la Méditerranée, notamment entre la Grèce et l'Italie. Pourtant une étude récente a montré que deux individus Mésolithiques de Grèce appartiennent à l'haplogroupe mitochondrial K1c, haplogroupe appartenant au package Néolithique. De plus une autre étude récente a montré que deux individus Mésolithiques de Sardaigne appartiennent aux haplogroupes J2b1 et I3. D'autre part, il y a des indices issus de la génétique des populations actuelles qui montrent que certains haplogroupes mitochondriaux comme J, T, I et W pourraient être arrivés en Europe avant le Néolithique.

Joana B. Pereira et ses collègues viennent de publier un papier intitulé: Reconciling evidence from ancient and contemporary genomes: a major source for the European Neolithic within Mediterranean Europe. Ils ont étudié les haplogroupes J et T dans la population actuelle pour estimer l'âge d'arrivée en Europe des principales sous-clades. Ils ont ainsi séquencé 203 nouveaux mitogénomes qui ont été ajoutés à 1476 séquences préalablement publiées. Ils ont ensuite estimé les dates de migration en utilisant une analyse fondatrice suivant trois axes différents:

  • du Proche-Orient vers l'Europe Méditerranéenne (sans l'Espagne)
  • du Proche-Orient et l'Europe Méditerranéenne vers l'Espagne
  • du Proche-Orient et l'Europe Méditerranéenne vers l'Europe Centrale et du Nord

2017_Pereira_Figure1.jpg

Le haut de la figure ci-dessus montre que le pic d'arrivée en Europe Méditerranéenne venant du Proche-Orient se situe vers 12.800 ans. Ce pic est suivi d'un léger renflement autour de 9000 ans. Ces résultats indiquent donc une première migration importante du Proche Orient vers l'Europe Méditerranéenne bien avant le Néolithique, suivie d'une plus faible migration au début du Néolithique. Ainsi les sous-clades J1c, J2b1, T2b et T1a1c arrivent en Europe Méditerranéenne autour de 13.000 ans, les sous-clades T2e et J1c2 entre 11.500 et 9000 ans, T1a1a1 vers 8600 ans au début du Néolithique. En moyenne, les deux tiers des sous-clades de J et T semblent arriver en Europe Méditerranéenne à la fin de l'époque glaciaire.

Le milieu de la figure ci-dessus montre que le pic se situe vers 7000 ans et correspond au début du Néolithique dans la péninsule Ibérique. Ainsi les sous-clades T2b, T1a1a1 et J1c5c semblent arriver en Espagne avec le Néolithique. De manière intéressante la sous-clade T2a1a est datée du Bronze Ancien autour de 4000 ans. En moyenne les deux-tiers des sous-clades arrivent en Espagne au Néolithique.

Le bas de la figure ci-dessus montre qu'il y a deux pics d'arrivée à 7200 et 5200 ans. Le premier pic correspond bien à l'arrivée des premiers fermiers en Europe Centrale. Il inclut notamment les sous-clades J1c2 et T2b qui semblent venir d'Europe Méditerranéenne plus que du Proche-Orient. Le second pic correspond essentiellement à la diffusion de la sous-clade T1a1a1 à la fin du Néolithique et pourrait correspondre à la diffusion de la culture de la céramique Cordée.

L'analyse de l'évolution de la taille effective de la population montre pour l'haplogroupe J une expansion Glaciaire au Proche-Orient et en Arabie autour de 15.000 ans, dans le Caucase du Sud et en Anatolie autour de 13.000 ans. En Europe Méditerranéenne on voit cette première expansion Glaciaire suivie d'une seconde au début du Néolithique autour de 7000 ans. La péninsule Ibérique et l'Europe Centrale, au contraire, ne montrent qu'une seule expansion correspondant au début du Néolithique après 8000 ans. Le motif est similaire pour l'haplogroupe T avec une distinction concernant l'Europe Centrale et du Nord qui montre une expansion principale à la fin du Néolithique après 5000 ans.

La figure ci-dessous résume les résultats obtenus dans cette étude:
2017_Pereira_Figure2.jpg

Elle montre une arrivée d'haplogroupes mitochondriaux J et T en Europe Méditerranéenne entre la Grèce et l'Italie à la fin de la période Glaciaire (flèche jaune), puis une diffusion de ces haplogroupes en Europe au Néolithique à partir du Proche-Orient mais aussi à partir de l'Europe Méditerranéenne (flèches vertes). Ces résultats devront néanmoins être validés par des analyses d'ADN ancien sur des squelettes Mésolithiques de Grèce ou d'Italie.

mardi 21 février 2017

Diversité mitochondriale de la population Sarde

La Sardaigne est une île qui est restée longtemps isolée même quand le niveau de la mer était à son plus bas niveau durant le Dernier Maximum Glaciaire. Elle est probablement la dernière île de la Méditerranée à avoir été colonisée par l'homme moderne. Les dernières études de génétique ont montré que les Sardes représentent la population Européenne la plus proche génétiquement des premiers fermiers Européens, bien qu'ils diffèrent substantiellement des fermiers Néolithiques du Proche-Orient, notamment d'Anatolie. Il est probable que la Sardaigne a été peu affectée par les dispersions de l'Âge du Bronze en Europe.

Les premières preuves archéologiques de la présence de l'homme moderne en Sardaigne remontent à environ 13.000 ans. De plus l'haplogroupe du chromosome Y: I2-M26 qui prend son origine en Europe au Paléolithique, est de loin l'haplogroupe le plus fréquent chez les Sardes (39%). Enfin, dernièrement, une analyse génomique de la population actuelle de Sardaigne, a montré que les montagnes Gennargentu hébergent une forte proportion d'ascendance chasseur-cueilleur et néolithique, par rapport aux autres régions Sardes. Ces résultats ont été interprétés comme une indication que les lignages Mésolithiques ne sont pas arrivés sur l'île récemment, mais soit qu'ils étaient déjà présents à l'arrivée des premiers fermiers, soit qu'ils ont été introduits par les premiers fermiers.

Anna Olivieri et ses collègues viennent de publier un papier intitulé: Mitogenome Diversity in Sardinians: a Genetic Window onto an Island's Past. Ils ont analysé le mitogénome de 3491 Sardes actuels et 21 mitogénomes d'anciens individus Sardes datés entre le Néolithique (4100 av. JC.) et l'Âge du Bronze Nuragique (1100 av.JC.).

L'analyse phylogénétique des résultats met en évidence 89 groupes spécifiques à la Sardaigne qui incluent 78,4% des échantillons Sardes. Ces groupes apparaissent dans toutes les parties de l'arbre mitochondrial (haplogroupes L, M, N et R). On les trouve notamment sous les haplogroupes suivants: HV (51%), JT (27%), U (17%) et autres (5%). Ces fréquences sont typiques des populations Européennes Occidentales. Il y a cependant des différences notables avec les populations continentales notamment les hautes valeurs des haplogroupes H1 (18,5%) et H3 (18,4%).

Les auteurs pensent qu'il est probable que ces 89 groupes spécifiques ont émergé en Sardaigne bien qu'il soit possible qu'ils aient émergés ailleurs avant d'arriver en Sardaigne et disparaître ailleurs. Les auteurs ont ensuite estimé la date d'apparition de ces groupes spécifiques en Sardaigne. Plus de la moitié d'entre eux ont émergé durant la période Nuragique (entre 4000 et 2000 ans) ou après (moins de 2000 ans). Les autres ont émergé durant le Néolithique ou le Chalcolithique, sauf trois qui sont apparus avant le Néolithique: K1a2d, N1b1a9 et U5b1i1. Ces trois haplogroupes représentent environ 3% de la population Sarde. Le Néolithique apparait en Sardaigne il y a environ 7800 ans:
2017_Olivieri_Table1.jpg

L'haplogroupe K1a2d émerge entre 16.000 et 11.000 ans. Les plus anciens mitogénomes appartenant à l'haplogroupe père K1a2 apparaissent chez des anciens fermiers d'Anatolie datés de 8300 et 8000 ans. K1a2 est donc probablement originaire du Proche-Orient. Les auteurs supposent que cet haplogroupe est arrivé en Sardaigne il y a plus de 11.000 ans.

L'haplogroupe U5b1i1 émerge entre 13.000 et 9700 ans. Les individus de l'haplogroupe père U5b1i sont tous d'Europe Occidentale. Cet haplogroupe a donc une racine profonde en Europe Occidentale.

L'haplogroupe N1b1a9 émerge entre 9400 et 7300 ans. L'haplogroupe père N1b1a apparait au Proche-Orient et en Europe, notamment chez un ancien fermier d'Anatolie vieux de 8300 ans. Son origine est donc probablement au Proche-Orient. Les auteurs supposent qu'il est arrivé en Sardaigne il y a plus de 7000 ans. Il pourrait cependant être arrivé seulement avec les premiers fermiers.

Malheureusement les anciens individus de Sardaigne sont tous datés entre le Néolithique et l'Âge du Bronze. Il n'est donc pas possible de connaître les haplogroupes des habitants Mésolithiques de Sardaigne. Ces anciens Sardes appartiennent tous aux haplogroupes HV, JT et U. Mais aucun d'eux n'appartient à un des 89 groupes spécifiques Sardes identifiés dans la population actuelle. Un campaniforme appartient à la sous-clade HV0j1 trouvée également chez un Sarde et un Italien actuel. Un individu de l'Âge du Bronze Ancien vieux de 4000 ans est un ancêtre direct d'un groupe spécifique Sarde: H3u2. Un autre individu de l'Âge du Bronze Ancien vieux de 4500 ans possède une des mutations qui mènent au groupe spécifique Sarde K1a32. Un autre individu de l'Âge du Bronze Ancien vieux de 4200 ans est l'ancêtre du groupe spécifique Sarde: U5b2b5a:
2017_Olivieri_FigureS6.jpg

Enfin un ancien individu Chalcolithique du Nord de l'Espagne vieux de 5000 ans est proche du groupe spécifique Sarde: X2c2a.

L'hypothèse que les haplogroupes K1a2d, N1b1a9 et U5b1i1 soient arrivés en Sardaigne avant le Néolithique reste à valider par des tests d'ADN ancien sur des squelettes Mésolithiques Sardes. Pour ma part, vu les premiers résultats concernant l'ADN mitochondrial de squelettes Mésolithiques en Europe, je pense que seul l'haplogroupe U5b1i1 est un candidat sérieux pour une arrivée en Sardaigne avant le Néolithique.

lundi 12 décembre 2016

Diversité mitochondriale des aborigènes d'Australie

Les aborigènes d'Australie représentent l'une des plus anciennes cultures dans le monde, sachant que leurs ancêtres furent parmi les plus anciens groupes à quitter l'Afrique. Les dernières découvertes archéologiques ont montré que les hommes modernes ont colonisé le Sahul (Australie et Nouvelle Guinée) il y a au moins 47.000 ans. Les détails temporels et géographiques de cette migration restent sujet à débats notamment sur une seule ou plusieurs migrations.

Nano Nagle et ses collègues viennent de publier un papier intitulé: Mitochondrial DNA diversity of present-day Aboriginal Australians and implications for human evolution in Oceania. Ils ont testé l'ADN mitochondrial de 502 échantillons issus des aborigènes Australiens. Pour cela ils ont séquencé la région de contrôle HVR1 et génotypé quelques SNPs de la région codante afin de discriminer les principaux haplogroupes. Ils ont également rajouté les résultats concernant 92 aborigènes Australiens préalablement publiés. L'ensemble de ces échantillons est réparti dans toutes les régions d'Australie: New South Wales, Northern Territory, Queensland, South Australia, Tasmania, Victoria et Western Australia.

Parmi ces 594 échantillons, 22,4% sont d'un haplogroupe non aborigène (L, H, R, W, X, Y, B, F, J, I, T, K ou U), notamment Européen pour 98% d'entre eux. Ces résultats s'expliquent aisément par la récente colonisation Européenne de l'Australie. Ce niveau d'introgression maternelle Européenne est nettement inférieur à l'introgression paternelle Européenne déterminée à l'aide de l'ADN du chromosome Y, qui est voisin de 80%.

Les échantillons restants appartiennent aux haplogroupes: M, Q, N, O, S et P. Ils se répartissent de la façon suivante:
2016_Nagle_Table1b.jpg

Le macro-haplogroupe M comprend 26,4% des échantillons aborigènes alors que le macro-haplogroupe N comprend 73,5% des échantillons.
2016_Nagle_Figure2.jpg

Dans l'haplogroupe M, 9,3% appartiennent à la sous-clade M42a et 2,6% à la sous-clade Q. Les autres sont classés M*. La sous-clade M42a se trouve principalement dans les états de l'Est et du Nord. La sous-clade Q se trouve également dans les états de l'Est: New South Wales et Queensland.
2016_Nagle_Figure3.jpg

Dans l'haplogroupe N, les sous-clades N* et N13 sont présents à faible fréquence respectivement dans les régions Northern Territory et Queensland (3%), et dans le Queensland (1%). La sous-clade O est plus largement répartie et se retrouve en New South Wales, Northern Territory, Queensland et South Australia. La plupart de ces échantillons n'appartiennent pas à l'unique sous-clade O1, et sont donc classifiés: O*.
2016_Nagle_Figure4.jpg

L'haplogroupe S est présent dans 22,6% des échantillons aborigènes dont plus de la moitié appartiennent à la sous-clade S1 et un tiers à la sous-clade S*.
2016_Nagle_Figure5.jpg

L'haplogroupe le plus fréquent est P avec 44% des échantillons aborigènes. Si on enlève les échantillons P1 et P3b supposés d'origine de Nouvelle-Guinée, cela fait 40,9%. Les échantillons P1 et P3b sont tous originaires des îles du détroit de Torres situées entre l'Australie et la Nouvelle-Guinée. Les sous-clades les plus fréquentes sont P* (43%) et P3a (28,3%).
2016_Nagle_Figure6.jpg

Parmi les régions d'Australie, Northern Territory a la plus grande diversité mitochondriale, et Victoria la plus faible.

Les âges estimés des différents haplogroupes aborigènes sont anciens:
2016_Nagle_Table2.jpg

Notamment les haplogroupes S et O sont estimés âgés de 49.000 et 39.000 ans respectivement. Ces valeurs correspondent bien à la date de la première colonisation de l'Australie par les hommes modernes indiquée par les preuves archéologiques. L'âge de l'haplogroupe P, qui donne la valeur maximale (57.400 ans) a probablement émergé dans le Sunda avant la colonisation du Sahul (de même que les haplogroupes M42a, Q et S), à moins que la colonisation de l'Australie a commencé avant la valeur indiquée par l'archéologie. Cependant des lignages P9 et P10 ont été détectés dans des populations des Philippines et des lignages P3 et P4 en Nouvelle-Guinée. Il est donc fort probable que l'haplogroupe P ait été apporté par les premiers colons en Australie, via la Nouvelle-Guinée.

Comme certains haplogroupes sont communs à la Nouvelle-Guinée et à l'Australie alors que d'autres sont spécifiques à l'Australie, les auteurs de cette étude supposent qu'il y a eu deux routes de colonisation de l'Australie: la première via la Nouvelle-Guinée, la seconde directement à la pointe Nord-Ouest de l'Australie depuis Timor, île située à l'Est de l'archipel Indonésien.

Cette étude n'apporte aucun support à une migration plus récente vers l'Australie durant l'holocène qui aurait diffusé les langues Pama-Nyungan et le dingo.

jeudi 12 mai 2016

Dispersion de populations dans la corne de l'Afrique à partir d'un refuge glaciaire situé dans la péninsule Arabique

L'haplogroupe mitochondrial R0a a une distribution unique atteignant ses plus hautes fréquences dans la péninsule Arabique, mais aussi de l'autre côté du détroit de Bab el-Mandeb, dans la corne de l'Afrique. Cette dernière région est exceptionnelle car elle abrite une très forte diversité mitochondriale et parce que sa population a une forte ascendance non autochtone à l'Afrique. Des études génétiques récentes ont ainsi conclu que cette forte proportion (30 à 50%) d'héritage non Africain dans certaines populations est le résultat de mélanges génétiques avec l'Arabie débutant il y a environ 3000 ans, suggérant un lien avec l'origine des langues éthiosémitiques.

D'autres analyses ont mis en évidence des flux de gènes plus anciens dans la corne de l'Afrique en provenance soit du Levant, soit de l'Arabie. Ainsi l'haplogroupe mitochondrial M1 est supposé être arrivé en provenance des côtes Méditerranéennes pendant le Dernier Maximum Glaciaire. De même l'haplogroupe mitochondrial U6a est également retrouvé dans la corne de l'Afrique en plus faible proportion et suivant une route différente.

L'haplogroupe mitochondrial R0a est trouvé à faible fréquence en Eurasie et trouve son maximum autour de 35% dans l'est du Yémen. On le retrouve a environ 15% dans la corne de l'Afrique sur les côtes de la Mer Rouge. Il est supposé originaire du Proche-Orient et avoir migré en Arabie à la fin du Pléistocène. Francesca Gandini et ses collègues viennent de publier un papier intitulé: Mapping human dispersals into the Horn of Africa from Arabian Ice Age refugia using mitogenomes. Ils ont analysé 205 séquences mitochondriales complètes de l'haplogroupe R0, ainsi que 733 séquences limitées à la région de contrôle du même haplogroupe.

L'haplogroupe R0a’b dont la sous-clade R0a forme l'immense majorité, est daté d'environ 40.000 ans. Il s'agit de l'unique haplogroupe frère de l'haplogroupe majeur HV. L'haplogroupe R0 est ainsi majoritairement Ouest Eurasien alors que l'haplogroupe père: R est lui plus largement distribué en dehors de l'Afrique:
2016_Gandini_Figure1.jpg

La figure ci-dessus montre les haplogroupes R0a et R0b. Ce dernier est constitué de seulement trois séquences situées en haut à droite. R0a est constitué de deux sous-clades majeures: R0a1a située dans la partie supérieure et R0a2 située dans la partie inférieure.

R0a est daté d'environ 30.000 ans. Il est formé de cinq sous-clades: R0a1, R0a2'3, R0a4, R0a5 et R0a6 dont les deux dernières ont été découvertes dans cette étude. La répartition géographique de ces séquences laisse penser à une origine de R0a au Proche-Orient. R0a4, R0a5 et R0a6 sont très rares. R0a5 se situe au Proche-Orient et en Europe. R0a6 semble restreint au Pakistan (principalement chez les Kalash) avec des singletons en Palestine, en Iran et en Italie.

Les sous-clades principales de R0a (R0a1 et R0a2'3) datent du Dernier Maximum Glaciaire entre 26.000 et 21.000 ans. R0a1a et R0a2 ont une structure en étoile typique d'une forte dispersion et sont datées respectivement de 13.000 et 17.000 ans. Ils représentent les lignages principaux de l'haplgoroupe R0. Bien qu'ils soient largement distribués, ils sont tous les deux fréquents dans la péninsule Arabique, notamment au Yémen. La diversité de R0a1 est importante en Arabie suggérant son origine dans cette péninsule datée de 26.000 ans. Similairement R0a2'3 daté de 21.000 ans semble également originaire de la péninsule Arabique.

Il y a deux sous-clades Est Africaines majeures: R0a2b et R0a2g datées respectivement de 13.000 et 11.000 ans. Il y a également une sous-clade R0a2r trouvée en Europe du Sud avec deux échantillons au Proche-Orient datée de 12.400 ans.
2016_Gandini_Figure2.jpg

Les auteurs ont effectué des analyses Bayesian skyline plots qui permettent d'étudier l'évolution des haplogroupes au cours du temps:
2016_Gandini_Figure3.jpg

L'haplogroupe R0a s'accroit notablement entre 16.000 et 10.000 ans, puis autour de 3000 ans. Si la sous-clade R0a2 se calque sur R0a, la sous-clade R0a1a croit à partir de 9000 ans. Ainsi les deux sous-clades R0a1a et R0a2 correspondent probablement à des populations différentes.

Les auteurs ont également réalisé des analyses d'événements fondateurs en utilisant des populations source et évier. Les résultats montrent que les dispersions de l'Arabie vers le Levant sont plus récentes que les dispersions dans le sens contraire. Ils montrent également que le Levant ne peut pas être la source principale de la diversité de l'haplogroupe R0a en Arabie, confirmant ainsi que l'Arabie semble être le plus ancien réservoir pour cet haplogroupe. De la même façon les dispersions de R0a vers l'Europe et l'Asie du Sud semblent prendre leur origine en Arabie.

En conclusion, les auteurs suggèrent que l'haplogroupe R0a est entré et s'est diversifié en Arabie avant le Dernier Maximum Glaciaire. Il est ensuite resté sur place dans un refuge glaciaire Arabique pendant le maximum de glaciation, avant de se disperser à nouveau après cet événement climatique comme le montre les deux sous-clades principales R0a2 et R0a1a. Ainsi R0a2 se retrouve maintenant principalement en Afrique de l'Est, alors que R0a1a s'est dispersé essentiellement dans la péninsule Arabique.

lundi 25 avril 2016

L'homme moderne a quitté l'Afrique en suivant une route par le Nord

La génétique a montré ces dernières années que l'origine de l'homme moderne se situe en Afrique et qu'il a ensuite colonisé le reste du monde, remplaçant les hommes archaïques préalablement installés. La théorie principale fait appel à une route côtière Sud à travers le détroit de Bab el Mandeb reliant l'Afrique à la péninsule Arabique, atteignant ensuite l'Inde et l'Australie il y a environ 60.000 ans. Cependant, différents indices ne plaident pas en faveur de cette théorie. Il y a notamment la présence de fossiles d'hommes modernes datés d'environ 80.000 ans en Chine, et ceux de Skhul et Qafzeh au Levant datés d'environ 100.000 ans.

Les études d'ADN mitochondrial ont montré que seuls deux haplogroupes nommés M et N se retrouvent à l'extérieur de l'Afrique aujourd'hui.

L'haplogroupe mitochondrial N

Rosa Fregel et ses collègues ont publié en 2015 un papier intitulé: Carriers of Mitochondrial DNA Macrohaplogroup N Lineages Reached Australia around 50,000 Years Ago following a Northern Asian Route. Ils ont collecté l'ADN mitochondrial de 1725 échantillons en Arabie Saoudite dont 28 ont été séquencés complètement. Les auteurs se sont intéressés aux échantillons dont l'haplogroupe est N(xR) c'est à dire qui appartienent à N mais pas à sa sous-clade: R. Ils ont comparé leurs données à 623 séquences préalablement publiées d'haplogroupe N(xR).

Les âges de coalescence issus des séquences complètes sont les suivants:
2015_Fregel_Table1.jpg

En dessous de L3, l'haplogoupe N11 présente l'âge le plus ancien (76.000 ans) avec deux branches N11a qui s'étend en Chine et en Mongolie, et N11b que l'on trouve aux Philippines. Ensuite il y a N10 vieux de 66.000 ans détecté principalement en Chine du Sud et au Tibet. Autour de 50.000 ans, les sous-clades N1 et N2 émergent en Eurasie de l'Ouest et la sous-clade S en Australie. Les sous-clades avec une répartition géographique le plus au Sud sont N8, N21 et N22. Elles ont un âge beaucoup plus jeune entre 20.000 et 17.000 ans en contradiction avec l'hypothèse d'une route Sud pour la diffusion de l'haplogroupe N. Elles sont ainsi plus jeunes que la sous-clade A qui est la plus jeune à se diffuser dans le Nord de l'Asie avec 28.000 ans.

L'hypothèse de la route cotière Sud place l'Arabie Saoudite comme la première étape de ce voyage. Les échantillons de cette étude montre que l'haplogroupe J (21%) et R0 (17%) sont les haplogroupes dominants de cette région. 13% de ces séquences appartiennent à l'haplogroupe L dont l'origine est clairement d'Afrique Sub-Saharienne. 7% sont de l'haplogroupe M dont 4% de l'haplogroupe Nord-Africain M1. Enfin 10% des séquences Saoudiennes sont de l'haplgroupe N(xR) dont 2,8% de X2, 2,1% de N1a3, 2% de N1b, 1,1% de N1a1a et 1,3% de I. Il n'y a aucune présence d'une clade ancienne appartenant à N(xR) en Arabie Saoudite. La plupart des séquences Saoudiennes ont des lignages frères qui prennent leur racine au Proche-Orient, en Iran, dans le Caucase ou plus au Nord. Par exemple, les deux séquences Saoudiennes N1a3a ont un âge de coalescence de seulement 11.900 ans. La séquence Saoudienne N3a se place sur une branche avec une séquence Iranienne et une autre de Bélarussie. La séquence Saoudienne X1 se situe avec une séquence Nord Africaine avec un âge de seulement 6500 ans. Toutes les séquences Saoudiennes d'haplogroupe N(xR) montrent ainsi qu'elles correspondent à des diffusions récentes. Il n'y a pas en Arabie Saoudite de séquence N(xR) correspondant à la diffusion ancestrale de cet haplogroupe vieux d'environ 60.000 ans. Ces données vont donc à l'opposée de l'hypothèse d'une route côtière Sud pour atteindre l'Australie.

La sous-clade la plus ancienne de N(xR) détectée en Inde est N5 dont l'âge est d'environ 36.000 ans. Elle partage la mutation 1719 avec la sous-clade N1 d'origine Ouest Asiatique. Les autres sous-clades Indiennes de N(xR) dérivent également de branches d'origine Ouest ou Est Asiatique. Ainsi la présence de N(xR) en Inde est mieux expliqué comme le résultat de migrations plus récentes à partir d'Asie de l'Ouest ou de l'Est. Il semble donc que les premiers colons arrivés en Australie portant l'haplogroupe N(xR) ont utilisé une route qui n'est pas passée en Inde.

L'âge de coalescence de l'haplogroupe mitochondrial S autochtone à l'Australie d'environ 50.000 ans est compatible avec les restes archéologiques de ce pays. De plus le génome complet d'un aborigène Australien a montré que celui-ci était le descendant d'une migration à travers l'Asie de l'Est datée entre 75.000 et 62.000 ans. Son ADN mitochondrial était de l'haplogroupe O, un des lignages basals de N(xR) en Australie. Il avait également la trace d'ADN d'hommes de Neandertal et de Denisova.

Les résulatts de cette étude supporte l'existence d'une route Nord de sortie d'Afrique en dehors de la péninsule Arabique et de l'Inde. Ce long voyage qui s'est terminé en Australie a probablement eu lieu durant l'ère glaciaire MIS-4 il y a environ 71.000 ans quand on pouvait rejoindre l'Australie à travers le Sahul:
2015_Fregel_Figure1A.jpg

En résumé, on peut supposer que l'haplogroupe L3 s'est largement diffusé en Afrique entre 95.000 et 59.000 ans durant une période de climat doux, voire entre 130.000 et 90.000 ans en fonction du taux de mutation utilisé. Cette dernière estimation est compatible avec les squelettes de Skhul et Qafzeh au Levant et à la diffusion de la culture Atérienne en Afrique du Nord, et correspond à un climat humide favorable à la dispersion des hommes modernes hors d'Afrique. On peut donc supposer que la sortie d'Afrique s'est bien effectuée par la péninsule du Sinaï. Ces hommes portaient probablement l'haplogroupe L3.

Il y a plusieurs routes possibles pour pénétrer à l'intérieur de l'Asie bien que la traversée du Caucase soit la plus probable. En effet, on a détecté un flux de gène Néandertalien chez tous les non Africains bien que le signal soit plus élevé chez les Asiatiques de l'Est. De plus des études ont montré que ce flux de gène est plus proche du Néandertal du Caucase que des autres Neandertaliens en Sibérie ou en Europe. Un peu plus loin sur leur route les ancêtres des Australiens ont rencontré un autre homme archaïque: l'homme de Denisova qui a également laissé dans leur ADN des traces de flux de gènes. Celui-ci est important seulement chez les Australiens et Mélanésiens.

Ensuite, les porteurs de l'haplogroupe mitochondrial N ont quitté le sud de la Sibérie pour entrer en Asie du Sud-Est puis en Australie probablement entre 70.000 et 55.000 ans. Ils ont pu suivre une route côtière ou intérieure comme le montre les restes fossiles en Chine vieux de 80.000 ans et au Laos de 50.000 ans.
2015_Fregel_Figure1B.jpg

Suite à cette première colonisation de l'Asie du Sud-Est et de l'Australie, les données phylogénétiques montrent un certain nombre de radiations secondaires des principaux haplogroupes M, N et R, notamment en Inde pour M et R, mais aussi en Europe et en Afrique du Nord.

L'haplogroupe mitochondrial M

Patricia Marrero et ses collègues viennent de publier un papier intitulé: Carriers of human mitochondrial DNA macrohaplogroup M colonized India from southeastern Asia. Un total de 206 échantillons d'Arabie Saoudite appartenant à l'haplogroupe M ont été analysés dont 24 ont été complètement séquencés. Ces échantillons ont été comparés à 4107 séquences d'haplogroupe M préalablement publiées d'origine Eurasienne ou Océanienne.

L'haplogroupe M représente environ 7% du gene pool mitochondrial en Arabie Saoudite, dont 53% appartiennent à la sous-clade M1 en provenance probablement du Levant, 39% en provenance d'Inde et 8% en provenance d'Asie du Sud-Est. Notamment les deux lignages M caractéristiques des îles Andaman (M31 et M32) sont également présents en Arabie Saoudite. Il a d'abord été proposé que les indigènes des îles Andaman représentent les descendants des premiers hommes sortis d'Afrique. Cependant, des études plus récentes ont proposé que ces îles ont été colonisées plus tardivement à la fin du Paléolithique. Une des deux séquences Saoudiennes caractéristiques des îles Andaman se retrouve également à Madagascar. Une autre séquence Saoudienne appartient à l'haplogroupe M81 que l'on retrouve également en Inde et à l'île Maurice.
2016_Marrero_FigureS1.jpg

Dans la figure ci-dessus la séquence Saoudienne est en vert, la séquence de l'île Maurice en jaune et la séquence Indienne en rouge. Les séquences Saoudienne et Mauritienne se différencient que par une seule mutation.

Il y a donc des affinités entre certaines séquences Saoudiennes et des séquences des îles de l'océan Indien le long des côtes Africaines qui pointent vers une arrivée de populations en Arabie Saoudite et dans ces îles en provenance d'Asie du Sud-Est, aux périodes historiques comme l'expansion Islamique ou les colonisations Européennes de l'Inde et de l'Asie du Sud-Est.

L'existence de l'haplogroupe M en Afrique a d'abord été détecté en Ethiopie et fut interprété comme la preuve de la route côtière Sud pour la sortie d'Afrique de l'homme moderne. Cependant la répartition géographique limitée et la faible diversité de l'haplogroupe M en Afrique ont été utilisés comme un argument contre cette hypothèse. Il fut alors suggéré que l'haplogroupe M1 représentait une migration retour de l'Inde vers l'Afrique. D'autre part, la sous-clade M1 partage la mutation 14110 avec les lignages (M20, M51 et M84) présents en Asie du Sud-Est, et la mutation 16129 avec M20. L'haplogroupe M1 est trouvé du Portugal et du Sénégal à l'Ouest jusqu'au Caucase, au Pakistan et au Tibet à l'Est, et de Guinée-Bissau et de Tanzanie au Sud jusqu'en Russie au Nord. Cependant sa plus forte diversité se trouve en Ethiopie et au Maghreb. M20 et M51 montrent une répartition géographique commune en Asie du Sud-Est incluant la Birmanie et la Malaisie à l'Ouest, les Philippines et Hainan à l'Est et le Tibet au Nord-Ouest. M84 se limite à la Birmanie, l'Inde et le Sud de la Chine. La séparation de ces 4 haplogroupes remonte à environ 56.000 ans probablement au cœur de leurs aires de répartition. Il est donc possible que l'haplgoroupe M1 ait émergé en Asie du Sud-Est et non en Inde. De plus, il a été suggéré que cet haplogroupe soit rentré en Afrique via le Levant à cause de sa faible diversité le long de la route côtière Sud.

L'haplogroupe M est caractérisé en Asie du Sud par une grande diversité, des âges de coalescence anciens et la nature autochtone de ses différents lignages. Ces différents éléments ont été utilisés pour proposer une origine Indienne et une rapide dispersion vers l'Est pour coloniser l'Asie du Sud-Est. Cependant il y a plusieurs arguments contre cette théorie. Premièrement comme les barrières géographiques ne sont pas plus fortes à l'Ouest qu'à l'Est, on pouvait s'attendre à ce que l'haplogroupe M se diffuse également vers l'Ouest, ce qui n'est pas le cas à part la sous-clade M1. Deuxièmement l'âge de l'haplogroupe M en Inde est significativement plus jeune qu'en Asie de l'Est et du Sud-Est et qu'en Australo-Mélanésie comme le montre le tableau ci-dessous:
2016_Marrero_Table1.jpg

D'autre part, des études génétiques précédentes ont montré que la colonisation de l'Inde s'est faite en deux vagues détectées comme deux anciennes populations: Ancestral Southern Indians et Ancestral Northern Indians. La première est présente notamment chez les habitants des îles Andaman. De manière intéressante ces derniers se regroupent avec les populations de l'Asie du Sud-Est lorsque celles-ci sont rajoutées dans l'étude. De plus, un support indépendant à cette théorie est apporté par une étude précédente sur l'haplogroupe du chromosome Y: K-M526 dont on a montré une origine dans l'Asie du Sud-Est suivie par une rapide dispersion dans la région et en Océanie avec également des expansions vers l'Ouest.

Ainsi les auteurs proposent une sortie ancienne des hommes modernes d'Afrique par le Levant illustrée par les restes fossiles de Skhul et Qafzeh datés de 100.000 ans. Ils étaient probablement de l'haplogroupe L3. Ensuite, ils ont suivi une unique route située au Nord vers les montagnes de l'Altaï où ils se sont mélangés avec les Neandertaliens et les Denisoviens. Puis, suite à un refroidissement du climat ils se sont dirigés vers le sud de la Chine et portaient les haplogroupes M et N:
2016_Marrero_Figure1a.jpg

Ensuite il se sont dirigés vers l'Ouest jusqu'en Inde et vers l'Est en Océanie:
2016_Marrero_Figure1b.jpg

Plus tard l'haplogroupe M1 s'est dirigé vers le Levant et l'Afrique, accompagnés probablement par quelques éléments d'haplogroupe M détecté en Europe au Paléolithique.

jeudi 17 décembre 2015

Analyse de l'haplogroupe mitochondrial HV

Une étude récente des marqueurs génétiques uni-parentaux en Italie comprenant un millier d'individus a révélé que l'haplogroupe mitochondrial HV est celui qui possède les plus anciennes racines en Italie. Cette étude peut être rapprochée d'une autre qui a étudié l'ADN mitochondrial d'un squelette Mésolithique de Sicile vieux de 14.000 ans d'haplogroupe HV1. Ainsi cet haplogroupe semble être une composante cruciale des premières dispersions humaines en Eurasie. Il a cependant été peu étudié jusqu'ici mis à part ses sous-clades H, V et HV4.

L'haplogroupe HV est une sous-clade majeure de l'haplogroupe R0, caractérisée par la mutation 14766 et comprenant au moins 18 sous-clades connues. La plus connue de ces sous-clades est l'haplogroupe H. L'haplogroupe V est lui contenu dans la sous-clade HV0. L'haplogroupe HV a probablement émergé entre l'Asie Centrale et l'Asie de l'Ouest. L'haplogroupe HV(xH,V) qui exclu les sous-clades H et V, n'est pas très commun en Europe avec des fréquences qui varient de 0 à 10%.

Certains scientifiques associent des lignages avec la diffusion des hommes au Paléolithique, notamment avec le repeuplement de l'Europe à partir des refuges après le dernier maximum glaciaire. Les refuges principaux sont la région Franco-Cantabrique, les Balkans, le Caucase et le sud de l'Italie. L'haplogroupe HV4 a été étudié précédemment comme un exemple de ces reconstruction phylogéographiques. Un fort signal d'expansion d'une de ses sous-clades a été détecté à la frontière entre l'Espagne et la France et associé à la repopulation de la région à partir du refuge Franco-Cantabrique. Cette étude a estimé l'âge de l'haplogroupe HV4 autour de 14.200 ans et suggéré que sa sous-clade HV4a1a a subi une forte expansion à partir de la région Basque durant le Dryas récent.

Sara De Fanti vient de publier un papier intitulé: Fine Dissection of Human Mitochondrial DNA Haplogroup HV Lineages Reveals Paleolithic Signatures from European Glacial Refugia. Elle a étudié la séquence mitochondriale complète de 55 individus Italiens appartenant à l'haplgroupe HV(xH,V). Ces séquences ont été ensuite ajoutées à 261 autres séquences du même haplogroupe préalablement publiées pour former un ensemble total de 316 séquences mitochondriales complètes réparties en Eurasie.

Les clades principales obtenues sont HV0, HV1, HV2 (en dessous de la mutation 73) et HV4. Les clades HV6, HV7, HV8, HV9, HV10, HV11, HV15, HV15, HV16 et HV17 se regroupent ensemble sous la mutation 16311 anciennement appelée HV3:
2015_DeFanti_Figure1A.jpg

L'arbe phylogénétique complet obtenu est accessible ici.

Une analyse a ensuite été réalisée avec le logiciel BEAST qui permet de reconstituer un arbre phylogénétique et d'estimer les âges des différentes branches de cet arbre. Le taux de mutation de Soares a été utilisé. Ainsi le temps de coalescence de HV est estimé autour de 28.000 ans, HV-73 (au-dessus de HV2) autour de 38.000 ans, HV0 autour de 17.000 ans, HV1 autour de 24.000 ans, HV4 autour de 20.000 ans et le bloc HV-16311 autour de 14.000 ans:
2015_DeFanti_Figure1B.jpg

La figure ci-dessous localise la distribution géographique des principales sous-clades de HV(xH,V) en Italie:
2015_DeFanti_Figure2.jpg

Ainsi HV0 apparait à hautes fréquences en Italie du Nord, mais également en Sicile, HV4, HV* et HV-73 sont plus fréquents en Italie du Sud.

De plus une analyse en correspondance a permi de situer les sous-clades de HV en Eurasie:
2015_DeFanti_FigureS4.jpg

Ainsi HV0 et HV-16311 sont plus fréquents en Europe de l'Ouest et du Nord et en Italie du Nord, HV4 est plus fréquent en Europe du Sud (zone Franco-Cantabrique et Italie), HV* en Italie du Sud et Europe de l'Est, HV-73 et HV1 au Proche-Orient, dans le Caucase et en Afrique du Nord et de l'Est.

L'haplogroupe HV4 est défini par la mutation 7094. Des séquences qui ont divergé très tôt sont observées en Italie du Centre et du Sud notamment entre les sous-clades HV4b et HV4c:
2015_DeFanti_Figure3.jpg

Une nouvelle sous-clade HV4d a été identifiée. Elle est constituée exclusivement de séquences Italiennes. HV4b et HV4c sont datées autour de 15.000 ans et incluent des séquences Italiennes mais aussi du Proche-Orient, du Caucase et d'Europe de l'Est. HV4a est également daté de 15.000 ans. Sa sous-clade HV4a2 inclu également des séquences Italiennes et des régions de l'Est. HV4a1a est une sous-clade majeure datée de 13.000 ans et qui montre un signal clair d'expansion à partir de la région Franco-Cantabrique.

Une analyse Bayesian Skyline Plot a été réalisée avec le logicile BEAST à partir des séquences complètes (en rouge) ou seulement de la région codante (en bleu):
2015_DeFanti_Figure4.jpg

Le signal d'expansion apparait entre 15.000 et 12.000 ans en Eurasie et correspond clairement à une date pré-Néolithique, même si certaines sous-clades se sont sûrement diffusées plus tard pendant le Néolithique dans certaines régions.

lundi 2 novembre 2015

Signatures mitochondriales Africaines dans la Péninsule Ibérique

La proximité géographique entre l'Afrique et les côtes Méditerranéennes Européennes dans sa partie occidentale (14 km), a permis de nombreux mouvements de populations au cours du temps. La préhistoire de l'Afrique du Nord depuis l'ancienne culture Atérienne à la culture Capsienne, via la culture Ibéromaurusienne n'a pas suivi une séquence linéaire et est sujet à de nombreux débats concernant la continuité ou non de la population. Cette région a subi également de nombreux changements climatiques oscillant entre des périodes arides et humides.

Des traces archéologiques de contacts transcontinentaux entre l'Afrique du Nord et la Péninsule Ibérique existent, comme le harpon de Taforalt: un outil Ibéromaurusien du Nord du Maroc contemporain des outils identiques du Magdalénien Espagnol. Plus tard le package Néolithique est identique dans le sud de l'Ibérie et le Maghreb: mêmes espèces domestiquées et même technologie.

Des études génétiques mitochondriales dans l'ouest de la Méditerranée ont montré de nombreuses contributions Européennes en Afrique du Nord. A l'inverse, des lignages Africains ont été détectés dans la péninsule Ibérique: la distribution des haplogroupes U6 et M1 pointent vers l'Afrique du Nord, le premier davantage dans le nord-ouest et le second dans le nord-est. La distribution de l'haplgroupe L pointe vers l'Afrique subsaharienne.

Candela L. Hernández vient de publier un papier intitulé: Early Holocenic and Historic mtDNA African Signatures in the Iberian Peninsula: The Andalusian Region as a Paradigm. Il a analysé 62 séquences mitochondriales complètes appartenant aux haplogroupes U6, M1 et L d'Andalousie et de berbères Marocains (Asni, Bouhria et Figuig) afin de raffiner l'histoire des migrations humaines entre l'Afrique et la péninsule Ibérique.

La table ci-dessous indique les fréquences de ces 3 haplogroupes dans les populations considérées contenant un total de 750 échantillons Andalous et 217 échantillons berbères:
2015_Hernandez_Table1.jpg

La population de la province de Huelva dans l'ouest de l'Andalousie présente une plus grande proportion de lignages Africains (11,8%) que celle de la région de Grenade dans l'est de l'Andalousie (3,6%). Ainsi la population de Huelva a une fréquence de 7,5% pour l'haplogroupe U6 comparable à sa fréquence dans la population berbère Asni (11,32%). Les fortes proportions de l'haplogroupe L dans les populations berbères montrent que le Sahara n'a pas toujours été une barrière infranchissable.

La figure ci-dessous donne la distribution géographique des fréquences des haplogroupes U6a et L1b:
2015_Hernandez_Figure1.jpg

U6a est principalement concentré au Maghreb et en Mauritanie avec une diffusion qui atteint l'Europe via la péninsule Ibérique. L1b se retrouve essentiellement en Afrique de l'ouest, du golf de Guinée à l'Afrique du Nord. Il atteint l'Europe via la péninsule Ibérique, mais aussi la Sicile et l'Italie du sud.

Pour mieux analyser l'histoire complexe des lignages Africains maternels, les auteurs ont ensuite séquencé complètement 32 échantillons Andalous et 30 échantillons berbères appartenant aux haplogroupes U6, M1 et L. La figure ci-dessous résume les arbres obtenus pour les haplogroupes U6 et M1:
2015_Hernandez_Figure2.jpg

L'estimation de l'âge des principales sous-clades est indiquée. Ainsi U6 est daté d'environ 35.500 ans au début du paléolithique supérieur. La principale sous-clade U6a est datée de 25.400 ans. Il n'est pas toujours facile de déterminer le lieu d'origine des différentes sous-clades de U6. U6a6 est probablement originaire d'Afrique du Nord car ses échantillons sont principalement situés au Maghreb. Il est daté de 22.300 ans. U6a1 est principalement Européen avec une forte contribution Ibérique, et avec quelques séquences Maghrébines. U6a2 (17.200 ans) est essentiellement présent en Ethiopie avec une diffusion vers le Proche-Orient. U6a3 (18.000 ans) comprend des branches spécifiquement subsahariennes: U6a3c et U6a3d et une branche Maghrébine et Ibérique: U6a3b. U6c (9.900 ans) et U6d (12.000 ans) sont présents à faible fréquence en Ibérie, Europe et Afrique du Nord. U6a5 (12.000 ans) est présent en Afrique subsaharienne, mais aussi en Tunisie et Italie indiquant peut-être une route de diffusion vers le nord. U6a7a (7.000 ans) et U6b (11.300 ans) ont des branches basales en Afrique du Nord, Ibérie, Proche-Orient et en Afrique de l'ouest. Certaines des branches de U6a7 ont été reliées à des événements historiques intéressants notamment un groupe séphardique. Enfin U6b1a est un groupe correspondant à la première colonisation des îles Canaries.

M1 est daté d'environ 26.100 ans suivi de près par M1a (21.000 ans) et M1b (22.400 ans). Il est principalement représenté en Afrique de l'est, en Asie du sud-ouest et dans le Caucase. Il y a peu de séquences Ibériques reliées à des séquences nord Africaines ou du Proche-Orient.

La figure ci-dessous représente l'arbre obtenu pour l'haplogroupe L:
2015_Hernandez_Figure3.jpg

La principale entrée en Europe correspond à L1b (35.800 ans) contemporaine de U6. La plupart des séquences Européennes appartiennent à L1b1, donc les premières migrations sont plus récentes que son âge estimé à environ 12.000 ans. D'autres séquences européennes appartiennent à L2 ou L3. Notamment les séquences Ibériques se regroupent ensemble bien qu'originaire de régions distantes. Il est possible qu'elles descendent d'émigrants Hispano-Américains revenus dans la péninsule en provenance d'Amérique après un mélange génétique avec des Afro-Américains.

Ensuite les auteurs ont utilisé l'analyse de l'effet fondateur. Celle-ci suppose une séparation nette entre population source et population cible, ainsi que deux critères f1 et f2 pour identifier les séquences fondatrices. La figure ci-dessous donne les résultats obtenus pour l'haplogroupe L:
2015_Hernandez_Figure4.jpg

La population source est l'Afrique subsaharienne et les populations cible sont l'Afrique du Nord, l'Europe Méditerranéenne et la péninsule Ibérique. Il y a deux pics d'entrée en Afrique du Nord: l'un est très récent et l'autre se situe durant l'optimal climatique de l'holocène (entre 6600 et 11800 ans). Le premier est probablement relié au marché aux esclaves vers le Maghreb et correspond à environ un tiers des lignages L. Le second, plus ancien, correspond aux deux tiers des lignages L. On retrouve des schémas équivalents pour l'entrée en Europe Méditerranéenne et en Ibérie.

Une analyse équivalente a été effectuée pour l'haplogroupe U6 avec deux hypothèses. La première et la plus probable est de prendre l'Afrique du Nord comme population source et l'Ibérie comme population cible. Cette analyse a d'abord été faite à partir des séquences HVR1. On voit ainsi sur la figure A ci-dessous un premier pic entre 800 et 1000 ans suivi par un plateau vers 10.000 ans et un second pic à 13.000 ans (courbe verte):
2015_Hernandez_Figure5.jpg

La seconde hypothèse envisage une migration de U6 de l'Ibérie vers l'Afrique du Nord (courbe rouge). On y voit un pic important à 9000 ans, et un plus petit il y a 3000 ans. Les séquences HVR1 ne donnent pas de bonne information sur le sens des migrations.

La même analyse a été faite à partir uniquement des séquences complètes (voir les courbes de la figure B ci-dessus). Deux pics apparaissent sur la courbe verte: un autour de 10.000 ans et un second très récent. Dans l'hypothèse inverse (courbe rouge) on voit un ancien pic vieux de 20.000 ans et un second beaucoup plus récent. Le pic ancien correspond plus probablement à une première diffusion de U6 en Afrique du Nord des clades uniquement Africaines et ne correspondent donc pas à une migration venue d'Ibérie.

La bonne hypothèse est donc celle qui prend pour source l'Afrique du Nord et cible l'Ibérie et correspond à la courbe verte. De plus, la première entrée de U6 en Ibérie il y a 10.000 ans correspond bien à l'entrée de l'haplogroupe L.

Une analyse Bayesian Skyline Plot a également été effectuée pour l'haplogroupe U6:
2015_Hernandez_Figure7.jpg

La première expansion de population est observée en Afrique du Nord (courbe verte), suivie 2000 ans plus tard par une expansion en Ibérie (courbe rouge). Ces expansions sont datées entre 20.000 et 11.500 ans, suivies par une longue période de stabilité. Ensuite une expansion a lieu en Afrique subsaharienne entre 10.000 et 5500 ans (courbe marron) et correspond à une période humide. En Ibérie on remarque une décroissance des lignées U6 entre 5000 et 2500 ans suivie par un plateau. On observe pas de signal correspondant aux époques romaine ou islamique.

En conclusion, les auteurs proposent le modèle démographique suivant: il y a environ 20.000 ans, l'haplogroupe U6 s'est largement diffusé dans la population du nord-ouest de l'Afrique associé à l'émergence de la culture Ibéromaurusienne. Ce pool génétique s'est plus tard enrichi de lignages subsahariens de l'haplogroupe L, notamment L1b qui est arrivé dans la région au début de la période humide entre 11.000 et 5.500 ans. Ensuite ces lignages U6 et L sont entrés en Ibérie à la même époque au début de l'holocène. Cette période humide a également permis l'arrivée de certains lignages U6 dans la zone sub-Saharienne. Les épisodes démographiques plus récents sont probablement associés à la période islamique, puis à la traite des esclaves.

lundi 19 janvier 2015

La diversité mitochondriale autour du détroit de Bering éclaire les migrations préhistoriques entre la Sibérie et l'Amérique du nord arctique

Stanislav Dryomov vient de publier un papier intitulé: Mitochondrial genome diversity at the Bering Strait area highlights prehistoric human migrations from Siberia to northern North America.

Durant le dernier âge glaciaire entre 28.000 et 18.000 ans, l'arctique sibérien était complétement abandonné ou très faiblement peuplé. Le réchauffement climatique entre 17.000 et 15.000 ans a permis à certaines populations d'atteindre l'ouest de l'Alaska, alors que d'autres sont restées bloquées en Béringie. La première colonisation du nouveau monde a été suivie par une période de flux de gènes entre les populations asiatiques et américaines. Ainsi une étude précédente a montré que cette première colonisation de l'Amérique a été suivie par au moins deux mouvements de populations du nord-est de l'Eurasie vers l'Amérique. La première a contribué à l'arrivée de la majorité de l'ascendance Native Américaine. Les mouvements suivants ont affecté principalement les groupes Na-Dene et Eskimo-Aléoutes.

Les haplogroupes mitochondriaux des populations arctique du nord-est de la Sibérie et du nord de l'Amérique sont essentiellement A2a, A2b, D2a et D4b1a2a1. Dans cette étude, les auteurs ont obtenu 52 nouvelles séquences complètes mitochondriales qui se rajoutent à 149 séquences préalablement publiées.
2015_Dryomov_Figure1.jpeg

Sur les 201 séquences obtenues, 8 séquences appartenant aux haplogroupes C5a2, C4b2 et D3 ont été retirées de l'étude pour se focaliser sur les 4 haplogroupes principaux.

108 séquences appartiennent aux 2 haplogroupes A2a et A2b. A2a est divisé en 5 sous-clades:
2015_Dryomov_FigureS1.jpeg

Contrairement aux sous-clades A2a1, A2a2 et A2a3 qui sont confinées dans la région arctique, les sous-clades A2a4 et A2a5 intègrent des tribus Na-Dene comme les Apaches ou les Navajo. L'âge de l'haplogroupe A2a est estimé à 3900 ans.

La sous-clade A2b a émergé dans la région du détroit de Bering il y a seulement 2600 ans peu de temps avant la séparation et la diffusion des populations parlant Inupiaq dans le nord de l'Alaska et le Canada arctique.

63 séquences appartiennent à l'haplogroupe D2a: 36 sont issues des îles du Commandeur à l'extrêmité ouest des îles Aléoutiennes, 22 sont issues de la péninsule de Chukotka à l'extrêmité est de la pointe nord-est de la Sibérie, et les 5 dernières viennent du Canada arctique et du Groënland.
2015_Dryomov_FigureS3.jpeg

La sous-clade D2a1 est largement diffusée et englobe les Paléo-Eskimo (Saqqaq), datés de 3600 à 4200 ans, les Aléoutes (D2a1a), les Eskimos Sireniki (D2a1b), et la culture de Dorset moyen. La sous-clade D2a2 est associée aux Eskimos Plover et Chaplin, ainsi qu'aux populations Tchouktches de la côte arctique. La présence de la sous-clade D2a2 en Sibérie est intrigante et pourrait être liée au déplacement de population d'une cinquantaine de Yupiks de la baie Plover sur l'île Wrangel en 1926 par le gouvernement soviétique.

L'âge de l'haplogroupe D2a est estimé à environ 4300 ans et l'âge de la sous-clade D2a1a spécifiquement Alléoute est de seulement 1200 ans.

L'haplogroupe D4b1a2 est séparé en 2 sous-clades principales: D4b1a2a1 et D4b1a2a2:
2015_Dryomov_FigureS3b.jpeg

La distribution géographique de l'haplogroupe D4b1a2 et son âge de 9400 ans environ peut être attribué à certains sibériens différenciés dans le refuge Altai-Sayan, qui se sont ensuite dirigés vers le nord-est de la Sibérie. Ainsi les Toubalars de l'Altaï sont liés génétiquement avec des populations Néo-Eskimos avec un ancêtre commun vieux d'environ 5300 ans.

La phylogéographie de A2 montre que la Béringie centrale est le lieu d'origine de cet haplogroupe qui a émergé il y a environ 15.000 ans. Cette date est en accord avec l'archéologie qui montre un premier peuplement de cette zone il y a 14.500 ans à Swan Point en Alaska. De plus A2 est absent de l'intérieur de la Sibérie.

Les variations de l'haplogroupe D2a dans les îles du Commandeur montrent que 5 séquences ne sont pas d'origine Alléoutienne, mais Native Américaine. Ces résultats sont en accord avec l'histoire qui indique que des femmes Tlingit de New Archangel dans le sud-est de l'Alaska ont été relocalisées en 1840 par la compagnie russe d'Amérique.

La première colonisation de l'arctique nord américain a été fait par les Paléo-Eskimos il y a environ 5000 ans. Cette colonisation a coïncidé avec un réchauffement climatique qui a permis aux hommes de suivre leur gibier: caribous et boeufs musqués. Il y a environ 1000 ans, presque tous les groupes Paléo-Eskimos ont été remplacés par des groupes de la culture de Thulé d'Alaska appelés aussi Néo-Eskimos. Ils étaient les ancêtres directs des Inuits actuels, et chassaient les mammifères marins comme les baleines. Bien que les Néo-Eskimos sont originaires des côtes arctiques, il n'est pas vraiment clair si les Inuits et les Paléo-Eskimos sont génétiquement issus du même peuple ou sont des groupes différents. Sur les 3 tribus Eskimos (Sireniki, Chaplin et Naukan), seuls les Naukan sont génétiquement similaires aux Inuits du Canada et du Groënland, parce qu'ils incluent la sous-clade D4b1a2a1. Cependant, les Néo-Eskimos, Naukan compris, n'incluent pas la sous-clade D2a. Au contraire les Sireniki incluent la sous-clade D2a1b qui est une trace des Paléo-Eskimos. Mais il faut être prudent, car ces résultats sont peut-être liés à un problème de sous-échantillonnage (trop peu de séquences obtenues aujourd'hui).

Les ancêtres directs des Paléo-Eskimos sont issus principalement de la péninsule de Chukotka en Sibérie nord orientale, alors que les Néo-Eskimos sont trouvés principalement dans le nord de l'Alaska, mais ont aussi une ascendance Altaï-Sayan. Cette étude pointe vers une origine commune des Paléo-Eskimos, des Alléoutes et des Tlingit (avec probablement d'autres groupes Na-Dene), dont les ancêtres communs vivaient sur la côte sud de la Béringie au début de l'holocène.

vendredi 29 août 2014

Amélioration de la calibration de l'horloge mitochondriale humaine utilisant d'anciens génomes

Adrien Rieux vient de publier un papier intitulé: Improved calibration of the human mitochondrial clock using ancient genomes.

Dans cette étude les auteurs ont utilisé 30 génomes mitochondriaux anciens et 320 génomes mitochondriaux contemporains pour estimer le taux de mutation et les âges des populations. Parmi les séquences contemporaines, 146 ont été générées spécifiquement dans le cadre de cette étude:
2014 Rieux Figure S2

Les génomes anciens sont les suivants:
2014 Rieux Table S3b

Parmi ces anciennes séquences, quatre présentent un excès substantiel de A/T par rapport à G/C témoignant ainsi d'un effet de déamination important. Pour cette raison, ces quatre séquences ont été écartées de la présente étude. Ces séquences sont les quatre séquences suédoises: Ire8, Ajv52, Ajv70 et Gok4. L'arbre obtenu à partir de ces séquences est le suivant:
2014 Rieux Figure 1

Seule une partie (85) des séquences a été visualisée dans l'arbre ci-dessus pour des raisons de visibilité. Les étoiles rouges dans la figure ci-dessus correspondent à différents événements démographiques utilisés pour la calibration des nœuds de l'arbre. Les ronds colorés correspondent aux échantillons contemporains alors que les rectangles colorés correspondent aux génomes anciens utilisés pour la calibration des bouts de branche de l'arbre.

Les auteurs ont ainsi montré qu'il y a une relation linéaire entre l'âge des génomes anciens et le nombre de substitutions de ces génomes anciens:
2014 Rieux Figure S10

Dans la figure ci-dessus les points bleus représentent les génomes de Néanderthal, les points rouges représentent les génomes des hommes modernes anciens et les points noirs à droite les génomes contemporains. A partir de cette relation les auteurs on pu estimer l'âge des principaux haplogroupes:
2014 Rieux Table S11

Ainsi l'âge de l'haplogroupe U est estimé à 53000 ans.

Les auteurs ont ensuite utilisé différents scénario de calibration. Ainsi la calibration de la racine (scission hommes/chimpanzés) conduit aux plus basses estimations du taux de mutations. Inversement, la calibration des nœuds intermédiaire de l'arbre phylogénétique (événements démographiques), produit les plus hautes estimations du taux de mutations. En fait, la calibration des bouts de branches obtenus avec les génomes anciens produit un taux de mutations intermédiaire. De plus l'intervalle de variation de l'estimation est plus petit lorsqu'on utilise une calibration basée sur les bouts de branches que lorsqu'on utilise une calibration basée sur les nœuds de l'arbre phylogénétique. L'utilisation de génomes anciens est donc plus fiable que l'utilisation des événements démographiques pour calibrer l'horloge mitochondriale. En effet l'utilisation des événements démographiques peut être biaisée si la population initiale inclue plusieurs branches du même haplogroupe, si la colonisation envisagée est réalisée par différentes vagues successives ou encore si la population initiale subit des effets de goulot génétique.

Les valeurs obtenues pour le taux de mutations en utilisant les génomes anciens dans cette étude (2,14 10-8 par site et par an) sont proches des valeurs obtenus dans d'autres études comme celles de Brotherton, 2013 (2,4 10-8 par site et par an) et Fu, 2013 (1,92 10-8 par site et par an). L'utilisation de ce taux de mutations permet d'estimer l'âge de scission entre humains et chimpanzés à environ 4,1 millions d'années, l'âge de scission entre Néanderthal et l'homme moderne à environ 389.000 ans, l'âge de l'ancêtre commun à tous les hommes modernes à environ 143.000 ans, l'âge de la sortie de l'Afrique à 72.000 ans

jeudi 22 mai 2014

Histoire de l'haplogroupe mitochondrial U6 en Afrique, en Eurasie et en Amérique

Je pouvais difficilement passé sous silence ce nouveau papier concernant l'haplogroupe mitochondrial U6 intitulé: The history of the North African mitochondrial DNA haplogroup U6 gene flow into the African, Eurasian and American continents.

Après sa sortie de l'Afrique, un des plus important mouvement migratoire de l'homme moderne a été de retourner en Afrique. Un signal de cette migration est donné par les haplogroupes mitochondriaux U6 et M1 qui ont une distribution principalement en Afrique du Nord et de l'Est. L'expansion de l'haplogroupe U6 a été corrélé à différentes cultures archéologiques nord africaines comme l'Atérien, le Dabbéen, l'Ibéromaurusien et le Capsien.On pensait que l'Atérien était vieux d'environ 40.000 à 20.000 ans, mais de récentes découvertes archéologiques ont montré qu'il datait en réalité entre 90.000 et 40.000 ans. Comme l'haplogroupe U6 est daté d'environ 35.000 ans, cela exclu l'Atérien des cultures qui lui sont associées. Des tests d'ADN ancien sur des squelettes marocains de la culture Ibéromaurusienne datés d'environ 12.000 ans ont montré qu'ils appartenaient aux haplogroupes mitochondriaux: H, JT, U6 et V. Ceci indique bien que l'haplogroupe U6 était déjà présent en Afrique du nord-ouest dans la culture Ibéromaurusienne.

Dans cette étude, les auteurs ont analysé 230 séquences mitochondriales complètes et 761 séquences limitées à la région HVR1, toutes de l'haplogroupe U6. Cela a permis d'améliorer considérablement notre connaissance de la phylogénie de l'haplogroupe U6 et d'identifier certaines sous-clades associées à un lieu géographique ou un groupe ethnique spécifique. Ainsi U6a1 est un groupe méditerranéen (européen ou maghrébin), U6a2 est relié principalement à des groupes éthiopiens, U6a8 est un groupe maghrébin, U6a3 se divisent en des groupes européens (U6a3a), maghrébins (U6a3b et U6a3e), ou ouest-Africains (U6a3c et U6a3f), U6a5 inclus deux groupes ouest africains et U6a6 est maghrébin. U6a7 est principalement européen, et contient un sous-groupe acadien (U6a7a1a) et un sous-groupe séphardique (U6a7a1b). U6b est un groupe moins fréquent que U6a, mais il est largement distribué le long du Sahel des Iles Canaries au Soudan, jusque dans la péninsule arabique. On le retrouve également dans la péninsule ibérique. U6d se retrouve en Afrique de l'Est, au Maghreb et en Europe. Le groupe U6c se retrouve au Maghreb, aux Canaries et en Europe méditerranéenne:
2014 Secher Figure 2

Neuf des onze séquences appartenant à la sous-clade U6a7a1a appartiennent à des descendants directs de 2 sœurs d'origine française qui se sont mariées en Acadie au 17ème siècle. Cela a permis de dessiner un arbre généalogique sur 15 générations à partir de 1625, soit une moyenne d'environ 25 ans par génération:
2014 Secher Figure 1

Dans cette famille, 2 polymorphismes hétéroplasmiques aux positions 146Y et 3202Y et 1 substitution à la position 15152 ont été détectées. Cela conduit à un taux de mutation de 1 substitution pour 90 événements soit 0.027 substitution par site et millions d'années. Cette valeur est plus élevée que la taux de mutation communément admis. Cette différence peut néanmoins s'expliquer par le taux d'hétéroplasmie, et le sexe des individus chez qui les mutations apparaissent puisque les hommes ne transmettent pas leur ADN mitochondrial à leurs enfants.

Discussion

L'origine probable de l'haplogroupe U6 est an Asie de l'ouest. Son âge est estimé à environ 35.300 ans, au début du paléolithique supérieur. On est situé avant le Dernier Maximum Glaciaire, mais la période est cependant suffisamment froide pour imposer un retour vers l'Afrique le long de la côte nord. La sous-clade U6a est âgée d'environ 26,200 ans et a probablement émergée en Afrique du Nord-Ouest. Si on considère la longueur de la côte nord de l'Afrique à environ 5.000 km, on peut considérer que la migration U6 initiale à mis 9.000 ans pour réaliser ces 5.000 km, soit une moyenne d'environ 0,56 km par an ou 14 km par génération. C'est une distance raisonable pour des chasseurs-cueilleurs.

L'arrivée de l'haplogroupe U6 en Afrique du Nord-Ouest correspond probablement à la culture Ibéromaurusienne et à l'expansion de la sous-clade U6a. Autour de 20.000 ans plusieurs sous-clades se sont dispersées au Maghreb (U6a3, U6a6, U6a6b, U6a7 et U6a7b), ou même jusqu'en Ibérie (U6a1 et U6a1b). Les aléas climatiques (aridité) ont probablement poussé l'haplogroupe U6a2 jusque sur les hauteurs d'Afrique de l'Est il y a environ 16.000 ans. Ensuite le climat est devenu plus humide en Afrique. La période entre 13.000 et 10.000 ans voit l'émergence des sous-clades U6b, U6d et U6c. U6b s'étend du Maghreb, à travers le Sahel, à l'Afrique de l'ouest jusqu'aux Iles Canaries d'un côté et en Afrique de l'Est et en Arabie de l'autre côté. U6c et U6d sont beaucoup plus localisés au Maghreb. Plusieurs autres dispersions traversent également le Sahara: U6a5a, U6a5b. Puis un assèchement du désert a mis fin à ce chemin. Les expansions ont continué le long de la côte ouest: U6a3f, U6a3c et U6b3, et également au Maghreb jusqu'en Europe: U6b2, U6a3e, U6a1b et U6a3b1.

La théorie de la coalescence permet d'estimer la taille des populations dans le passé, notamment à l'aide du logiciel BEAST. La figure a ci-dessous estime ainsi l'évolution de la population U6 totale en fonction du temps:
2014 Secher Figure 3

On remarque ainsi une expansion continue jusque vers 15.000 ans, puis une stagnation jusque vers 3000 ans suivie par une brusque expansion. La figure b ci-dessus redonne la même estimation uniquement à partir des séquences africaines. On remarque alors une croissance jusque vers 20.000 ans suivi par une stagnation de la population durant le Dernier Maximum Glaciaire. La croissance repart ensuite à partir de 8.000 ans, correspondant au tout début du néolithique.

L'archipel des Iles Canaries est seulement à 100 km des côtes africaines. Quand il a été découvert par les européens au 15ème siècle, il était habité par une population appelée Guanche. Ces Guanches ont de proches affinités avec les berbères d'Afrique du Nord. Les analyses mitochondriales ont montré que les haplogroupes U6b1a et U6c1 étaient présents dans les Iles Canaries avant l'arrivée des européens. On considère que les premiers habitants sont arrivés il y a seulement 2500 ans. Cette date ne correspond pas à l'âge estimée pour la clade U6b1a (3600 ans) que l'on ne trouve qu'aux Iles Canaries. On suppose effectivement que plusieurs lignages sont arrivés ensemble dans l'archipel: U6b1a1, U6b1a2, U6b1a3 et U6c1b âgés respectivement de 1500, 2600, 1300 et 1300 ans environ. Connaissant la marge d'erreur, ces dates sont plus en accord avec les données archéologiques.

Les fréquences de U6 sont très faibles en Europe, bien que plus élevées dans les régions méditerranéennes: Portugal (2.5%), Espagne (1.1%) ou Sicile (0.4%), avec un gradient décroissant de l'ouest vers l'est. Les résultats de cette étude montrent que U6 est arrivée en Europe aussi bien aux temps préhistoriques qu'historiques. On trouve ainsi des traces d'arrivée en Europe aux racines de la sous-clade U6a1 âgée de 18.600 ans. Il y a également des séquences européennes à la racine de U6a2 (16.800 ans). La sous-clade U6a4 âgée de 10.600 ans semble montrer un signal de dispersion lié à la diffusion du néolithique en Europe. De même, les sous-clades U6a3a (9600 ans) et U6a7a (7600 ans) montres des expansions européennes au néolithique. D'autres groupes se dispersent en Europe seulement au chalcolithique: U6a3a1, U6a7a1, U6a7a2 et U6c1. Enfin 14 lignages européens montrent une diffusion aux périodes historiques: U6d1a semble lié à la conquête romaine des Iles Britanniques, U6a7a1b est une diffusion des juifs séphardiques, Enfin U6a1a1a2, U6a7a1a, U6a7a2a1 et U6b1a montrent une colonisation européenne de l'Amérique.

Les français sont arrivés en Acadie au début du 17ème siècle. La sous-clade U6a7a1a est représentative de cette colonisation. Onze séquences complètes appartiennent à ce lignage. L'âge de ce groupe est estimé à 467 ans en accord avec son histoire. Une autre séquence très proche de ce groupe bien qu'elle diffère d'une mutation ancre son origine en France au milieu de l'Age du Bronze.

Diverses séquences américaines se regroupent avec des individus de diverses origines: Europe, Europe méditerranéenne, Afrique du Nord, Afrique sub-saharienne. La fréquence de U6 reste faible dans les 3 principales communautés ethniques américaines: 0,62% chez les afro-américains, 0,31% chez les caucasiens et 0,75% chez les hispaniques.

mardi 29 avril 2014

Histoire maternelle de l'Océanie

Ana Duggan vient de publier un papier intéressant intitulé: Maternal History of Oceania from Complete mtDNA Genomes: Contrasting Ancient Diversity with Recent Homogenization Due to the Austronesian Expansion.

L'occupation humaine de la Nouvelle-Guinée et de l'Australie qui étaient regroupés en une seule terre nommée Sahul a eu lieu il y a environ 44.000 ans. Les hommes se sont alors dispersé aussitôt à travers le détroit de Vitiaz et les îles de l'archipel de Bismarck. Les descendants de cette expansion initiale ont voyagé et se sont installés au moins jusqu'à l'île de Buka au nord de l'archipel Salomon, il y a environ 28.000 ans, puis l'île de Manus dans les îles de l'Amirauté, il y a 12.000 ans. Ils possédaient ainsi suffisamment de compétence marine pour naviguer sur plus de 200 km. Cependant, ils n'ont pas été plus loin. En fait, il semble que la colonisation de la Lointaine-Océanie (Iles Reef, Santa Cruz, Vanuatu, Nouvelle Calédonie, Fiji, et la Polynésie), et probablement la plupart des îles Salomon a été réalisée par les descendants d'une expansion qui a débuté à Taiwan il y a 5000 à 6000 ans, atteignant d'abord la Proche-Océanie il y a 3500 à 3300 ans, puis la Lointaine-Océanie il y a seulement 3100 ans culminant avec la colonisation de l'archipel d'Hawaï, l'île de Pâques et la Nouvelle-Zélande il y a seulement 800 à 1200 ans.

Chacune de ces 2 expansions est associée à des peuples, phénotypes, culture et langage distincts. Ainsi la première expansion est associée à des papous vivant dans une société patriarcale, ayant une peau sombre et parlant un très vieux langage. Au contraire, la seconde migration est associée à un style de poterie, une langue austronésienne descendant d'un langage proto-océanique. Ils vivaient dans une société matriarcale et avaient une peau plus claire que les papous.

Les précédentes études génétiques ont montré que l'expansion austronésienne est associée à la diffusion de l'haplogroupe B (notamment B4a1) de l'ADN mitochondrial, alors que l'expansion papoue est associée à la diffusion des haplogroupes Q, P, M27, M28 et M29.

Dans cette étude, les auteurs ont analysé 1331 séquences complètes mitochondriales appartenant à 34 populations réparties entre l'archipel de Bismarck et la Polynésie:
2014 Duggan Figure 1

Les fréquences relatives en fonction des différents haplogroupes, pour les 34 populations sont décrites dans la figure ci-dessous:
2014 Duggan Figure 2

En général, les fréquences des haplogroupes d'origine Proche-Océanienne (P, Q, M27, M28 et M29) décroissent lorsque l'on s'éloigne de la Nouvelle-Guinée à l'intérieur du Pacifique. Cependant, 2 populations contredisent cette tendance: Nagovisi de Bougainville avec 97% d'haplogroupe B et Santa Cruz avec 85% d'haplogroupes Proche-Océaniens.

L'haplogroupe B est de loin l'haplogroupe dominant dans cette étude avec 76% des séquences. La sous-clade B4a1a1a correspond à elle toute seule à 69% des séquences. L'analyse des haplotypes montre que cet haplogroupe s'est propagé récemment et rapidement dans la région. Ce résultat est également conforté par l'analyse Bayesian Skyline Plot qui estime l'évolution en fonction du temps.

Les plus vieux haplogroupes: Q, P, M27, M28 et M29 sont supposés être autochtones à la Proche-Océanie. Ainsi trois lignages de l'haplogroupe M27 divergent il y a environ 60.000 ans:
2014 Duggan Figure 5

L'haplogroupe M28a est très largement répandu dans tous les groupes de populations sauf en Polynésie. Q1 est également largement répandu et représente 40% des échantillons de Santa Cruz. Enfin un nouveau lignage nommé M* a été découvert dans cette étude à Bougainville, les îles Salomon et Santa Cruz. Il diverge d'environ 60.000 ans des haplogroupes M28 et M29. La dispersion de ce lignage M* remonte à environ 5900 ans, ce qui est plus récent que les autres lignages Proche-Océaniens.

La présence d'haplogroupes différents de B et des haplogroupes Proche-Océaniens comme l'haplogroupe E indique d'autres influences migratoires. Ainsi E1b1 représente 45% de la population Ata. L'haplogroupe E1 se retrouve uniquement à la Nouvelle Bretagne, Bougainville et les îles Salomon. L'haplogroupe E2a se retrouve seulement dans 3 échantillons sur l'île Isabelle dans les îles Salomon. L'haplogroupe E se retrouve également à relativement haute fréquence dans les îles du sud-est de l'Asie et à Taiwan. La dispersion de l'haplogroupe E en Océanie est estimée à environ 14.000 ans, bien avant l'expansion austronésienne.

La haute proportion de lignages Proche-Océaniens sur l'île de Santa-Cruz est connue et non expliquée. Cette île est peuplée depuis 3200 ans probablement à partir de l'archipel de Bismarck. Les habitant parlent une langue austronésienne. La raison de la composition génétique de cette île reste une énigme. On ignore si sa colonisation remonte à l'arrivée de la vague austronésienne ou si elle est plus ancienne.

samedi 1 février 2014

Héritage maternel en Andalousie

Candela Hernandez vient de publier un papier intéressant concernant l'étude de l'ADN mitochondrial dans deux régions d'Andalousie: Huelva à l'ouest et Grenade à l'est. Il est intitulé: Human maternal heritage in Andalusia (Spain): its composition reveals high internal complexity and distinctive influences of mtDNA haplogroups U6 and L in the western and eastern side of region.

L'archéologie et l'histoire de l'ancienne Méditerranée a montré que cette mer a toujours été un obstacle perméable aux migrations humaines. Au cours des âges, de multiples échanges culturels autour de la Méditerranée se sont produits donnant lieu probablement à des mélanges de population. Une région critique de ces migrations a été la Péninsule Ibérique de part sa situation géographique stratégique en contact avec l'Océan Atlantique et la Mer Méditerranée et sa proximité avec le continent Africain via le détroit de Gibraltar.

L'ADN mitochondrial est l'un des outils les plus utilisés pour la connaissance de la diversité génétique ibérique. Cependant l'absence de recherche concernant la mise en œuvre de cet outil en Andalousie est frappante. Cette étude fournit ainsi la composition mitochondriale de deux régions d'Andalousie: les provinces de Huelva et Grenade, localisées respectivement à l'ouest et à l'est:
2014 Hernandez Figure 1

Les deux provinces sont ouvertes sur la mer et par conséquent sont sujettes aux contacts maritimes.

Dans cette étude, 279 séquences mitochondriales ont été analysées: 158 dans la province de Huelva et 121 dans la province de Grenade. Pour chaque échantillon la région HVR1 et une partie de la région HVR2 ont été testées. De plus, 47 marqueurs de la région codante ont été testés afin de déterminer l'haplogroupe de chaque séquence. Ainsi un total de 197 haplotypes a été déterminé: 104 en Huelva et 95 en Grenade. La diversité génétique est équivalente dans les deux régions, bien que supérieure aux autres régions ibériques.

La composition mitochondriale des Andalous est typique de l'Europe de l'ouest avec 85,4% d'haplogroupes eurasiens en Huelva et 96,7% en Grenade. La moitié des lignages européens est constitué par les sous-clades de l'haplogroupe R0. Parmi eux l'haplogroupe H couvre 40 à 50% du pool génétique européen avec un gradient décroissant vers l'est et le sud du continent. Dans cette étude la fréquence de l'haplogroupe H est particulièrement basse en Huelva avec une valeur de 32,9%, alors qu'elle est de 50,4% en Grenade. Cette valeur est proche de 60% dans le nord de l'Espagne. Les sous-clades H1 et H3 montrent des pics de fréquences traditionnellement interprétés comme un signal d'expansion post-glaciaire à partir du refuge franco-cantabrique vers le nord-est de l'Europe. Ces lignages sont effectivement trouvés en Andalousie (Huelva, H1: 17.7% et H3: 2.5% et Grenade, H1: 16.5% et H3: 5.8%).

Les haplogroupes frères J et T montrent les caractéristiques suivantes. En Europe de l'ouest, T2 représente environ 80% de T. Ce qui est pratiquement le cas en Huelva (90%) et en Grenade (72,7%). Par contre T1 est plus fréquent chez les berbères marocains et les égyptiens. Les sous-clades de J: J1b1a, J2a1a et J2b1a ont été détectées chez les andalous. Les deux premières sont associées à des expansions post-glaciaire du Proche-Orient vers l'Europe alors que la dernière est spécifique à l'Europe.

La fréquence des haplogroupes U/K est supérieure en Huelva (36,1%) qu'en Grenade (15,7%). U5 est l'une des sous-clades de U les plus fréquentes en Europe. En Huelva il représente 8,2% sur 15,8% pour U(xU6). En Grenade il représente 10,7% pour 12,4% pour U(xU6). L'haplogroupe K est très fréquent en Huelva (11,4%) alors qu'il est seulement de 1,6% en Grenade. Enfin, l'haplogroupe N1 qui est très rare en Europe est trouvé avec une fréquence de 3,3% en Grenade.

Les haplogroupes U6 et M1 sont considérés comme des marqueurs des populations d'Afrique du Nord. En Europe ils sont distribués inégalement avec l'haplogroupe L à faible fréquence avec des pics situés dans la péninsule ibérique. Les andalous de l'ouest de la province de Huelva possèdent de hautes fréquences de ces haplogroupes: 14,6%. Cette valeur est seulement de 3,3% chez les andalous de l'est de la province de Grenade. L'haplogroupe U6 apparait avec des fréquences variant de 0,5 à 5% dans la péninsule ibérique. En Afrique du nord-ouest, ce lignage est prépondérant tant en fréquence qu'en diversité: 11% chez les berbères marocains et 8% chez les arabes tunisiens. En Huelva il est proche de 9%. L'haplogroupe M1 a été trouvé dans un seul individu de Grenade. Enfin l'haplogroupe sub-saharien L est présent avec une fréquence de 5,7% en Huelva, alors qu'il est seulement de 0,8% en Grenade.
2014 Hernandez Figure 3

Le réservoir génétique des Andalous des provinces de Huelva et de Grenade, révèle un vaste spectre d'haplogroupes originaires de différents continents. Les basses fréquences des marqueurs eurasiens et les hautes fréquences de marqueurs africains parmi les population de Huelva constituent un résultat frappant des caractéristiques mitochondriales en Andalousie et dans la péninsule ibérique indiquant une sous-structure de la population féminine. Ainsi, l'Andalousie ne peut être considérée comme une population unique. La province de Huelva apparait comme intermédiaire entre l'Europe du sud-ouest, le Maghreb, la Méditerranée centrale et orientale.

Les lignages mitochondriaux les plus adéquats pour étudier les migrations entre la Péninsule Ibérique et l'Afrique du Nord sont U6 et L. Actuellement un débat intéressant existe au sujet de l'origine et la diffusion de l'haplogroupe U6. Certain auteurs favorisent une dispersion précoce de U6 il y a 40.000 ou 45.000 ans à partir de l'Asie du sud-ouest vers l'Afrique du Nord. Récemment, d'autres chercheurs ont proposé une dispersion plus récente de U6 associée avec la culture Ibéromaurusienne entre 20.000 et 9.000 ans.

La figure ci-dessous montre une carte de répartition de l'haplogroupe U6 autour de la Méditerranée:
2014 Hernandez Figure 6

L'expansion musulmane a été largement citée pour expliquer le flux de gènes entre l'Afrique du Nord et la Péninsule Ibérique, bien que d'autres mouvements humains ont sûrement eu lieu entre les côtes, et ceci depuis le paléolithique. La taille de la population ibérique était plus importante que celle de l'Afrique du Nord. Ainsi le mouvement du nord vers le sud devait être plus important que l'inverse. On peut ainsi supposer que des clades U6 originaire d'Ibérie ont du se diffuser en Afrique du Nord. La présence de U6 au Proche-Orient et en Éthiopie reflète des mouvements de populations à travers la Mer Méditerranée. L'hypothèse d'un chemin terrestre est en effet moins probable. Certains auteurs ont proposé une route maritime qui a conduit à l'entrée du Néolithique en Ibérie. Des mouvement similaires ont du reliés les côtes ibériques et nord-africaines. Enfin, plus tard, des contacts maritimes ont relié les côtes méditerranéennes orientales et occidentales durant le première millénaire avant JC. Ces contacts se sont poursuivis avec l'hégémonie de Carthage, puis celle de Rome. Ainsi il est probable que la diffusion de l'haplogroupe U6 entre les continents se soit passée à toutes les époques bien avant l'expansion musulmane et ceci de l'Ibérie vers l'Afrique du Nord.

Le lignage L1b est largement présent dans la province de Huelva. Son âge est estimé à environ 9700 ans et sa structure présente une forme en étoile. Son expansion hors d'Afrique s'est donc produit durant ou avant le Néolithique. La sous-clade L2a montre une structure différente qui n'est pas en étoile, et sa dispersion pourrait être liée à l'expansion musulmane.

En conclusion, les migrations entre le Maghreb et la Péninsule Ibérique ont eu lieu depuis le paléolithique. La navigation maritime a du être une pratique courante comme technique de pêche, sans perdre de vue les côtes pour des raisons de sécurité. La plus courte distance entre l'Afrique et l'Europe est localisée au détroit de Gibraltar. Cependant, les vents et la mer sont variables et dangereux autour du détroit. Il est donc possible qu'une route alternative ait reliée la côte est du Maroc avec les côtes andalouses entre Malaga et Almeria, avec l'île Alboran située au milieu. Cette dernière devait être connue dès le paléolithique avec ses réserves nombreuses de mammifères marins. De plus les restes archéologiques trouvés dans l'est du Maroc à Taforalt; suggèrent l'existence de contacts maritimes entre l'Europe et l'Afrique dès le Magdalénien.

vendredi 15 novembre 2013

Les premières dispersions de l'homme moderne en Afrique

Teresa Rito vient de publier un papier intéressant intitulé: The First Modern Human Dispersals across Africa, qui permet d'étudier les premières dispersions de l'homme moderne en Afrique à partir de l'analyse de l'ADN mitochondrial. S'il est communément admis que l'homme moderne prend ses origines en Afrique, il est difficile de déterminer en quel endroit de l'Afrique il a émergé. Les preuves viennent principalement de quatre disciplines: la paléoanthropologie, la génétique, l'archéologie et la paléoclimatologie.

A partir des premiers fossiles humains, l'Afrique de l'est a longtemps été considérée comme le berceau de l'homme moderne. Ainsi le plus ancien fossile connu daté de 190 à 200.000 ans a été trouvé en Éthiopie du sud-ouest.

Deux études génétiques autosomales récentes semblent indiquer une origine en Afrique du sud. L'étude du chromosome Y semble indiquer une origine en Afrique centrale de l'ouest, alors que l'ADN mitochondrial semble pointer vers l'Afrique du sud pour sa branche L0 et l'Afrique centrale de l'est pour sa branche L1'6. L'âge de l'ancêtre mitochondrial correspond à peu près aux plus anciens fossiles connus, soit 200.000 ans. L'âge de l'ancêtre relatif au chromosome Y est plus récent autour de 140.000 ans bien que récemment une ancienne branche (A00) a été découverte et repousse l'ancêtre commun à 350.000 ans.

Les enregistrements archéologiques suggèrent que le comportement et l'anatomie moderne ont émergé ensemble graduellement. Ainsi l'utilisation de ressources marines et de pigments remonte à 165.000 ans en Afrique du sud.

L'impact du climat sur la démographie a été inévitablement au centre du débat. Ainsi l'Afrique Centrale a subi plusieurs épisodes de grandes sécheresses entre 135.000 et 75.000 ans, suivis par des conditions humides entre 75.000 et 60.000 ans. Ces conditions ont été reliées aux expansions de L3 en Afrique et hors de l'Afrique. D'autre part, l'Afrique tropicale a pu servir de refuge pendant la période glaciaire entre 190.000 et 135.000 ans.

Les auteurs de cette étude ont testé 42 nouvelles séquences complètes de l'ADN mitochondrial appartenant à l'haplogroupe L0. Les échantillons sont localisés au Mozambique, dans l'archipel de São Tomé, en Somalie, en Nubie, au Soudan, au Kenya, au Tchad, au Niger, au Cameroun et en Éthiopie:
2013 Rito Figure S1

Les auteurs ont utilisé également des séquences complètes L0 préalablement testées, ainsi que 1250 séquences HVR1 également de l'haplogroupe L0. L'âge des différents sous-haplogroupes a été déterminé en utilisant l'horloge de Soares sur les séquences complètes. Bien qu'étant un lignage minoritaire en Afrique, L0 possède la moitié de la variabilité des populations africaines. L'arbre mitochondrial de l'espèce humaine se sépare pour la première fois il y a 180.000 ans pour donner naissance aux branches L0 et L1'6:
2013 Rito Figure 1

La branche L1'6 est beaucoup plus fréquente que la branche L0 et a une origine probable en Afrique Centrale ou de l'est.

La figure suivante montre l'arbre phylogénétique de l'haplogroupe L0 construit à partir des séquences mitochondriales complètes:
2013 Rito Figure 2

L0 date de 130.000 ans environ et est beaucoup plus fréquent en Afrique du sud à la fois chez les Khoesans et les Bantous. Les premières branches à se séparer sont d'abord L0d, puis L0k que l'on retrouve essentiellement en Afrique du sud, suggérant que l'haplogroupe L0 est originaire d'Afrique du sud:
2013 Rito Figure 3

L0d se sépare en deux branches: L0d1'2 et L0d3. Cette dernière indique une récente expansion de l'Afrique du sud vers Afrique de l'est qui a pu voir l'arrivée des langues à cliques dans cette région entre 25.000 et 7.500 ans. La branche L0k se sépare de l'arbre il y a environ 120.000 ans, mais ne se diversifie pas avant 40.000 ans. Au contraire des deux précédentes branches, la branche L0a'b'f est probablement originaire d'Afrique de l'est. Elle date d'environ 90 ou 95.000 ans. L0f se diversifie il y a 70 ou 80.000 ans et se retrouve essentiellement en Ouganda et en Tanzanie. les branches L0a et L0b se séparent il y a environ 70.000 ans. L0b se disperse il y a environ 50.000 ans et est centrée sur le Kenya. Enfin la branche la plus commune: L0a se disperse il y a environ 40.000 ans et a une distribution plus complexe. Elle a cependant probablement une origine en Afrique de l'est. Enfin une analyse de l'effet fondateur pour l'ensemble de l'haplogroupe L0 montre un pic il y a environ 2000 ans. Ce pic est relié à une expansion qui commence probablement dans la région des grands lacs en Afrique de l'est. Elle est portée par différentes sous-clades de la branche L0a. Ces lignages bougent d'Afrique de l'est vers l'Afrique centrale il y a 10 à 12.000 ans, avant d'être incorporés à une population qui sera à l'origine de l'expansion bantoue il y a environ 2000 ans. Pour résumé, l'haplogroupe L est probablement originaire d'Afrique Centrale il y a 180.000 ans. Ensuite L0 émerge en Afrique du sud il y a 130.000 ans. Puis la branche L0a'b'f émerge il y a 95.000 ans en Afrique de l'est, puis L0a émerge il y a 40.000 ans en Afrique de l'est avant de se disperser au début de l'holocène vers l'Afrique Centrale, et enfin revenir en Afrique du sud avec l'expansion bantoue il y a 2000 ans:
2013 Rito Figure 5

Il est frappant de noter que l'émergence de l'haplogroupe L0 il y a 130.000 ans coïncide avec le début de grandes périodes de sécheresse en Afrique. C'est également à cette période que les enregistrements archéologiques deviennent plus fréquents. On peut ainsi penser que l'accroissement de l'aridité a provoqué une expansion démographique: l'homme est devenu plus mobile. Curieusement, l'expansion de la branche L0a'b il y a 70.000 ans coïncide avec l'expansion la la branche L3 à la fois hors d'Afrique et vers l'Afrique Centrale.

jeudi 24 octobre 2013

Cartographie mitochondriale de la France

Ce papier de Richard est un peu ancien (2007): An mtDNA perspective of French genetic variation, mais il donne une vision intéressante de la répartition des différents haplogroupes d'ADN mitochondrial dans notre pays. De plus un papier analogue concernant l'ADN du chromosome Y en France est en cours de diffusion et devrait bientôt sortir.

Un total de 868 échantillons français, dont 788 issus de 12 régions géographiques, et 80 sans origine connue a été étudié, De plus, des données issues de précédentes études ont été intégrées, ce qui porte le nombre d'échantillons pour la France a 1385:
2007 Richard Figure 1

Les données ont été ensuite comparées aux résultats obtenus dans diverses études préalables pour différents pays européens.

Pour chaque échantillon de cette étude, les auteurs ont testé la région HVRI et quelques SNP de la région codante qui permettent de discriminer les principaux haplogroupes européens.

Les résultats montrent que la France ne diffère pas beaucoup de ses voisins européens:
2007 Richard Table S1 1
2007 Richard Table S1 2

L'haplogroupe le plus fréquent est H avec 45,56%, suivi par K (8,74%), U5 (8,30%), T (8,52%), J (7,76%) et V (4,77%).

Le Pays-Basque se démarque par son très fort taux d'haplogroupe H: 58%. Il se rapproche ainsi de la région Basque espagnole. Par contre ces deux régions basques se distinguent par les haplogroupes U4 et U5. Les basques français ont un taux élevé d'haplogroupe U4: 6,17% et un faible taux d'haplogroupe U5: 2,47%. A l'inverse les basques espagnols n'ont pas de U4 et un fort taux de U5: 12,18%. Les basques français et espagnols se distinguent également par l'haplogroupe J. Il est très important chez les basques français: 17,28% et faible chez les basques espagnols: 2,56%. Ainsi le peuple basque ne pas être considéré comme un reliquat paléolithique car l'haplogroupe J est un marqueur caractéristique du flux génétique néolithique.

En Bretagne, le Finistère se rapproche plus des pays celtiques que le Morbihan et la Loire-Atlantique. De plus l'haplogroupe U5 est particulièrement fréquent dans le Finistère: 15%.

lundi 19 août 2013

L'étude de deux haplogroupes mitochondriaux rares I et W, indique une expansion post-glaciale et une dispersion néolithique en Europe

Anna Olivieri vient de publier un nouveau papier sur l'analyse de deux haplogroupes mitochondriaux rares: I et W: Mitogenomes from Two Uncommon Haplogroups Mark Late Glacial/Postglacial Expansions from the Near East and Neolithic Dispersals within Europe.

Une question fondamentale concerne les quantités relatives de flux génétique issues de migrations paléolithiques et de migrations néolithiques chez l'européen moderne. Les migrations paléolithiques concernent à la fois la première migration en Europe et la repopulation de l'Europe à partir des refuges glaciaires après la dernière glaciation. Les premières analyses indiquaient le rôle majeur du néolithique, alors que les études plus récentes sur l'ADN mitochondrial montrent une part plus importante du mésolithique dans le génôme européen. Ainsi Maria Pala, dans une étude récente, suppose que les haplogroupes mitochondriaux J et T se sont répandus en Europe avant le néolithique. Cependant de nombreuses questions restent sans réponse, mais le développement des tests d'ADN ancien peut aider à résoudre ces problèmes.

Les premières études d'ADN ancien mitochondrial semblent montrer une discontinuité entre les chasseurs-cueilleurs principalement de l'haplogroupe U et les premiers fermiers néolithiques. Ces résultats suggèrent que le néolithique s'est diffusé principalement par migrations en provenance du Proche-Orient. De plus la différence entre les haplogroupes des premiers fermiers et les haplogroupes des européens modernes supposent des événements migratoires post-néolithiques importants. La situation est donc plus compliquée que le laissaient entendre les premiers scénarios.

Les progrès récent en séquençage de l'ADN mitochondrial a vu une augmentation importante des génomes mitochondriaux complets disponibles dans les bases de données publiques. L'arbre phylogénétique devient ainsi beaucoup plus précis et donne de nombreuses informations. L'étude présentée ici se focalise sur deux haplogroupes ouest-eurasiens: I et W qui sont largement distribués sur tout le continent européen, le Proche-Orient et l'Asie de l'ouest, mais à basse fréquence. Ces deux haplogroupes sont issus directement des haplogroupes N1 et N2 proche de la branche N qui est la première branche non africaine, qui est entrée d'abord en Asie du sud-ouest il y a 60.000 ans, puis en Europe il y a 45.000 ans.

La phylogénie mitochondriale actuelle n'est pas également répartie, mais favorise largement l'Europe Centrale et du Nord. Ceci affecte notamment les haplogroupes I et W dont les composantes sud-européennes et du Proche-Orient sont sous représentées. Les objectifs de cette analyses sont ainsi de faire le bilan de toutes les séquences disponibles (192 I, 4 N1a1b1 et 223 W), dont 58 nouvelles séquences complètes principalement d'Europe du sud et du Proche-Orient, et enfin rechercher des corrélations entre des sous-clades et des événements démographiques. Ces résultats montrent que les haplogroupes I, N1a1b1 et W sont probablement originaire du Proche-Orient durant le dernier maximum glaciaire, et comme les haplogroupes J et T, ils sont impliqués dans des expansions post-glaciales à partir du Proche-Orient. Ces données contribuent donc à mieux définir le repeuplement de l'Europe entre le dernier maximum glaciaire et avant le début du néolithique.

58 nouveaux échantillons ont été complètement séquencés: 31 W, 26 I ET 1 N1b1A1, et ajoutés à 361 séquences déjà connues pour obtenir un total de 419 séquences. L'arbre phylogénétique a été construit à partir de l'ensemble de ces séquences, et les datations des différentes sous-clades ont été estimées à partir du taux de mutation de Soares. L'haplogroupes N1a1b1 est extrêment rare et représenté par seulement 4 séquences dont 1 de Sibérie et les 3 autres du Proche-Orient.

L'haplogroupe I inclue 192 séquences complètes. N1a1b est daté d'environ 29.000 ans, alors que I est daté entre 20.100 et 21.100 ans, durant le dernier maximum glaciaire. Il donne ensuite naissance à sept branches majeures de I1 à I7.
2013 Olivieri Figure 1

L'haplogroupe I1 est le plus fréquent des sous-clades de I. Il émerge il y a environ 16.000 ans. On le retrouve principalement en Europe et au Proche-Orient, mais aussi en Afrique du Nord et dans le Caucase. Il se sous-divise en 3 sous-clades: I1a, I1b et I1c qui émergent il y a 10.000 à 13.000 ans. I1a se retrouve principalement en Europe:
2013 Olivieri Figure 2

Les haplogroupes I2 et I3 sont issus d'un même noeud et ont émergé entre 6.800 et 10.600 ans. Ces haplogroupes se retrouvent principalement en Europe, mais aussi au Proche-Orient. Les sous-clades I2a et I2b se retrouvent seulement en Europe et sont datées de 4700 et 1700 ans. L'haplgroupe I4 est daté de 15.100 ans et se divise ensuite en I4a et I4b datés de 6400 et 8400 ans. On les retrouve en Europe, au Proche-Orient et dans le Caucase. L'haplogroupe I5 est le second sous-groupe de I en fréquence et se retrouve en Europe et au Proche-Orient. Il est daté de 18.500 ans. I5a1 se retrouve seulement en Europe et est daté de 9.200 ans. Au contraire l'haplogroupe I6 est très rare et se retrouve principalement au Proche-Orient. Enfin l'haplogroupe I7 se retrouve seulement dans deux échantillons. Il est daté de 9100 ans.

L'haplogroupe W inclue 223 séquences complètes. Il émerge il y a environ 17.000 ans. Il s'étend du nord de l'Inde à l'Europe de l'ouest. Il se divise en 6 sous-clades: W1, W3 à W7. L'haplogroupe W1 est le plus fréquent. Il est daté de 10.400 ans et diverge en 6 sous-clades de W1a à W1c et W1e à W1g. W1a et W1b sont datés respectivement de 1600 et 2800 ans. On les retrouve en Finlande et en Europe du Nord. W1c est daté de 8000 ans et se retrouve en Europe, au Proche Orient, dans le Caucase et en Inde. L'haplogroupe W3 est daté de 15.000 ans.et s'étend de l'Europe jusqu'à l'Inde. Il se divise en 2 sous-clades: W3a et W3b datées de 12.000 et 10.000 ans. Les sous-clades W4, W5 et W6 datent approxiamtivement de la même période entre 12.200 et 12.600 ans, mais sont distribuées différemment. W4 s'étend en Europe, au Proche-Orient, en Mongolie et en Inde. W5 se trouve principalement en Europe et au Maghreb. W5a et W5b datés respectivement de 8400 et 9300 se retrouvent exclusivement en Europe. L'haplogroupe W6 est daté de 12.600 ans et s'étend en Europe de l'est et au Proche-Orient. Son pic de fréquence se situe au Caucase. Enfin l'haplogroupe W7 daté de 10.000 ans environ est représenté par seulement 4 échantillons.

Les figures de Bayesian Skyline Plot montrent deux expansions principales pour l'haplogroupe N1a1b: la première se situe entre 11.000 et 13.000 ans, et la seconde à partir de 7000 ans, et une expansion unique entre 13.000 et 7.000 ans pour W:
2013 Olivieri Figure 3

Discussion

Il est probable que les haplogroupes I et W ont émergé au Proche-Orient durant le dernier maximum glaciaire. Ils semblent très similaires aux 2 haplogroupes précédemment étudiés: J et T. Ces deux haplogroupes ont récemment été étudiés. Il a été proposé que leur expansion et leur entrée en Europe à partir du Proche-Orient, s'est déroulé après le dernier maximum glaciaire, mais avant le néolithique. Ce scénario pourrait être identique pour les haplogroupes I et W, notamment signalé par les sous-clades I1, I2'3, I5, W3, W4 et W5.

Les auteurs de cette étude proposent donc que la majorité des haplogroupes européens sont arrivés en Europe avant l'arrivée des premiers fermiers. Pour ma part, je suis très sceptique sur les conclusions de cette étude. Je ne vois pas que les données indiquent une expansion en Europe pré-néolithique. Je penche davantage pour une première expansion de ces haplogroupes limitée au Proche-Orient, suivie d'une seconde expansion avec les premiers fermiers du néolithique. C'est selon moi, le moment où ces haplogroupes sont arrivés en Europe. C'est en tout cas ce que montre les résultats actuels des tests d'ADN ancien. Cela doit être également le cas pour les haplogroupes J et T.

mardi 26 mars 2013

Nouvelle estimation du taux de mutations basée sur des génomes anciens de l'ADN mitochondrial

Qiaomei Fu vient de publier un papier intitulé: A Revised Timescale for Human Evolution Based on Ancient Mitochondrial Genomes, dans lequel il estime le taux de mutations à partir de séquences complètes de l'ADN mitochondrial issues de squelettes préhistoriques.

Les différences entre plusieurs séquences ADN correspondent aux mutations qui se sont accumulées depuis l'époque de leur ancêtre commun le plus récent (MRCA). Connaissant le nombre moyen de mutations par unité de temps, on en déduit le taux de mutations. Si on considère que ce dernier est constant au cours du temps, on peut estimer le temps de divergence entre espèces ou entre populations. Les restes fossiles ont souvent été utilisés pour estimer une date pour un MRCA de deux groupes, donnant ainsi un point de calibration pour l'estimation des taux de mutations. Cependant la rareté de ces fossiles pose problème, ainsi aucun fossile n'a été identifié pour représenter le MRCA entre humains et chimpanzés. En conséquence, les taux de mutations nucléaire et mitochondrial, pour les humains ont longtemps été débattus.

De récentes analyses des comparaisons des génomes entre parents et enfants, ont permis le calcul direct des taux de mutations par génération. De manière surprenante, ces résultats ont donné des valeurs deux fois plus faible pour le taux de mutation, que les estimations obtenues à partir des fossiles. Ceci a des impacts importants sur l'estimation de certains temps clefs dans l'évolution humaine comme la divergence entre l'homme et le chimpanzé, la divergence entre l'homme et Néandertal, ou la migration d'un groupe humain d'une région à une autre. Avec ces derniers résultats, la plupart des événements devraient être repoussée d'un facteur 2, par exemple conduisant à une estimation de la sortie de l'Afrique de l'homme entre 90.000 et 130.000 ans, ce qui est 60.000 ans plus ancien que les précédentes estimations.

Une alternative pour obtenir une meilleure précision sur l'estimation des taux de mutations, est d'utiliser des tests ADN sur des squelettes fossiles dont on connait bien la date. En comparant ce génome avec le génome d'individus contemporains, on peut mesurer le nombre de mutations et donc estimer le taux de mutations. Dans cette étude, les auteurs ont utilisé les séquences mitochondriales complètes de dix anciens hommes modernes, pour lesquels des dates radiocarbones précises sont connues. Ces dates sont comprises dans un intervalle de 40.000 ans, et sont originaires d'Europe et d'Asie de l'est.
2013 Fu Table 1
Toutes les séquences paléolithiques européennes sauf une, sont de l'haplogroupe U, confirmant ainsi les découvertes précédentes montrant la dominance de cet haplogroupe en Europe avant le néolithique. L'exception vient de l'échantillon "Cro-Magnon 1" qui est T2b1 et est daté de 30.000 ans. Comme la date estimée pour cet individu vient d'un coquillage associé, les auteurs ont redaté cet échantillon directement à partir des ossements. L'âge ainsi obtenu est seulement de 700 ans, montrant ainsi que le coquillage n'était pas réellement associé au squelette. Ce dernier a par la suite, été enlevé des collections Cro-Magnons du musée du Louvre. Un arbre phylogénétique de l'haplogroupe U, a été construit à partir des échantillons restants, et avec 63 séquences d'individus contemporains. Le résultat montre clairement que les 4 individus pré-glaciaires (en rouge) sont sur une plus courte branche que les 4 individus post-glaciaires (en bleu):
2013 Fu Figure S2
La séquence Tianyuan de l'est de la Chine se retrouve à la base de l'haplogroupe B.

La diversité des européens préhistoriques est deux fois plus faible que la diversité des européens d'aujourd'hui, mais 1,5 fois plus grande que celle des Néandertaliens.

Le taux de mutations pour l'ensemble de la molécule mitochondriale est estimé à 1,92 10-8 par site et par an, et 1,25 10-8 par site et par an pour la région codante seulement, avec un modèle de régression linéaire. Par contre pour un modèle Bayésien, l'estimation est de 2,67 10-8 par site et par an pour l'ensemble de la molécule mitochondriale et 1,57 10-8 par site et par an pour la région codante. Si maintenant on inclut les résultats des Néandertaliens dans le calcul, les estimations des taux de mutations sont proches de ceux calculés sans les Néandertaliens.

En utilisant ces estimations pour les taux de mutations, on peut déterminer la date du MRCA de tous les hommes modernes à environ 157.000 ans, et la date de la divergence entre tous les hommes non africains à environ 78.300 ans (entre 62.400 et 94.900 ans). L'émergence de l'haplogroupe Q, sensé dater le peuplement de l'Australie, est estimé à 42.000 ans et l'émergence de l'haplogroupe U5, sensé dater le peuplement de l'Europe, est estimé à 29.600 ans.

Conclusion

Les auteurs ont reconstruit complètement 3 séquences mitochondriales anciennes et presque complètement 6 séquences mitochondriales anciennes, sur un intervalle de 40.000 ans. Toutes les séquences européennes paléolithiques ou mésolithiques sont de l'haplogroupe U. Deux des trois individus de Dolni Vestonice, appartenant à la culture gravettienne, ont la même séquence mitochondriale indiquant une relation maternelle proche. Cette séquence est proche de la base de l'haplogroupe U5. Les individus de Dolni Vestonice ont été datés de 31.500 ans, une date proche de l'âge de l'haplogroupe U5 estimé à 29.600 ans. Les résultats en Europe montre une continuité génétique au paléolithique entre les âges pré-glaciaire et post-glaciaire, jusqu'au début du néolithique. Les estimations des taux de mutations donnent des valeurs 1,6 fois plus élevées que les estimations calibrées par les restes fossiles. Ces estimations ont conduit à une estimation de la divergence entre les africains sub-sahariens et les non africains, inférieure à 95.000 ans, ce qui contredit les résultats obtenus à partir des comparaisons des génomes entre parents et enfants

mercredi 5 décembre 2012

Histoire des haplogroupes mitochondriaux M1 et U6

Pennarun et al. vient de publier un nouveau papier sur les haplogroupes mitochondriaux nord africains: M1 et U6 intitulé Divorcing the Late Upper Palaeolithic demographic histories of mtDNA haplogroups M1 and U6 in Africa. Le pool génétique nord-africain a subit différentes influences soit sub-saharienne soit du Moyen-Orient. Les haplogroupes mitochondriaux M1 et U6 sont spécifiques à l'Afrique du nord alors que les autres sous-clades des haplogroupes M et U sont connus essentiellement en dehors de l'Afrique. L'histoire archéologique de l'Afrique du nord est composé de différentes cultures. La plus ancienne est la culture atérienne datée de 115.000 à 145.000 ans. La transition du paléolithique moyen au paléolithique supérieur vers 30.000 ans est caractérisée par la culture dabbéenne restreinte géographiquement à la Cyrénaïque en Libye. Ensuite l'expansion ibéro-maurusienne apparait il y a environ 20.000 ans durant le Dernier Maximal Glaciaire. A cette époque là le Sahara est très aride. Par la suite, l'augmentation de l'humidité a pu ouvrir des corridors entre l'Afrique du nord et les zones sub-sahariennes. Il y a environ 11.000 ans apparait la culture Capsienne.
Suivant les spécificités géographiques des haplogroupes mitochondriaux M1 et U6, les études précédentes les ont associé à certaines des populations d'Afrique du nord. Ainsi la plupart d'entre elles les ont associé à un retour en Afrique en provenance de l'Asie du sud-ouest. Ainsi Olivieri et al, 2006, a associé M1 et U6 avec l'arrivée des premiers hommes modernes dans le bassin méditerranéen en provenance d'Asie du sud-ouest il y a 40.000 à 45.000 ans. Olivieri a suggéré que la culture Aurignacienne en Europe et la culture Dabbéenne en Afrique du nord provenait de la même source en Asie du sud-ouest. Ensuite, Forster et Romano, 2007, ont proposé d'associer M1 et U6 à des événements plus récents comme l'arrivée des langages Afro-asiatiques en Afrique du nord.

Dans cette étude un ensemble de 5.700 séquences mitochondriales en Afrique du nord et de l'est, au Proche-Orient, au Moyen-Orient et dans le Caucase a été analysé. 24 nouvelles séquences complètes M1 et 33 nouvelles séquences complètes U6 ont été déterminées afin de raffiner l'arbre phylogéographique de ces deux haplogroupes.
Les résultats montrent ainsi que ces deux haplogroupes sont présents tout le long du bassin méditerranéen, surtout le long de la côte sud. M1 atteint l'Afrique de l'est alors que U6 est plus confiné en Afrique du nord-ouest. Néanmoins ces deux haplogroupes restent confinés dans les zones géographiques où les langues Afro-asiatiques dominent aujourd'hui. Ci-dessous A donne la répartition géographique de M1 et B celle de U6: 2012 Pennarun Figure 1
L'estimation des âges de coalescence a été fait en utilisant soit la méthode de Loogväli basée uniquement sur les mutations synonymes soit celle de Soares. Les résultats donnent un âge de 29.000 ans pour M1 et 35.000 ans pour U6. L'âge des sous-clades principales de M1: M1a et M1b est proche de 20.000 ans soit durant le Dernier Maximum Glaciaire. Par contre l'âge de la sous-clade principale de U6: U6a est plus ancienne: entre 25.000 et 30.000 ans. M1a est situé principalement en Afrique de l'est alors que M1b est situé principalement en Afrique du nord-ouest. U6a est principalement localisé en Afrique du nord-ouest mais U6a2 est principalement présent en Afrique de l'est.
La taille des populations anciennes M1 et U6 au cours du temps a été estimée à l'aide d'une analyse Bayesian Skyline Plots à partir de l'ensemble des séquences complètes: 2012 Pennarun Figure 2
Pour U6, l'expansion commence avec la coalescence de la sous-clade U6a, puis continue à un taux constant. Puis vers 13.000 ans la population reste constante pour se remettre à augmenter il y a 6.000 ou 7.000 ans. Pour M1, l'expansion commence plus tardivement, mais l'accroissement est plus important à deux époques différentes. La première est entre 22.000 et 15.000 ans, la seconde commence vers 10.000 ou 11.000 ans. Il apparait donc improbable que l'histoire de ces deux haplogroupes coïncide.
L'estimation de la corrélation de ces haplogroupes avec l'apparition des langages Afro-asiatiques a été faite à l'aide de tests de corrélation de Mantel. Si on prend ensemble les haplogroupes M1 et U6, ou si on prend l'haplogroupe U6 seul, on ne trouve aucune corrélation. Par contre si on prend l'haplogroupe M1 seul, on trouve une corrélation significative. A l'intérieur de M1, on trouve une corrélation avec la sous-clade M1a mais pas avec M1b.

L'origine de M1 et U6 en Asie du sud-ouest reste spéculative tant que l'on a pas trouvé de sous-clades de ces haplogroupes spécifiques à l'Asie du sud-ouest. De plus il est difficile d'associer l'arrivée de ces haplogroupes en Afrique du nord avec la culture Dabbéenne comme le suggère Olivieri. L'âge de ces haplogroupes est plus consistant avec une association avec la culture ibéro-maurusienne il y a 20.000 ans (M1b et U6a1). De plus rien ne prouve que la culture Dabbéenne se soit diffusée en Afrique du nord-ouest. Enfin l'âge de U6b et M1b1 est compatible avec la diffusion de la culture Capsienne. Un mimétisme des haplogroupes M1 et U6 a été suggéré dans de précédentes études (Gonzalez, Olivieri). Cependant il semble que ce mimétisme ne résiste pas à une analyse des dates de coalescence. U6a est plus vieux que M1a ou M1b d'au moins 10.000 ans. De plus M1 s'étend beaucoup plus géographiquement que U6. Enfin l'analyse BSP montre que les histoires respectives des haplogroupes M1 et U6 sont différentes. Cependant la courbe BSP de U6 doit être prise avec précaution car la moitié des séquences sont européennes.

vendredi 11 mai 2012

Les haplogroupes mitochondriaux J et T sont ils arrivés en Europe avant le néolithique ?

C'est l'hypothèse que propose le papier de Maria Pala et al.: Mitochondrial DNA Signals of Late Glacial Recolonization of Europe from Near Eastern Refugia. Les informations supplémentaires sont accessibles ici. Ces populations étaient présentes dans le refuge du Proche-Orient pendant la dernière glaciation. Elles auraient ainsi pu commencer à peupler l'Europe dès la fin de cette glaciation entre 19.000 et 12.000 ans, soit à l'époque paléolithique.Dolukhanov a proposé deux scénarios de repopulation de l'Europe à la fonte des glaces. Le premier à partir du refuge ibérique situé dans la zone franco-cantabrienne, correspondrait à l'expansion magdalénienne et serait associé à la diffusion des haplogroupes mitochondriaux H1, H3, H5, U5b1b et V. Le second scénario correspondrait à un refuge dans les plaines ukrainiennes et serait associé à la diffusion des haplogroupes U4 et U5a. Jusqu'ici la diffusion des haplogroupes J et T1 étaient associés au néolithique. L'étude de Maria Pala a ainsi consisté à étudier les haplogroupes J et T afin de déceler une éventuelle diffusion en Europe dès le paléolithique à partir d'un refuge situé au Proche-Orient.
Cette nouvelle étude est basée sur l'étude de nombreuses nouvelles séquences complètes: 215 séquences J et 165 séquences T ciblant principalement l'Europe méditerranéenne, le Caucase et le Proche-Orient. Ces nouvelles séquences se rajoutent à 522 anciennes séquences, soit un total de 902 séquences complètes. L'arbre phylogénétique résultant est résumé ci-dessous: Pala figure 1

La nomenclature est conforme à l'arbre phylotree de Mannis Van Oven et le récent papier de Behar et al. L'âge de coalescence des haplogroupes a été déterminé à partir du taux de mutation de Soares. A l'ensemble de ces séquences complètes, les auteurs ont ajouté un ensemble de 37.239 séquences réduites à la région de contrôle, et dessiné de bien jolies cartes de répartition des haplogroupes: Pala map 1
Pala map 2
Pala map 3
Les dates des différents haplogroupes sont indiquées ci-dessous: Pala table 1
Ainsi l'âge de l'haplogroupe JT est estimé à 58.000 ans avant leur arrivée au Proche-Orient. Ensuite J apparait il y a 40.000 ans et T il y a 30.000 ans tous les deux au Proche-Orient. Aujourd'hui, on retrouve des branches de J et T en Europe, au Proche-Orient, en Afrique du Nord, en Inde et en Asie centrale.
L'haplogroupe J s'est d'abord diversifié au Proche-Orient. L'haplogroupe J1 vieux de 33.000 ans englobe 80% de toutes les lignées J. J1b daté de 23.000 ans se trouve essentiellement au Proche-Orient: Iran et Arabie, avec une branche européenne J1b1a datée de 14.000 ans. J1d daté de 20.000 ans se trouve aussi au Proche-Orient, jusqu'en Arabie et en Afrique de l'est, en Iran, dans le nord du Caucase et en Asie centrale. Par contre J1c qui est principalement européen, date de 16.000 ans. On le retrouve notamment en Europe centrale, dans les Balkans et en Ukraine. L'haplogroupe J2, plus rare, date de 37.000 ans. Il englobe J2a et J2b daté respectivement de 32.000 et 20.000 ans. Il est prédominant au Proche-Orient,mais possède des sous-clades européennes: J2a1 et J2b1 datées toutes les deux de 15 à 16.000 ans.
L'haplogroupe T est divisé en deux sous-haplogroupes: T1 et T2 datés de 21.000 ans et originaire du Proche-Orient. T1 s'étend de l'Europe à l'Afrique du nord-ouest en passant par le Caucase, le Proche-Orient, l'Inde de l'ouest, l'Asie centrale et la Sibérie. T1b par contre, est beaucoup moins fréquent, et se retrouve seulement au Proche-Orient: Anatolie de l'est et sud de l'Irak. T2 est le sous-groupe de T le plus fréquent. On le retrouve en Europe, au Proche-Orient et en Iran. Le sous-groupe de T2 le plus fréquent est T2b qui est principalement européen et daté de 10.000 ans. Un autre sous-groupe T2f est principalement européen et date de 17.000 ans. T2a date aussi de 17.000 ans. Il est originaire du Proche-Orient et semble se dispersé en Europe en plusieurs vagues successives. Ainsi T2a1 date de 14.500 ans et semble être entré en Europe avant le néolithique. T2e date de 11.000 ans et se trouve principalement en Europe méditerranéenne.
En conclusion, les haplogroupes J et T ont commencé à se répandre en Europe avant le néolithique, entre 16.000 et 12.000 ans, signalés notamment par les haplogroupes: J1c, J1b1a, J2a1, T1a1, T2a1b, et T2f1, puis entre 11.000 et 10.000 ans signalés par les groupes T2b et T2e.

Tout ceci devra néanmoins être validé par les tests d'ADN ancien sur des squelettes préhistoriques. Au jour d'aujourd'hui les plus anciens tests d'ADN J ou T en Europe datent de 7500 ans dans des squelettes du néolithique de la culture rubanée (LBK) en Allemagne et de 7000 ans dans des squelettes du néolithique de la culture cardiale en Espagne.

- page 1 de 2