Les langues Austronésiennes sont parlées à Taïwan, dans les îles du Sud Est Asiatique, dans des régions de la Nouvelle Guinée et dans la plupart des îles du Pacifique. La forte diversité linguistique sur l'ile de Taïwan comparée à l'unique branche malayo-polynésienne parlée ailleurs, suggère une origine de ces langues à Taïwan. Ce modèle linguistique a reçu un support ces dernières années du modèle Out Of Taiwan pour la dispersion de la culture Néolithique (notamment de la culture du riz et de la poterie à engobe rouge) datée entre 4000 et 3000 ans à partir de l'île de Taïwan vers les îles Océaniennes du Pacifique.

Un autre facteur plus ancien de migration de populations a pu être la transformation dramatique du paysage de cette région à la fin du Pléistocène et au début de l'Holocène suite à la montée du niveau de la mer consécutif au réchauffement climatique après 15.000 ans.

Pedro A. Soares vient de publier un papier intitulé: Resolving the ancestry of Austronesian‐speaking populations. Il a analysé l'ADN mitochondrial de 2216 individus des îles du Sud Est Asiatiques dont 320 nouvelles séquences obtenues dans cette étude. Ces résultats ont été comparés à 6070 séquences mitochondriales chinoises. Cette analyse a porté uniquement sur la région HVR1 de la région de contrôle. Il a également analysé 19 marqueurs STR du chromosome Y, et 12 SNP qui permettent de différencier certains haplogroupes:
2016_Soares_FigureS1.jpg

Une analyse fondatrice a ensuite été faite à partir des résultats mitochondriaux et du chromosome Y. Cette analyse est une approche phylogéographique qui permet d'évaluer la diversité des groupes de lignages qui ont émergé dans les îles du Sud Est Asiatique, suite à une migration à partir de Chine ou de Taïwan. Les auteurs ont utilisé le taux de mutation de Soares pour l'ADN mitochondrial et le taux de mutation de Zhivotovsky pour l'ADN du chromosome Y. Les résultats sont les suivants:
2016_Soares_Figure1A.jpg

Pour les lignages maternels ont voit deux pics principaux, le premier entre 10.000 et 8.000 ans et le second entre 4800 et 4600 ans. Il y a également une légère bosse autour de 55.000 ans.

Pour les lignages paternels ont obtient des pics similaires autour de 8000 ans et entre 5000 et 4000 ans. Il y a également un accroissement très récent à partir de 500 ans, un autre pic entre 11.000 et 10.000 ans et un autre autour de 20.000 ans. Les auteurs considèrent que le pic entre 11.000 et 10.000 ans peut être fusionné avec celui autour de 8000 ans et correspondre ensemble au premier pic de l'ADN mitochondrial entre 10.000 et 8000 ans. Les auteurs considèrent également que la méthode de datation basée sur les marqueurs STR sous-estime les dates les plus anciennes et que le pic autour de 20.000 ans peut correspondre à la bosse autour de 55.000 ans pour l'ADN mitochondrial.

La migration la plus ancienne correspond aux haplogroupes mitochondriaux M*, N*, R* et peut-être F3, et aux haplogroupes du chromosome Y K* et C qui représentent environ 30%:
2016_Soares_Figure1D.jpg

La migration autour de 8000 ans est la plus importante puisqu'elle inclu entre 40 et 50% des lignages mitochondriaux et du chromosome Y. Cette migration correspond à l'époque de la remontée du niveau de la mer. On y trouve notamment l'haplogroupe mitochondrial B4a1a (motif polynésien), des sous-clades des haplogroupes mitochondriaux E et M, et des sous-clades des haplogroupes du chromosome Y O2a1, O3 et O1a.

La contribution Néolithique entre 5000 et 4000 ans représente environ 25 à 35% des différents lignages. Les lignages correspondant à cet événement sont les haplogroupes mitochondriaux M7c3c, Y2, F1a4a, B4c1c et peut-être B4b, et l'haplogroupe du chromosome Y O1a, notamment sa sous-clade O1a2. Ces haplogroupes mitochondriaux sont tous originaires de Chine continentale et supportent le modèle Out of Taiwan.

Les auteurs ont également testés l'ADN autosomal de 1251 échantillons de la région. Ils ont utilisé un total de 23.332 SNPs pour une analyse avec le logiciel ADMIXTURE. Le coefficient est optimal pour une valeur K=10. Le modèle pour K=5 semble néanmoins également pertinent. Il inclu une composante Africaine violette, une composante Sud Asiatique blanche, une composante Proche Océanienne bleue et deux composantes Est Asiatique verte (centrée sur l'ancien continent Sunda: Sud-Est de l'Asie, Sumatra, Java et Bornéo) et rouge (Chine et Nord-Est de l'Asie):
2016_Soares_Figure3.jpg

Pour K=10, la composante Sud Asiatique blanche se retrouve à basses fréquences dans la péninsule Malaisienne et à Sumatra. La composante Nord-Est Asiatique rouge se retrouve à très faibles fréquences aux Philippines. Une composante Proche Océanienne bleue claire domine dans beaucoup de populations d'Indonésie de l'Est. Deux composantes mineures vert foncé et jaune semblent spécifiques aux îles du Sud Est Asiatique. La composante grise est spécifique aux populations qui parlent une langue Austronésienne et se retrouve à hautes fréquences dans les îles du Sud-Est Asiatique. Elle atteint 60 à 70% dans les groupes aborigènes de Taïwan, et entre 70 à 90% dans les Philippines, à Sumatra et en Sulawesi. Elle est apparemment absente en Asie continentale suggérant une origine insulaire. Considérant le signal post-glaciaire observé dans l'ADN mitochondrial et du chromosome Y, cette composante autosomale grise pourrait correspondre à un groupe ancestral commun à Taïwan et aux îles du Sud-Est Asiatique établi avant la dispersion Néolithique Austronésienne.

Deux composantes pourraient correspondre à la dispersion Néolithique. La première est vert clair. Elle est fréquente en Chine continentale du sud-est et varie de 5 à 40% en Indonésie. Elle est absente à Taïwan et rare dans les Philippines. La seconde est bleu foncé. Elle se retrouve à hautes fréquences en Chine du Sud, à moindre fréquences à Taïwan, dans les Philippines et en Indonésie et Malaisie. Ainsi l'ADN autosomal assigne un impact mineur Néolithique dans la région à partir de l'Asie Continentale du Sud-Est, en concordance avec l'analyse mitochondriale et du chromosome Y, suivie par un impact démographique Néolithique important depuis Taïwan vers les Philippines, mais moins important ailleurs dans l'archipel Indo-Malaisien.

Les auteurs ont également étudié la séquence mitochondriale complète des individus appartenant à l'haplogroupe M7c3c associé à la diffusion du Néolithique à partir de l'île de Taïwan. L'haplogroupe M7 est daté d'environ 50.000 ans et sa distribution géographique actuelle recouvre l'Asie continentale de l'Est. Il est divisé en deux branches principales: M7a qui est centré sur l'Asie du Nord-Est et une clade qui regroupe M7b, M7c, M7d, M7e, M7f et M7g qui est centrée en Asie de l'Est. Les aborigènes de Taïwan et les individus des îles du Sud-Est Asiatique sont toujours proche du bout des branches dont la distribution géographique est en Asie continentale de l'Est. M7b3a est seulement présent à Taïwan et dans les îles du Sud-Est Asiatique. Sa fréquence est voisine de 10% à Taïwan et son âge, proche de 6000 ans, semble correspondre à l'arrivée du riz à Taïwan. Cet haplogroupe est cependant très faible dans les îles du Sud-Est Asiatique. De même M7b1d3 semble limité à Taïwan et son âge est similaire. M7c3 se disperse à Taïwan et dans les îles. Cette clade est probablement originaire du sud de la Chine. Sa sous-clade M7c3c datée autour de 5000 ans est restreinte aux populations de langue Austronésienne. Elle est un candidat important pour un marqueur de l'Out of Taiwan. Sa distribution géographique est très différente des haplogroupes B4a1a et E restreints aux populations insulaires Austronésiennes, et qui ne montrent pas une origine dans le sud de la Chine.

Les auteurs proposent de caractériser les marqueurs de l'Out of Taiwan par les paramètres suivants:

  • l'haplogroupe doit être porté par les cultivateurs de riz du sud de la Chine vers Taïwan entre 8000 et 6000 ans.
  • une sous-clade spécifique aux îles et aux populations Austronésiennes doit dater après l'arrivée des cultivateurs de riz à Taïwan en provenance de Chine, mais avant la migration Out of Taiwan vers 4500 ans.
  • l'âge fondateur dans les îles doit être proche de 4500 ans.
  • l'âge fondateur des sous-clades issues de Taïwan ou des Philippines et diffusées dans les autres îles doit être inférieur à l'Out of Taiwan soit proche de 4000 ans.
  • l'expansion dans Taïwan doit précédée l'expansion dans les îles.

Ces différents points ont été évalués dans la figure ci-dessous:
2016_Soares_Figure5.jpg

Seul M7c3c remplit tous les critères qui correspondent avec l'Out of Taiwan, alors que E et B4a1a n'en remplissent aucun.

En conclusion, cette étude montre que deux vagues Néolithiques sont entrées dans les îles du Sud-Est Asiatique, mais seulement à petite échelle. La première migration à partir du Continent Asiatique est reflétée par les haplogroupes mitochondriaux B5a1 et F1a1a, ainsi que par la composante autosomale vert clair. Elle est datée autour de 4500 ans, et a affecté principalement l'Indonésie de l'ouest et Bornéo. La seconde migration correspond à la diffusion de la poterie à engobe rouge datée d'environ 4000 ans. Elle a impacté fortement les Philippines où le riz y apparait assez tôt. Cependant son impact démographique est resté faible, souvent négligeable, dans le reste des îles, notamment dans l'archipel Indo-Malaisien. Ce modèle génétique suppose donc que les langues Austronésiennes se sont diffusées davantage par contacts que par migrations importantes. La plupart de la diversité génétique actuelle en Océanie Proche a été établie en Nouvelle Guinée il y a environ 10.000 ans, puis transportée en Océanie Lointaine par les individus parlant une langue Austronésienne.