A la suite de la migration hors d'Afrique, l'Asie du Sud a probablement été l'un des premiers territoires colonisés par les hommes modernes. Ce point est conforté par la forte diversité génétique de cette région. Quoique les premiers fossiles humains remontent seulement entre 36.000 et 28.000 ans, les estimations génétiques et archéologiques suggèrent une arrivée de l'homme moderne il y a environ 50.000 ans, soit après l'éruption volcanique du mont Toba.

L'Inde est composé de différents groupes de populations associés à différentes religions et différentes langues. Les langues Indo-Européennes sont plus souvent parlées dans le Nord de l'Inde, le Pakistan et le Bangladesh. On suppose que leur arrivée dans la région remonte aux invasions Indo-Aryennes datées d'environ 3500 ans. Le Sud de l'Inde est dominé par les langues Dravidiennes souvent associées aux dispersions Néolithiques à partir de l'Asie du Sud-Ouest. De manière générale, l'Inde montre un haut niveau d'endogamie lié à des barrières sociales strictes et une dérive génétique importante consécutive à l'isolation de certaines de ces populations.

Marina Silva et ses collègues viennent de publier un papier intitulé: A genetic chronology for the Indian Subcontinent points to heavily sex-biased dispersals. Ils ont réuni les séquences complètes mitochondriales disponibles dans la littérature, le projet des 1000 génomes et le projet Human Genome Diversity, relatives aux populations d'Asie du Sud. Ils ont également analysé le génome complet à partir des données disponibles, ainsi que l'ADN du chromosome Y.

Les auteurs ont d'abord construit un arbre phylogéographique mitochondrial en se concentrant sur les lignages originaires d'Asie du Sud à partir de 1478 échantillons. Ils ont également estimé l'âge des principales sous-clades:

2017_Silva_Figure1.jpg

Il y a deux haplogroupes principaux en Asie du Sud: M et R. L'haplogroupe N reste lui rare dans la région. L'âge de M est estimé à environ 50.000 ans en Asie du Sud et l'âge de R à environ 64.500 ans. Les plus anciennes sous-clades de R sont plus fréquentes dans l'ouest et le sud de la région, supportant ainsi une route côtière sud de colonisation de l'Asie. La phylogéographie de l'haplogroupe M est plus complexe montrant à priori des âges équivalents dans les différentes régions de l'Asie du Sud. Cependant si les auteurs tiennent compte de l'origine probable de chaque sous-clade, l'âge de l'haplogroupe M dans l'ouest est plus ancien que dans les autres régions, supportant également une route côtière sud de colonisation de l'Asie. Ce résultat suggère des ré-expansions de certaines sous-clades de M à une date plus récente à l'intérieur du sous-continent Indien. Ainsi plusieurs branches: M38, M65, M45, M5b, M5c, M34, M57 et M33a montrent une diffusion autour de 38.000 ans. Ces résultats sont supportés par une analyse Bayesian Skyline Plots avec le logiciel BEAST qui montre un accroissement de la population effective portant l'haplogroupe M à cette période:
2017_Silva_FigureS1.jpg

La figure ci-dessus montre une seconde expansion autour de 12.000 ans correspondant au réchauffement climatique à la suite du Dernier Maximum Glaciaire. C'est le cas des sous-clades suivantes: M6a1a (11.4 ka), M18a (9.2 ka), M30d (12.1 ka), R8b1 (11.6 ka) et U2b2 (9.2 ka) à partir du Sud et de R30c + 373 (12.4 ka) à partir de l'Ouest.

L'analyse phylogéographique indique également que certaines clades arrivent en Asie du Sud en provenance du Proche-Orient autour de 21.000 ans: N1a1b1, pre-HV2, HV + 146!, HV + 9716, HV + 73!, pre-U1c, U1a1, J1d et une clade de T2. Autour de 12.000 ans, plusieurs clades arrivent d'Asie du Sud-Ouest: T2e2, T2 + 195 + 4225, W3a1 + 143, W3a1b, U1a3 + 10253, N1a2, U7a + 12373 et U7a3a + 6150. Ensuite plusieurs lignages mitochondriaux semblent arriver avec le Néolithique en provenance d'Anatolie, du Caucase ou d'Iran: K2a5 + 2831 + 189, HV14 + 150, H13a2a + 8952, K2a5 + 2831, X2 + 153! + 7109 et U1a3a ou d'Arabie Saoudite: R0a2 + 11152. A l'Âge du Bronze, il y a également l'arrivée de H29 + 9156 + 4689, R2a + 7142 et U1a1a2a.

Les auteurs ont ensuite analysé le génome complet de la population d'Asie du Sud avec le logiciel ADMIXTURE:
2017_Silva_Figure2a.jpg

La figure ci-dessus montre que les ascendances occidentales (en marron, jaune et bleu foncé) sont plus fréquentes dans l'Ouest de l'Asie du Sud notamment au Pakistan. La composante marron correspondant aux chasseurs-cueilleurs du Caucase (mais aussi au Mésolithique et Néolithique d'Iran) atteint ainsi 35% au Pakistan et dans le Gujarat. Cette composante correspond également à environ 50% de l'ascendance des pasteurs nomades de la culture Yamnaya des Steppes.

La composante jaune correspondant aux populations de la péninsule Arabique, se retrouve avec une proportion d'environ 15% chez certaines populations Musulmanes du Pakistan: Baloutches, Brahouis et Makranis.

Les auteurs ont également construit une Analyse en Composantes Principales:
2017_Silva_Figure2b.jpg

La figure ci-dessus montre que les populations d'Asie du Sud sont plus proches des populations d'Asie Centrale et du Caucase que des populations du Proche-Orient ou d'Arabie. Les populations Pakistanaises se retrouvent dans une position intermédiaire. L'analyse classique pour expliquer la structure génétique des populations d'Asie du Sud est de considérer qu'elle dérive de deux populations ancestrales: Ancient North Indians (ANI) et Ancient South Indians (ASI). La composante ANI (importante dans le Nord-Ouest) serait arrivée dans la région en deux vagues (Néolithique et Âge du Bronze). Les résultats mitochondriaux suggèrent que la réalité a été plus complexe avec au moins quatre vagues d'arrivée entre la Dernière Glaciation et l'Âge du Bronze.

Les résultats mitochondriaux montrent une proportion de lignages autochtones située entre 70 et 90%. Elle est supérieure à la proportion d'ascendance autosomale autochtone (entre la moitié et deux tiers). Les auteurs ont ensuite analysé les lignages paternels issus de l'ADN du chromosome Y. La proportion de lignages occidentaux se situe entre 50 et 90% selon les régions d'Asie du Sud:
2017_Silva_Figure3.jpg

La figure ci-dessus résume ces résultats pour différentes régions: Penjab (PJL), Gujarat (GIH), Telugu (ITU), Sri Lanka (STU) et Bengale (BEB). La figure b montre les proportions des différentes origines (Africaine en orange, Est Asiatique en gris, Occidentale en noir et autochtone en vert) pour les lignages maternels. La figure c montre les proportions pour les lignages paternels et la figure d pour les lignages autosomaux. De manière générale les lignages paternels occidentaux sont beaucoup plus fréquents que les lignages maternels occidentaux.

Ainsi les lignages maternels sont principalement autochtones à l'Asie du Sud et permettent de remonter à la première colonisation de la région par l'homme moderne il y a environ 55.000 ans. Ensuite plusieurs lignages mitochondriaux arrivent d'Asie du Sud-Ouest durant et après le Dernier Maximum Glaciaire. Ces mouvements ont dû commencer à contribuer à la proportion d'ANI dans la population d'Asie du Sud, au niveau génomique.

2017_Silva_Figure4.jpg

Les premiers sites Néolithiques de la vallée de l'Indus datent d'environ 9000 ans. De nombreux lignages mitochondriaux datent de cette période. Certaines hypothèses attribuent l'arrivée des langues Indo-Européennes à cette époque, bien que d'autres suggèrent plutôt l'arrivée des langues Dravidiennes. Ainsi l'hypothèse de la dispersion des langues Indo-Européennes la plus largement acceptée est celle des Steppes de l'Âge du Bronze. Elle a reçu des supports des dernières études d'ADN ancien sur les populations de la culture Yamnaya et les anciennes populations d'Europe. Une arrivée de tels migrants en Asie du Sud a probablement contribué à l'augmentation de la composante marron dans l'ADN autosomal. Les preuves archéologiques suggèrent que les descendants de la culture d'Andronovo et de la culture de Sintashta ont d'abord infiltré l'Asie Centrale (BMAC) avant d'entrer en contact avec la civilisation de l'Indus il y a environ 4000 à 3500 ans.

Notamment des analyses récentes du chromosome Y suggèrent que l'haplogroupe R1a s'est dispersé à la fois vers l'ouest et vers l'est en Eurasie à la fin du Néolithique et à l'Âge du Bronze. La clade R1a-M17 représente environ 17,5% des lignages paternels en Inde et montre de plus hautes fréquences dans les groupes Indo-Européens que dans les groupes Dravidiens. Notamment, l'âge des sous-clades R1a-Z93 et R1a-Z94 sont trop récents pour correspondre à l'arrivée du Néolithique:
2017_Silva_Figure5.jpg

De plus tous les individus des cultures Andronovo et Sintashta actuellement analysés appartiennent à l'haplogroupe R1a. Tous ces résultats suggèrent que l'haplogroupe R1a est le marqueur de la diffusion des Indo-Aryens en Asie du Sud. Ces résultats doivent cependant être validés par des test d'ADN ancien en Asie du Sud.

Les auteurs ont également mis en évidence que l'haplogroupe mitochondrial H2b semble également lié à la diffusion des Indo-Européens en Asie du Sud:
2017_Silva_Figure6.jpg

Cette clade est datée d'environ 6200 ans avec une probable origine en Europe de l'Est. Elle inclut notamment des individus Sud Asiatiques, ainsi que deux individus anciens des cultures Yamnaya et Srubnaya.

Finalement le schéma général du peuplement de l'Asie du Sud ressemble par certains côtés à celui de l'Europe avec plusieurs vagues de migrations au Paléolithique, au Mésolithique, au Néolithique et à l'Âge du Bronze. Ainsi l'haplogroupe R1b semble avoir joué le rôle en Europe de l'haplogroupe R1a en Asie du Sud avec une migration conduite principalement par des hommes porteurs des langues Indo-Européennes. Cependant l'influence sur l’Europe a été plus importante qu'en Asie du Sud avec une plus grande fréquence de l'haplogroupe R1b en Europe que celle de l'haplogroupe R1a en Asie du Sud et une plus grande influence des langues Indo-Européennes en Europe qu'en Asie du Sud.