L'analyse phylogénétique des langues Indo-Européennes est étudiée depuis des décennies, mais la recherche statistique dans ce domaine est relativement récente. En 1992, Dyen a utilisé des statistiques lexicales pour classifier les langues Indo-Européennes à partir d'une liste de mots issus de 84 langues et 200 termes basiques. Sa méthode supposait un taux d'évolution constant des termes lexicaux dans toutes les langues. Une approche alternative qui permet de s'affranchir de cette hypothèse a été proposée par Ringe en 2002. Il a analysé un ensemble de données consistant en des termes phonologiques, morphologiques et lexicaux appartenant à 24 langues anciennes et médiévales.

En 2003, Gray et Atkinson ont présenté une première analyse phylogénétique Bayésienne produisant une chronologie Indo-Européenne. Ils ont utilisé la liste de mots de Dyen en rajoutant des termes Hittites et Tochariens A et B. Des événements historiques attestés ont été utilisés pour dater différentes séparations linguistiques, et un lissage des taux sur les différentes branches a été utilisé pour relâcher la contrainte du taux d'évolution constant. Leurs travaux, ainsi que les suivants, ont supporté la théorie Anatolienne de la patrie Indo-Européenne. En 2008, Nicholls et Gray ont repris ce travail en modifiant le modèle pour obtenir quelques améliorations. En 2011, Ryder et Nicholls ont ajouté un modèle de couverture lexicographique qui a permis de travailler sur les 24 langues différentes proposées par Ringe en 2002. En 2012 et 2013, Bouckaert a réalisé une analyse phylogéographique dont le but était de déterminer la location géographique des Proto-Indo-Européens (PIE).

Chang vient de publier un nouveau papier sur le sujet intitulé: Ancestry-constrained phylogenetic analysis supports the Indo-European steppe hypothesis. Utilisant le même modèle que Bouckaert avec cependant des changements importants, les auteurs obtiennent un résultat qui supporte fortement la théorie des Steppes Pontiques. La différence clef entre ces travaux, est que Chang a imposé la contrainte suivante: certaines langues anciennes et médiévales doivent être ancestrales à 39 langues modernes.
2015_Chang_Figure2.jpeg

La figure suivante résume les différents résultats obtenus dans les différentes études Bayésiennes en commençant par l'étude de Gray et Atkinson en 2003 jusqu'à celle-ci de Chang en 2015. Si les premières études supportaient la théorie Anatolienne, cette dernière étude supporte la théorie des Steppes:
2015_Chang_Figure3.jpeg

La table suivante liste les 8 langues anciennes et médiévales qui sont connues pour être les ancêtres de 39 langues modernes. Elles ont servi de contrainte dans la présente étude.
2015_Chang_Table2.jpeg

Ainsi la dernière épine dans le pied de la théorie des Steppes comme patrie d'origine des Proto-Indo-Européens vient de tomber. Les dernières études tant linguistiques, qu'archéologiques ou génétiques confortent l'hypothèse selon laquelle les Steppes Eurasiennes étaient bien la patrie d'origine des Indo-Européens.