Siiri Rootsi vient de publier un papier intitulé: Phylogenetic applications of whole Y-chromosome sequences and the Near Eastern origin of Ashkenazi Levites. Un SNP informatif peut permettre de distinguer ente deux populations s'il est présent dans l'une et absent dans l'autre. De tels marqueurs pourraient se multiplier avec la venue du séquençage complet du chromosome Y. Les auteurs décrivent un tel marqueur dans cette étude appliquée aux Lévites ashkénazes.

La large distribution de l'haplogroupe R1a en Eurasie est connue depuis une décade, depuis la découverte du SNP M17 dont la fréquence dépasse 30% dans certaines populations asiatiques et 50% en Europe de l'est. Récemment la découverte du SNP M458 a permis de séparer un lignage européen d'un lignage asiatique.

Le peuple juif peut être classifié de différentes façons. Par exemple ashkénazes et non ashkénazes permet de différencier des juifs issus d'Europe centrale ou de l'est d'autres communautés juives. D'autre part, l'héritage juif reconnait trois castes paternelles: les Cohen, les Lévites et les Israélites, les deux premiers représentant une forme de clergé. Les Lévites représentent 4% de la population juive masculine. Parmi les Lévites ashkénazes, plus de la moitié sont de l'haplogroupe R1a. Cet haplogroupe est rare dans d'autres communautés juives, ainsi que dans les populations proche-orientales. Par contre il est fréquent en Europe de l'est. Ceci semble montrer que le père fondateur de cette lignée R1a des Lévites ashkénazes prend ses origines dans une population non juive européenne dont les descendants furent capable d'assumer le statut de Lévite. Cependant la pauvreté des sous-structures jusqu'ici connues de l'haplogroupe R1a n'a pas permis de déterminer une origine particulière en Europe, ni de tester l'hypothèse d'un ancêtre khazar parlant le turc, proposition qui a été suggérée pour des membres khazar convertis au judaïsme aux 8ème et 9ème siècles. Cette étude a pour objectif d'utiliser le séquençage complet du chromosome Y pour démêler l'origine des Lévites ashkénazes.

13 échantillons appartenant à l'haplogroupe R1 ont été séquencés sur une longueur de 8,97 millions de paires de bases du chromosome Y. Parmi eux 8 sont d'origine juive. De plus, 3 échantillons préalablement séquencés également de l'haplogroupe R1 ont été ajoutés à cette étude. L'arbre phylogénétique basé sur les résultats du génome de ces échantillons est représenté ci-dessous:
2013 Rootsi Figure 1a

Les séquences juives semblent donc se regrouper séparément. Ainsi pour l'haplogroupe R1b, 90% des lignages européens se situent dans la sous-clade L11/L52, alors que 3 des nouvelles séquences juives se situe dans la sous-clade Z2105. Pour l'haplogroupe R1a, la majorité des européens se situent dans les sous-clades S198 et M458, alors que toutes les nouvelles séquences juives se situent dans la sous-clade Z94. De plus, deux séquences ashkénazes R1a partagent 19 marqueurs SNP, dont 6 sont également partagés avec une séquence ibère issue de la base de données du projet des 1000 génomes. Une de ces 6 mutations a été dénommée M582. Puis 2834 échantillons R1a ont été testés sur ce marqueurs M582, afin de déterminer sa distribution géographique et son âge. Les résultats sont indiqués dans le tableau ci-dessous:
2013 Rootsi Table 1

Dans la population non juive, la fréquence de M582 est de seulement 0,15% sur l'ensemble de la population et de 0,81% sur seulement les R1a. La distribution géographique se limite au Moyent-Orient. Elle est très rare en Europe et absente d'Europe de l'est. Au Moyen-Orient, on trouve M582 essentiellement en Iran et chez les kurdes de Turquie et du Kazakhstan. Au contraire ce marqueur est très rare dans le Caucase où il apparait dans seulement 1 échantillon sur 211 R1a.

Parmi les juifs, la fréquence du marqueur M458 est de 6,33% sur l'ensemble de la population et de 73,2% de la population R1a. Parmi les non ashkénazes, 4,38% sont R1a et 1,22% sont M458. Cette dernière valeur est proche de la fréquence de M458 dans la population non juive du Moyen-Orient. Parmi les 10 échantillons M458 juifs non ashkénazes, 2 sont d'Algérie, 6 sont des juifs expulsés d'Espagne et 2 sont d'Israël. De manière significative, parmi ces 10 échantillons, 8 ont leur caste connue et sont Lévites. La caste est inconnue pour les deux autres échantillons. De plus parmi les 9 Lévites non ashkénazes, 8 sont positifs pour le marqueur M458. Parmi les ashkénazes, 14,5% sont R1a et parmi ces derniers, 92% sont M458. Parmi les 600 ashkénazes de cette étude, on trouve 279 Israélites, 110 Cohens, 97 Lévites et 114 échantillons non classés. Les fréquences de R1a-M198 et R1a-M582 sont indiquées dans le tableau ci-dessous:
2013 Rootsi Table 2

On notera la forte proportion de M582 parmi les ashkénazes Lévites: 64,9%. De plus, tous les échantillons R1a ashkénazes Lévites sont positifs pour le marqueur M582. Ce marqueur est également quasi absent chez les Cohens.

L'étude des marqueurs STR du chromosome Y est utile pour déterminer des sous-structures à l'intérieur d'un haplogroupe. Ainsi parmi les 90 juifs positifs pour M582, 86 d'entre eux ont subi un test pour 19 marqueurs STR: DYS19, DYS388, DYS389-I, DYS389-II, DYS390, DYS391, DYS392, DYS393, DYS439, DYS461, DYS385a, DYS385b, DYS437, DSY438, DYS448, DYS456, DYS458, DYS635 et GATA-H4. Un réseau a été construit à partir de ces résultats:
2013 Rootsi Figure 1b

Un premier groupe (à gauche dans la figure ci-dessus) rassemble les Lévites ashkénazes, les ashkénazes non Lévites, les juifs non ashkénazes et les européens. Ce groupe montre un motif en forme d'étoile. L'ensemble le plus différencié regroupe des populations recouvrant l'Iran et l'Anatolie de l'est. Ce groupe du Moyen-Orient (à droite ci-dessus) n'a pas un motif en forme d'étoile. Le marqueur DYS456 est très discriminant pour séparer le groupe des Lévites ashkénazes du groupe du Moyen-Orient.

En prenant un taux de mutation de 1.x10-9 mutation par an et par paire de base, les auteurs ont estimé l'âge de divergence entre les deux ashkénazes M582 à environ 1200 ans. Comme ces deux échantillons ont un ancêtre commun plus récent que l'ancêtre commun à tous les Lévites ashkénazes, cet âge correspond à un minimal. L'estimation maximale est obtenue en prenant en plus de ces deux échantillons, l'assyrien Z2122 (voir figure 1a ci-dessus). La valeur obtenue est de 4000 ans. On en déduit que l'ancêtre commun à tous les Lévites ashkénazes vivait entre 4000 et 1200 ans. Il est également possible de faire une estimation à partir des marqueurs STR bien qu'il y ait une controverse sur le taux de mutation à utiliser. Ainsi l'âge du groupe du Moyen-Orient est estimé à environ 11.300 ans et l'âge du groupe des ashkénazes est estimé à 2400 ans. L'âge des Lévites ashkénaze est estimé à environ 2600 ans et le groupe des juifs non ashkénazes à 3100 ans. Ces estimations ont été réalisées en utilisant le taux de mutation évolutionnaire qui donne des résultats plus ancien qu'un taux de mutation généalogique.

Les résultats de cette étude obligent de modifier l'hypothèse actuelle concernant l'origine des Lévites ashkénazes. Elle n'est pas est européenne, mais proche orientale et est arrivée en Europe avec des juifs migrants. En effet la plus grande diversité et la plus grande fréquence du SNP R1a-M582 au Proche-Orient pointe une origine dans cette région géographique. L'hypothèse d'un ancêtre khazar parlant le turc doit être éliminée sachant qu'un seul échantillon R1a-M582 (sur 2164) a été trouvé dans la région comprenant les steppes pontiques et le nord Caucase. De manière remarquable, le seul échantillon non M582, mais Z2122 correspond à un individu assyrien parlant un langage araméen. L'araméen et l'hébreu sont les deux anciens langages sémitiques qui sont encore parlés. On suppose qu'ils ont divergé il y a 3500 ou 4000 ans. Cette date doit correspondre approximativement à l'âge de la sous-clade R1a-Z2122. Ainsi une origine levantine pour la sous-clade R1a-M582 précédant la séparation entre ashkénazes et non ashkénazes doit être considérée. Dans ce scénario le lignage Lévite R1a-M582 devait exister parmi les anciens hébreux et s'est propagé dans les différentes communautés juives avec la diaspora. Un autre scénario propose que la lignée R1a-M582 a émergé plus récemment, uniquement chez les ashkénazes Lévites avant de se propager par flux de gènes dans les autres communautés juives.

La distribution génétique des Lévites ashkénazes ne se limite pas à l'haplogroupe R1a. Ainsi l'haplogroupe R1b est également retrouvé à basse fréquence chez les juifs. Ces données penchent également pour une origine Proche-Orientale pour cette lignée R1b-Z2105. Curieusement cette sous-clade est également partagée par un échantillon assyrien. Enfin une autre lignée R1b-L52 regroupe un ashkénaze avec un chrétien arabe. Ceci devra faire le sujet de futures études.