Paolo Francalacci vient de publier un papier intitulé: Low-Pass DNA Sequencing of 1200 Sardinians Reconstructs European Y-Chromosome Phylogeny.

Les auteurs ont séquencé le chromosme Y de 1204 Sardes sur une région de 8,97 millions de paires de base. 11.763 SNPs ont été détectés dans au moins deux individus. Parmi ceux-ci, 6751 sont nouveaux et ne sont pas présents dans les bases de données actuelles. Ces SNPs ont été ensuite utilisés pour construire un arbre phylogénétique. La racine de cet arbre a été déterminé à partir du génome de chimpanzé. Le nombre moyen de SNPs dans les 1204 séquences à partir de la racine de l'arbre est de 1002,6 +/- 21,2. Ce résultat montre une uniformité remarquable dans la longueur des branches. La pluspart des haplogroupes communs en Europe se retrouve dans l'arbre obtenu à partir des Sardes comme on peut le voir dans la figure ci-dessous:
2013 Francalacci Figure 1

La première bifurcation sépare 7 individus de l'haplogroupe sub-saharien A (0,6%) du reste de l'arbre. L'haplogroupe E (11%) est présent avec sa clade européenne définie par le marqueur M35. L'haplogroupe rare F (0,6%) est proche de l'haplogroupe G (10,9%) qui montre une clade spécifique Sardo-corse dont une racine ancienne est donnée par l'haplogroupe de l'homme des glaces: Ötzi. L'haplogroupe I (40,7%) est d'un intérêt spécial car il est principalement représenté par sa clade I2a1a définie par le marqueur M26, et spécifique à la Sardaigne. L'haplogroupe J (13,4%) est observé avec ses branches principales ainsi que l'haplogroupe K (3%) présent aves ses branches L et T. Un seul individu de l'haplogroupe Q est présent (0,08%). Enfin l'haplogroupe R (19,9%) est présent principalement dans sa version occidentale définie par le marqueur M269.

Presque la moitié des nouveaux SNPs forment le squelette de l'arbre et sont à la racine des principaux haplogroupes. Pour estimer les points de divergence entre les clades Sardes et continentales, 2 échantillons appartenant à l'haplogroupe I, du Pays Basque et du nord de l'Italie ont été rajoutés, ainsi que 2 échantillons de l'haplogroupe G de Corse et de Toscane. Les auteurs ont ajouté également dans cette étude le génome de l'homme des glaces, ainsi que 133 échantillons européens issus du projet des 1000 génomes. L'individu basque se situe à la base d'une branche qui comprend 11 échantillons Sardes. L'individu Nord Italien représente probablement la dernière étape de la clade I2a1 juste avant son arrivée en Sardaigne:
2013 Francalacci Figure 2

Considérant deux autres groupes spécifiques Sardes, on peut en déduire que lorsque l'haplogroupe I2a1a est arrivé en Sardaigne, il était déjà divisé en 4 groupes fondateurs. Deux autres groupes fondateurs montrent une divergence similaire après leur arrivée en Sardaigne: l'un appartient à l'haplogroupe R1b1c(xV35) et l'autre à l'haplogroupe G2a2b-L166.

L'uniformité de la longueur des branches de l'arbre est consistante avec une accumulation constante des SNPs au cours du temps. Cette accumulation peut donc être utilisée comme une horloge moléculaire pour dater les différentes branches de l'arbre. Les auteurs ont utilisé les branches spécifiques Sardes associées à des enregistrements archéologiques pour calibrer cette horloge. L'archéologie nous indique que le premier peuplement de la Sardaigne remonte à environ 7.700 ans. Les auteurs se sont focalisés sur les branches I2a1a partagées par 435 individus. Le taux de mutations ainsi déterminé est de 0,53 10-9 mutation par paire de base et par an. Le TMRCA paternel est alors estimé à environ 200.000 ans. Cette valeur est plus grande que les précédentes estimations, mais est en accord avec les résultats estimés à partir d'un taux de mutation de novo dans un lignage africain, ainsi qu'avec les résultats estimés pour le TMRCA maternel. La sortie de l'Afrique est estimée à environ 110;000 en accords avec les premiers fossiles d'hommes modernes trouvés au Proche-Orient. Cependant ces estimations restent provisoires sachant que le point de calibration utilisé n'est pas très précis. Dans le futur, ce point de calibration pourra être précisé par l'utilisation d'ADN ancien analysé sur des squelettes datés par des méthodes radiocarbone.