L'étude de 1497 échantillons de l'haplogroupe G de l'Europe au Pakistan est à la base du papier de Siiri Rootsi: Distinguishing the co-ancestries of haplogroup G Y-chromosomes in the populations of Europe and the Caucasus. Les informations supplémentaires sont accessibles ici. Cet haplogroupe est principalement présent dans le Caucase, au Proche et Moyen Orient et en Europe du sud.

Cinq nouveaux SNPs ont été identifiés dans cette étude. Voici le nouvel arbre de l'haplogroupe G: G tree
Un sous-ensemble de 693 échantillons a été utilisé pour séquencer un ensemble de 17 marqueurs STRs. L'estimation de l'âge des différents haplogroupes a été fait en utilisant le taux de mutation de Zhivotovsky.
La détermination du lieu d'origine de l'haplogroupe G est faite d'une part à partir du maximum de diversité, et d'autre part en recherchant les endroits où sont présents les deux sous-groupes principaux: G1-M285 et G2-P287. On estime ainsi que ce lieu d'origine est soit en Anatolie de l'est, soit en Arménie, soit en Iran de l'ouest.
Le groupe G1-M285 est rare. Il s'étend en Anatolie, dans la péninsule Arabique, la région du golfe persique, en Iran et dans le sud du Caucase. Son âge est estimé à 19.000 ans. Au contraire, le groupe G2-P287 est beaucoup plus fréquent, notamment le sous-groupe G2a-P15. Ce dernier est âgé d'environ 15.000 ans.
Le sous-groupe G2a4-L91 est très rare, sauf en Corse et en Sardaigne. C'est à ce cluster qu'appartient Ötzi, l'homme des glaces, daté de 5.300 ans. Le sous-groupe G2a2-M286 est aussi très rare, détecté uniquement en Anatolie et dans le sud du Caucase. Au contraire, le groupe G2a3b-P303 est beaucoup plus fréquent. Le SNP G2a3-L30 a été détecté sur un squelette vieux de 7.000 ans de la culture néolithique LBK en Allemagne.
Les cartes ci-dessous donnent la fréquence de l'haplogroupe G et de ses principaux sous-groupes: G2a3b-P303, L497, U1(xM527), M406 et P16: G maps
Le groupe P303 est daté de 12.600 ans. Il s'étend sur toute la zone peuplée par l'haplogroupe G. Les plus hautes fréquences sont situées dans le Caucase. Le sous-groupe G2a3a-M406 est situé essentiellement en Capadoce et en Anatolie. Il est daté de 12.600 ans et correspond à la sédentarisation des premiers chasseurs-cueilleurs du Proche-Orient, qui ont évolué ensuite vers le néolithique. On retrouve ce groupe également en Grèce et en Italie avec un âge de 8.100 ans en adéquation avec le néolithique méditerranéen. Vers l'est, ce groupe se retrouve en Iran, dans les montagnes du Zagros avec un âge de 8.800 ans et correspond également à la propagation du néolithique.
La faible diversité du groupe G dans le Caucase indique qu'il est intrusif plutôt qu'autochtone dans cette région. G est présent essentiellement dans le nord-ouest et le sud du Caucase. Le groupe G2a1-P16 est spécifique du Caucase. Son âge est estimé à 9.400 ans. Le deuxième groupe caucasien est U1. Ce dernier est daté de 10.500 ans. Il est très rare en Europe, sauf son sous-groupe M527, présent en Italie, en Ukraine et au Levant. Il semble associé à des diffusions néolithiques et post-néolithiques en Grèce il y a 7.000 ans. La présence de ce groupe en Provence, dans le sud de l'Italie et en Ukraine peut correspondre à des expansions grecques de l'âge du fer.
Le sous-groupe G2a3b1c-L497 est européen et probablement originaire d'Europe. Son âge est estimé à 7.500 ans et correspond à la diffusion de la culture néolithique LBK. Il semble originaire d'Europe centrale car sa diversité et son âge sont maximales dans cette région.

En résumé, l'haplogroupe G du chromosome Y est originaire d'une région située au nord du croissant fertile entre l'est de l'Anatolie et l'ouest de l'Iran. Son expansion est liée indiscutablement à la diffusion du néolithique que ce soit en Europe, dans le Caucase ou en Asie.