Dans de nombreuses sociétés, le patronyme se transmet de la même façon que l'ADN du chromosome Y. Cependant, différents facteurs diminuent cette corrélation: plusieurs pères fondateurs de même patronyme, événements de non paternité (adultères), adoption d'enfants, et transmission du patronyme par la mère.
Deux types de marqueurs génétiques sont utilisés pour comparer l'ADN du chromosome Y: les SNPs à faible taux de mutation (de l'ordre de 10-8 par base et par génération) et les STRs à fort taux de mutation (de l'ordre de 10-3 à 10-4 par génération). Ces mutations diversifient au cours du temps les haplotypes des marqueurs STR du chromosome Y associés à un même patronyme. Cependant le taux de mutation des SNPs est suffisamment faible pour ne pas modifier leur valeur dans une échelle de temps correspondant aux patronymes (entre 500 à 1000 ans). Ainsi tous les descendants biologiques d'un père fondateur d'un patronyme auront le même haplotype SNP, contrairement aux haplotypes STRs qui se diversifient au cours du temps.
Des études précédentes en Grande-Bretagne ont montré que les patronymes les plus fréquents ont une diversité du chromosome Y plus importante, correspondant probablement à plusieurs pères fondateurs pour le même patronyme. Par contre, des études précédentes en Irlande n'ont pas montré de corrélation significative entre la fréquence d'un patronyme et la diversité du chromosome Y. Les patronymes les plus fréquents avaient un seul père fondateur.
Neus Solé-Morata vient de publier un papier intitulé: Y-chromosome diversity in Catalan surname samples: insights into surname origin and frequency. Les auteurs ont utilisé une liste de 50 patronymes Catalans. La Catalogne est une région du nord-est de la péninsule ibérique dont l'origine remonte à l'invasion islamique de l'an 711. Une étroite bande de terre est en effet restée sous le contrôle des chrétiens et fragmentée en différents royaumes. Le comté de Barcelone était initialement un fief carolingien. En 1162, il est intégré au royaume d'Aragon. Il s'est étendu par la suite jusqu'à Valence au sud et aux îles Baléares vers l'est:
La langue Catalane prend ses origines dans la fragmentation du latin populaire, et ses premiers textes datent du 12ème siècle. Elle est aujourd'hui parlée par 4,5 millions de personnes comme langue principale et par 5 millions de personnes de plus comme langue secondaire, dans une aire comprenant le Roussillon dans le sud de la France, l'Andorre, la Catalogne, l'est de l'Aragon, les îles Baléares et la ville Sarde de Alghero.
Les patronymes Catalans sont basés sur la langue Catalane et sont donc facilement reconnaissables. Ils sont plus divers que les patronymes espagnols. Ainsi les 10 patronymes espagnols les plus fréquents représentent 18,1% de la population, alors que les 10 patronymes catalans les plus fréquents représentent seulement 8% de la population. La pluspart des gens semble avoir un patronyme en Catalogne depuis le 13ème siècle comme dans la pluspart de l'Europe occidentale, bien que le concil de Trent a imposé la tenue des registres paroissiaux seulement à partir du 16ème siècle.
Dans cette étude, les auteurs ont testé 17 marqueurs STRs et 68 marqueurs SNPs du chromosome Y pour environ 2560 hommes portant un des 50 patronymes catalans sélectionnés. Après avoir éliminés les proches parents, un ensemble de 2309 échantillons a servi de base à cette étude.
Les résultats montrent que la diversité des haplotypes est hautement corrélée avec la fréquence des patronymes (figure 2a ci-dessous):
Ceci implique que les patronymes les plus fréquents n'ont pas subi d'expansion soudaine comme en Irlande. Les auteurs ont ensuite déterminé les groupes de descendance (avec le même père fondateur) pour chaque patronyme. Parmi les 50 patronymes, les auteurs ont trouvé 1151 groupes de descendance dont 751 sont constitués d'un seul individu.
La distance médiane entre les groupes de descendance a été mesurée et la valeur trouvée est de 6 mutations STRs. Dans seulement 11,1% des cas, la distance la plus proche entre 2 haplotypes appartenant à 2 groupes de descendance distincts est de 3. Le nombre de groupes de descendance est également fortement corrélé à la fréquence du patronyme. Pour séparer les groupes issus d'un père fondateur et les introgressions liées à un événement de non paternité plus récent, les auteurs ont supposé que les groupes les plus importants sont liés à un père fondateur, alors que les plus restreints sont liés à un événement de non paternité. Les auteurs ont définis arbitrairement les groupes majeurs (liés à un père fondateur) comme ceux composés d'au moins 4 individus. Le nombre de groupes majeurs par patronyme varie de 0 à 6, avec une moyenne de 2,64. La proportion d'individus de même patronyme appartenant à un groupe majeur varie de 0 à 95,7%, avec une moyenne de 40,6%. Cette proportion, ainsi que le nombre de groupes majeurs, diminuent lorsque la fréquence du patronyme augmente (voir la figure 2b ci-dessus). Ceci s'explique de la façon suivante. Les patronymes les plus rares comprennent moins de groupes de descendances. Ces derniers sont donc plus fréquents et probablement plus vieux. A l'inverse les patronymes les plus fréquents possèdent un très grand nombre de groupes de descendance. Ces derniers sont donc moins fréquents et peu atteignent le seuil de 4 qui définit un groupe majeur. Ces résultats restent identiques si on modifie le seuil pour une valeur de 3 ou de 5.
Les auteurs ont ensuite mesuré la distance génétique entre chaque patronyme et la population générale. Celle-ci diminue lorsque la fréquence du patronyme augmente. L'effet fondateur est donc plus important pour les patronymes les plus rares. Dans une Analyse Multidimensionnelle basée sur cette distance génétique, les patronymes rares se situent en périphérie, alors que les plus courants se situent au centre:
Des réseaux basés sur les haplotypes STRs ont été tracés pour chaque patronyme:
Ces réseaux montrent également que plus un patronyme comprend un grand nombre d'individus, plus la diversité d'haplotypes et d'haplogroupes augmentent et plus le nombre de groupes majeurs diminue.
Tous ces résultats sont similaires à ceux obtenus en Grande-Bretagne dans une étude précédente. Ils indiquent que la fréquence des patronymes est liée principalement au nombre de pères fondateurs dans le même patronyme. A l'inverse l'étude irlandaise a montré que les patronymes fréquents gardaient peu de pères fondateurs. Leur fréquence a augmenté cette fois à cause du prestige et de la richesse associés à certains patronymes.
L'âge a été estimé pour 131 groupes majeurs. La date moyenne du père fondateur est 1479. Elle n'est pas corrélée avec la fréquence du patronyme. L'âge de ces groupes catalans (500 ans) est plus jeune que l'âge estimé pour les groupes de Grande-Bretagne (650 ans) ou d'Irlande (1100 ans). Les patronymes sont apparus à la même époque en Catalogne et en Grande-Bretagne vers les 12ème et 13ème siècles, alors qu'ils sont apparus plus tôt en Irlande dès le 10ème siècle.
Les événements de non paternité, les adoptions, les multiples pères fondateurs et la transmission du patronyme par la mère ont modifié le lien entre patronymes et chromosome Y. Si un patronyme est supposé avoir un seul père fondateur, le nombre de groupes de descendance permet d'estimer le nombre d'événements d'introgression par génération. La valeur obtenue varie entre 1,5 et 2,6% par génération. Ces valeurs sont similaires à celles obtenues pour la Grande-Bretagne. D'autres valeurs déterminées pour la Flandre et l'Italie du Nord sont de 0,9 et 1,2%. Mais comme ces études incluaient la généalogie de tous les échantillons, elles estimaient en fait uniquement les événements de non paternité.
Les auteurs se sont ensuite intéressés aux patronymes dont l'éthymologie suggère un lieu d'origine pour le père fondateur. Ainsi 5 patronymes d'origine germanique ont été analysés: Armengol, Ricart, Gual, Albert et Robert, et comparés aux patronymes d'origine latine. Ainsi les patronymes germaniques ont une composition d'haplogroupes différente notamment à cause de la fréquence importante de l'haplogroupe R1b-P312*. Cependant cet haplogroupe est bien plus fréquent en Catalogne qu'en Allemagne.
Ensuite une analyse de mélange génétique a été effectuée utilisant les fréquences des haplogroupes, en prenant comme populations sources les Catalans et les Bavarois. Le résultat a montré que tous les Catalans dont le patronyme est germanique étaient issus d'une population Catalane à 100%. Ainsi le nom des patronymes ne donnent pas d'indication géographique sur le lieu d'origine des pères fondateurs.
La même étude a été faite pour les patronymes d'origine arabe ou juive. Là encore l'analyse de mélange génétique en prenant comme populations source les Catalans et les Marocains, a montré que tous les Catalans dont le patronyme est arabe étaient issus d'une population Catalane à 100%. Cependant ces patronymes contenaient un excès d'haplogroupes originaires d'Afrique du Nord comme E-M81 et J-M267.
L'analyse de mélange génétique pour les patronymes d'origine juive en prenant comme populations source les Catalans et les Séphardiques ont montré que ceux-ci avaient 20,2% d'ascendance juive.
Il a été proposé qu'il est possible de faire une prédiction du patronyme sur un échantillon inconnu. Ainsi si un échantillon a un haplotype qui appartient à un groupe majeur de descendance donné, on peut lui attribué le patronyme correspondant. Cependant un haplotype peut être attribué à un groupe majeur d'un autre patronyme pour au moins deux raisons:
- la combinaison des 17 marqueurs STR et des 68 marqueurs SNP conduit à une résolution génétique insuffisante
- les événements de non paternité, les adoptions, ou la transmission par la mère
Pour mettre en place une telle prédiction les auteurs ont estimé qu'il faudrait mettre en place une base de données contenant 37.368 individus appartenant aux 3173 patronymes les plus fréquents.