banner
Maison / Nouvelles / Des génomes anciens de l'Himalaya éclairent l'histoire génétique des Tibétains et de leur Tibeto
Nouvelles

Des génomes anciens de l'Himalaya éclairent l'histoire génétique des Tibétains et de leur Tibeto

Aug 05, 2023Aug 05, 2023

Nature Communications volume 13, Numéro d'article : 1203 (2022) Citer cet article

17 000 accès

6 Citations

46 Altmétrique

Détails des métriques

Les Tibétains d'aujourd'hui se sont adaptés à la fois génétiquement et culturellement à l'environnement de haute altitude du plateau tibétain, mais des questions fondamentales sur leurs origines restent sans réponse. Des recherches archéologiques et génétiques récentes suggèrent la présence d'une population précoce sur le Plateau au cours des 40 000 dernières années, suivie de l'arrivée de groupes ultérieurs au cours des 10 000 dernières années. Ici, nous obtenons de nouvelles données à l'échelle du génome pour 33 individus anciens provenant de sites de haute altitude sur la frange sud du plateau tibétain au Népal, dont nous montrons qu'ils sont les plus étroitement liés aux Tibétains d'aujourd'hui. Ils tirent la majeure partie de leur ascendance de groupes liés aux populations du Néolithique tardif à la limite nord-est du plateau tibétain, mais abritent également une composante génétique mineure d'une ascendance eurasienne paléolithique distincte et profonde. Contrairement à leurs voisins tibétains, les locuteurs tibéto-birmans non tibétains actuels vivant à des altitudes moyennes le long des marges sud et est du plateau forment un cline génétique qui reflète une histoire génétique distincte. Enfin, une comparaison entre les montagnards anciens et actuels confirme la sélection positive continue des allèles adaptatifs de haute altitude.

Le plateau tibétain se caractérise par des conditions hypobares, un terrain accidenté, des températures froides et une productivité biologique relativement faible. Malgré ces contraintes, les Tibétains de souche se sont adaptés avec succès à cet environnement et vivent sur le plateau depuis des millénaires1. Comprendre leurs adaptations génétiques et culturelles à cet environnement hypoxique difficile présente un grand intérêt archéologique, anthropologique, génétique et physiologique2. Pour y parvenir pleinement, il faut répondre à de nombreuses questions fondamentales concernant les origines des populations tibétaines actuelles, y compris les populations sources et les mouvements initiaux des peuples sur le plateau, le moment de l'établissement des populations permanentes du plateau et l'établissement des pools génétiques ancestraux. aux Tibétains d'aujourd'hui.

Bien que les données archéologiques relatives aux premiers mouvements de population sur le plateau soient rares, le site de la grotte de Baishiya Karst (3280 m d'altitude, mètres au-dessus du niveau de la mer) à l'extrême nord-est du plateau tibétain suggère la présence de peuples apparentés à Denisovan entre 160 et 60 mille il y a des années (kya)3,4,5. Les dates du site de Nywa Devu (4600 m d'altitude) sur le Plateau central suggèrent une présence humaine moderne entre 30 et 40 kya6. On ne sait pas si l'un ou l'autre de ces sites reflète un établissement permanent d'humains sur le Plateau. Meyer et al.7 proposent une première occupation permanente du Plateau central à Chusang (4270 m d'altitude) par des chasseurs-cueilleurs entre 7,4 et 12,7 kya. En revanche, Chen et al.8 et d'autres ont soutenu qu'une population permanente sur le plateau central n'était pas possible avant l'avènement de l'agriculture basée sur l'orge autour de 3,6 kya. Ce dernier modèle suppose généralement que l'agriculture a été introduite sur le Plateau par des migrants provenant de sites à basse altitude (<2500 msl) le long des marges nord-est du Plateau ; il est proposé que ces migrants aient contribué substantiellement au patrimoine génétique des Tibétains d'aujourd'hui9.

Cependant, les preuves d'origines multiples et plus complexes des Tibétains d'aujourd'hui sont également étayées par des données génétiques. Les marqueurs uniparentaux densément échantillonnés peuvent être attribués pour la plupart à des lignées présentes dans le nord de l'Asie de l'Est depuis le début de l'Holocène, mais des haplogroupes plus anciens tels que la mitochondrie M16 et le chromosome Y D-M174, provenant d'une lignée eurasienne profonde, sont également présents de manière unique parmi les -jour Tibétains10,11,12. L'idée d'une contribution paléolithique ancienne au pool génétique tibétain a également été proposée sur la base de données de séquence du génome entier. Une étude comparant les génomes tibétains actuels à ceux des anciens Sibériens et des hominines archaïques a déduit une contribution d'un mélange d'ascendances anciennes - archaïques et non archaïques - parmi les premiers peuples hypothétiques du Plateau13. Cette proposition est cohérente avec la découverte d'un haplotype au locus EPAS1 (Endothelial PAS Domain Protein 1) qui s'est introgressé d'une population de type Denisovan dans le pool génétique tibétain actuel, conférant un avantage sélectif dans les environnements de haute altitude14,15,16 ,17.

Prises ensemble, les données génétiques actuelles suggèrent un peuplement en plusieurs étapes du plateau : mouvements de populations de l'ère pléistocène avec un certain niveau de mélange archaïque sur le plateau, suivis de migrations de l'ère holocène depuis les bords nord-est du plateau. Bien que l'identité et les origines de la population de l'ère du Pléistocène restent inconnues, une analyse récente a identifié un cline clair est-ouest de variation génétique au sein des populations tibétaines géographiquement dispersées aujourd'hui18. Ce cline peut refléter des mouvements de population néolithiques, tels que ceux qui auraient pu être associés à la propagation de l'agriculture de l'orge. Avant la propagation dans le Plateau, l'agriculture de l'orge était pratiquée par les populations du Néolithique tardif et du début de l'âge du bronze dans la région du Gansu-Qinghai, telles que celles associées à la culture Qijia (vers 2300-1800 avant notre ère)19,20. Ce cline peut également avoir été établi ou renforcé par des événements historiques ultérieurs, tels que l'expansion de l'empire tibétain depuis le 7ème siècle de notre ère, ou par un processus prolongé de flux de gènes entre les populations voisines d'une manière isolée par la distance qui n'a pas impliquent des migrations à longue distance.

Les données sur l'ADN ancien (ADNa) ont le potentiel de résoudre ces questions, en partie parce que les inférences génétiques des populations anciennes ne sont pas confondues par les événements historiques récents. Des études antérieures d'ADNa d'individus provenant de trois sites himalayens de haute altitude dans le district de Mustang du centre-nord du Népal datant de 800 avant notre ère à 650 de notre ère ont montré que ces sites étaient habités par des populations d'ascendance claire d'Asie de l'Est qui avaient probablement migré du plateau tibétain21.

Ici, nous obtenons des données d'ADNa d'individus supplémentaires de ces sites et de quatre sites himalayens supplémentaires dans les districts de Mustang et Manang (MMD), augmentant la couverture temporelle de plus de 600 ans, à partir de ca. 1420 BCE–650 CE, et fournissant les premières preuves génétiques à ce jour pour les populations du Plateau. Nous montrons que ces anciennes populations himalayennes se regroupent génétiquement avec les Tibétains actuels et qu'elles représentent une branche précoce au sein de la lignée tibétaine, ce qui les rend particulièrement instructives pour déduire l'histoire du pool génétique tibétain, ses origines et sa distribution actuelle parmi le présent. Tibétains du jour et leurs voisins.

Ici, nous analysons les données pangénomiques de 38 individus anciens de sept sites de la région MMD, au Népal (Fig. 1; Données supplémentaires 1–3): Suila (n = 1; 1494–1317 avant notre ère), Lubrak (n = 2; 1269-1123 avant notre ère), Chokhopani (n = 3 ; 801-770 avant notre ère), Rhirhi (n = 4 ; 805-767 avant notre ère), Kyang (n = 7 ; 695-206 avant notre ère), Mebrak (n = 9 ; 500 avant notre ère –1 CE) et Samdzong (n = 12 ; 450–650 CE). Sur ces 38 individus, 31 sont nouvellement signalés dans cette étude et sept ont déjà été signalés dans une étude antérieure de la région21. Nous avons également produit de nouvelles données pour deux des individus précédemment publiés, résultant en de nouvelles données pangénomiques pour 33 individus (Données supplémentaires 1, 2). Toutes les données ont été générées à partir de matériel dentaire humain. En raison de la perturbation des contextes mortuaires, certaines dents étaient initialement supposées provenir d'individus distincts, mais ont ensuite été identifiées comme des échantillons répétés sur la base de données génétiques, ce qui a donné neuf individus avec des données provenant de plusieurs dents (Données supplémentaires 4). Les données de plusieurs dents et bibliothèques appartenant à un seul individu ont été regroupées en conséquence avant les analyses en aval. Parmi les sept sites archéologiques, Suila, Lubrak, Rhirhi et Kyang n'ont pas été décrits auparavant (Texte supplémentaire 1). Après le dépistage génétique initial, 13/33 individus ont été séquencés du génome entier à une faible couverture (0,5-6,6x par individu ; données supplémentaires 1). Nous avons également appliqué des méthodes de capture-enrichissement pour cibler deux ensembles de polymorphismes mononucléotidiques (SNP) : (1) un ensemble de variantes "1240K", conçues pour s'intersecter avec des marqueurs sur les puces Affymetrix Human Origins et Illumina génotypage22 et ici capturées pour tous 33 personnes ; et (2) un ensemble supplémentaire de 50 variantes K, sélectionnées et organisées à partir d'analyses de sélection et de signaux d'association de phénotypes dans les populations tibétaines actuelles23 et capturées pour 21 individus (Données supplémentaires 1). Les données combinées par individu ont satisfait aux mesures de contrôle de qualité standard pour les données génomiques anciennes (Données supplémentaires 2). Pour l'analyse en aval, nous avons assemblé deux ensembles de données de référence dérivés principalement de données publiées sur le génotype à l'échelle du génome produites sur les matrices de génotypage Affymetrix Human Origins ("HO" ; ~ 500 K SNP) et Illumina ("Illumina" ; ~ 220 K SNP) ( Données supplémentaires 5, 6). Nous avons augmenté ces ensembles de données avec des génomes anciens publiés ainsi que des génomes d'individus Sherpa et Tibétains actuels du Népal (Données supplémentaires 5, 6). Alors que nous avons concentré la plupart de nos analyses sur l'ensemble HO pour sa densité de SNP plus élevée, nous avons également utilisé l'ensemble Illumina pour une analyse approfondie de diverses populations himalayennes au Népal, au Bhoutan, en Inde et dans la région autonome du Tibet24.

Les cercles représentent des groupes anciens et sont colorés par les périodes archéologiques ; les carrés représentent les populations actuelles de locuteurs tibéto-birmans. Encadré à gauche : une vue agrandie des sept sites aMMD. Encart en bas à gauche : une vue agrandie des populations népalaises et bhoutanaises actuelles : 1. Bahing ; 2. Les Montagnes ; 3. Baram; 4. Hernies ; 5. Brokpa; 6. Bumthang ; 7. Chali ; 8. Chamling; 9. Chantyal; 10. Chepang; 11. Chétri ; 12. Dakpa ; 13. Damai; 14. Dhimal ; 15. Doumi ; 16. Faim ; 17. Gongduk ; 18. Gurung; 19. Khengpa ; 20. Kulung ; 21. Court ; 22. Lakha ; 23. Layap; 24. Limbu ; 25. Basse_Mustang ; 26. Magar; 27. Majhi ; 28. Mangdé ; 29. Monpa; 30. Nachiring; 31. Néwar ; 32. Pêcheur ; 33. Nubri ; 34. Non ; 35. puma ; 36. Sampang; 37. Sarki ; 38. Sherpa ; 39. Sherpa_Frapper ; 40. Sonar ; 41. Sunwar ; 42. Tamang; 43. Thakali ; 44. Tshangla ; 45. Tsoum ; 46. ​​Upper_Mustang; 47. Wambule. La carte de base a été créée dans R v4.0.0 à l'aide des packages MapData v2.3.0 et Elevatr v0.3.4 accessibles au public.

Pour décrire le profil génétique des anciens individus du Népal (aMMD) dans le contexte de la diversité humaine mondiale, nous avons d'abord effectué une analyse en composantes principales (ACP)25. Après avoir confirmé qu'ils se regroupent avec d'autres individus d'Asie de l'Est (Fig. 1 supplémentaire), nous avons projeté les individus aMMD sur les deux premiers PC calculés pour les individus d'Eurasie orientale actuels (Fig. 2; Données supplémentaires 4). Les populations actuelles forment une structure avec trois éperons représentant, respectivement, des clines d'ascendance correspondant aux populations du sud de la Chine et du sud-est asiatique (SC-SEA), du nord-est asiatique et des populations tibéto-birmanes. L'Ami de Taiwan, l'Ulchi du bassin inférieur du fleuve Amour dans l'Extrême-Orient russe et le Sherpa du Népal forment respectivement les extrémités distales des trois éperons. L'éperon tibéto-birman correspond au cline génétique est-ouest des Tibétains actuels rapporté dans une étude précédente18. Conformément à nos résultats précédents21, tous les individus aMMD, y compris ceux des sites nouvellement étudiés de Suila, Lubrak, Rhirhi et Kyang, se regroupent avec les populations tibétaines actuelles. Les profils génétiques obtenus à partir de la méthode de regroupement basée sur un modèle non supervisé ADMIXTURE sont cohérents avec ceux de la PCA, les individus aMMD partageant des composants ancestraux uniques avec les populations actuelles de moyenne et haute altitude (Fig. 2 supplémentaire). De même, les statistiques de l'exogroupe f326 indiquent que les individus aMMD ont le plus haut niveau de dérive génétique partagée les uns avec les autres, suivis des Sherpa et des Tibétains actuels, puis des locuteurs tibéto-birmans de basse altitude tels que Naxi, Yi et Nagaland. populations en Inde (Figures supplémentaires. 3, 4).

Nous avons calculé les PC de 486 individus asiatiques actuels dans l'ensemble de données HO et projeté les individus aMMD au-dessus des meilleurs PC. Les points gris représentent les individus actuels que nous avons utilisés pour calculer les PC. Les cercles représentent les positions médianes des groupes actuels colorés par leurs familles linguistiques ainsi que leurs abréviations de groupe respectives. Les lettres majuscules rouges "U, L, C, R, K, M, S" représentent les individus aMMD projetés.

Les haplogroupes uniparentaux des individus aMMD soutiennent également leur relation génétique étroite avec les Sherpa/Tibétains actuels (Données supplémentaires 2). Nous avons attribué des haplogroupes Y à 14 individus aMMD. Nous avons observé peu de diversité, 13 des 14 mâles ayant des marqueurs dérivés de l'haplogroupe Y O-M117 et 12 mâles portant des marqueurs dérivés de sa sous-lignée Oα1c1b-CTS5308 (Fig. 5 supplémentaire)27. Parmi les populations actuelles, cette sous-lignée se retrouve principalement chez les Tibétains et les Sherpa du Plateau, contrairement à sa lignée sœur Oα1c1b-Z25929, qui se trouve aujourd'hui principalement dans le sud de la Chine et le nord-est de l'Inde27. On estime qu'une radiation rapide de toutes les lignées O-M117 existantes s'est produite entre 7000 et 5000 BP et a été interprétée comme reflétant la propagation des langues sino-tibétaines, probablement originaires du nord de la Chine27. Notamment, l'haplogroupe Y O-M117 a également été trouvé chez des individus anciens des cultures Yangshao néolithique supérieure du fleuve Jaune et Qijia néolithique tardif28, fournissant des preuves de la majorité des lignées mâles aMMD remontant à cette région. Un individu mâle aMMD (S41) appartenait à un autre haplogroupe Y, D1a, qui est un autre haplogroupe commun sur le plateau tibétain aujourd'hui10. Les haplogroupes mitochondriaux des individus aMMD, bien que plus diversifiés, sont également répandus chez les Tibétains actuels (Données supplémentaires 2).

Bien que les plus étroitement liés les uns aux autres (Fig. 3, 4 supplémentaires), les individus aMMD présentent des différences subtiles dans leur affinité génétique qui peuvent suggérer une hétérogénéité génétique à petite échelle entre eux (Fig. 3 supplémentaire). Plus important encore, tous les groupes aMMD ont la statistique d'exogroupe-f3 la plus élevée avec Lubrak, tout en ayant la valeur la plus faible avec Chokhopani. En effet, tous les autres groupes aMMD, y compris les premiers Suila, sont significativement plus proches des individus de Lubrak que de Chokhopani, tel que mesuré par f4 (Mbuti, aMMD ; Chokhopani, Lubrak) (>+4,4 SEM, mesure d'erreur standard). Le même schéma est également observé pour les Sherpa/Tibétains népalais actuels (> + 2,7 SEM), tandis que les populations des basses terres d'Asie de l'Est sont symétriquement liées à Chokhopani et Lubrak (Données supplémentaires 7). En utilisant qpWave, nous avons formellement comparé les deux topologies ((Lubrak, aMMD), Chokhopani) et ((Chokopani, aMMD), Lubrak). Nous montrons que Suila, Rhirhi, Mebrak et Samdzong sont cladal à Lubrak (c'est-à-dire que l'ancienne topologie est valable) dans les limites de notre résolution (p> 0,192), et Kyang ne se différencie que légèrement de Lubrak (p = 0,027; Tableau supplémentaire 1 ). En revanche, la modélisation des groupes aMMD en tant que groupe frère de Chokhopani a uniformément échoué et donc la dernière des deux topologies peut être rejetée (p < 1,38 × 10−4). Une combinaison de Lubrak avec une contribution mineure d'un groupe sud-asiatique (par exemple, Pulliyar) correspond de manière adéquate aux quatre groupes, avec une contribution d'ascendance sud-asiatique estimée de seulement 1,9 à 5,1 % (p > 0,179 ; tableau supplémentaire 2). Pour Chokhopani, ni Lubrak + Sud-Asiatique ni Lubrak + Naxi/Yi/Naga ne correspondent (p < 3,67 × 10−4) ; cependant, Suila + Naxi/Yi/Naga correspondent à une contribution substantielle des basses terres (31 à 40 % ; tableau supplémentaire 3). Nous détectons également un signal significatif de mélange chez Chokhopani à l'aide de DATES, ce qui déduit un temps de mélange chez Chokhopani de 46 ± 11 générations avant l'époque de Chokhopani, le plaçant à ca. 1500-2800 avant notre ère (pour moyenne ± 2 SEM; Fig. 6 supplémentaire). Cela implique que le flux de gènes doit avoir eu lieu entre Chokhopani et les ancêtres de ces populations de basse / moyenne altitude avant 800 avant notre ère, et vraisemblablement avant 1500 avant notre ère.

Comme les groupes aMMD, les groupes Sherpa/Tibétains actuels de la région MMD et des districts voisins de Gorkha/Solukhumbu au Népal23, ainsi que les Tibétains d'endroits plus éloignés, sont génétiquement les plus proches de Lubrak, puis les uns des autres parmi les anciens et les actuels. jour Asiatiques de l'Est (Fig. 7 supplémentaire; Données supplémentaires 8). Le premier groupe aMMD de Suila, ainsi que les groupes aMMD ultérieurs, font également partie des meilleurs signaux f3 de l'exogroupe des Sherpa / Tibétains actuels. Chokhopani affiche des valeurs f3 exogroupes plus petites, comme prévu par son signal de mélange avec les habitants des basses terres. Par conséquent, nous concluons que Lubrak/Suila sont jusqu'à présent le premier représentant connu d'un pool génétique qui est le plus enrichi dans les populations de haute altitude du plateau tibétain et de l'Himalaya ; nous nous référons à ce pool de gènes comme la lignée "tibétaine" dans cette étude.

Les données archéologiques suggèrent que les populations néolithiques du bassin supérieur/moyen du fleuve Jaune ont exercé une influence culturelle majeure sur la propagation de l'agriculture sur le plateau8. Cette région a également été proposée comme la patrie probable de la famille des langues sino-tibétaines29,30. Fait intéressant, parmi les anciens Asiatiques de l'Est des basses terres28, 31, 32, 33, les groupes du Néolithique moyen / tardif de la région du haut fleuve Jaune et de sa périphérie (Fig. 1) présentent l'affinité génétique la plus proche avec les groupes aMMD (Fig. 8 supplémentaire). Il s'agit notamment d'individus du Néolithique tardif des sites de Jinchankou et de Lajia dans la région du Haut Fleuve Jaune appartenant à la culture Qijia (vers 2300-1800 avant notre ère ; Upper_YR_LN), des individus du site du Néolithique tardif Shimao de Shengedaliang dans la province du Shaanxi (vers 2250- 1950 avant notre ère ; Shimao_LN), et ceux du site néolithique moyen de Miaozigou en Mongolie intérieure (vers 3550-3050 avant notre ère ; Miaozigou_MN). Ces trois groupes ont un profil génétique similaire, dérivant ~ 80% de leur ascendance d'un pool génétique lié aux individus du Néolithique moyen des sites de culture Yangshao de Wanggou et Xiaowu dans la plaine centrale (environ 4000-3000 avant notre ère; YR_MN) et les ~20% restants du pool génétique de l'Asie du Nord-Est antique (ANA) liés aux chasseurs-cueilleurs de l'ère néolithique du site de la grotte de la porte du diable de l'Extrême-Orient russe ("DevilsCave_EN")28,32. En prenant Upper_YR_LN et YR_MN comme représentants des pools génétiques des basses terres, nous avons modélisé la relation entre aMMD et Upper_YR_LN/YR_MN via une approche basée sur des graphes utilisant qpGraph34. YR_MN ne parvient pas à imiter la source principale des groupes aMMD et des Sherpa/Tibétains actuels, principalement en raison de l'affinité supplémentaire de l'aMMD avec le pool génétique ANA (tableau supplémentaire 4). En revanche, Upper_YR_LN, ayant une affinité génétique plus forte avec l'ANA, est systématiquement choisi comme source génétique principale dans les graphiques les mieux notés (Fig. 3). Avec leur proximité géographique et temporelle avec les premiers agriculteurs du Plateau, nos résultats confirment un lien génétique majeur entre les populations du Plateau et les prédécesseurs des premiers agriculteurs d'orge de la frange nord-est du Plateau. Cependant, nous notons que ce lien génétique était déjà établi dans les premiers groupes aMMD datant de 1494-1317 cal. BCE à l'extrême sud du Plateau (Données supplémentaires 3). Cette date est seulement ~ 200 ans après le début proposé du ca. 1650 av. J.-C. Expansion des cultivateurs d'orge à partir de la frange nord-est du Plateau8. Une expansion rapide de la population du fleuve Jaune à travers tout le plateau, une distance de plus de 1800 km à travers un terrain accidenté, devrait être invoquée pour expliquer ces résultats. Par conséquent, un échange génétique substantiel avec les basses terres s'est probablement produit avant l'expansion de l'orge.

Les groupes aMMD sont modélisés comme des mélanges bidirectionnels avec Upper_YR_LN comme source et une lignée profonde comme autre source. La position phylogénétique de la lignée profonde est supposée se situer autour de la séparation entre les lignées ouest et est de l'Eurasie, mais aucune autre spécification n'a pu être faite en raison de la résolution limitée de notre ensemble de données. Nous présentons ici un graphique pour Suila qui préfère une source eurasienne orientale profonde et un pour Lubrak qui a une branche de longueur nulle suggérant une affinité avec les lignées eurasiennes ni occidentales ni orientales. Des topologies alternatives et celles sans flux génétique eurasien profond sont présentées dans la Fig. 9 supplémentaire. Les scores Z sont calculés par jackknifing de blocs de 5 cM, comme mis en œuvre dans le programme qpGraph.

Bien que dérivant 80 à 92 % de leur ascendance d'une lignée liée à Upper_YR_LN (tableau supplémentaire 4), l'aMMD et les Sherpa/Tibétains actuels ne sont pas correctement modélisés en tant que clade sœur de Upper_YR_LN, comme prévu compte tenu des composants génétiques uniques des Tibétains non partagé avec les habitants des basses terres, y compris l'allèle EPAS1 d'un mélange lié à Denisovan. Au contraire, les 8 à 20% restants de leur ascendance dérivent d'une partie profonde du graphique de la population près de la séparation entre les branches ouest et est de l'Eurasie (Fig. 3; Fig. Supplémentaire 9). Cette source, cependant, ne dérive pas d'hominines archaïques (les Néandertaliens ou les Denisoviens, qui contribuent à <0,5 % d'ascendance à l'échelle du génome), et nos résultats rejettent les sources précédemment suggérées de flux de gènes dans la lignée tibétaine13,35,36, y compris les racines orientales profondément ramifiées. Les lignées eurasiennes, telles que l'individu Ust'-Ishim de 45 000 ans du sud de la Sibérie, l'individu Tianyuan de 40 000 ans du nord de la Chine et les lignées liées à Hoabinhian / Onge en Asie du Sud-Est (Fig. 10 supplémentaire), suggérant au lieu de cela, il représente encore une autre lignée non échantillonnée au sein de la diversité génétique eurasienne précoce. Cette lignée eurasienne profonde est susceptible de représenter le substrat génétique paléolithique des populations du Plateau.

Les versants sud de l'Himalaya abritent de nombreux groupes ethnolinguistiques qui montrent un schéma frappant de stratification à travers les altitudes : les populations sud-asiatiques parlant l'indo-iranien occupent les basses terres, les sherpa/tibétains occupent les hautes terres et divers groupes de langue tibéto-birmane non tibétains , comme les Tamang et les Gurung, occupent la gamme d'altitude moyenne37,38. Alors que les Sherpa/Tibétains du Népal sont probablement arrivés dans l'Himalaya depuis le Plateau (c'est-à-dire la route du nord)39, une étude génétique précédente a suggéré une route de migration sud distincte pour les groupes tibéto-birmans d'altitude moyenne37. Cependant, la manière dont les groupes de langue tibéto-birmane non tibétains sont liés les uns aux autres et à la lignée tibétaine est restée floue. Ici, nous utilisons Lubrak, le groupe ancien le plus représentatif de la lignée tibétaine, pour étudier l'histoire génétique des populations de langue tibéto-birmane. Plus précisément, nous modélisons les Sherpa/Tibétains et d'autres groupes tibéto-birmans en utilisant les Tibétains népalais de Tsum comme source et Upper_YR_LN/YR_MN comme autre, tout en utilisant Lubrak comme exogroupe clé pour distinguer la lignée tibétaine des ancêtres des basses terres avec une haute résolution. Conformément à un rapport précédent18, nous observons que les groupes tibétains du Plateau et de l'Himalaya forment un cline génétique. Premièrement, les Tibétains népalais des districts de Mustang et de Gorkha (Upper Mustang, Nubri, Tsum), qui sont cladal l'un par rapport à l'autre, et les Sherpa du district de Solukhumbu tirent 87 à 92% de leur ascendance de la lignée tibétaine, qui est représentée par Tsum (Fig. 4; Tableau supplémentaire 5). Deuxièmement, les Tibétains relativement proches de l'Himalaya (par exemple, Lhassa, Shigatse, Shannan) tirent une grande partie de leur ascendance de la lignée tibétaine (76 à 86 %). Enfin, les groupes tibétains plus à l'est ou au nord-est ont des contributions beaucoup plus élevées de la lignée des basses terres (21 à 58%). Alors que nous savons par la datation au radiocarbone que les deux pôles de ce cline, représentés par aMMD et Upper_YR_LN, étaient déjà présents vers ca. 1420 avant notre ère, le processus de mélange entre les deux pôles qui formaient le cline actuel peut s'être produit plus tard. Des études archéogénétiques supplémentaires sur le Plateau sont nécessaires pour comprendre quand le cline a commencé à se former et comment il s'est développé au fil du temps sur le Plateau.

Nous modélisons les groupes tibéto-birmans en utilisant le tibétain népalais de la région de Tsum ("Tsum") et Upper_YR_LN comme les deux sources en utilisant qpAdm. Les Tibétains du plateau et les Tibétains proches de l'Himalaya tirent la majorité de leur ascendance de la lignée tibétaine, tandis que les groupes tibéto-birmans plus à l'est tirent une proportion beaucoup plus élevée de leur ascendance de la lignée des basses terres. Les cercles/rectangles numérotés représentent des estimations ponctuelles de qpAdm, et les segments verticaux épais et minces représentent ± 1 et ± 2 mesures d'erreur standard (SEM) estimées par jackknifing de bloc de 5 cM, respectivement.

En ce qui concerne les populations tibéto-birmanes non tibétaines, nous déduisons des liens génétiques entre elles le long de la route circum-Plateau (Fig. 5). Nous décrivons les résultats en commençant par le bord sud-est du plateau avec les Naxi et Yi et procédons dans le sens des aiguilles d'une montre vers le sud-ouest (Fig. 5). Premièrement, Naxi et Yi du sud-ouest de la Chine ont un profil génétique qui ressemble beaucoup à celui de YR_MN mais distinct de celui de Upper_YR_LN (Fig. 11 supplémentaire). En utilisant qpAdm, nous modélisons Naxi/Yi comme un clade sœur de YR_MN sans contribution de la lignée tibétaine requise (tableau supplémentaire 5). Les modèles utilisant Upper_YR_LN comme proxy échouent en renvoyant des coefficients d'ascendance supérieurs à 1 à partir de Upper_YR_MN. Les Naga du nord-est de l'Inde sont modélisés comme un mélange de 68 à 78 % de YR_MN/Naxi/Yi et de 22 à 32 % de lignée tibétaine (Fig. 5 ; Tableaux supplémentaires 5 à 6). Enfin, les Tamang et Gurung de la région de moyenne altitude du sud de l'Himalaya ont des niveaux encore plus élevés d'ascendance de la lignée tibétaine (60–63%), ainsi qu'un afflux sud-asiatique (9–19%) en plus de la Ascendance de type YR_MN (tableau supplémentaire 7). Les modèles utilisant Naxi/Yi/Naga comme source au lieu de YR_MN conviennent également (tableau supplémentaire 7). Ce même modèle de mélange à trois voies, lignée tibétaine + YR_MN/Naga + sud-asiatique, correspond également de manière adéquate aux 16 groupes himalayens bhoutanais précédemment publiés24, avec des niveaux hétérogènes de contribution des YR_MN/Naga (21–47 % YR_MN ou 32–75 % Naga) et les lignées tibétaines (20 à 82 % ; Fig. 12 supplémentaire ; Données supplémentaires 9). Dans l'ensemble, la contribution sud-asiatique est faible mais non négligeable pour de nombreux groupes bhoutanais, allant de 0 à 7 %. Fait intéressant, pour les populations du Népal ayant une ascendance sud-asiatique substantielle (par exemple, Baram, Chantyal, Chepang, Gurung), les groupes tribaux du sud de l'Inde (par exemple, Pulliyar) représentent mieux leur ascendance sud-asiatique que les groupes du nord de l'Inde (Données supplémentaires 9). Ces résultats mettent en évidence la complexité et l'histoire des mélanges multicouches des populations tibéto-birmanes dans l'Himalaya.

Les groupes tibétains du Plateau et de l'Himalaya forment un cline génétique, avec les deux pôles représentés par les Tibétains népalais actuels (ainsi que aMMD) et Upper_YR_LN ("le cline tibétain"). Le cline tibéto-birman non tibétain reflète un mélange le long de la route circum-Plateau et comprend des populations de moyenne altitude telles que Naxi, Yi, Naga, Tamang et Gurung. Naxi et Yi ne peuvent pas être modélisés comme faisant partie du cline tibétain, c'est-à-dire Tsum+Upper_YR_LN ; au lieu de cela, YR_MN seul les modélise adéquatement. Les locuteurs tibéto-birmans non tibétains ont une contribution plus élevée de la lignée tibétaine (représentée par le Tsum tibétain népalais ), et les populations de l'extrême ouest de moyenne altitude Tamang et Gurung ont en outre un afflux sud-asiatique. Les carrés indiquent les populations sources utilisées dans les modèles d'ascendance (cercles).

Notre étude précédente a rapporté que les allèles dérivés des SNP sélectionnés positivement dans le gène EPAS1 n'étaient observés que chez les individus Samdzong plus récents, mais pas chez les individus Chokhopani et Mebrak plus âgés21. En incluant nos nouveaux génomes aMMD, nous ne détectons toujours pas d'allèles dérivés dans le bloc d'haplotype EPAS1 chez les individus Chokhopani et Suila, mais nous les observons à une fréquence intermédiaire dans les cinq autres sites (25 à 58 %). Fait intéressant, la fréquence des allèles dérivés dans l'ensemble des échantillons anciens est inférieure à celle des Tibétains actuels (75%), ce qui indique que la sélection a encore agi sur ces allèles dans un passé récent (Fig. 13 supplémentaire; Tableaux supplémentaires 8, 9). Nous avons également tenté d'étudier les changements de fréquence au niveau de deux allèles adaptatifs non synonymes du gène EGLN1 : rs12097901, qui est courant chez les Asiatiques de l'Est, et rs186996510, qui est pratiquement unique aux Tibétains16,40. Malheureusement, des conditions de capture défavorables limitent la couverture de ces deux SNP. Néanmoins, les lectures du séquençage du fusil de chasse suggèrent que la fréquence des allèles dérivés dans la fenêtre génomique couvrant le gène EGLN1 dans les échantillons aMMD est similaire à celle des populations tibétaines actuelles (tableau supplémentaire 8) ; si cette découverte indique que la sélection sur les allèles EGLN1 ne s'est pas étendue sur la période couverte par les échantillons d'aMMD ou est simplement due à la rareté des données de séquence n'est pas claire.

Nous avons ensuite profité de 18 individus séquencés par fusil de chasse dans cette étude et dans notre étude précédente18 pour effectuer une analyse de sélection à l'échelle du génome avec des statistiques f3 basées sur une fenêtre41 (Fig. 6; Tableau supplémentaire 10). La méthode quantifie les différences de fréquence d'allèles entre les Tibétains anciens et actuels, en utilisant les Chinois Han comme exogroupe, et vise donc à détecter une sélection positive chez les Tibétains actuels depuis l'époque des spécimens aMMD. En combinant 17 individus anciens (à l'exclusion d'un individu en raison de sa parenté), les fenêtres génomiques chevauchant le gène EPAS1 montrent les signaux les plus forts, soutenant la sélection positive continue à ce locus. Les fenêtres génomiques chevauchant le gène EGLN1 montrent les deuxièmes signaux les plus forts. Fait intéressant, les statistiques f3 élevées dans ces fenêtres ne sont pas motivées par les SNP non synonymes rs12097901 et rs186996510 qui avaient déjà atteint une fréquence élevée dans l'aMMD, mais plutôt par les SNP qui sont communs à la fois à l'aMMD et aux Han mais qui sont rares chez les Tibétains d'aujourd'hui ( Données supplémentaires 10). Ensuite, nous avons examiné le chevauchement entre les signaux trouvés dans cette analyse de sélection (en utilisant un seuil de score z de 4) et un ensemble précédent de signaux (valeurs PBS supérieures de 0,1 % à l'échelle du génome) identifiés en utilisant uniquement des données de population contemporaines23. Tous les signaux qui se chevauchent sauf trois semblent être contribués par la signature forte aux locus EPAS1 et EGLN1 (Données supplémentaires 11). Sur les trois régions restantes, deux couvrent les gènes PET112 et MCL1, qui ne sont pas des candidats bien établis pour la réponse à l'hypoxie, et une contient le gène AKT3, qui est impliqué dans l'angiogenèse et est impliqué dans le contrôle des traits des globules rouges dans une étude de gène candidat42.

Nous avons calculé f3 (Tibétains ; aMMD, Han) en utilisant une approche de fenêtre glissante avec une taille de fenêtre de 500 kb et une taille de pas de 10 kb. Les scores Z pour chaque fenêtre ont été calculés avec une approche de rééchantillonnage (voir Méthodes). Les fenêtres couvrant les gènes EPAS1 et EGLN1 abritent les deux principaux signaux.

Dans cette étude, nous analysons le profil génétique de 38 anciens individus de l'Himalaya et montrons que l'ascendance trouvée aujourd'hui parmi les Asiatiques de haute altitude (c'est-à-dire les Tibétains et les Sherpa) était déjà nettement différente de celle des habitants des basses terres vers 1494-1317 avant notre ère. Cela repousse les premières preuves du pool génétique tibétain d'au moins 500 ans par rapport à nos rapports précédents sur Chokhopani21. En tirant parti de ces premiers génomes, nous éclairons les principales caractéristiques de l'histoire génétique des Tibétains et de leurs proches dans le plateau tibétain et sa périphérie. Nous constatons que la lignée tibétaine est bien modélisée comme un mélange de deux sources d'ascendance génétique : l'une est un substrat paléolithique ancien et jusqu'alors non caractérisé qui représente jusqu'à 20 % de l'ascendance tibétaine contemporaine, et l'autre est liée aux habitants des basses terres vivant au frange nord-est du Plateau au Néolithique final. Le substrat paléolithique semble avoir contribué exclusivement au pool génétique tibétain parmi les populations actuelles étudiées à ce jour.

Notre modélisation approfondie des locuteurs tibéto-birmans tibétains et non tibétains actuels identifie deux clines génétiques pour expliquer leur histoire génétique. Ces clines reflètent vraisemblablement deux voies distinctes de dispersion de la population qui se reflètent dans la répartition des diverses langues tibéto-birmanes dans l'Himalaya : l'une traversant le plateau de sa frange nord-est jusqu'à l'Himalaya (la voie "nord"), et l'autre le long de la périphérie du Plateau et la frange sud de l'Himalaya (la route "sud") (Fig. 5). Nous fournissons une modélisation formelle des mélanges des populations tibétaines le long du cline nord et corroborons notre rapport précédent sur ce cline18,43. La diversité génétique, culturelle et linguistique des locuteurs tibéto-birmans actuels le long du versant sud de l'Himalaya reflète la confluence de populations anciennes arrivées par ces deux voies suite à leur séparation depuis le Néolithique supérieur.

Les caractéristiques uniques du profil génétique tibétain ont longtemps intrigué les chercheurs, conduisant à des modèles d'histoire de la population extrêmement différents et souvent incompatibles, allant des Tibétains représentant un clade frère qui s'est séparé des Chinois Han il y a moins de 3000 ans14, aux Tibétains issus d'un Chinois Han. -lignée apparentée il y a plus de 9000 ans avec un flux génétique de Sibériens paléolithiques (Ust'-Ishim) ou même d'un hominidé archaïque inconnu13,35. De plus, ces modèles antérieurs, contradictoires entre eux, ont été élaborés sur la base des seules données actuelles des Tibétains et des Chinois Han et ont accepté une hypothèse trop simpliste selon laquelle les deux populations sont représentatives des groupes anciens ancestraux des deux grandes branches du Sino. - Famille des langues tibétaines, c'est-à-dire respectivement tibéto-birmane et sinitique. Ici, nous avons utilisé des génomes anciens de périodes clés et de lieux géographiques, qui sont de meilleurs représentants des lignées modélisées que les populations actuelles, pour effectuer un test direct des modèles démographiques proposés.

Dans notre étude, nous montrons que les ancêtres des Tibétains actuels sont présents dans l'Himalaya depuis au moins ca. 1420 avant notre ère, lorsque les premières preuves directes d'une présence humaine soutenue apparaissent sur des sites aMMD tels que Suila et Lubrak. De plus, nous confirmons la relation étroite entre les premières populations himalayennes et les groupes du Néolithique tardif vivant le long de la frange nord-est du plateau vers 2300–1800 avant notre ère (Upper_YR_LN). Les groupes néolithiques de la région du Gansu-Qinghai comprennent probablement la population ancestrale de ceux qui se sont ensuite étendus sur le plateau ; cependant, le moment précis de l'expansion n'est pas clair. La culture de l'orge, qui est plus adaptée au climat plus frais et plus sec du plateau que le mil, a longtemps été considérée comme ayant permis l'expansion néolithique sur le plateau. Bien que nos résultats puissent ostensiblement correspondre à l'hypothèse de longue date de l'expansion de l'orge sur le Plateau ca. 1650 avant notre ère, une diffusion démique aussi massive du Qinghai à l'Himalaya en seulement 200 ans environ est peu susceptible d'être la seule explication de l'ancien lien génétique entre le plateau et la région du Gansu-Qinghai. Nous proposons un scénario alternatif dans lequel le lien génétique entre les populations du plateau et des basses terres peut s'être formé beaucoup plus tôt et donc ne pas avoir été lié à l'introduction d'orge ou d'autres plantes ou animaux domestiqués d'origine ouest-eurasienne. Le site de Karou au Tibet oriental (environ 5000-3000 BP) et le site de Qugong près de Lhassa (environ 3800-3000 BP) montrent une tradition archéologique indigène et ont une composition d'assemblage et des motifs céramiques distincts de ceux de Qijia2. De plus, les preuves du site de Zongri (vers 2600-2000 avant notre ère) suggèrent que les chasseurs-cueilleurs du Plateau échangeaient des millets avec les habitants des plaines bien avant l'introduction présumée de l'orge44. L'absence d'une signature de sélection EGLN1 dans le Upper_YR_LN combinée à un balayage sélectif EGLN1 estimé daté d'environ 8000 BP40,45 suggère que les deux populations se sont peut-être déjà séparées bien avant l'arrivée de l'orge dans le Gansu-Qinghai. L'orge était cultivée comme culture mineure dans le Gansu-Qinghai dès ca. 2000 avant notre ère, laissant ouverte la possibilité d'une expansion antérieure basée sur l'orge avant 1650 avant notre ère, mais les preuves archéologiques à l'appui d'un tel scénario font défaut. Nous reconnaissons que nos données actuelles ne peuvent pas complètement rejeter l'hypothèse de l'orge ; par conséquent, nous appelons à une recherche d'anciens génomes du Plateau datant de plus de 1650 avant notre ère pour le tester directement.

Enfin, notre étude montre les effets prolongés de la sélection naturelle dans la formation du pool génétique des Asiatiques de haute altitude. Il convient de noter que l'augmentation de la fréquence de l'allèle EPAS1 au cours de la période couvrant les échantillons d'aMMD et les Tibétains actuels met en évidence l'action lente mais régulière de la sélection positive sur cette variante génétique dérivée de Denisovan. Des études futures sur d'autres génomes anciens à travers le plateau tibétain pourront nous conduire vers une compréhension globale de l'histoire évolutive des deux gènes de signature tibétains, EGLN1 et EPAS1, ainsi que pour approfondir les signatures polygéniques d'adaptation suggérées par l'étude. des génomes actuels23.

Tous les spécimens rapportés dans ce manuscrit ont été exportés vers le co-auteur MA sous l'autorité du Département d'archéologie (DoA) du gouvernement du Népal via les permis de la Sky Door Foundation Nepal/USA de 2007 à nos jours. L'échantillonnage des échantillons archéologiques sur le terrain a été supervisé par des représentants sur place du DoA à Rhirhi, Lubrak, Suila, Kyang et Samdzong. Des représentants des comités de développement villageois et d'autres membres des communautés descendantes étaient présents lors de l'échantillonnage sur le terrain des matériaux archéologiques à Rhirhi, Lubrak, Suila et Samdzong. On a montré aux personnes présentes le matériel pris pour l'exportation et aucune objection n'a été formulée. L'échantillonnage du matériel du musée de Kapilvastu a été supervisé par le personnel local et un représentant du DoA. L'échantillonnage des matériaux des restes de Mebrak a été supervisé au DoA à Katmandou. L'approbation pour l'analyse destructive et l'investigation génétique a été fournie par le DoA dans le cadre du processus d'autorisation et d'exportation. La sensibilisation des communautés descendantes comprenait : (1) la conservation et le contrôle locaux des matériaux excavés dans les villages de Samdzong, Chuksang (pour Rhirhi), Lubrak (matériaux conservés et disponibles dans le temple Bon du village) et Suila (matériaux conservés dans le monastère bouddhiste de Ghiling) sous la tutelle des chefs de la communauté ; (2) de petits musées ont été créés à Samdzong et Chuksang pour exposer les matériaux extraits de Samdzong et Rhirhi ; (3) un livre de coloriage sur les méthodes scientifiques archéologiques et présentant le site de Samdzong a été développé par CW et al. et a été traduit en népalais et en tibétain par les membres de la communauté Ghiling Nawang Tsering Gurung et Tsering Dorjee Gurung et mis à la disposition des communautés locales. Ceux-ci peuvent être trouvés en ligne sur https://doi.org/10.17617/2.3367799 (népalais) et https://doi.org/10.17617/2.3367804 (tibétain) et sont distribués gratuitement ; et (4) tous les rapports requis ont été soumis au DoA ; la Sky Door Foundation/Népal se prépare à publier de courts résumés (en népalais, éventuellement en tibétain) des principaux résultats du projet qui seront proposés aux écoles secondaires de Jomsom et de Lo Manthang ainsi qu'aux plus grands villages du Haut Mustang.

Le contexte de dépôt d'origine à Chokhopani a été détruit par l'installation d'un micro-oléoduc. La récupération des données s'est limitée à la collecte d'artefacts et de restes humains qui ont été découverts dans le complexe de grottes ou qui ont été trouvés en aval de celui-ci46. Le site de Suila a été découvert en 2018 après que la grotte a été endommagée par la construction d'une route. Les villageois locaux ont collecté les matériaux exposés et les ont emmenés dans un complexe monastique à Ghiling. Ces matériaux ont été montrés à notre équipe d'arpentage peu de temps après la destruction du site ; ils ont été photographiés et des échantillons ont été prélevés sous la supervision du représentant du DoA. Aucune fouille n'a été possible. Les matériaux archéologiques du site de Lubrak ont ​​été découverts en 2018 suite à l'érosion d'une berge du village éponyme. Les villageois ont sauvé le matériel qui a été emmené dans un monastère. Notre équipe d'enquête a cartographié et photographié les tombes à partir desquelles les matériaux ont été récupérés et a documenté le contenu des tombes. Des échantillons de restes humains ont été prélevés sous la supervision du représentant du DoA. Les tombes restent in situ mais aucune autre récupération de données n'a été entreprise. Le site de Rhirhi a été découvert lors d'une enquête archéologique en 2016. Le site avait été pillé dans le passé et du matériel culturel a été trouvé à l'entrée de la grotte. Le profil de la fosse du pilleur a été nettoyé, dessiné et des échantillons supplémentaires de matériel culturel ont été découverts dans le profil au cours de ce processus. Mebrak 63 a été minutieusement fouillé et documenté par une équipe germano-népalaise47. La préservation des matériaux organiques, y compris les restes humains, était excellente. Une grande partie de l'intérieur du site était recouverte d'une couche de guano d'oiseau de 40 cm d'épaisseur qui a été soigneusement retirée. De nombreux restes dans la tombe ont été mélangés par des visites répétées pour ajouter le défunt récemment à la tombe. Au total, huit niveaux de palimpseste ont été cartographiés puis soigneusement fouillés à la main ; la matrice n'a pas été examinée. Le contexte a été largement documenté avec des dessins au trait et des photographies. Le site de Kyang, pillé dans le passé, a d'abord été documenté photographiquement. Une grille de 1 m a été placée sur le dépôt et les matériaux de surface, y compris les os humains, le bois et d'autres matériaux organiques, ont été ensachés par unité de grille. L'excavation s'est poursuivie en utilisant des niveaux arbitraires de 10 cm; deux niveaux ont été enregistrés et le gisement a été excavé jusqu'au substratum rocheux. La matrice de sol a été tamisée à l'aide d'un maillage fin. La grande majorité des artefacts et autres vestiges ont été récupérés à la surface; peu ont été trouvés dans l'un ou l'autre des niveaux arbitraires48. Le site de Samdzong48,49 se compose de 10 grottes, très probablement des tombes à puits, creusées dans la face abrupte d'une falaise. L'activité sismique avait effondré les tombes et le contexte original de dépôt a été brassé et mélangé avec du sol et de la roche d'en haut. L'intérieur des grottes était généralement assez peu profond; chacun a été documenté photographiquement et les matériaux visibles à la surface ont été collectés et ensachés. En raison de la nature mixte du dépôt, la fouille n'a pas été effectuée dans les niveaux stratigraphiques. Toutes les fouilles ont été faites à la main et les plus gros artefacts rencontrés ont été mis en sac au fur et à mesure de leur découverte. La matrice des grottes a été criblée de mailles fines ; cela a amélioré la découverte d'artefacts plus petits tels que des morceaux de métal, des fragments d'os d'animaux et d'humains, du bois et de nombreuses perles de verre.

La datation au 14C par spectrométrie de masse par accélérateur (AMS) de 15 échantillons est nouvellement rapportée dans cette étude (Données supplémentaires 3) : Suila (n = 1), Lubrak (n = 1), Rhirhi (n = 2), Mebrak (n = 2) , Kyang (n = 2) et Samdzong (n = 7). Pour Suila, Lubrak, Rhirhi, les dents humaines utilisées dans l'étude génomique ont été directement datées à l'Université de Californie, Irvine WM Keck Carbon Cycle AMS (code de laboratoire UCIAMS). Pour Mebrak, Kyang, Samdzong, des spécimens de bois ou de dents d'animaux non carbonisés ont été datés au Curt-Engelhorn-Zentrum Archäometries-Zentrum (code de laboratoire MAMS). Toutes les dates 14C ont été calibrées à l'aide de la courbe d'étalonnage de l'hémisphère nord dans la version en ligne de Calib 8.2 (http://calib.org/calib/calib.html) (Données supplémentaires 3).

Un total de 54 dents appropriées et un os pétreux (de U2) ont été sélectionnés pour analyse dans sept sites archéologiques de la région MMD : Suila (n = 2 ; 1494-1317 avant notre ère), Lubrak (n = 2 ; 1269-1123 avant notre ère) , Chokhopani (n = 3 ; 801–770 avant notre ère), Rhirhi (n = 6 ; 805–767 avant notre ère), Kyang (n = 11 ; 695–206 avant notre ère), Mebrak (n = 10 ; 500 avant notre ère – CE 1), et Samdzong (n = 20; CE 450–650) (Données supplémentaires 1–3). Les échantillons ont été sélectionnés pour compléter les données publiées précédemment sur le génome entier de huit individus à Chokhopani (n = 1), Mekbrak (n = 3) et Samdzong (n = 4)21. Cependant, la bioturbation et la perturbation faunique des restes humains ont dans certains cas rendu difficile l'attribution sans ambiguïté de matériel squelettique et dentaire à des individus distincts. Pour cette raison, les données des 62 matériaux squelettiques aMMD ont été réanalysées, dont 55 étaient suffisamment bien conservées pour effectuer des tests de parenté génétique, ce qui a permis d'identifier 42 individus distincts, dont 34 sont nouveaux dans cette étude (Fig. 14 supplémentaire). ; Données supplémentaires 4). Trois dents analysées dans cette étude ont été déterminées comme provenant de deux individus (M63 et S10) qui ont été précédemment publiés21.

La manipulation de l'ADN ancien (ADNa) pour tous les échantillons a été effectuée dans des installations dédiées à l'ADNa à l'Université de l'Oklahoma (OU) et à l'Institut Max Planck pour la science de l'histoire humaine (MPI-SHH). Les deux laboratoires exploitent des salles blanches d'ADNa filtrées par HEPA (classées ISO7 ou mieux) et la manipulation de l'ADN a également été effectuée dans des hottes à flux laminaire dédiées. L'accès au laboratoire de la salle blanche et les flux de travail sont restreints, et l'équipement de protection individuelle (comprenant des combinaisons intégrales en Tyvek, des gants, des masques et des lunettes/écrans faciaux) est porté par tout le personnel. Toutes les surfaces sont régulièrement stérilisées avec une solution d'eau de Javel diluée (NaOCl) et irradiées quotidiennement aux UV, et toutes les activités PCR et post-PCR sont effectuées dans des installations de laboratoire séparées. L'extraction d'ADN pour les nouveaux échantillons de Chokhopani, Rhirhi, Kyang, Mebrak et Samdzong (n = 50) a été réalisée à l'OU. En bref, les surfaces des dents ont été essuyées avec du NaOCl à 2 %, suivies d'une abrasion mécanique et d'une irradiation UV pour éliminer les contaminants de surface. La dentine dentaire (100 mg) a été broyée en une poudre grossière et digérée dans une solution de 1 mL d'EDTA 0,45 M et de protéinase K 0,25 mg/mL. L'ADN a été purifié et concentré à l'aide d'un appareil à réservoir Qiagen MinElute/Zymo selon un protocole publié50. En bref, 13 ml de tampon PB ont été combinés avec le surnageant d'ADN dans l'appareil de réservoir et centrifugés pour lier l'ADN à la membrane de la colonne de silice. La colonne a été lavée deux fois avec du tampon PE, suivi d'un centrifugation à sec. L'ADN purifié a été élué de la colonne avec 60 μL de tampon EB.

L'extraction d'ADN pour les échantillons de Suila et Lubrak (n = 4) a été réalisée au MPI-SHH en utilisant des méthodes similaires avec de légères modifications. L'échantillonnage a suivi un protocole précédemment décrit51. En bref, les dents ont été nettoyées mécaniquement et irradiées aux UV pour éliminer la contamination de surface. Les dents ont été sectionnées et la poudre de dentine a été obtenue à partir de la cavité interne de la pulpe à l'aide d'une perceuse mécanique. L'extraction de l'ADN a été effectuée comme décrit précédemment52. En bref, la poudre de dentine (50 mg) a été digérée dans une solution de 1 mL d'EDTA 0,45 M et de protéinase K 0,25 mg/mL. L'ADN a été purifié et concentré à l'aide du kit Roche High Pure Viral Nucleic Acid. En bref, 10 ml de tampon de liaison (5 M GuHCl, 40 % d'isopropanol) et 400 μL d'acétate de sodium 3 M ont été combinés avec le surnageant d'ADN dans l'assemblage High Pure Extender et centrifugés pour lier l'ADN à la membrane de la colonne de silice. La colonne a été centrifugée à sec, lavée deux fois avec un tampon de lavage (NaCl 20 mM, Tris-HCl 2 mM dans de l'éthanol), puis à nouveau centrifugée à sec. L'ADN purifié a été élué de la colonne dans 100 μL de tampon TET (10 mM Tris, 0,1 mM EDTA, 0,05 % Tween 20).

Pour cribler la conservation, des extraits d'ADN d'échantillons de Chokhopani, Rhirhi, Kyang, Mebrak et Samdzong ont été construits dans des bibliothèques Illumina à double brin et à double index en utilisant un protocole à extrémité franche à l'OU en utilisant un kit NEBNext DNA Library Prep Master, comme décrit précédemment21 . En bref, l'ADN a été réparé en utilisant un mélange de réparation d'extrémité NEB (contenant de la polymérase T4 et du T4 PNK), suivi d'une purification Qiagen MinElute. Un mélange d'adaptateurs compatible Illumina P5 (IS1 + IS3) et P7 (IS2 + IS3)53 a été ajouté à l'aide de la ligase Quick T4, suivi d'une purification Qiagen MinElute. Une réaction de remplissage de l'adaptateur a été réalisée en utilisant l'ADN polymérase Bst, suivie d'une inactivation par la chaleur. Après une qPCR pour déterminer la concentration de la bibliothèque, l'achèvement de la bibliothèque a été effectué par amplification PCR en triple à l'aide des amorces d'indexation P5 et P7 et de l'enzyme KAPA HiFi + Uracil HotStart, suivie d'une purification d'ADN Qiagen QiaQuick. Au total, 49/50 extraits ont été intégrés avec succès dans des bibliothèques, puis séquencés à l'Université de Chicago sur un Illumina HiSeq 4000 en utilisant une chimie de 2 × 75 pb pour cribler la conservation.

Pour cribler les échantillons de Suila et Lubrak (qui sont devenus disponibles plus tard dans le projet), nous avons construit des extraits d'ADN dans des bibliothèques Illumina double brin (pour Lubrak) ou simple brin (pour Suila), à double index au MPI-SHH suivant des protocoles similaires mais avec de légères modifications, comme décrit dans les protocoles publiés55,56,57. En bref, pour les bibliothèques double brin, l'ADN a été réparé à l'extrémité à l'aide d'un mélange de réparation d'extrémité (contenant de la polymérase T4 et du T4 PNK), suivi d'une purification Qiagen MinElute. Un mélange d'adaptateurs compatible Illumina P5 (IS1 + IS3) et P7 (IS2 + IS3)58 a été ajouté à l'aide de la ligase Quick T4, suivi d'une purification Qiagen MinElute. Une réaction de remplissage de l'adaptateur a été réalisée en utilisant l'ADN polymérase Bst, suivie d'une inactivation par la chaleur. Après une qPCR pour déterminer la concentration de la bibliothèque, la complétion de la bibliothèque56 a été réalisée par amplification PCR à l'aide d'amorces d'indexation P5 et P7 et d'ADN polymérase Pfu Turbo Cx HotStart, suivie d'une purification d'ADN Qiagen MinElute. Les bibliothèques indexées ont ensuite été réamplifiées à l'aide de l'enzyme Herculase II Fusion59, puis purifiées et regroupées pour le séquençage à l'aide d'un Qiagen MinElute.

Pour les bibliothèques simple brin, l'ADN a été déphosphorylé et dénaturé par la chaleur, après quoi le premier adaptateur (CL78/TL137) a été ligaturé à l'ADN en utilisant la ligase T4. Les billes magnétiques Dynabeads MyOne Streptavidin C1 ont été liées aux bibliothèques, lavées avec une solution BWT-SDS (0,1 M NaCl, 0,01 M Tris-HCl, 0,001 M EDTA, 0,05 % Tween 20, 0,5 % SDS) et incubées dans un tampon de lavage de stringence. Les bibliothèques ont été lavées avec une solution BWT (NaCl 0, 1 M, Tris-HCl 0, 01 M, EDTA 0, 001 M, Tween 20 à 0, 05%) et incubées avec l'amorce d'extension CL130, suivie du fragment de Klenow. Les bibliothèques ont été lavées avec une solution BWT-SDS et incubées dans un tampon de lavage de stringence (NaCl 0,015 M, citrate trisodique 1,5 mM, SDS 0,1%). Les bibliothèques ont été lavées avec une solution BWT puis incubées avec de la ligase T4 pour ligaturer le deuxième adaptateur (CL53/CL73). Les bibliothèques ont été lavées avec une solution BWT-SDS et incubées dans un tampon de lavage de stringence. Les bibliothèques ont été lavées avec une solution BWT et incubées dans un tampon TT (10 mM Tris, 0,05 % Tween 20) à 95 °C pour libérer l'ADN des billes. Après détermination de la concentration de la bibliothèque à l'aide de qPCR, la bibliothèque a été indexée56 par amplification PCR à l'aide des amorces d'indexation P5 et P7 et de l'ADN polymérase Pfu Turbo Cx HotStart, suivie d'une purification de l'ADN Qiagen MinElute. Les bibliothèques indexées ont ensuite été réamplifiées59 à l'aide de l'enzyme Herculase II Fusion, puis purifiées et regroupées pour le séquençage à l'aide d'un Qiagen MinElute. Au total, 4/4 extraits ont été intégrés avec succès dans des bibliothèques, puis séquencés au MPI-SHH sur un Illumina HiSeq 4000 en utilisant une chimie de 1 × 75 pb.

Pris dans leur ensemble, 47 des 54 nouveaux échantillons ont donné suffisamment d'ADN endogène (> 0,1 %) lors du dépistage pour une analyse plus approfondie. Parmi ceux-ci, 25 échantillons (21 individus) ont été sélectionnés pour une capture en solution personnalisée à l'aide de sondes oligonucléotidiques correspondant à 50 K sites cibles sélectionnés manuellement avec une signification fonctionnelle (« 50 K », voir la description de la conception du test ci-dessous). Pour assurer une couverture suffisante à l'échelle du génome des marqueurs informatifs d'ascendance pour l'analyse de l'ascendance dans l'ensemble de l'échantillon, nous avons effectué une capture en solution pour environ 1,2 million de SNP nucléaires informatifs ('1240K')22,60 sur les 47 échantillons bien conservés. Cependant, pour améliorer la complexité de la bibliothèque des 43 échantillons initialement traités à OU, nous avons d'abord généré de nouvelles bibliothèques double brin à double index pour ces échantillons au MPI-SHH en utilisant la méthode décrite pour les échantillons Lubrak. Nous avons appliqué la capture 1240K aux 47 échantillons et les avons séquencés sur un Illumina HiSeq 4000 en utilisant une chimie 1 × 75 et Illumina NextSeq 500 en utilisant une chimie 2 × 75 bp jusqu'à ce que nous obtenions une couverture suffisante sur les SNP capturés ou la complexité de la bibliothèque épuisée (Données supplémentaires 1 ). Après avoir retiré trois échantillons qui ne répondaient pas à nos critères de contrôle qualité (C2 pour une faible couverture, M3490 et U2 pour 4 % et 9 % de contamination mitochondriale, respectivement), 44/47 échantillons (33 individus) ont été inclus dans notre analyse. Enfin, 15 échantillons (13 individus) ont été sélectionnés pour le séquençage profond du génome entier (WGS). Sept de ces échantillons ont été séquencés chez Macrogen, Inc. à l'aide d'un Illumina HiSeq X10 avec une chimie de 2 × 75 pb, et 9 (y compris un échantillon chevauchant les échantillons de l'U de Chicago) ont été séquencés au MPI-SHH à l'aide d'un Illumina HiSeq4000 avec 1 × Chimie de 75 pb (Données supplémentaires 1); Les échantillons WGS séquencés au MPI-SHH ont été soumis à un demi-traitement UDG61. Ces données ont ensuite été combinées avec 7 génomes aMMD profondément séquencés précédemment publiés (individus C1, M63, M344, S10, S35, S40 et S41 ; à l'exclusion de M240 pour sa position aberrante dans PCA) pour une analyse ultérieure, ce qui a donné un total de 20 individus. avec des génomes entiers séquencés à une profondeur de 0,1 à 6,6x. Au total, des données d'ascendance à l'échelle du génome ('1240K') ont été générées pour 33 individus, des données SNP fonctionnelles ('50K') ont été générées pour 21 individus et des données de génome entier ont été analysées pour un total de 20 individus, ce qui a donné 38 individus. dans l'ensemble de données final (qui comprend des individus de cette étude et de l'étude précédente21).

L'enrichissement pour les SNP du panel 1240K a été effectué au MPI-SHH selon les protocoles décrits précédemment22. Une quantité de 1-2 μg a été utilisée dans chaque capture. En bref, les bibliothèques d'ADN ont été diluées à environ 200-400 ng/μL et mélangées avec des oligos bloquants (ADN Cot01 humain, ADN de sperme de saumon, P5, P7). Le pool de bibliothèques a été dénaturé à 95 ° C pendant 5 min, suivi de 37 ° C pendant 10 min, puis ajouté à une plaque à 96 puits pré-préparée avec un tampon d'hybridation et des sondes d'ADN biotinylées. L'hybridation s'est produite à 65 °C pendant 24 heures, après quoi les sondes biotinylées ont été immobilisées sur des billes Dynabeads MyOne Streptavidin T1. L'ADN non lié a été éliminé par trois lavages à haute température en utilisant un tampon HWT, suivis d'une incubation dans une solution fondue pour libérer les bibliothèques d'ADN. Le surnageant de la bibliothèque d'ADN a été transféré sur une nouvelle plaque et lié aux SeraMag Speedbeads. La solution de billes a été lavée à plusieurs reprises avec de l'éthanol et séchée. Les billes ont été remises en suspension dans du tampon TT pour libérer l'ADN, et après granulation des billes, le surnageant contenant les bibliothèques a été collecté. Après quantification qPCR des bibliothèques enrichies, les bibliothèques ont été amplifiées par PCR à l'aide de Herculase II Fusion. Le profil thermique utilisé était : une dénaturation initiale à 95 °C pendant 2 minutes, 30 cycles de 95 °C pendant 30 secondes, 60 °C pendant 30 secondes et 72 °C pendant 30 secondes, et une extension finale pendant 5 minutes à 72 ° C Les bibliothèques post-capture ont été purifiées à l'aide de billes SPRI et quantifiées à l'aide d'un NanoDrop (ThermoFisher). Une aliquote de 100 ng de bibliothèque post-capture a été réamplifiée à l'aide d'un test de reconditionnement pour éliminer les hétéroduplexes. Le profil thermique utilisé était : 1 cycle de 95 °C pendant 2 min, 58 °C pendant 2 min et 72 °C pendant 5 min. Des aliquotes des bibliothèques résultantes ont été regroupées en quantités équimolaires et purifiées sur un Qiagen MinElute. Les concentrations du pool de bibliothèques ont été mesurées avec un NanoDrop et une TapeStation (Agilent) avant le séquençage.

L'enrichissement pour les SNP fonctionnels ("50K") a été réalisé à l'Université de Chicago à l'aide de sondes d'ARN biotinylées personnalisées générées par MYBaits (Arbor Biosciences). La capture a été effectuée selon les recommandations du fabricant. Une quantité de 200 ng d'ADN a été utilisée à chaque capture. L'hybridation s'est produite à 55 °C pendant 48 heures, après quoi les sondes biotinylées ont été immobilisées sur des billes Dynabeads MyOne Streptavidin C1. Les instructions du fabricant ont été suivies pour laver tout ADN non lié, avant l'amplification par PCR à l'aide de Kapa HiFi HotStart. L'ADN lié aux billes a été utilisé directement. Le profil thermique utilisé était : une dénaturation initiale à 98 °C pendant 2 minutes, 14 cycles de 98 °C pendant 20 secondes, 60 °C pendant 30 secondes et 72 °C pendant 30 secondes, et une extension finale pendant 5 minutes à 72 ° C Les bibliothèques post-capture ont ensuite été purifiées via MinElute (Qiagen), en éluant dans 20 ul de tampon EB en suivant les instructions du fabricant. La distribution de la longueur des fragments des bibliothèques enrichies a été étudiée à l'aide du BioAnalyzer (Agilent) et la concentration vérifiée à l'aide de Qubit (Invitrogen) pour permettre le regroupement des échantillons en quantités équimolaires pour le séquençage. Les échantillons ont été séquencés par lots de 6 sur une voie d'un instrument Illumina HiSeq 4000 en utilisant une chimie de 2 × 100 pb.

Les séquences d'adaptateur Illumina ont été coupées à l'aide d'AdapterRemoval v2.2.062 et les doublons de PCR ont été supprimés à l'aide de DeDup v0.12.263. Les lectures ont été cartographiées sur le génome de référence humain avec des séquences leurres (hs37d5) à l'aide de BWA v0.7.1264. Pour tous les échantillons, nous avons estimé la contamination mitochondriale à l'aide du package Schumutzi. Pour les individus mâles séquencés à génome entier et/ou capturés à 1240K, nous avons également estimé la contamination en utilisant l'haploïdie sur le chromosome X à l'aide du module de contamination ANGSD65. Aucune bibliothèque séquencée du génome entier ni 1240K n'a estimé la contamination mitochondriale ou nucléaire (mâles uniquement) supérieure à 5% (Données supplémentaires 1).

Pour déterminer la branche haplotype Y des individus anciens mâles, nous avons analysé les SNP sur le chromosome Y. Pour référence, nous avons utilisé des marqueurs de https://isogg.org/tree (Version : 13.238, 2018). Nous avons également fusionné dans les SNP raffinés de l'haplogroupe O définis par Wang et al. 201827. Nous avons recherché des lectures ancestrales et dérivées de cet ensemble de SNP chez chacun des anciens mâles de notre ensemble de données. Les appels d'haplotype étaient basés sur l'inspection manuelle du nombre de lectures ancestrales et dérivées par branche d'haplogroupe, en tenant compte de la couverture et des estimations d'erreur. Comme les conventions de dénomination des haplogroupes sont susceptibles de changer, nous annotons les haplogroupes en termes de transport de l'état dérivé à un SNP définissant. Pour déterminer l'haplogroupe mitochondrial, nous avons d'abord déterminé la séquence consensus en utilisant le script log2fasta dans le package Schmutzi avec un seuil de qualité 10. Nous avons ensuite attribué des haplogroupes à chacune des séquences consensus en utilisant Haplogrep v266.

Pour atténuer l'impact des dommages post-mortem dans le génotypage, nous avons coupé 5 bps des deux extrémités des lectures à l'aide du module bam de BamUtil v1.0.1467. Pour les SNP 1240K, nous avons créé un pileup pour chaque bibliothèque en utilisant samtools68 mpileup v1.9 avec les indicateurs "-R" et "-B". Ensuite, pour appeler des génotypes "pseudo-haploïdes", nous avons tiré au hasard une seule base de haute qualité (score de qualité de base à l'échelle Phred de 30 ou plus) à partir d'une lecture de haute qualité (score de qualité de cartographie à l'échelle Phred de 30 ou plus) par bibliothèque , en utilisant le programme pileupCaller dans sequenceTools v1.4.0.5 (https://github.com/stschiff/sequenceTools). Pour les individus Suila, nous avons exécuté pileupCaller avec le drapeau "--singleStrandMode", qui a pris un échantillon aléatoire pour les SNP C/T à partir de lectures de brins négatifs uniquement et pour les SNP G/A à partir de lectures de brins positifs uniquement. Ensuite, nous avons détecté des bibliothèques des mêmes individus en calculant le taux de non-appariement par paires (PMR) des génotypes pseudo-haploïdes pour toutes les paires de bibliothèques (Fig. 14A supplémentaire): les paires en double affichent des valeurs de PMR ~ 0, 12 tandis que les paires d'individus non apparentés ont ~ 0, 24 (Données supplémentaires 4), le double de la valeur des doublons69. Après avoir détecté les doublons, nous avons fusionné les fichiers BAM par individu et répété la procédure de génotypage pour créer des données de génotype pseudo-haploïde par individu. Nous avons ensuite recalculé le PMR en utilisant les données par individu, en identifiant 7 parents au premier degré et 5 parents au deuxième degré (Fig. 14B supplémentaire; Données supplémentaires 4). Nous avons en outre calculé les probabilités de génotype à partir de fichiers BAM masqués par individu à l'aide du script "SNPbam2vcf.py" dans le programme lcMLkin v0.5.070 et estimé les coefficients IBD1 et IBD2 à l'aide du programme lcMLkin, ce qui a permis de distinguer les parents au premier degré en quatre parents. paires de descendants et trois frères et sœurs à part entière.

Nous avons compilé deux ensembles de données de référence pour l'analyse génétique des populations : les ensembles de données HumanOrigins ("HO") et "Illumina". Pour l'ensemble de données HO, nous avons fusionné les données de génotype à l'échelle du génome des populations mondiales actuelles du réseau Affymetrix Axiom Genome-Wide Human Origins 1, y compris un grand nombre d'Asiatiques du Sud et de l'Est23,36,71,72. Nous avons ensuite augmenté ce panel avec des individus tibétains et sherpas actuels séquencés au génome entier23,43,73 et deux individus anciens à couverture élevée : un chasseur-cueilleur européen mésolithique du Luxembourg ("Loschbour")71 et un individu âgé de 45 000 ans. de la Sibérie occidentale ("Ust'-Ishim")74. Nous avons également inclus des données de génotype pseudo-haploïde des individus anciens suivants : Natufian75, Ganj Dareh Neolithic76, Villabruna77, Anatolia Neolithic22, MA-126, Botai78, Tyumen_HG et Sosonivoy_HG76, anciens génomes d'Asie de l'Est précédemment publiés, y compris les chasseurs-cueilleurs Hoabinhian, Devil's Gate Cave , YR_MN, Upper_YR_LN28,31,32,33 et l'aMMD (Données supplémentaires 5). Pour l'ensemble de données Illumina, nous avons fusionné des individus sud-asiatiques79, tibétains et sherpa au Népal23,43,73, des individus himalayens24 avec des individus du Human Genome Diversity Project80 (Données supplémentaires 6). Nous avons ensuite fusionné des individus birmans et thaïlandais du Simon Genome Diversity Project73. Nous avons inclus le même ensemble d'individus anciens que dans l'ensemble de données HO. Nous avons supprimé les SNP à brin ambigu des ensembles de données.

Pour l'ensemble de données HO, nous avons calculé les PC pour deux ensembles de populations actuelles: (i) 2096 individus eurasiens et (ii) 486 individus d'Asie de l'Est (Fig. 2; Fig. 1 supplémentaire; Données supplémentaires 5). Pour PCA, nous avons utilisé le programme smartpca v16000 dans le package EIGENSOFT v7.2.125, avec l'option "lsqproject : YES" pour les deux ensembles, et en plus avec l'option "shrinkmode : YES" pour l'ensemble est-asiatique. Les individus non inclus dans le calcul des PC sont projetés sur l'espace PC à l'aide de ces options. Ces deux options tiennent compte du rétrécissement dû à l'absence et à la projection, respectivement.

Nous avons analysé les profils de mélange pour les 486 individus d'Asie de l'Est et les individus aMMD à l'aide du programme ADMIXTURE81 v1.3.0. Nous avons supprimé les SNP avec une fréquence d'allèles mineurs inférieure à 1 % et avons conservé les SNP indépendants en éliminant les SNP en déséquilibre de liaison à l'aide de la commande "indep-pairwise 200 25 0,2" dans PLINK v1.982, laissant 374 924 SNP dans l'analyse. Pour chaque valeur de K de deux à six, nous avons effectué dix essais avec des graines aléatoires. Nous avons visualisé les composants d'ascendance déduits (les matrices Q) à l'aide de pong83.

Nous avons utilisé les programmes qp3Pop v650 et qpDstat v970 dans le package admixtools v7.025 pour calculer les statistiques outgroup-f3 et f4, respectivement. Pour l'ensemble de données HO, nous avons calculé f3 (Mbuti; X, Y), où X est un groupe aMMD et les Y incluent 54 populations d'Asie de l'Est actuelles, 7 groupes d'aMMD et 28 anciens groupes d'Asie de l'Est publiés28,32,33 (Supplementary Figure 3 ; Données supplémentaires 5). En utilisant le même ensemble de Y, nous avons également effectué des tests de symétrie f4 sous la forme de f4 (Mbuti, Y ; Chokhopani, Lubrak), f4 (Mbuti, Y ; Chokhopani/Lubrak, aujourd'hui Sherpa népalais/Tibétain), f4 (Mbuti , Y ; YR_MN/Upper_YR_LN, Naxi/Yi) et f4 (Mbuti, Devil's Gate ; YR_MN/Upper_YR_LN, aMMD) (Fig. 11 supplémentaire ; Données supplémentaires 7, 8). Nous avons également calculé les mêmes statistiques de l'exogroupe-f3 en utilisant l'ensemble de données Illumina avec des Y incluant les populations himalayennes et les populations d'Asie de l'Est. Les erreurs standard sont calculées par un jackknifing de bloc de 5 cM tel qu'implémenté dans les programmes qp3Pop et qpDstat.

Nous avons utilisé les programmes qpWave v1200 et qpAdm v1201 dans le package admixtools v7.0 pour tester la cladalité entre deux groupes et pour tester divers modèles de mélange à deux et à trois voies, respectivement. Dans tous les tests utilisant l'ensemble de données HO, nous avons utilisé un ensemble de base de six groupes externes pour distinguer les principales branches des ancêtres eurasiens en haute résolution : Mbuti d'Afrique centrale (n = 10), Onge des îles Andaman (n = 11), Mixe d'Amérique centrale (n = 10), Iran_N du site néolithique de Ganj Dareh en Iran (n = 8), le chasseur-cueilleur européen du Paléolithique supérieur Villabruna (n = 1) et le taïwanais Ami (n = 10) (Données supplémentaires 5). En plus de cela, nous avons ajouté un exogroupe supplémentaire qui appartient à la lignée tibétaine pour augmenter la puissance statistique permettant de distinguer la lignée tibétaine des autres lignées d'Eurasie orientale : Suila, Lubrak, Chokhopani. Les résultats QpAdm pour les populations actuelles sont principalement basés sur l'ensemble de base + Lubrak. Pour l'ensemble de données Illumina, nous avons remplacé Mixe par Karatiana sud-américain (n = 13). Pour maximiser l'utilisation des données, nous avons utilisé une option non par défaut "allsnps : YES", qui utilise tous les SNP disponibles pour calculer la statistique f individuelle plutôt que de prendre un ensemble commun de SNP couverts par les populations cibles, sources et hors groupe. Pour la modélisation des mélanges des populations tibétaines actuelles et d'autres populations tibéto-birmanes, nous avons utilisé Tsum23 comme référence liée au Tibétain, YR_MN/Upper_YR_LN/Naga/Naxi/Yi comme référence liée à l'Asie de l'Est des basses terres, et Pathan/Mala/Pulliyar comme référence. les sources liées à l'Asie du Sud (tableaux supplémentaires 1–3, 5–7). Pour l'ensemble de données Illumina, nous avons remplacé Mala par Sindhi (Données supplémentaires 9).

Nous avons déduit la topologie de graphe de mélange la plus plausible avec qpGraph v7365 dans le package admixtools v7.0. Nous avons d'abord construit un squelette graphique à cinq populations sans événements de mélange de Mbuti, MA-1, Tianyuan, Ami et DevilsGate. Nous avons ensuite ajouté Mixe et Upper_YR_LN, et un groupe aMMD ou actuel f3 Tibétain/Sherpa sur la topologie séquentiellement. Lors de l'ajout d'un groupe, nous avons énuméré toutes les topologies de graphes de mélange possibles jusqu'au mélange bidirectionnel en choisissant jusqu'à deux branches existantes comme groupes sources proximaux. Nous avons ensuite choisi la topologie qui a conduit au plus petit nombre de z-scores> 2, où les scores sont calculés par jackknifing de blocs de 5 cM. Nous préférons également les topologies avec des longueurs de branche internes positives. Notez que la procédure ci-dessus est gourmande en ce sens qu'un ordre différent à partir duquel ces populations ont été ajoutées peut conduire à une topologie finale différente. Nous avons répété notre procédure de recherche de graphes en remplaçant Tianyuan par deux chasseurs-cueilleurs Hoabinhiens en Asie du Sud-Est ("McColl_SEA_GR1" ; La368 et Ma911 ; Données supplémentaires 5). Nous avons ensuite essayé d'ajouter des hominines archaïques (Altai Neandertal et Denisovan) ou Ust-Ishim dans notre squelette à cinq populations. Enfin, nous avons essayé d'ajouter un groupe fusionné à partir de 2 Eneolithic Botai, Tyumen_HG et Sosonivoy_HG, en espérant que ce groupe pourrait déterminer si la lignée profonde montre plus d'affinité eurasienne orientale ou occidentale.

Nous avons testé un flux de gènes de populations tibéto-birmanes non tibétaines vers Chokhopani et pour estimer la date de ce mélange à l'aide de DATES v75376, avec les options "jackknife : OUI" et "binsize 0,01". Nous avons utilisé Suila et un ensemble combiné de Naxi et Yi actuels comme deux sources.

Nous avons calculé les statistiques de l'exogroupe-f3 de la forme f3 (Tibétains ; aMMD, Han) pour le balayage de sélection. Le nombre d'allèles pour les Tibétains et les Han d'aujourd'hui a été calculé à partir des génotypes de 27 Népalais tibétains d'aujourd'hui non apparentés et de 103 individus Han (CHB) séquencés sur le génome entier du projet 1000 Genome. Le nombre d'allèles pour aMMD a été calculé à partir de 17 génomes pseudo-haploïdes aMMD séquencés par fusil de chasse (à l'exclusion de KS8 en raison de la parenté des 18 individus). Nous avons appliqué une approche de fenêtre glissante avec une taille de fenêtre de 500 kb et une taille de pas de 10 kb41. Les statistiques F3 dans une fenêtre ont été calculées à partir des SNP bialléliques dans la fenêtre qui se séparent soit dans le CHB, soit dans les Tibétains actuels, à condition qu'il y ait plus de 15 individus aMMD ayant plus d'une lecture couvrant un SNP. Nous avons en outre exclu les fenêtres avec <250 SNP. Ces valeurs brutes de f3 ont été normalisées par l'hétérozygotie des Tibétains actuels dans les fenêtres correspondantes pour atténuer leur dépendance aux fréquences alléliques34. Nous avons échantillonné au hasard un f3 dans chaque bloc LD84 pour estimer les moyennes et les erreurs standard des valeurs f3 et convertir les valeurs f3 basées sur la fenêtre en scores z.

De plus amples informations sur la conception de la recherche sont disponibles dans le résumé des rapports de recherche sur la nature lié à cet article.

Les séquences d'ADN brutes (FASTQ) et les données d'alignement (BAM) rapportées dans cet article ont été déposées dans l'European Nucleotide Archive (ENA) sous le numéro d'accession PRJEB41752. Les données de génotype des panels 1240K et HumanOrigins ont été déposées dans le référentiel de données Edmond de la Max Planck Society [https://edmond.mpdl.mpg.de/imeji/collection/H8mcNv5pbSen6sLg?q=]. Les 15 nouvelles dates AMS rapportées dans cette étude, leurs codes de laboratoire associés et leurs protocoles de laboratoire correspondants sont fournis dans les données supplémentaires 3. les sources suivantes : (1) les données génotypiques combinées pour les SNP du panel 1240K fournies par le Reich Lab [https://reich.hms.harvard.edu/datasets], (2) les fichiers BAM des individus de Devil's Gate Cave dans le ENA sous le numéro d'accès PRJEB29700, et (3) les données de génotype pour les SNP du panel 1240 K d'individus anciens de Chine dans les archives de séquences génomiques du centre de données de l'Institut de génomique de Pékin sous le numéro d'accès HRA000123.

Toutes les analyses effectuées dans cette étude sont basées sur les logiciels accessibles au public. Les informations de version spécifiques ainsi que les arguments non par défaut sont décrits dans la section Méthodes.

Aldenderfer, M. Peupler le plateau tibétain: aperçus de l'archéologie. Haut. Alt. Méd. Biol. 12, 141-147 (2011).

Google Scholar PubMed

d'Alpoim Guedes, J. & Aldenderfer, M. L'archéologie du plateau tibétain ancien : nouvelles recherches sur le peuplement initial jusqu'au Bronze ancien. Âge. J. Archéol. Rés. 28, 339-392 (2020).

Google Scholar

Zhang, D. et al. ADN de Denisovan dans les sédiments du Pléistocène supérieur de la grotte karstique de Baishiya sur le plateau tibétain. Sciences 370, 584-587 (2020).

CAS PubMed Google Scholar

Chen, F. et al. Une mandibule de Denisovan du Pléistocène moyen tardif du plateau tibétain. Nature 569, 409–412 (2019).

ADS CAS PubMed Google Scholar

Zhang, X. et al. L'histoire et l'évolution de l'haplotype Denisovan-EPAS1 chez les Tibétains. Proc. Natl Acad. Sci. 118, e2020803118 (2021).

ADS CAS PubMed PubMed Central Google Scholar

Zhang, XL et al. La première occupation humaine du plateau tibétain de haute altitude il y a 40 000 à 30 000 ans. Sciences 362, 1049-1051 (2018).

ADS CAS PubMed Google Scholar

Meyer, MC et al. Occupation humaine permanente du plateau tibétain central au début de l'Holocène. Sciences 355, 64-67 (2017).

ADS CAS PubMed Google Scholar

Chen, FH et al. L'agriculture a facilité l'occupation humaine permanente du plateau tibétain après 3600 BP Science 347, 248-250 (2015).

ADS CAS PubMed Google Scholar

Dong, G. et al. Variété spatiale et temporelle de l'établissement humain préhistorique et de ses facteurs d'influence dans la haute vallée du fleuve Jaune, province de Qinghai, Chine. J. Archéol. Sci. 40, 2538-2546 (2013).

Google Scholar

Qi, X. et al. Preuve génétique de la colonisation paléolithique et de l'expansion néolithique des humains modernes sur le plateau tibétain. Mol. Biol. Évol. 30, 1761–1778 (2013).

CAS PubMed Google Scholar

Qin, Z. et al. Une révélation mitochondriale des premières migrations humaines vers le plateau tibétain avant et après le dernier maximum glaciaire. Suis. J.Phys. Anthropol. 143, 555-569 (2010).

Google Scholar PubMed

Zhao, M. et al. Les preuves du génome mitochondrial révèlent une colonisation réussie du Paléolithique tardif sur le plateau tibétain. Proc. Natl Acad. Sci. États-Unis 106, 21230–21235 (2009).

ADS CAS PubMed PubMed Central Google Scholar

Lu, D. et al. Origines ancestrales et histoire génétique des montagnards tibétains. Suis. J. Hum. Genet. 99, 580-594 (2016).

CAS PubMed PubMed Central Google Scholar

Yi, X. et al. Le séquençage de 50 exomes humains révèle une adaptation à la haute altitude. Sciences 329, 75-78 (2010).

ADS CAS PubMed PubMed Central Google Scholar

Beall, CM et al. Sélection naturelle sur EPAS1 (HIF2alpha) associée à une faible concentration d'hémoglobine chez les montagnards tibétains. Proc. Natl Acad. Sci. États-Unis 107, 11459–11464 (2010).

ADS CAS PubMed PubMed Central Google Scholar

Simonson, TS et al. Preuve génétique de l'adaptation à haute altitude au Tibet. Sciences 329, 72-75 (2010).

ADS CAS PubMed Google Scholar

Huerta-Sánchez, E. et al. Adaptation à l'altitude chez les Tibétains causée par l'introgression d'ADN de type Denisovan. Nature 512, 194–197 (2014).

ADS PubMed PubMed Central Google Scholar

Jeong, C. et al. Un cline longitudinal caractérise la structure génétique des populations humaines du plateau tibétain. PLoS ONE 12, 1–12 (2017).

CAS Google Scholar

Ren, L. et al. La transformation des modèles de culture du Néolithique tardif au début de l'âge du fer (5900–2100 BP) dans la région du Gansu-Qinghai au nord-ouest de la Chine. Holocène https://doi.org/10.1177/0959683620941137 (2020).

Article Google Scholar

Brunson, K. et al. La zooarchéologie, l'ancien ADNmt et la datation au radiocarbone fournissent de nouvelles preuves de l'émergence de bovins domestiques et de caprins dans la vallée de la rivière Tao de la province de Gansu, au nord-ouest de la Chine. J. Archéol. Sci. Rep. 31, 102262 (2020).

Google Scholar

Jeong, C. et al. Une stabilité génétique à long terme et une origine est-asiatique de haute altitude pour les peuples des hautes vallées de l'arc himalayen. Proc. Natl Acad. Sci. États-Unis A 113, 7485–7490 (2016).

CAS PubMed PubMed Central Google Scholar

Mathieson, I. et al. Modèles de sélection à l'échelle du génome chez 230 anciens Eurasiens. Nature 528, 499-503 (2015).

ADS CAS PubMed PubMed Central Google Scholar

Jeong, C. et al. Détecter la sélection naturelle passée et en cours parmi les femmes ethniquement tibétaines à haute altitude au Népal. PLoS Genet. 14, 1–29 (2018).

Google Scholar

Arciero, E. et al. Histoire démographique et adaptation génétique dans la région himalayenne déduites des génotypes SNP à l'échelle du génome de 49 populations. Mol. Biol. Évol. 35, 1916-1933 (2018).

CAS PubMed PubMed Central Google Scholar

Patterson, N., Price, AL & Reich, D. Structure de la population et analyse propre. PLoS Genet. 2, 2074-2093 (2006).

CAS Google Scholar

Raghavan, M. et al. Le génome sibérien du Paléolithique supérieur révèle une double ascendance d'Amérindiens. Nature 505, 87–91 (2014).

ADS PubMed Google Scholar

Wang, LX et al. La reconstruction de la phylogénie du chromosome Y révèle deux expansions néolithiques des populations tibéto-birmanes. Mol. Genet. Génome. 293, 1293-1300 (2018).

CAS Google Scholar

Ning, C. et al. Les génomes anciens du nord de la Chine suggèrent des liens entre les changements de subsistance et la migration humaine. Nat. Commun. 11, 1–9 (2020).

Annonces Google Scholar

Sagart, L. et al. Des phylogénies linguistiques datées éclairent l'ascendance sino-tibétaine. Proc. Natl Acad. Sci. États-Unis 116, 10317–10322 (2019).

CAS PubMed PubMed Central Google Scholar

Zhang, M., Yan, S., Pan, W. & Jin, L. Preuve phylogénétique de l'origine sino-tibétaine dans le nord de la Chine au Néolithique supérieur. Nature 569, 112-115 (2019).

ADS CAS PubMed Google Scholar

McColl, H. et al. Le peuplement préhistorique de l'Asie du Sud-Est. Sciences 361, 88-92 (2018).

ADS CAS PubMed Google Scholar

Sikora, M. et al. L'histoire de la population du nord-est de la Sibérie depuis le Pléistocène. Nature 570, 182-188 (2019).

ADS CAS PubMed Google Scholar

Yang, MA et al. L'ADN ancien indique des déplacements et des mélanges de population humaine dans le nord et le sud de la Chine. Sciences 369, eaba0909 (2020).

Annonces Google Scholar

Patterson, N. et al. Mélange antique dans l'histoire humaine. Génétique 192, 1065–1093 (2012).

PubMed PubMed Central Google Scholar

Hu, H. et al. Histoire évolutive des Tibétains déduite du séquençage du génome entier. PLOS Genet. 13, e1006675 (2017).

PubMed PubMed Central Google Scholar

Wang, C.-C. et coll. La formation génomique des populations humaines en Asie de l'Est https://doi.org/10.1101/2020.03.25.004606 (2020). bioRxiv 2020.03.25.004606.

Gnecchi-Ruscone, GA et al. Le paysage génomique des Népalais tibéto-birmans révèle de nouvelles perspectives sur le peuplement récent du sud de l'Himalaya. Sci. Rep. 7, 1–12 (2017).

CAS Google Scholar

Cole, AM et al. Structure génétique chez les Sherpa et les populations népalaises voisines. BMC Génom. 18, 102 (2017).

Google Scholar

Oppitz, M. Mythes et faits : reconsidérer certaines données concernant l'histoire du clan des Sherpas. Kailash 2, 121–131 (1974).

Google Scholar

Lorenzo, FR et al. Un mécanisme génétique pour l'adaptation tibétaine à haute altitude. Nat. Genet. 46, 951–956 (2014).

CAS PubMed PubMed Central Google Scholar

Skoglund, P. et al. Reconstitution de la structure préhistorique de la population africaine. Cellule 171, 59–71.e21 (2017).

CAS PubMed PubMed Central Google Scholar

Buroker, NE et al. Associations AKT3, ANGPTL4, eNOS3 et VEGFA avec le mal de l'altitude chez les Han et les Chinois tibétains sur le plateau Qinghai-Tibétain. Int. J. Hématol. 96, 200-213 (2012).

CAS PubMed Google Scholar

Jeong, C. et al. Le mélange facilite les adaptations génétiques à la haute altitude au Tibet. Nat. Commun. 5, 1–7 (2014).

Annonces Google Scholar

Ren, L. et al. Recherche de nourriture et agriculture: preuves archéobotaniques et zooarchéologiques des échanges néolithiques sur le plateau tibétain. Antiquité 94, 637–652 (2020).

Google Scholar

Xiang, K. et al. Identification d'une mutation spécifique au Tibet dans le gène hypoxique EGLN1 et sa contribution à l'adaptation à haute altitude. Mol. Biol. Évol. 30, 1889–1898 (2013).

CAS PubMed Google Scholar

Tiwari, D. Sépultures rupestres de l'ouest du Népal. Mustang Inc. Népal 136, 51–75 (1984).

Google Scholar

Angela Simons (éd.): Bergers dans l'Himalaya - Momies préhistoriques dans la tombe de la grotte Mebrak 63 (Mustang / Népal) - Propylaeum eBooks. Disponible sur : https://books.ub.uni-heidelberg.de/propylaeum/catalog/book/596. (Consulté : 20 août 2020).

Eng, J. & Aldenderfer, M. Approches interdisciplinaires pour reconstruire l'histoire de la population ancienne dans le haut Himalaya du Népal. Bioarchéol. Int. 4, 1–20 (2020).

Google Scholar

Aldenderfer, M. & Eng, JT Mort et enterrement parmi deux anciennes communautés de haute altitude du Népal. dans A Companion to South Asia in the Past 374–397 (John Wiley & Sons, Inc, 2016). https://doi.org/10.1002/9781119055280.ch24.

Dabney, J. et al. Séquence complète du génome mitochondrial d'un ours des cavernes du Pléistocène moyen reconstruite à partir de fragments d'ADN ultracourts. Proc. Natl Acad. Sci. États-Unis 110, 15758–15763 (2013).

ADS CAS PubMed PubMed Central Google Scholar

Neumann, GU, Andrades Valtuena, A., Fellows Yates, JA, Stahl, R. & Brandt, G. Échantillonnage de dents de la chambre pulpaire interne pour l'extraction d'ADN ancien V.2 Dans 2 collections, https://doi.org/ 10.17504/protocols.io.bqebmtan (2020).

Velsko, I., Skourtanioti, E. & Brandt, G. Extraction d'ADN ancien à partir de matériel squelettique., https://doi.org/10.17504/protocols.io.baksicwe (2020).

Meyer, M. & Kircher, M. Illumina préparation de la bibliothèque de séquençage pour la capture et le séquençage de cibles hautement multiplexées. Cold Spring Harb. Protocole 5, pdb.prot5448 (2010).

Google Scholar

Kircher, M., Sawyer, S. & Meyer, M. La double indexation surmonte les inexactitudes dans le séquençage multiplex sur la plate-forme Illumina. Nucleic Acids Res. 40, e3 (2012).

CAS PubMed Google Scholar

Aron, F., Neumann, GU & Brandt, G. Préparation de bibliothèque d'ADN ancienne double brin non traitée par UDG pour le séquençage Illumina, https://doi.org/10.17504/protocols.io.bakricv6 (2020).

Stahl, R. et al. Double indexation d'ADN double brin Illumina pour l'ADN ancien, https://doi.org/10.17504/protocols.io.bakticwn (2020).

Gansauge, MT et al. Préparation d'une bibliothèque d'ADN simple brin à partir d'ADN hautement dégradé à l'aide de l'ADN ligase T4. Nucleic Acids Res. 45, e79 (2017).

CAS PubMed PubMed Central Google Scholar

Aron, F. & Brandt, G. Library Adapter Preparation for Dual-Index Double Stranded DNA Illumina Sequencing, https://doi.org/10.17504/protocols.io.bem5jc86 (2020).

Aron, F. & Brandt, G. Amplification et mise en commun, https://doi.org/10.17504/protocols.io.beqkjduw (2020).

Haak, W. et al. La migration massive de la steppe était une source de langues indo-européennes en Europe. Nature 522, 207–211 (2015).

ADS CAS PubMed PubMed Central Google Scholar

Rohland, N., Harney, E., Mallick, S., Nordenfelt, S. & Reich, D. Traitement partiel uracile-ADN-glycosylase pour le dépistage de l'ADN ancien. Philos. Trans. R. Soc. B Biol. Sci. 370, 20130624 (2015).

Google Scholar

Schubert, M., Lindgreen, S. & Orlando, L. AdapterRemoval v2 : découpage rapide de l'adaptateur, identification et fusion de lecture. BMC Rés. Notes 9, 88 (2016).

PubMed PubMed Central Google Scholar

Peltzer, A. et al. EAGER : reconstruction efficace du génome ancien. Génome Biol. 17, 60 (2016).

PubMed PubMed Central Google Scholar

Li, H. & Durbin, R. Alignement de lecture rapide et précis avec la transformée de Burrows-Wheeler. Bioinformatique 25, 1754–1760 (2009).

CAS PubMed PubMed Central Google Scholar

Korneliussen, TS, Albrechtsen, A. & Nielsen, R. ANGSD : analyse des données de séquençage de nouvelle génération. BMC Bioinforma. 15, 1–13 (2014).

Google Scholar

Weissensteiner, H. et al. HaploGrep 2 : classification des haplogroupes mitochondriaux à l'ère du séquençage à haut débit. Nucleic Acids Res. 44, W58–W63 (2016).

CAS PubMed PubMed Central Google Scholar

Jun, G., Wing, MK, Abecasis, GR & Kang, HM Un cadre d'analyse efficace et évolutif pour l'extraction et le raffinement de variants à partir de données de séquences d'ADN à l'échelle de la population. Génome Res. 25, 918–925 (2015).

CAS PubMed PubMed Central Google Scholar

Li, H. et al. Le format Sequence Alignment/Map et SAMtools. Bioinformatique 25, 2078-2079 (2009).

PubMed PubMed Central Google Scholar

Kennett, DJ et al. Des preuves archéogénomiques révèlent une dynastie matrilinéaire préhistorique. Nat. Commun. 8, 1–9 (2017).

Google Scholar

Lipatov, M., Sanjeev, K., Patro, R. et Veeramah, KR Estimation du maximum de vraisemblance de la parenté biologique à partir de données de séquençage à faible couverture, https://doi.org/10.1101/023374 (2015). bioRxiv 023374.

Lazaridis, I. et al. Les génomes humains anciens suggèrent trois populations ancestrales pour les Européens d'aujourd'hui. Nature 513, 409–413 (2014).

ADS CAS PubMed PubMed Central Google Scholar

Nakatsuka, N. et al. La promesse de découvrir des gènes associés à des maladies spécifiques à une population en Asie du Sud. Nat. Genet. 49, 1403–1407 (2017).

CAS PubMed PubMed Central Google Scholar

Mallick, S. et al. Le projet Simons Genome Diversity : 300 génomes de 142 populations diverses. Nature 538, 201-206 (2016).

ADS CAS PubMed PubMed Central Google Scholar

Fu, Q. et al. Séquence du génome d'un humain moderne de 45 000 ans originaire de Sibérie occidentale. Nature 514, 445–449 (2014).

ADS CAS PubMed PubMed Central Google Scholar

Lazaridis, I. et al. Aperçus génomiques sur l'origine de l'agriculture dans l'ancien Proche-Orient. Nature 536, 419–424 (2016).

ADS CAS PubMed PubMed Central Google Scholar

Narasimhan, VM et al. La formation des populations humaines en Asie du Sud et centrale. Sciences 365, eaat7487 (2019).

CAS PubMed PubMed Central Google Scholar

Fu, Q. et al. L'histoire génétique de l'Europe glaciaire. Nature 534, 200-205 (2016).

ADS CAS PubMed PubMed Central Google Scholar

de Barros Damgaard, P. et al. Les premiers éleveurs de chevaux et l'impact de l'expansion des steppes du début de l'âge du bronze en Asie. Sciences 360, eaar7711 (2018).

PubMed PubMed Central Google Scholar

Metspalu, M. et al. Composants partagés et uniques de la structure de la population humaine et signaux de sélection positive à l'échelle du génome en Asie du Sud. Suis. J. Hum. Genet. 89, 731–744 (2011).

CAS PubMed PubMed Central Google Scholar

Li, JZ et al. Relations humaines mondiales déduites des modèles de variation à l'échelle du génome. Sciences 319, 1100-1104 (2008).

ADS CAS PubMed Google Scholar

Alexander, DH, Novembre, J. & Lange, K. Estimation rapide basée sur un modèle de l'ascendance chez des individus non apparentés. Génome Res. 19, 1655-1664 (2009).

CAS PubMed PubMed Central Google Scholar

Chang, CC et al. PLINK de deuxième génération : relever le défi de jeux de données plus grands et plus riches. Gigascience 4, 7 (2015).

PubMed PubMed Central Google Scholar

Behr, AA, Liu, KZ, Liu-Fang, G., Nakka, P. & Ramachandran, S. pong : analyse rapide et visualisation des grappes latentes dans les données génétiques des populations. Bioinformatique 32, 2817–2823 (2016).

CAS PubMed PubMed Central Google Scholar

Berisa, T. & Pickrell, JK Blocs de déséquilibre de liaison approximativement indépendants dans les populations humaines. Bioinformatique 32, 283–285 (2015).

PubMed PubMed Central Google Scholar

Télécharger les références

Nous tenons à remercier Rowan K. Flad pour ses commentaires utiles sur les versions antérieures du document. Nous sommes également reconnaissants à Karma Ngodup pour les discussions utiles au cours de ce projet. Ce travail a été soutenu par les National Institutes of Health (R01HL119577 à AD), la US National Science Foundation (BCS-1528698 à MA), la National Research Foundation (NRF) de Corée subvention financée par le gouvernement coréen (MSIT) (2020R1C1C1003879 à CJ ), le Conseil européen de la recherche dans le cadre du programme de recherche et d'innovation Horizon 2020 de l'Union européenne (numéros de convention de subvention 804884-DAIRYCULTURES à CW) et la Max Planck Society.

Anna Gosling

Adresse actuelle : Département d'anatomie, Université d'Otago, Dunedin, 9054, Nouvelle-Zélande

Harald Ringbauer

Adresse actuelle : Department of Human Evolutionary Biology, Harvard University, Cambridge, MA, 02138, États-Unis

Richard Hagan

Adresse actuelle : Department of Archaeology, University of York, York, YO10 5DD, Royaume-Uni

Nisha Patel

Adresse actuelle : Kintai Therapeutics, Cambridge, MA, 02139, États-Unis

Département de génétique humaine, Université de Chicago, Chicago, IL, 60637, États-Unis

Chi-Chun Liu, David Witonsky, Anna Gosling, Harald Ringbauer, John Novembre & Anna DiRienzo

École des sciences biologiques, Université nationale de Séoul, Séoul, 08826, République de Corée

Ju Hyeon Lee et Choongwon Jeong

Département d'anthropologie, Université d'Oklahoma, Norman, OK, 73019, États-Unis

Richard Hagan

Département de plantes et de microbiologie, Université de l'Oklahoma, Norman, OK, 73019, États-Unis

Nisha Patel

Institut Max Planck d'anthropologie évolutive, 04103, Leipzig, Allemagne

Raphaela Stahl et Christina Warner

Département d'anthropologie et d'études du patrimoine, Université de Californie, Merced, CA, 95343, États-Unis

Marc Aldenderfer

Département d'anthropologie, Université de Harvard, Cambridge, MA, 02138, États-Unis

Christina Warinner

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

CJ, AD, CW et MA ont conçu et supervisé l'étude. AG, RH, NP, RS ont effectué les travaux de laboratoire. MA et CW ont fourni des matériaux archéologiques et des informations associées. CC.L., CJ, DW, AG, JL, HR ont analysé les données. CC.L., CJ, AD, CW, MA, JN ont rédigé l'article avec la contribution de tous les coauteurs.

Correspondance avec Mark Aldenderfer, Christina Warinner, Anna Di Rienzo ou Choongwon Jeong.

Les auteurs ne déclarent aucun intérêt concurrent.

Nature Communications remercie Elena Arciero et les autres examinateurs anonymes pour leur contribution à l'examen par les pairs de ce travail. Les rapports des pairs examinateurs sont disponibles.

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Liu, CC., Witonsky, D., Gosling, A. et al. Des génomes anciens de l'Himalaya éclairent l'histoire génétique des Tibétains et de leurs voisins de langue tibéto-birmane. Nat Commun 13, 1203 (2022). https://doi.org/10.1038/s41467-022-28827-2

Télécharger la citation

Reçu : 10 janvier 2021

Accepté : 14 février 2022

Publié: 08 mars 2022

DOI : https://doi.org/10.1038/s41467-022-28827-2

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.