banner
Maison / Blog / Un projet de génome d'Escherichia coli du XVIe siècle associé à une infection biliaire opportuniste
Blog

Un projet de génome d'Escherichia coli du XVIe siècle associé à une infection biliaire opportuniste

Aug 09, 2023Aug 09, 2023

Communications Biology volume 5, Article number: 599 (2022) Citer cet article

12 000 accès

557 Altmétrique

Détails des métriques

Escherichia coli - l'une des bactéries les plus caractérisées et un problème majeur de santé publique - reste invisible dans le paysage temporel. Ici, nous présentons la reconstruction méticuleuse du premier génome ancien d'E. coli à partir d'un calcul biliaire du XVIe siècle d'une momie italienne atteinte de cholécystite chronique. Nous avons isolé l'ADN ancien et reconstruit l'ancien génome d'E. coli. Il se composait d'un chromosome de 4446 gènes et de deux plasmides putatifs avec 52 gènes. La souche E. coli appartenait au phylogroupe A et à une séquence exceptionnellement rare de type 4995. Les gènes des composants du système de sécrétion de type VI semblent avoir été acquis horizontalement à partir de Klebsiella aerogenes, mais nous n'avons pu identifier aucun gène spécifique au pathovar ni aucune résistance acquise aux antibiotiques. Un test de septicémie chez la souris a montré qu'une souche contemporaine d'E. coli étroitement apparentée était avirulente. Notre reconstruction de cet ancien E. coli aide à brosser un tableau plus complet du fardeau des infections opportunistes du passé.

La récupération de l'ADN pathogène ancien (ADNa) de victimes humaines s'est presque exclusivement concentrée sur des événements de mortalité historiquement significatifs, tels que la peste noire, révélant l'histoire évolutive d'agents pathogènes canoniques tels que Yersinia pestis, Mycobacterium tuberculosis1 et le virus de la variole. En revanche, une grande partie de la morbidité et de la mortalité humaines est le résultat d'infections opportunistes, celles qui restent souvent invisibles dans le passé. Les agents pathogènes opportunistes, ceux qui n'ont pas d'antécédents historiques, tels que Escherichia coli, Pseudomonas aeruginosa et Staphylococcus aureus, ont été sous-étudiés par rapport à leurs fardeaux contemporains sur les personnes d'aujourd'hui2. Ils sont définis par leur capacité à infecter pendant les périodes de stress, de déséquilibre ou de perturbation tout en étant par ailleurs commensaux ou saprophytes3. Les infections opportunistes ont probablement joué un rôle important dans la mortalité humaine dans notre passé commun et ont donc eu un impact plus large sur la santé humaine que ce qui peut être ou a été mesuré.

Un facteur de confusion dans l'identification d'agents pathogènes historiquement sous-étudiés est que les infections résultantes étaient probablement principalement opportunistes. C'est-à-dire qu'ils ont colonisé leurs environnements d'accueil de manière asymptomatique, ne laissant aucune pathologie identifiable et ne sont donc pas facilement identifiables dans les restes humains4. Les études sur l'ADN ancien se concentrent généralement sur des agents pathogènes obligatoires tels que M. leprae, Salmonella enterica et Y. pestis qui sont facilement corrélés avec des événements de mortalité pathologiquement distincts ou historiquement pertinents et, en tant que tels, sont facilement distingués comme étrangers dans les données de lecture d'ADN métagénomique humain ancien5, 6,7. Les infections opportunistes ont le fardeau supplémentaire de l'authentification en raison de leur omniprésence en tant que contaminants environnementaux et des souches commensales modernes. L'identification historique de ces pathogènes permettrait une évaluation minutieuse de leur histoire évolutive et du continuum commensal-pathogène défini par le gain et la perte de contenu génétique à mesure que les souches modulent vers ou loin de la virulence de l'hôte.

E. coli est l'un de ces agents pathogènes. Il s'agit d'une bactérie commensale commune présente dans le microbiome intestinal des vertébrés8 qui peut également devenir un agent pathogène opportuniste dans des conditions spécifiques9. E. coli a un tel impact sur nos systèmes de santé qu'il fait l'objet de plusieurs efforts de développement de vaccins pour atténuer les effets des souches les plus pathogènes10. Responsable de plusieurs épidémies d'intoxications alimentaires et devenu l'un des principaux agents pathogènes des décès dus à la résistance aux antimicrobiens, E. coli est donc une bactérie clé utilisée dans la surveillance de la santé publique11.

L'échantillonnage global des souches d'E. coli produit un arbre avec plusieurs groupes phylogénétiques uniques et des pathovars intercalés12. Alors que les relations phylogénétiques entre les souches sont construites sur la base de la similitude génétique, les pathovars sont définis par les traits de virulence de leurs membres. Dans de nombreux cas, les membres du même pathovar se regroupent dans le même clade, cependant, comme les gènes de virulence peuvent être acquis horizontalement, certains pathovars, comme E. coli entéroaggrégatif, sont répartis sur plusieurs groupes phylogénétiques12. Cette diversité frappante et les états transitoires évolutifs parmi les souches d'E. coli mettent en évidence leur plasticité génomique et leur polyvalence évolutive le long de ce continuum susmentionné. Les génomes anciens d'E. coli fourniraient des informations utiles sur les forces qui influencent l'émergence du commensalisme et de la pathogénicité chez les bactéries. Nous décrivons ici la reconstruction d'un génome d'E. coli du XVIe siècle caractérisé à partir du calcul biliaire d'un noble italien - Giovanni d'Avalos (1538-1586) - mettant en évidence un génome aux caractéristiques commensales.

En 1983, les restes momifiés de plusieurs nobles italiens ont été retrouvés à l'abbaye de Saint Domenico Maggiore à Naples, en Italie (Fig. 1 supplémentaire). Une étude paléopathologique et histologique minutieuse de l'un des individus - Giovanni d'Avalos (NASD1), un noble napolitain décédé en 1586 à l'âge de 48 ans (de plus amples informations peuvent être trouvées dans la section Notes supplémentaires des Documents supplémentaires) - a révélé parois épaissies de la vésicule biliaire, sinus de Rokitanski-Aschoff et plusieurs calculs biliaires intacts13. Ces caractéristiques suggèrent que NASD1 pourrait avoir souffert de cholécystite chronique14. Bien qu'elles ne soient pas la seule cause de cholécystite, les infections bactériennes chroniques causées par E. coli, Bacteroides spp. et Clostridium spp. peut entraîner la formation de calculs biliaires15. Ces infections sont généralement indiquées par un pigment brun, comme on peut le voir dans le calcul biliaire de NASD115 (Fig. 1a, b).

a Foie et vésicule biliaire de Giovani d'Avalos. Les calculs biliaires sont visibles dans le rectangle rouge. Notez sa coloration marron foncé. La barre d'échelle représente 1 cm b Vésicule biliaire avec une paroi épaissie (a) et des sinus de Rokitansky-Aschoff (b) (hématoxyline-éosine, 3X et 250X). La barre d'échelle pour (a) représente 2 cm et 100 μm pour (b). c Tracés des dommages des extrémités \({5}^{\prime}\) et \({3}^{\prime}\) des lectures mappées pour E. coli. Les couleurs se réfèrent au résumé, pas au type de dommage. Mapdamage 2.052 a été utilisé pour calculer les taux de dégâts. d Distribution de la longueur des fragments des lectures mappées dédupliquées d'E. coli. Une échelle \({\log }_{10}\) est utilisée pour souligner les différences entre les résumés. Une longueur minimale de 30 bp était requise pour qu'une lecture soit conservée.

Les profils métagénomiques générés à partir des extraits d'ADN à l'aide de Kraken 216 ont fourni des preuves préliminaires de la présence substantielle et croissante d'entérobactéries dans les cycles de digestion 2 (couche externe), 3–4 (couche intermédiaire) et 5–6 (couche interne) du calcul biliaire tandis que indiquant son absence dans les échantillons de tissus de NASD1 (Fig. 2 supplémentaire). Les lectures d'entérobactéries sont également présentes dans le cycle de digestion 1, mais elles sont comparables à celles des blancs de réactifs (Fig. 2 supplémentaire), donc probablement un mélange d'ADN endogène et contaminant tel que Bradyrhizobium. L'indication au niveau de l'espèce a suggéré qu'E. coli constituait la plus grande proportion de lectures identifiées comme des entérobactéries. Heureusement, les lectures spécifiques à E. coli sont pratiquement absentes (≤ 0,002 %) des blancs et présentes dans les deuxième à sixième digestions. En comparaison, d'autres taxons tels que Alcaligenes et Bradyrhizobium étaient présents à la fois dans les échantillons expérimentaux et les blancs et sont susceptibles d'être des contaminants. Des lectures humaines attribuées étaient présentes dans tous les résumés, mais ont également été détectées dans les blancs. Klebsiella aerogenes a également été détecté, mais uniquement dans les cycles de digestion 3–4. Pour évaluer l'authenticité des lectures humaines, E. coli et K. aerogenes, nous avons examiné la cinétique de désamination et de dépurination (Fig. 1c, d et Fig. 3 supplémentaire).

L'ancien génome reconstruit d'E. . coli pan-genome dataset et une taille totale estimée de 4050, 429bp lorsque les gènes détectés sont concaténés. Des différences significatives (test t bilatéral, P = 7,951 × 10−05) ont été détectées lors de la comparaison des profondeurs de lecture du noyau (3122 gènes, 28,73[28,61, 28,86] ×) et accessoire (1324gènes, 27,82[27,39, 28,26] ×) génomes (Fig. 2a et Tableau 1) ; il en était de même pour leur hétérozygotie moyenne avec le noyau à 2,74 × 10−4 [2,34 × 10−4, 3,15 × 10−4] et le génome accessoire à 1,92 × 10−3 [1,61 × 10−3, 2,24 × 10− 3] (Fig. 4 supplémentaire). Quatre-vingt-trois gènes ont été identifiés comme ayant une couverture de gènes substantiellement (au moins deux écarts-types) plus profonde. Ces résultats ont ensuite été comparés aux génomes étroitement apparentés du phylogroupe A E. coli de FSIS11816402, une souche de type de séquence (ST) 4995, et de K-12 MG1655, une souche ST10 (Fig. 2b et Fig. 5 supplémentaire). Les deux comparaisons de génomes ont donné une profondeur moyenne inférieure avec une plus grande variance de couverture. Cela est particulièrement vrai pour FSIS11816402, car 25,24 % de ses contigs avaient une couverture moyenne inférieure à 1 × (Fig. 6 supplémentaire).

a Distribution des couvertures génétiques moyennes avec un CV ≤ 1 pour le génome ancien. La ligne pointillée indique le seuil de détection à 10×. Le rectangle noir à droite indique la zone où se trouvent les gènes avec un nombre de copies élevé (tel que défini par \(\bar{x}+2* s\)). b Tracé de couverture pour FSIS11816402. Une fenêtre de 1 % a été utilisée à des fins d'illustration. c Tracé de couverture pour CP019906.1. Une fenêtre de 0,1 % a été utilisée à des fins d'illustration. La première piste indique la couverture avec la ligne rouge illustrant la moyenne globale. La deuxième piste indique le nombre de SNP sur la même fenêtre tandis que la troisième est le contenu GC. d Couverture génique du T6SS chez K. aerogenes en utilisant une fenêtre de 100 pb. Les noms de gènes sont inclus lorsqu'ils sont disponibles.

Nous avons identifié deux plasmides potentiels dans les échafaudages assemblés avec MOB-suite17 : E. coli MDR_56 plasmide sans nom 5 (CP019906.1) et S. flexneri 1a souche 0228 plasmides (CP012732.1). Les cartographies ultérieures des lectures d'E. coli sur ces plasmides de référence ont confirmé leur présence dans l'ancienne souche et authentifié leur origine (Fig. 2c et Fig. 5, 7 supplémentaires). Un plasmide, CP019906.1 avait une couverture de lecture similaire à celle de K-12 (20,95[20,80, 21,10] ×) et 34 gènes, alors que CP012732.1 avait une couverture inférieure (16,46[16,28, 16,64] ×) et seulement 19 gènes. Ces plasmides contiennent des régions sans couverture de lecture, y compris une région d'environ 6,6 Kpb dans CP012732.1, mais nous n'avons pas pu confirmer si les gènes faisaient partie du chromosome.

Un sous-ensemble des lectures séquencées a également été classé comme appartenant à K. aerogenes par Kraken 216. Pour confirmer ou réfuter ce résultat, des lectures non cartographiées ont été alignées sur le génome de référence de K. aerogenes (NC_015663.1). La profondeur de lecture globale (0, 38 [0, 37, 0, 38] ×) et la couverture du génome étaient faibles (3, 43%), suggérant que seul un sous-ensemble de gènes de K. aeorgenes était présent. Cependant, une section de 38 Kbp du génome (Fig. 2d) avait une profondeur de cartographie de lecture similaire aux anciens résultats d'E. coli (20,36 [20,23, 20,50] ×).

Afin de placer l'ancien E. coli dans la phylogénie globale et d'aider à identifier la souche, nous avons produit un alignement SNP de base de 451 E. coli et quatre génomes de Shigella représentant l'étendue actuelle de la diversité d'E. coli. Après suppression de la redondance, la phylogénie résultante contenait 107 génomes. Cet ensemble d'échantillons élagués a ensuite été utilisé pour créer un nouvel alignement de 5007 SNP de base qui a renvoyé une topologie globale ressemblant aux résultats publiés précédemment et a placé l'ancienne souche dans une phylogénie fortement soutenue au sein du phylogroupe A (Fig. 3a).

a La phylogénie globale avec des valeurs bootstrap et des groupes phylogénétiques avec E. coli EC42405 comme groupe externe. b Phylogénie du sous-groupe réduit A0 tel que défini par le génotype Clermont (+ - - -)61. Les pointes représentent le type de séquence de la souche. IAI1 était le groupe externe de la phylogénie. c Phylogénie des souches ST4995. Les rectangles rouges représentent l'intervalle de confiance à 95 % pour la topologie ; les étiquettes indiquent la date médiane de divergence. Le taux d'évolution de la phylogénie était de 2,555 × 10−6[1,567 × 10−6, 3,992 × 10−6] sous/site/an. CFSAN051544 était le groupe externe. Les flèches brunes indiquent la position de l'ancien génome.

Pour affiner plus soigneusement la position de l'ancienne souche au sein du groupe A, nous avons généré un arbre ML réduit en utilisant 94 génomes (Fig. 3b) composés de 291 SNP. L'ancien génome était étroitement regroupé avec les souches ST4995 avec un certain support statistique (support bootstrap de 65%), ce qui signifie qu'il fait probablement partie du même type de séquence (tableau 2). Un arbre ML encore plus raffiné a ensuite été généré à l'aide des 22 génomes ST4995 disponibles d'Enterobase18 (Fig. 3c). L'alignement SNP central contenait 16 026 nucléotides, offrant une résolution bien supérieure à celle des alignements global et du sous-groupe A0. L'ancienne souche se regroupe clairement dans les génomes ST4995.

Nous avons recherché des signaux temporels dans toutes les phylogénies à l'aide de TEMPest19 et en avons trouvé un lorsque la phylogénie était limitée aux génomes ST4995 (Fig. 8 supplémentaire), un résultat a confirmé un test de randomisation de date dans le LSD (P = 0,003). La phylogénie ST4995 (Fig. 3c) suggère un tMCRA du 11ème siècle (1027[787, 1220]CE) pour les souches ST4995, près de 500 ans avant la diversification des souches modernes. Le taux d'évolution estimé à travers la phylogénie était de 2,555 × 10−6[1,567 × 10−6, 3,992 × 10−6] sous/site/an, similaire aux résultats publiés précédemment20.

La séquence multilocus et le typage de notre ancien génome d'E. coli ont confirmé son placement dans le ST4995, un type de séquence rare avec seulement 22 souches dans la base de données Enterobase18 qui comprend 182 476 entrées18. Il présentait un Onovel15:H? sérotype, similaire à ses taxons frères (voir la section Discussion supplémentaire dans le Matériel supplémentaire pour les résultats complets). Une variante fimH différente – fimH86 – était présente dans notre souche E. coli.

La majorité (95%) des souches d'E. coli contenaient 3190 gènes principaux, dont 3122 ont été détectés dans notre génome ancien (Fig. 9 supplémentaire). L'analyse d'enrichissement des gènes de base manquants a révélé un manque significatif de gènes d'assemblage flagellaire (P = 0,0445), cependant, le réseau protéine-protéine contenait le nombre attendu d'interactions (P = 0,11). Une analyse des régions avec des lectures anciennes cartographiées dans CP019906.1 a révélé la présence de gènes impliqués dans la formation de biofilm (NP_311382.1) et une pompe à efflux multidrogues (acrD). Pour CP012732.1, en revanche, les lectures mappées sur des pseudogènes sont probablement liées aux réglementations d'osmoprotection et de transcription.

Une analyse présence/absence (P/A) du génome accessoire récapitule les résultats des résultats de phylogénie ML (Fig. 4a) et les résultats publiés précédemment21. La PCoA accessoire indique que le génome est membre du phylogroupe A et membre ancestral de ST4995. Ce dernier est confirmé par une analyse P/A d'un pan-génome ST4995 uniquement (Fig. 10 supplémentaire).

Le génome accessoire (a, c) et les gènes de virulence identifiés (b, d) ont été regroupés à l'aide d'une distance binaire. Les phylogroupes ont été identifiés à l'aide de Clermont Typing59 tandis que les pathovars ont été déterminés à l'aide des métadonnées disponibles dans la base de données Patric49. L'ancien génome est indiqué par la flèche noire. Dans les deux cas, les distances binaires ont été calculées avant de créer la PCoA.

Un total de 91 facteurs de virulence ont été identifiés dans le génome ancien, dont 37 n'ont pas été trouvés dans E. coli K-12 MG1655 (voir le tableau 3 pour les familles de gènes avec plus d'un hit). Les composants du système de sécrétion de type VI (T6SS) comprenaient la majorité de ces gènes et contenaient un nombre élevé de copies. Le T6SS - formé par la famille de gènes tss ainsi que hcp, vasK et vgrG - assure la médiation des interactions antagonistes entre les bactéries concurrentes. En plus de son rôle dans la destruction bactérienne, le T6SS est impliqué dans la signalisation interbactérienne, la formation de biofilm et la défense contre les phages22. Des parties d'un système de sécrétion de type III ont également été détectées à des niveaux beaucoup plus bas.

Nous avons également observé des compléments incomplets de gènes de virulence impliqués dans plusieurs mécanismes. Plusieurs gènes appartenant aux familles ecp et fim fimbriae ont été trouvés dans le génome ancien. S'ils sont impliqués dans la virulence9,23,24, ils peuvent également être présents dans des souches commensales. Des fimbriae connus pour être associés à la virulence tels que cfaB et csg ont également été identifiés23 mais ils ne fournissent pas suffisamment d'informations pour identifier le pathovar spécifique de l'ancienne souche9,23,24. Les principaux facteurs de virulence pour les pathovars d'E. coli tels que eae et stx pour les E. coli producteurs de toxines de Shiga (STEC), les gènes thermolabiles et thermostables pour les E. coli entérotoxinogènes (ETEC) et le système de sécrétion de type III en EPEC et EHEC étaient absents9.

En revanche, astA, un facteur de virulence clé chez E. coli entéroaggrégatif (EAEC)25, a été détecté dans le génome ancien. En combinaison avec la preuve que le T6SS est couramment trouvé dans les souches EAEC9, cela peut indiquer que l'ancienne souche faisait partie de ce pathovar. Les facteurs de virulence EAEC restants dans le pan-génome - aggA, aggR et aap - n'ont cependant pas été détectés25. L'ancien génome contient également un système complet d'entérobactine responsable de l'absorption du fer23. Le système entérobactine et le gène astA ont également été trouvés dans E. coli K-12 MG1655, indiquant une fois de plus qu'ils ne confèrent pas suffisamment de virulence par eux-mêmes.

Pour évaluer le potentiel de virulence extra-intestinale de ST4995, nous avons testé un proche parent (507 SNP centraux séparant les deux souches) de l'ancien génome, la souche de référence ATCC11229 (voir Fig. 3b et Supplémentaire Fig. 11 pour les similitudes avec la souche moderne) dans un test de septicémie de souris bien calibré où dix souris ont été inoculées avec la souche et leur mort a été enregistrée26. Aucune des souris n'a été tuée par ATCC11229, alors que toutes les souris infectées par la souche témoin positif B2 du phylogroupe CFT073 ont été tuées. Le phénotype de la souche qui a tué les souris est lié à la présence de gènes spécifiques de virulence extra-intestinale ayant un rôle majeur dans le système de capture du fer codant pour des gènes comme ceux portés par l'îlot à haute pathogénicité (HPI)27,28. Ce résultat est en accord avec l'absence de gènes typiques de virulence extra-intestinale présents dans l'ATCC11229 et la souche ancienne.

Nous avons recherché dans notre ancien génome la présence de gènes de résistance aux antimicrobiens (AMR) à l'aide du Resistance Gene Identifier29 et avons trouvé 47 gènes distincts dans l'assemblage d'échafaudage de notre ancien génome d'E. coli. Parmi ceux-ci, 35 gènes ont également été identifiés dans l'analyse P/A pan-génome globale. Huit gènes contenaient des doublons, mdtB étant le plus couramment détecté. Le sous-ensemble restant couvrait treize classes de résistance aux antimicrobiens, neuf classes étant représentées plus d'une fois (tableau 4). Des cassettes de résistance ciblant les cinq classes de médicaments les plus courantes ont été détectées dans l'ancienne souche E. coli. La majorité de ces gènes sont des pompes à efflux multidrogues, ce qui est typique d'E. coli30. Il n'y avait pas de gènes AMR inattendus présents dans notre ancien génome, les 35 étant tous trouvés dans E. coli K-12 MG1655.

L'ADN isolé de la pierre a montré des preuves claires de dommages à l'ADN. Plus précisément, les tracés de désamination pour les lectures anciennes cartographiant la référence pan-génomique d'E. coli contenaient des profils d'ADNa caractéristiques qui indiquaient des taux de désamination accrus au niveau ou à proximité des bases terminales (Fig. 1c). De plus, les tracés de la cinétique de dépurination des lectures cartographiées d'E. coli à partir de bibliothèques avec une profondeur de lecture d'E. coli suffisante (digestes 2, 3–4, 5–6) ont montré que des fragments de sections internes du calcul biliaire (mieux protégés de l'hydrolyse) étaient sur moyenne plus longue (médiane de 34 pb dans les digestions 2 à médiane de 37 pb dans les digestions 5 à 6) (Fig. 1d). Nous avons obtenu des résultats similaires pour les données de K. aerogenes dans les digestions deux à six. Fait intéressant, les lectures humaines cartographiées manquent de ces caractéristiques de signature (Fig. 3 supplémentaire). Plus important encore, cependant, ils confirment que les séquences d'E. coli et de K. aerogenes sont en effet anciennes et ne sont pas le résultat d'une contamination moderne.

Deux explications potentielles existent pour le manque de signal de désamination dans les lectures humaines cartographiées. La première est que l'échantillon contient probablement un mélange d'ADN humain ancien contaminant et, dans une moindre mesure, authentique. C'est presque certainement le cas pour la première digestion, car elle représente la couche externe du calcul biliaire, qui aurait été soumise à une contamination due à la manipulation, au stockage, à l'échantillonnage, etc. Cependant, à mesure que nous nous sommes déplacés vers des couches plus profondes du calcul biliaire, vraisemblablement mieux protégé de la contamination, l'absence d'ADN humain endogène était surprenante. Ceci est particulièrement frappant avec les distances d'édition pour les lectures humaines et E. coli à travers les différents digests (Fig. 12 supplémentaire). L'explication la plus probable est qu'il n'y a tout simplement pas assez de lectures d'ADN humain pour une analyse significative des dommages. Les calculs biliaires sont généralement formés d'une combinaison de cholestérol, de sels biliaires et de phosphatidylcholine15. De plus, dans l'environnement hautement acide de la vésicule biliaire, seules les bactéries spécialisées dans la survie à ces conditions peuvent prospérer et potentiellement former une pierre15. Étant donné que les calculs biliaires ne sont pas formés à partir de composants cellulaires humains directs, leur intérieur est probablement pratiquement dépourvu d'ADN humain, ce qui est très différent des résultats que nous avons obtenus à partir de l'ADN d'anciens abcès31.

Les résultats de la profondeur génétique de l'ancien génome d'E. coli confirment l'absence de contaminants modernes car ils font partie d'une distribution normale unimodale. La seule exception à ces statistiques de couverture sont 83 gènes avec des profondeurs moyennes sensiblement plus grandes (Données supplémentaires 2). Ces gènes sont constitués principalement de protéines hypothétiques (24,10%), d'intergrases et de transposons (19,28%) et du T6SS (13,25%). Ils contiennent également une hétérozygotie moyenne significativement (P = 5,03 × 10−11) supérieure (1,23 × 10−2[9,25 × 10−3, 1,53 × 10−2]) que le reste du génome ancien. Cependant, ces gènes à nombre de copies élevé sont principalement des gènes accessoires (96,34%), ce qui suggère - en combinaison avec la plus grande hétérozygotie et la présence de transposons - qu'ils étaient situés dans des éléments mobiles partagés entre plusieurs espèces bactériennes.

Les plasmides que nous avons détectés dans l'assemblage d'échafaudage, CP019906.1 et CP012732.1, avaient des couvertures de profondeur de gène inférieures à celles de notre chromosome reconstruit (tableau 1). La plupart des plasmides sont généralement présents en plus grand nombre de copies que les chromosomes32, cependant, ce n'était pas le cas car le chromosome ancien avait une couverture moyenne significative (P = 0 en utilisant la méthode de Tukey pour comparer les estimations de couverture entre les plasmides et le chromosome ancien) plus profonde que CP019906. 1 et CP012732.1. Une possibilité est que ces deux plasmides ne soient en fait pas présents, mais plutôt que les gènes auxquels les anciennes lectures étaient cartographiées étaient en fait situés dans l'ancien chromosome. Ceci est étayé par le fait que les profondeurs moyennes des gènes pour les plasmides se situent fermement dans la distribution de couverture du chromosome (tableau supplémentaire 2). Cela pourrait expliquer de grandes régions des plasmides dépourvues de lectures cartographiées, ainsi que l'absence de lectures cartographiées sur des régions intergéniques (voir Fig. 2c et Fig. 5B supplémentaire).

La cartographie des lectures sur le génome de K. aeorgenes pourrait représenter une situation similaire aux données plasmidiques. Fait intéressant, la région de 38 Kbp dans le chromosome de K. aerogenes qui avait une profondeur de lecture similaire mais significativement différente (P ≈ 0 en utilisant la méthode de Tukey pour comparer les estimations de couverture entre le K. aerogenes T6SS et l'ancien chromosome d'E. coli) à partir des plasmides et Le chromosome d'E. coli (20,36 ± 13,56 ×) contient le système de sécrétion de type VI (T6SS), qui est omniprésent dans les bactéries Gram-négatives et joue un rôle important dans les interactions antagonistes22. Étant donné que le T6SS est répandu parmi les bactéries, sa présence n'est pas un marqueur exclusif pour K. aerogenes. Cependant, la cartographie de lecture compétitive entre E. coli et K. aerogenes suggère que ce T6SS appartient bien à K. aerogenes plutôt qu'au système homologue chez E. coli suggérant un transfert horizontal récent, qui est étayé par une comparaison de leur GC relatif contents33 (Fig. 13 supplémentaire).

La structure de notre phylogénie globale ressemble à celles précédemment publiées34 et place le génome ancien dans le phylogroupe A avec un support significatif (100% bootstrap pour un clade de trois souches). Fait intéressant, d'autres souches historiques d'E. coli (~1800) ont également été placées dans ce phylogroupe35. Les souches qui ont été isolées d'humains vivant dans des communautés moins industrialisées et plus rurales hébergent généralement des souches appartenant au phylogroupe A8. La date médiévale tardive de notre échantillon, ainsi que son emplacement phylogénétique, permettent de confirmer son authenticité. De plus, une étude de souches d'E. coli isolées d'infections biliaires a montré qu'elles appartiennent majoritairement au groupe phylogénétique A36.

Nous avons identifié un signal temporel dans la phylogénie réduite (Fig. 3c) qui fournit un contexte supplémentaire pour l'histoire évolutive des souches ST4995. La majorité du type de séquence peut retracer leur lignée à une souche d'environ 1592 [1479, 1690] CE, cependant, la divergence de notre ancien génome et de deux autres - ESC_AA9618AA_AS et ESC_VA4573AA_AS - a un tMRCA plus profond ca. 956[689, 1172] CE. Compte tenu de la disparité des âges entre les deux clades, il est probable que ST4995 soit en fait composé d'au moins deux sous-groupes. Des preuves à l'appui de cela peuvent être vues dans un MDS de l'analyse P / A de tous les génomes ST4995 existants (Fig. 9 supplémentaire).

L'analyse P/A des gènes accessoires récapitule les résultats des phylogénies ML (Fig. 4a). La PCoA accessoire confirme que l'ancienne souche est membre du groupe phylogénétique A, tandis qu'une analyse P / A ultérieure avec un pan-génome ST4995 uniquement soutient la proposition selon laquelle le génome est membre de ST4995 (Fig. 9 supplémentaire). Le groupe phylogénétique A - le groupe dont provient ST4995 - est un clade bien décrit et est le type le plus couramment isolé des commensaux humains8. La diversité des souches d'E. coli est principalement déterminée par des facteurs socio-économiques, car les personnes vivant dans les pays industrialisés modernes sont plus susceptibles d'être porteuses de souches B2, tandis que celles des communautés moins industrialisées et rurales hébergent principalement A8. Compte tenu de la période de temps vécue par NASD1, notre ancien E. coli est membre du groupe phylogénétique A.

Aucun gène AMR acquis n'a été détecté dans l'ancien génome confirmant l'âge de la souche. Après le retrait des pompes d'efflux multidrogues de notre génome, aucun autre gène AMR n'a été trouvé par rapport à E. coli K-12 MG165530. Cette dernière est extrêmement pertinente car une forte résistance à une classe de médicaments particulière nécessite plusieurs mécanismes37. Ainsi, il est probable que seules de légères résistances à ces composés antimicrobiens étaient nécessaires30,38.

L'ancien génome identifié présentait probablement des caractéristiques commensales car il partage la plupart de ses facteurs de virulence avec E. coli K-12 MG1655. L'ancienne souche n'a pas les facteurs de virulence canoniques pour STEC et ETEC tout en manquant également les composants du système de sécrétion de type III utilisé dans EHEC. Des composants d'EAEC - astA et T6SS9 - ont été détectés, mais d'autres facteurs de virulence clés manquaient et astA a également été détecté dans K-12 MG1655. Les résultats de l'analyse P/A des gènes accessoires avec des marqueurs pathovars (Fig. 4c) et des gènes de virulence (Fig. 4d) présentent une image similaire. L'ancien génome est positionné dans un groupe relativement général contenant une variété de pathovars différents qui incluent EHEC, ETEC, ExPEC et STEC. Le modèle de septicémie chez la souris renforce encore le fait que l'ancien génome était un pathogène opportuniste car la souche proxy - ATCC 11229 - n'a infecté aucune souris. Cette information, en combinaison avec les gènes de virulence identifiés et le regroupement P/A de l'ancien E. coli suggère que l'ancien génome est un pathogène opportuniste qui a acquis une cassette de gène T6SS de K. aerogenes lors de l'expansion dans la vésicule biliaire, conformément aux travaux antérieurs montrant Klebsiella sp souvent associée à E. coli dans les infections biliaires contemporaines39.

Nous avons effectué des extractions d'ADN sur un seul calcul biliaire - qui avait été isolé des restes momifiés de NASD1 - dans les salles blanches du McMaster Ancient DNA Center (Université McMaster, Hamilton, Ontario, Canada) en utilisant des méthodologies spécifiques à l'ADN ancien. Nous avons émis l'hypothèse que les couches minéralisées successives de la pierre contiendraient de l'ADN de mieux en mieux conservé et avons ainsi soumis le calcul biliaire à six cycles successifs de déminéralisation et de digestion40. Par la suite, l'ADN a été extrait de 250 μL du surnageant provenant de chaque cycle, qui a ensuite été purifié et préparé dans des bibliothèques à double index, sélectionné en fonction de la taille pour éliminer les artefacts et séquencé sur la plate-forme Illumina HiSeq 1500 avec des lectures appariées de 90 pb41 ,42. Trois types de tissus supplémentaires provenant du même individu (vessie, intestin grêle et poumon) ont été traités et séquencés comme ci-dessus à des fins de comparaison. Les détails complets des méthodes peuvent être trouvés dans la section Méthodes supplémentaires dans le Matériel supplémentaire.

Les adaptateurs ont été identifiés via AdapterRemoval43 avec découpage et fusion effectués par leeHom44 à l'aide de son paramètre d'ADNa. Les voies de séquençage ont été regroupées le cas échéant et Kraken 216 a déterminé la composition métagénomique globale des échantillons. Cela a été fait pour caractériser le métagénome et identifier les taxons d'intérêt. Une base de données Kraken 216 standard avec quelques modifications a été utilisée - une taille de kmer de 25 pb et aucun minimiseur - pour tenir compte des plus petites longueurs de lecture des fragments d'ADNa. Les lectures ont subi une déduplication de chaîne à l'aide de prinseq45 avant l'analyse métagénomique.

Les échantillons ont ensuite été cartographiés par rapport au génome humain GRCh3846 avec BWA47 avec une distance d'édition maximale de 0,01 (-n 0,01), au plus deux ouvertures d'espace (-o 2) et un ensemencement effectivement désactivé (-l 16500)48. Une longueur minimale de 30 bp et une qualité de mappage de 30 étaient requises pour qu'une lecture soit correctement appariée. Les fragments qui n'ont pas été cartographiés avec succès ont ensuite été comparés à un pan-génome d'E. coli en utilisant les mêmes paramètres. Le pan-génome a été créé avec des génomes d'E. coli de PATRIC49 et quatre génomes de Shigella de NCBI. Plus précisément, les génomes qui ont été trouvés chez les humains, les poulets, les vaches, les chiens, les souris ou les porcs et qui ont été déterminés comme ayant une "bonne" qualité de génome (telle que définie par PATRIC) ont été sélectionnés, ce qui a donné 451 souches. Ces séquences ont été annotées avec Prokka50 en utilisant les protéines de E. coli K-12 MG1655 (NC_000913.3) obtenues auprès du NCBI comme séquences de confiance. Les annotations résultantes ont été compilées par Roary51 pour créer le pan-génome. Les paralogues n'ont pas été divisés et une identité minimale de blastP de 90 % a été utilisée comme paramètres supplémentaires. Les lectures humaines cartographiées sans succès ont également été comparées à K. aerogenes (NC_015663.1) car elle était substantiellement - abondance proportionnelle ≥ 1% - présente dans l'un des condensés tout en étant également exclue des blancs.

Les lectures humaines, E. coli et K. aerogenes cartographiées avec succès ont été dédupliquées en fonction de leurs coordonnées \({5}^{\prime}\) et \({3}^{\prime}\) avec bam-rmdup (https ://bitbucket.org/ustenzel/biohazard-tools/src/master/). Les échantillons dédupliqués ont été regroupés en fonction de leur condensé d'origine (1, 2, 3–4 ou 5–6). MapDamage 2.052 a été utilisé pour estimer la quantité de désamination sur les lectures cartographiées. Les distributions de longueur de fragment (FLD) et les inadéquations de cartographie ont également été extraites. L'hétérozygotie a été testée en appelant les polymorphismes mononucléotidiques (SNP) à l'aide de bcftools avec une ploïdie fixée à deux53 et un seuil de qualité de 100.

Après authentification, un assemblage a été créé avec l'ensemble complet de lectures cartographiées d'E. coli et de K. aerogenes (c'est-à-dire non dédupliquées) à l'aide de SPAdes 3.14.1 en mode isolement54 avec des longueurs de kmer personnalisées - 9, 19 et 29. L'assemblage résultant était un échafaudage incomplet et très fragmenté. Cela était principalement dû aux courtes longueurs médianes des fragments (35 pb) des lectures d'entrée et aux tailles de kmer requises. Néanmoins, le N50 de l'assemblage était de 939 pb avec une longueur totale de 3 917 339 pb, ce qui est sensiblement plus court que les chromosomes complets d'E. coli dans PATRIC (5, 00 [4, 96, 5, 05] Mbp). MOB-suite a été utilisé pour identifier les plasmides potentiels dans l'assemblage, cependant, l'identification finale a été effectuée par cartographie sur les plasmides de référence17.

Nous avons créé un alignement SNP en utilisant les génomes d'E. coli de PATRIC et les génomes de Shigella en utilisant Snippy (https://github.com/tseemann/snippy) avec E. coli EC42405 (CP043414.1) comme souche de référence. Les paires de bases non canoniques ont été remplacées par un N et les régions recombinantes ont été supprimées par des gubbines55. Comme l'ancien génome contenait plusieurs lacunes, l'indicateur "filter_percentage" a été augmenté à 32 % pour s'assurer que l'assemblage n'était pas exclu. Une fois les sites de recombinaison identifiés et supprimés, une phylogénie à vraisemblance maximale a été créée à l'aide de IQ-TREE 256. ModelFinder a été utilisé pour sélectionner le modèle phylogénétique approprié avec un biais de détermination57 et l'arbre a été amorcé 1000 fois. Les génomes redondants ont été retirés de la phylogénie à l'aide de Treemmer en veillant à conserver 95% de la diversité - mesurée par la longueur de la racine à la pointe -, ce qui a renvoyé 107 génomes58. Un nouvel alignement et une nouvelle phylogénie des SNP ont ensuite été créés à l'aide de ces génomes élagués. Les souches modernes ont été étiquetées en fonction des groupes phylogénétiques connus d'E. coli à l'aide de ClermonTyping59. Quatre souches d'E. coli qui ont été identifiées comme faisant partie de A ont été réétiquetées comme souches potentielles de Shigella. Cela est dû à la présence d'un gène ipaH dans deux des génomes et à leur positionnement dans la phylogénie60.

Lors de la détermination du phylogroupe de l'ancien génome, les génomes du sous-groupe A0 E. coli ont été utilisés pour positionner soigneusement l'ancienne souche au sein du même clade. Ce sous-groupe est défini par le génotype Clermont (+ - - -)61. Sept autres souches d'E. coli entérotoxinogènes obtenues auprès de von Mentzer et al. 2014 ont également été inclus dans la phylogénie62. Cette phylogénie a été créée en utilisant le même processus noté précédemment et a été enracinée en utilisant IAI1 B1 (NC_011741.1). La phylogénie des souches ST4995 a été créée avec les 22 génomes ST4995 disponibles dans Enterobase18 et enracinés à l'aide de la souche ST325 CFSAN051544 (SAMN05414627). Pour déterminer si les données contenaient une signature temporelle, des dates d'échantillonnage ou des dates de séquençage ont été attribuées à la phylogénie élaguée et une régression de la racine à la pointe (RTT) a été effectuée pour les phylogénies globales, du sous-groupe A0 et ST4995. La présence d'un signal temporel a ensuite été évaluée via un test de randomisation de date et avec TEMPest19. Une horloge moléculaire a été adaptée aux données à l'aide d'une approche de datation par les moindres carrés utilisant le LSD263,64.

La phylogénie datée ST4995 a été créée en datant les arbres bootstrap avec LSD2 (en utilisant -rl ns 1500000 comme paramètres)63. Ces arbres ont ensuite été résumés à l'aide de treeannotator65 avec la hauteur des nœuds définie par la moyenne de la distribution bootstrap. La phylogénie résultante a ensuite été utilisée pour tracer la phylogénie datée avec les intervalles de confiance de la hauteur des nœuds inclus.

Pour déterminer quels gènes étaient présents dans l'ancienne souche, nous avons converti les profondeurs de lecture de l'ancien pan-génome d'E. coli en une métrique de présence/absence de gène (P/A). Nous avons ensuite utilisé une approche conservatrice, identifiant un gène comme présent s'il avait une profondeur de séquence moyenne d'au moins 10 × avec un coefficient de variation (CV) ≤1. Un filtre CV a été utilisé pour supprimer les gènes, qui contenaient des régions substantielles de lectures empilées. Par rapport à un seuil de couverture en pourcentage, un CV est plus permissif avec des zones non cartographiées si le reste de la couverture génétique est relativement cohérent. Un seuil supplémentaire de \(\bar{x}+2* s\) a été utilisé pour identifier les gènes avec un nombre de copies élevé. Bien qu'ils fassent toujours partie de l'ancien génome, ces gènes pourraient potentiellement appartenir à des plasmides32 ou représenter une amplification génique66.

La matrice P/A pour les souches modernes a été générée par Roary51. Un génome central à 95 % des souches modernes a été identifié et les gènes manquants de notre ancienne souche ont été soumis à STRING67 pour être annotés de manière fonctionnelle à l'aide d'un réseau constitué d'interactions "à haute confiance". Les facteurs de virulence ont été identifiés à l'aide d'un ensemble organisé de gènes de virulence connus68. Des gènes aux noms ambigus (c'est-à-dire groupe_1000) ont été exécutés via blastX69 contre la base de données de protéines non redondantes RefSeq du 2019-11-29 avec une valeur E maximale de 10−5 pour déterminer les candidats. Si plusieurs occurrences ont été trouvées pour un gène, la plus petite valeur E a été sélectionnée. Les liens ont été résolus en choisissant le gène avec le bitcore le plus élevé suivi du pourcentage d'identité le plus élevé. Un pourcentage d'identité minimum de 90 % était requis pour qu'une correspondance soit conservée et que le gène ambigu soit renommé. Les descriptions des gènes précédemment ambigus ont été recherchées pour les mots-clés "sécrétion, invasion et entérotoxine". Les gènes avec des résultats de cette recherche ont été inclus avec les gènes de virulence. Pour déterminer le pathovar du génome ancien, des informations pertinentes ont été extraites des métadonnées PATRIC.

Nous avons effectué une analyse P/A sur le noyau, les génomes accessoires et les gènes de virulence. Les souches ont été transformées en une matrice de distance binaire et regroupées à l'aide d'un PCoA. Pour s'assurer que les gènes redondants n'étaient pas inclus, deux critères d'exclusion ont été créés : les gènes qui étaient présents de manière ubiquitaire ont été exclus et les gènes non présents dans au moins cinq génomes ont été retirés de l'analyse du génome accessoire. Sur les 451 génomes d'E. coli, quatre ont été retirés de l'analyse pan-génomique en raison du faible nombre de gènes (voir la Fig. 14 supplémentaire pour le nombre de gènes et les données supplémentaires 1 pour les génomes supprimés). L'identificateur de gène de résistance (RGI)29 avec les paramètres par défaut a identifié des résistances antimicrobiennes potentielles dans l'ancienne souche. Seules les entrées RGI renvoyées en raison d'homologies de gènes et présentes dans le pan-génome ont été acceptées. Les gènes de virulence et de résistance identifiés ont été comparés à l'archétype de la souche E. coli K-12 MG1655. Il est avirulent et sensible aux antibiotiques70.

Dix souris femelles OF1 de 14 à 16 g (âgées de 4 semaines) de Charles River® (L'Arbresle, France) par souche ont reçu une injection sous-cutanée de 0,2 ml de suspension bactérienne dans le cou (2 × 108 unité formant colonie) . L'heure du décès a été enregistrée au cours des 7 jours suivants. Les souris survivant plus de 7 jours ont été considérées comme guéries et sacrifiées. La souche E. coli CFT073 a été utilisée comme contrôle positif tuant toutes les souris inoculées tandis que la souche E. coli K-12 MG1655 a été utilisée comme contrôle négatif pour lequel toutes les souris inoculées survivent26. Le protocole (n∘APAFIS#4948) a été approuvé par le ministère français de la recherche et par le comité d'éthique de l'expérimentation animale. La souche ATCC11229 (AMC 198) a été obtenue à partir de la collection de l'Institut Pasteur (CIP 103795) et le génome entier a été séquencé à l'aide de la technologie Illumina pour vérifier l'identité de la souche. Cette souche est d'origine commensale et est couramment utilisée dans les tests de résistance bactérienne.

De plus amples informations sur la conception de la recherche sont disponibles dans le résumé des rapports de recherche sur la nature lié à cet article.

Les données de séquençage brutes ont été téléchargées sur NCBI en tant que PRJNA810725 avec les métadonnées de support situées dans le tableau supplémentaire 1. L'accès à l'échantillon lui-même peut être organisé en contactant GSL

Les scripts et les données supplémentaires utilisées pour analyser les données après la cartographie pan-génome sont disponibles sur https://github.com/longg2/AncientEcoli71. Les scripts utilisés pour la cartographie initiale et la création pan-génome sont disponibles sur https://github.com/longg2/LongBioinformatics/tree/vAncEcoli72.

Duchêne, S., Ho, SY, Carmichael, AG, Holmes, EC & Poinar, H. La récupération, l'interprétation et l'utilisation des génomes pathogènes anciens. Courant. Biol. 30, R1215–R1231 (2020).

Article PubMed PubMed Central CAS Google Scholar

Parkins, MD, Somayaji, R. & Waters, VJ Épidémiologie, biologie et impact des infections clonales à Pseudomonas aeruginosa dans la mucoviscidose. Clin. Microbiol. Rév. 31, e00019-18 (2018).

Achermann, Y., Goldstein, EJ, Coenye, T. & Shirtliff, ME Propionibacterium acnes : du commensal au pathogène d'implant opportuniste associé au biofilm. Clin. Microbiol. Rév. 27, 419–440 (2014).

Article PubMed PubMed Central Google Scholar

Bois, JW et al. Le paradoxe ostéologique: problèmes d'inférence de la santé préhistorique à partir d'échantillons squelettiques. Courant. Anthropol. 33, 343–370 (1992).

Article Google Scholar

Krause-Kyora, B. et al. Une ancienne étude de l'ADN révèle un locus de susceptibilité HLA à la lèpre chez les Européens médiévaux. Nat. Commun. 9, 1–11 (2018).

Article CAS Google Scholar

Wu, X. et al. Une lignée basale de S. enterica vieille de 3 000 ans de l'âge du bronze du Xinjiang suggère qu'elle s'est répandue le long de la Proto-Route de la soie. PLoS Pathog. 17, e1009886 (2021).

Article CAS PubMed PubMed Central Google Scholar

Wagner, DM et al. Yersinia pestis et la peste de Justinien 541-543 après JC : une analyse génomique. Lancette infectée. Dis. 14, 319-326 (2014).

Article PubMed Google Scholar

Tenaillon, O., Skurnik, D., Picard, B. & Denamur, E. La génétique des populations d'Escherichia coli commensal. Nat. Rév. Microbiol. 8, 207-217 (2010).

Article CAS PubMed Google Scholar

Croxen, MA & Finlay, BB Mécanismes moléculaires de la pathogénicité d'Escherichia coli. Nat. Rév. Microbiol. 8, 26–38 (2010).

Article CAS PubMed Google Scholar

Rojas-Lopez, M., Monterio, R., Pizza, M., Desvaux, M. & Rosini, R. Escherichia coli pathogène intestinal : perspectives pour le développement de vaccins. Devant. Microbiol. 9, 440 (2018).

Article PubMed PubMed Central Google Scholar

Murray, CJ et al. Fardeau mondial de la résistance bactérienne aux antimicrobiens en 2019 : une analyse systématique. Lancette 399, 629–655 (2022).

Denamur, E., Clermont, O., Bonacorsi, S. & Gordon, D. La génétique des populations d'Escherichia coli pathogènes. Nat. Rév. Microbiol. 19, 37–54 (2021).

Article CAS PubMed Google Scholar

Fornaciari, G., Pollina, L., Tornaboni, D. & Tognetti, A. Pathologies pulmonaires et hépatiques dans la série des momies de s. domenico maggiore à naples (xvi siècle). Dans Proc. VII Rencontre européenne de l'Association de paléopathologie (Lyon, septembre 1988) 89–92. Marino Solfanelli Editore (Journal of Paleopathology, Monographic Publications, 1989).

Knab, LM, Boller, A.-M. & Mahvi, DM Cholécystite. Surg. Clin. Amérique du Nord. Rév. 94, 455–470 (2014).

Article PubMed Google Scholar

Venneman, NG & van Erpecum, KJ Pathogenèse des calculs biliaires. Gastro-entérologue. Clin. Amérique du Nord. 39, 171-183 (2010).

Article Google Scholar

Wood, DE, Lu, J. & Langmead, B. Analyse métagénomique améliorée avec Kraken 2. Genome Biol. 20, 257 (2019).

Article CAS PubMed PubMed Central Google Scholar

Robertson, J. & Nash, JH MOB-suite : outils logiciels pour le regroupement, la reconstruction et le typage de plasmides à partir d'assemblages préliminaires. Microb. Génome. 4, e000206 (2018).

Zhou, Z. et al. Le guide de l'utilisateur d'EnteroBase, avec des études de cas sur les transmissions de Salmonella, la phylogénie de Yersinia pestis et la diversité génomique centrale d'Escherichia. Génome Res. 30, 138-152 (2020).

Article CAS PubMed PubMed Central Google Scholar

Rambaut, A., Lam, TT, Carvalho, LM & Pybus, OG Pybus Exploration de la structure temporelle de séquences hétérochrones à l'aide de TempEst (anciennement Path-O-Gen). Virus Évol. 2, vew007 (2016).

Lee, H., Popodi, E., Tang, H. & Foster, PL Taux et spectre moléculaire des mutations spontanées dans la bactérie Escherichia coli, déterminés par séquençage du génome entier. Proc. Natl Acad. Sci. 109, E2774–E2783 (2012).

Article CAS PubMed PubMed Central Google Scholar

Touchon, M. et al. Le contexte phylogénétique et l'habitat sont à l'origine de la diversification génétique d'Escherichia coli. PLoS Genet. 16, e1008866 (2020).

Article CAS PubMed PubMed Central Google Scholar

Russell, AB, Peterson, SB & Mougous, JD Effecteurs du système de sécrétion de type VI : poisons avec un but. Nat. Rév. Microbiol. 12, 137-148 (2014).

Article CAS PubMed PubMed Central Google Scholar

Liu, B., Zheng, D., Jin, Q., Chen, L. & Yang, J. VFDB 2019 : une plateforme pathogénique comparative avec une interface web interactive. Nucleic Acids Res. 47, D687–D692 (2019).

Article CAS PubMed Google Scholar

Morales-Espinosa, R. et al. Caractérisation des souches UPEC isolées chez des patients mexicains souffrant d'infections urinaires récurrentes. J. Infecter. Dév. Cessais. 10, 317-328 (2016).

Article CAS PubMed Google Scholar

Aslani, MM, Alikhani, MY, Zavari, A., Yousefi, R. & Zamani, AR Caractérisation des isolats cliniques d'Escherichia coli entéroaggrégatif (EAEC) et leur profil de résistance aux antibiotiques. Int. J. Infecter. Dis. 15, e136–e139 (2011).

Article CAS PubMed Google Scholar

Johnson, JR et al. Létalité expérimentale chez la souris des isolats d'Escherichia coli, en relation avec les traits accessoires, le groupe phylogénétique et la source écologique. J. Infecter. Dis. 194, 1141–1150 (2006).

Article CAS PubMed Google Scholar

Johnson, JR et al. Les traits accessoires et le contexte phylogénétique prédisent mieux la virulence extra-intestinale d'Escherichia coli que la source écologique. J. Infecter. Dis. 219, 121-132 (2019).

CAS PubMed Google Scholar

Galardini, M. et al. Rôle majeur des systèmes de captation du fer dans la virulence extra-intestinale intrinsèque du genre Escherichia révélé par une étude d'association à l'échelle du génome. PLoS Genet. 16, e1009065 (2020).

Article CAS PubMed PubMed Central Google Scholar

Alcock, BP et al. CARD 2020 : surveillance de la résistance aux antibiotiques avec la base de données complète sur la résistance aux antibiotiques. Nucleic Acids Res. 48, D517–D525 (2020).

CAS PubMed Google Scholar

Goldstone, RJ & Smith, DG Une approche de génomique des populations pour exploiter le « résistome » accessoire d'Escherichia coli. Microb. Génome. 3, e000108 (2017).

Devault, AM et al. Un portrait moléculaire de la septicémie maternelle de troie byzantine. eLife 6, e20983 (2017).

Article PubMed PubMed Central Google Scholar

Friehs, K. Nombre de copies du plasmide et stabilité du plasmide. Adv. Bioch. Ing. Biotechnol. 86, 47–82 (2004).

Daubin, V., Lerat, E. & Perrière, G. La source des gènes transférés latéralement dans les génomes bactériens. Génome Biol. 4, 1–12 (2003).

Article Google Scholar

Chaudhuri, RR & Henderson, IR L'évolution de la phylogénie d'Escherichia coli. Infecter. Genet. Évol. 12, 214-226 (2012).

Article PubMed Google Scholar

Desroches, M. et al. L'odyssée de la souche ancestrale Escherich à travers les collections de cultures : un exemple de diversification allopatrique. mSphere 3, e00553-17 (2018).

Wang, M.-C. et coll. Différents rôles des facteurs hôtes et bactériens dans les infections extra-intestinales à Escherichia coli. Clin. Microbiol. Infecter. 15, 372–379 (2009).

Article PubMed Google Scholar

Benveniste, R. & Davies, J. Mécanismes de résistance aux antibiotiques chez les bactéries. Ann. Rév. Biochem. 42, 471-506 (1973).

Article CAS PubMed Google Scholar

Piddock, LJ Pompes à efflux à résistance multiple? pas seulement pour la résistance. Nat. Rév. Microbiol. 4, 629–636 (2006).

Article CAS PubMed Google Scholar

Brook, I. Microbiologie aérobie et anaérobie des maladies des voies biliaires. J.Clin. Microbiol. 27, 2373-2375 (1989).

Article CAS PubMed PubMed Central Google Scholar

Schwarz, C. et al. Nouvelles connaissances à partir de vieux os : préservation et dégradation de l'ADN dans les restes de mammouth préservés dans le pergélisol. Nucleic Acids Res. 37, 3215–3229 (2009).

Article CAS PubMed PubMed Central Google Scholar

Dabney, J. et al. Séquence complète du génome mitochondrial d'un ours des cavernes du Pléistocène moyen reconstruite à partir de fragments d'ADN ultracourts. Proc. Natl Acad Sci. États-Unis 110, 15758–15763 (2013).

Glocke, I. & Meyer, M. Extension du spectre des séquences d'ADN extraites d'os et de dents anciens. Génome Res. 27, 1230-1237 (2017).

Schubert, M., Lindgreen, S. & Orlando, L. AdapterRemoval v2 : découpage rapide de l'adaptateur, identification et fusion de lecture. BMC Rés. Notes 9, 88 (2016).

Article PubMed PubMed Central Google Scholar

Renaud, G., Stenzel, U. & Kelso, J. leeHom : découpage et fusion d'adaptateurs pour les lectures de séquençage Illumina. Nucleic Acids Res. 42, e141–e141 (2014).

Article PubMed PubMed Central CAS Google Scholar

Schmieder, R. & Edwards, R. Contrôle de la qualité et prétraitement des ensembles de données métagénomiques. Bioinformatique 27, 863–864 (2011).

Article CAS PubMed PubMed Central Google Scholar

Schneider, VA et al. L'évaluation des assemblages de génomes haploïdes GRCh38 et de novo démontre la qualité durable de l'assemblage de référence. Génome Res. 27, 849–864 (2017).

Article CAS PubMed PubMed Central Google Scholar

Li, H. & Durbin, R. Alignement de lecture rapide et précis avec la transformée de Burrows-Wheeler. Bioinformatique 25, 1754–1760 (2009).

Article CAS PubMed PubMed Central Google Scholar

Duggan, AT et al. Le virus de la variole du XVIIe siècle révèle l'histoire récente de la variole. Courant. Biol. 26, 3407–3412 (2016).

Article CAS PubMed PubMed Central Google Scholar

Wattam, AR et al. Améliorations apportées à PATRIC, la base de données bioinformatique entièrement bactérienne et le centre de ressources d'analyse. Nucleic Acids Res. 45, D535–D542 (2016).

Article PubMed PubMed Central CAS Google Scholar

Seemann, T. Prokka : annotation rapide du génome procaryote. Bioinformatique 30, 2068-2069 (2014).

Article CAS PubMed Google Scholar

Page, AJ et al. Roary : analyse rapide à grande échelle du pan génome procaryote. Bioinformatique 31, 3691–3693 (2015).

Article CAS PubMed PubMed Central Google Scholar

Jónsson, H., Ginolhac, A., Schubert, M., Johnson, PL et Orlando, L. mapDamage2.0 : estimations bayésiennes approximatives rapides des anciens paramètres de dommages à l'ADN. Bioinformatique 29, 1682–1684 (2013).

Article PubMed PubMed Central CAS Google Scholar

Seguin-Orlando, A. et al. Aucune caractéristique génomique particulière ne sous-tend les conséquences économiques dramatiques des épidémies de peste du XVIIe siècle en Italie. iScience 24, 102383 (2021).

Article CAS PubMed PubMed Central Google Scholar

Nurk, S. et al. Assemblage de génomes et de mini-métagénomes à partir de lectures hautement chimériques. Dans la conférence internationale annuelle sur la recherche en biologie moléculaire computationnelle (Springer, 2013).

Croucher, NJ et al. Analyse phylogénétique rapide de grands échantillons de séquences de génomes entiers bactériens recombinants à l'aide de gubbines. Nucleic Acids Res. 43, e15–e15 (2015).

Article PubMed CAS Google Scholar

Minh, BQ et al. IQ-TREE 2 : nouveaux modèles et méthodes efficaces d'inférence phylogénétique à l'ère génomique. Mol. Biol. Évol. 37, 1530-1534 (2020).

Article CAS PubMed PubMed Central Google Scholar

Kalyaanamoorthy, S., Minh, BQ, Wong, TK, Von Haeseler, A. & Jermiin, LS Modelfinder : sélection rapide de modèles pour des estimations phylogénétiques précises. Nat. Méthodes 14, 587–589 (2017).

Article CAS PubMed PubMed Central Google Scholar

Ménardo, F. et al. Treemmer : un outil pour réduire de grands ensembles de données phylogénétiques avec une perte minimale de diversité. BMC Bioinformatics 19, 1–8 (2018).

Article Google Scholar

Beghain, J., Bridier-Nahmias, A., Le Nagard, H., Denamur, E. & Clermont, O. Clermontyping : une méthode in silico facile à utiliser et précise pour le phylotypage des souches du genre Escherichia. Microb. Génome. 4, e000192 (2018).

Hazen, TH et al. Étudier la parenté d'Escherichia coli entéro-invasif avec d'autres isolats d'E. coli et de Shigella en utilisant la génomique comparative. Infecter. Immun. 84, 2362-2371 (2016).

Clermont, O., Christenson, JK, Denamur, E. & Gordon, DM La méthode de phylotypage de Clermont Escherichia coli revisitée : amélioration de la spécificité et détection de nouveaux phylo-groupes. Environ. Microbiol. Rep. 5, 58–65 (2013).

Article CAS PubMed Google Scholar

von Mentzer, A. et al. Identification des clades Escherichia coli entérotoxinogènes (ETEC) avec une distribution mondiale à long terme. Nat. Genet. 46, 1321 (2014).

Article CAS Google Scholar

To, T.-H., Jung, M., Lycett, S. & Gascuel, O. Datation rapide utilisant des critères et des algorithmes des moindres carrés. Syst. Biol. 65, 82–97 (2016).

Article CAS PubMed Google Scholar

Duchene, S. et al. Inférer des paramètres démographiques dans les données génomiques bactériennes à l'aide de méthodes bayésiennes et phylogénétiques hybrides. BMC Évol. Biol. 18, 1–11 (2018).

Article Google Scholar

Suchard, MA et al. Intégration de données phylogénétiques et phylodynamiques bayésiennes à l'aide de BEAST 1.10. Virus Évol. 4, vey016 (2018).

Article PubMed PubMed Central Google Scholar

Riehle, MM, Bennett, AF & Long, AD Architecture génétique de l'adaptation thermique chez Escherichia coli. Proc. Natl Acad. Sci. États-Unis 98, 525–530 (2001).

Article CAS PubMed PubMed Central Google Scholar

Szklarczyk, D. et al. STRING v11 : réseaux d'association protéine-protéine avec une couverture accrue, soutenant la découverte fonctionnelle dans des ensembles de données expérimentaux à l'échelle du génome. Nucleic Acids Res. 47, D607–D613 (2019).

Article CAS PubMed Google Scholar

de Lastours, V. et al. Mortalité dans les bactériémies à Escherichia coli : la résistance aux antibiotiques ne passe toujours pas. J. Antimicrobe. Chimimère. 75, 2334-2343 (2020).

Article PubMed CAS Google Scholar

Camacho, C. et al. BLAST+ : architecture et applications. BMC Bioinformatique 10, 421 (2009).

Article PubMed PubMed Central CAS Google Scholar

Touchon, M. et al. La dynamique organisée du génome chez l'espèce Escherichia coli se traduit par des voies adaptatives très diverses. PLoS Genet. 5, e1000344 (2009).

Article PubMed PubMed Central CAS Google Scholar

longg2. longg2/AncientEcoli : version publiée. Zenodo https://doi.org/10.5281/zenodo.6403348 (2022).

longg2. longg2/LongBioinformatics : ancienne version Ecoli. Zenodo https://doi.org/10.5281/zenodo.6403351 (2022).

Télécharger les références

Nous tenons à remercier Wael Elhenawy et Brian Coombes pour leur correspondance ainsi que Sara Dion pour son assistance technique avec le modèle de souris. Le financement de ce travail a été soutenu par une subvention Savoir du CRSH, un financement de recherche du programme sur les humains et le microbiome de l'ICRA et le Fonds de la famille Boris à HP ainsi que la subvention du CRSNG RGPIN-2020-05733 attribuée à GBG Ce travail a également été partiellement soutenu par le "Fondation pour la Recherche Médicale" Equipe FRM 2016, numéro de subvention DEQ20161136698 à ED

Ces auteurs ont contribué à parts égales : George S. Long, Jennifer Klunk.

Département de biologie, Université McMaster, Hamilton, Canada

George S. Long, Jennifer Klunk et G. Brian Golding

McMaster Ancient DNA Centre, Départements d'anthropologie et de biochimie, Université McMaster, Hamilton, Canada

George S. Long, Jennifer Klunk, Ana T. Duggan, Madeline Tapson et Hendrik Poinar

Daicel Arbor Biosciences, 5840 Interface Drive, Suite 101, Ann Arbor, MI, 48103, États-Unis

Jennifer Klunk et Madeline Tapson

Département d'anthropologie, Université McMaster, Hamilton, ON, Canada

Ana T. Duggan

Division de paléopathologie, Département de recherche translationnelle et nouvelles technologies en médecine et chirurgie, Université de Pise, Via Roma 57, 56126, Pise, Italie

Valentina Giuffra

Département des sciences humaines (DISUM), Université de Catane, Piazza Dante 32, 95124, Catane, Italie

Lavinia Gazze

Département des civilisations et des formes de connaissance, Université de Pise, Via Trieste 40, 56126, Pise, Italie

Antonio Fornaciari & Gino Fornaciari

Département de microbiologie et d'immunologie, Peter Doherty Institute for Infection and Immunity, Université de Melbourne, Melbourne, VIC, Australie

Sébastien Duchêne

Université Paris Cité, IAME, UMR 1137, INSERM, 75018, Paris, France

Olivier Clermont & Erick Denamur

Laboratoire de Génétique Moléculaire, Hôpital Bichat, APHP, 75018, Paris, France

Eric Denamur

Michael G. DeGroote Institute for Infectious Disease Research et CIFAR Humans and the Microbiome Program, Toronto, ON, Canada

Hendrik Poinar

Programme sur les humains et le microbiome du CIFAR, Toronto, ON, Canada

Hendrik Poinar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

GSL et JK étaient responsables de l'enquête, de la méthodologie, de l'analyse formelle et de l'ébauche originale de cette étude. GSL a également effectué la curation des données. MT, ATD, VG, LG et AF ont participé à l'enquête. ATD a également contribué à la méthodologie. GF a fourni l'échantillon. ED et OC ont validé la fonction d'E. coli et les résultats de typage. ED a également financé le test de septicémie chez la souris. SD a validé le signal temporel et l'a aidé dans son enquête. GBG a supervisé et fourni les ressources informatiques et le financement. HP a conçu et administré le projet, fourni le financement et également supervisé. Tous les auteurs ont approuvé le manuscrit final.

Correspondance à George S. Long, Erick Denamur ou Hendrik Poinar.

Les auteurs ne déclarent aucun intérêt concurrent.

Communications Biology remercie les relecteurs anonymes pour leur contribution à la relecture par les pairs de ce travail. Rédacteur en chef de la gestion principale : Luke R. Grinham. Les rapports des pairs examinateurs sont disponibles.

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Long, GS, Klunk, J., Duggan, AT et al. Un brouillon de génome d'Escherichia coli du XVIe siècle associé à une infection opportuniste de la bile. Commun Biol 5, 599 (2022). https://doi.org/10.1038/s42003-022-03527-1

Télécharger la citation

Reçu : 01 mars 2022

Accepté : 23 mai 2022

Publié: 16 juin 2022

DOI : https://doi.org/10.1038/s42003-022-03527-1

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.