banner
Maison / Nouvelles / Structure de l'OMEGA nickase IsrB en complexe avec ωARN et ADN cible
Nouvelles

Structure de l'OMEGA nickase IsrB en complexe avec ωARN et ADN cible

May 06, 2023May 06, 2023

Nature volume 610, pages 575–581 (2022)Citer cet article

17 000 accès

2 Citations

107 Altmétrique

Détails des métriques

Les systèmes guidés par ARN, tels que CRISPR-Cas, combinent la reconnaissance programmable du substrat avec la fonction enzymatique, une combinaison qui a été utilisée avantageusement pour développer de puissantes technologies moléculaires1,2. Des études structurelles de ces systèmes ont mis en lumière la façon dont l'ARN et la protéine reconnaissent et clivent conjointement leurs substrats, guidant l'ingénierie rationnelle pour le développement technologique ultérieur3. Des travaux récents ont identifié une nouvelle classe de systèmes guidés par l'ARN, appelée OMEGA, qui comprend IscB, l'ancêtre probable de Cas9, et la nickase IsrB, un homologue d'IscB dépourvu du domaine de la nucléase HNH4. IsrB ne comprend qu'environ 350 acides aminés, mais sa petite taille est contrebalancée par un guide d'ARN relativement grand (environ 300 nt d'ωARN). Nous rapportons ici la structure cryogénique-microscopie électronique de Desulfovirgula thermocuniculi IsrB (DtIsrB) en complexe avec son ωARN apparenté et un ADN cible. Nous constatons que la structure globale de la protéine IsrB partage un échafaudage commun avec Cas9. Contrairement à Cas9, cependant, qui utilise un lobe de reconnaissance (REC) pour faciliter la sélection de la cible, IsrB s'appuie sur son ωARN, dont une partie forme une structure ternaire complexe positionnée de manière analogue à REC. Les analyses structurelles d'IsrB et de son ωARN ainsi que des comparaisons avec d'autres systèmes guidés par l'ARN mettent en évidence l'interaction fonctionnelle entre la protéine et l'ARN, faisant progresser notre compréhension de la biologie et de l'évolution de ces divers systèmes.

La protéine IsrB guidée par l'ARN est un membre de la famille OMEGA codé dans la superfamille des transposons IS200/IS605. IsrB est l'antécédent probable d'IscB, un autre membre de la famille OMEGA qui est l'ancêtre apparent de Cas9, comme indiqué à la fois par l'analyse phylogénétique et par l'architecture de domaine unique partagée4,5. Comme IscB et Cas9, IsrB contient un domaine de nucléase de type RuvC qui est interrompu par l'insertion d'une hélice en pont (BH) (Fig. 1a). Cependant, contrairement à IscB et Cas9, IsrB n'a pas le domaine de la nucléase HNH, le lobe REC et de grandes parties du domaine d'interaction avec le motif adjacent au protospacer (PAM-) et, par conséquent, est beaucoup plus petit (à environ 350 acides aminés) que Cas9. . IsrB contient en outre un domaine PLMP N-terminal (nommé d'après son motif d'acides aminés conservé) et un domaine C-terminal non caractérisé (Fig. 1b). Des travaux antérieurs ont montré qu'IsrB s'associe à un ωARN d'environ 300 nt, qui guide IsrB pour entailler le brin non cible d'ADN double brin (ds) contenant un motif adjacent à la cible 5′-NTGA-3′ (TAM)4 .

a, Architecture du locus et ARN guides pour IsrB (à gauche) et Cas9 (à droite). b, Architecture de domaine de Streptococcus pyogenes SpCas9 (haut) et D. thermocuniculi IsrB (DtIsrB) (bas). c, Schéma d'IsrB en complexe avec l'ωARN et l'ADN cible. Le duplex partiel d'ADN contenant le TAM et les séquences cibles utilisées pour l'étude structurale sont représentés par des lettres de séquence. d, e, carte de densité Cryo-EM (d) et modèle structurel (e) du complexe IsrB – ωARN-ADN cible. Les lignes pointillées représentent les régions mal résolues de l'ωARN. TE, fin transposon ; DR, répétition directe ; NUC, nucléase; PI, interaction avec PAM ; PLL, boucle à verrouillage phosphate ; TI, TAM en interaction ; TS, brin cible ; NTS, brin non cible.

Pour caractériser le mécanisme moléculaire du ciblage d'ADN guidé par ωARN par IsrB, nous avons analysé un complexe ternaire comprenant Desulfovirgula thermocuniculi IsrB (DtIsrB), un ωARN de 284 nt contenant un segment guide de 20 nt, un brin d'ADN cible de 31 nt et un brin d'ADN cible de 10 nt. -nt brin d'ADN non cible à l'aide d'un cryo-EM à une seule particule (Fig. 1c). Nous avons obtenu une reconstruction tridimensionnelle (3D) du complexe ternaire avec une résolution globale de 3, 1 Å (Fig. 1d, Extended Data Fig. 1a – c et Extended Data Table 1). Certaines régions de la carte correspondant à l'ωARN ont cependant été résolues à une résolution inférieure. Pour affiner la modélisation des coordonnées de l'ARN, nous avons utilisé un outil de modélisation spécifique à l'ARN, auto-DRRAFTER, ainsi qu'un modèle de structure secondaire basé sur la covariance pour construire un modèle initial d'ARN ω. Sur la base de ce modèle ωARN et d'un modèle IsrB initial généré par prédiction de la structure des protéines, nous avons déterminé la structure IsrB – ωARN – ADN (Fig. 1e et Extended Data Figs. 1d,e et 2)6,7,8.

La structure a révélé qu'IsrB se lie largement à l'ADN cible via un duplex de 20 nt entre l'ωARN et l'ADN cible (Fig. 1e). Le domaine RuvC (résidus 60–253) englobe les trois motifs catalytiques (RuvC I–III) et trois insertions (BH (résidus 92–112), A (résidus 113–129) et B (résidus 161–179)) (Fig. 1b). L'insertion A est un lieur « raccourci » entre BH et RuvC II ; ce lieur est remplacé par le lobe REC dans Cas9. Ainsi, nous notons cette insertion le linker REC (RECL). L'insertion B, entre RuvC II et III, est un simple linker constitué d'une boucle et d'une hélice α qui dans la structure IsrB occupe une position correspondant à celle du domaine HNH dans Cas9. Ainsi, nous le désignons par le lieur HNH (HNHL). Le domaine C-terminal (résidus 287–351) adopte un pli central comprenant deux feuillets β déformés (β1/2/6 et β3/4/5) et se lie au duplex d'ADN contenant du TAM (Fig. 1e et Extended Data Fig. .3a). Nous désignons ce domaine par le domaine d'interaction TAM (TI) en raison de similitudes structurelles et fonctionnelles avec le domaine d'interaction PAM de Cas9 (Extended Data Fig. 3b). Le brin β supplémentaire (β7) interagit largement avec le pli central du domaine TI et partage une feuille β commune avec le noyau RuvC qui adopte le pli RNaseH (Extended Data Fig. 3a). Cet arrangement suggère que les domaines TI et RuvC coopèrent pour définir la distance entre le site actif RuvC et le site de liaison TAM (Fig. 1e). Les régions intermédiaires A (résidus 254–267) et B (268–286) entre les domaines RuvC et TI semblent être fonctionnellement analogues à la boucle phosphate-lock et au domaine WED de Cas9, respectivement, et nous avons donc adopté ces termes pour IsrB (Fig. 1e). Le domaine PLMP (résidus 1 à 59) comporte une feuille β antiparallèle à quatre brins (β1–4) et une hélice α, et est structurellement similaire au domaine N-terminal du facteur d'initiation de la traduction 3 (Fig. 1e et Extended Data figures 3a et 4). Dans ce domaine, le brin contenant le motif PLMP (β2) est bombé en raison de deux prolines (Pro17 et Pro20) perturbant l'une des liaisons hydrogène, mais semble conserver l'intégrité d'un brin cohérent (β1). Le domaine PLMP interagit largement avec les domaines RuvC et TI, suggérant un rôle dans la prise en charge de leurs fonctions.

L'ωARN se compose du segment guide de 20 nt, qui s'apparie avec l'ADN cible, et de l'échafaudage d'ωARN de 262 nt. Cet échafaudage se compose de 12 hélices (quatre tiges (S1–4) et huit boucles de tige (SL1–8)), qui sont situées sur trois couches (couche 1, S1/3 et SL1/2/5/6 ; couche 2, S2/4 et SL3/4 ; couche 3, SL7/8) (Fig. 2a, b). Toutes les hélices d'ARN sont regroupées par diverses interactions d'ARN. Les combinaisons S1-SL1, S2-SL3 et S3-SL6 sont directement empilées dans chaque combinaison. S4 et SL4 sont empilés coaxialement en raison de l'empilement direct entre A152 et U154 et de la formation de base triple entre A152, U179 et U183. SL2 et SL5 forment un pseudonœud (que nous appelons le pseudonœud adaptateur), qui est coiffé par un triplet de base formé par G81, A192 et U197 (Fig. 2c). Certaines hélices d'ARN relient des couches au sein de la structure globulaire de l'ARN ω. S2, C107, A108, G245 et A246 forment la région du nexus, qui est largement conservée dans le tracrRNA de Cas9s (réf. 9) (Fig. 2a). Cette région de nexus et S4 sont directement connectées à S1 et SL5, respectivement, entre les couches 1 et 2. SL4 forme un pseudonœud (que nous désignons comme le pseudonœud de nexus) avec la région entre S2 et SL7, permettant des interactions entre les couches 2 et 3 ( Figures 2a,b). Les mutations perturbant les paires de bases dans les pseudonœuds ont aboli l'activité de coupure de l'ADN, et les mutations ultérieures restaurant les paires de bases dans le pseudonœud adaptateur ont partiellement restauré cette activité, soulignant l'importance des pseudonœuds pour la fonction ωARN (Fig. 2d). Ces données structurales et biochimiques montrent que l'ωARN forme une structure globulaire compacte obtenue par diverses interactions d'ARN. Une telle structure peut être bénéfique pour les systèmes OMEGA : si l'ωARN forme de manière autonome sa structure globulaire et fonctionne comme un échafaudage (contrairement au tracrARN), la protéine effectrice n'a pas besoin de motifs/domaines auxiliaires pour soutenir le repliement et la fonction de l'ARN. De plus, si la forme globulaire offre une certaine résistance à la dégradation endogène de l'ARN, elle pourrait faciliter le fonctionnement de l'ωARN en trans avec une protéine effectrice. Cette dernière possibilité est étayée par la découverte d'ARN ω autonomes qui peuvent fonctionner avec l'effecteur OMEGA associé IscB4.

a, b, Schéma ( a ) et modèle structurel ( b ) de l'échafaudage ωARN (résidus 21 à 282). S1–4, tige 1–4 ; SL1–8, boucle de tige 1–8 ; PK, pseudo-nœud. En a, les paires de bases canoniques et non canoniques sont représentées par des lignes noires pleines. Les régions mal résolues sont entourées d'une boîte en pointillés. En b, le segment de guidage est omis pour plus de clarté. c, Une formation de base triple dans le pseudonœud de l'adaptateur. Les liaisons hydrogène sont représentées par des lignes en pointillés. d, entaille RNP DtIsrB-ωARN reconstituée in vitro de substrats d'ADNdb (avec TTGA TAM) avec ωARN pleine longueur ou ωARN tronqué. n = 3 répétitions techniques indépendantes. Δ34–67, ωARN dans lequel les nucléotides 34–67 ont été remplacés par GAAA ; 165-AGCG-168, ωARN dans lequel les nucléotides 165-168 ont été remplacés par AGCG ; 194-GCGG-197, ωARN dans lequel les nucléotides 194-197 ont été remplacés par GCGG ; 194-GCGG-197/81-CCGC-84, ωARN dans lequel les nucléotides 81–84 et 194–197 ont été remplacés par CCGC et GCGG, respectivement.

La région 5'-tige de l'ARN ω (S1, SL1 et SL2) est appelée région adaptatrice de guidage. Il semble que lors de la transition évolutive du système OMEGA vers CRISPR–Cas, SL2 et les brins descendants de S1/SL1 de l'ωARN aient été adaptés pour former le réseau CRISPR afin de permettre la formation de l'ARN fonctionnel Cas9–CRISPR (ARNcr)–tracrARN complexe (Fig. 1a). La séquence génomique codant pour la région adaptatrice guide est importante pour l'activité de transposon IS200/IS605 dans les génomes bactériens10 (Fig. 2a). Nous avons tronqué une partie de cette région, SL1 (ΔSL1 ωARN), et avons constaté que l'ARN résultant supportait toujours une activité de coupure d'ADN robuste par IsrB (Fig. 2d). De plus, nous avons reconstitué ΔSL1 ωARN avec la protéine IsrB et l'ADN cible et effectué une analyse à une seule particule, générant une carte de résolution de 6, 9 Å (Extended Data Fig. 6a – e). La comparaison de cette carte avec celle de l'ARN pleine longueur a validé la position SL1 déterminée à partir de notre modèle d'ARN et a révélé une similitude conformationnelle entre les ARN pleine longueur et ΔSL1 (Extended Data Fig. 6a, b). Ces résultats indiquent que SL1 dans la région de l'adaptateur guide n'est pas nécessaire pour l'entaille de l'ADN cible par IsrB et peut plutôt contribuer à d'autres fonctions impliquées dans la mobilité des transposons codant pour IsrB. L'échafaudage ωARN interagit de manière intensive avec toutes les parties d'IsrB, à l'exception de la région HNHL (Fig. 1e). En particulier, le domaine PLMP interagit avec les épingles à cheveux en tandem (SL7 et SL8) près de l'extrémité 3 'de l'ωARN. La troncature de SL7 / 8, mais pas de SL8, a réduit l'activité de coupure d'IsrB (Fig. 2d). Étant donné que l'épingle à cheveux terminale (SL7) de l'ωARN contient la séquence Shine-Dalgarno située immédiatement en amont de la région codant pour IsrB, ces résultats indiquent que l'interaction IsrB-ωARN est importante pour la fonction IsrB et pourrait contribuer à la régulation de l'expression d'IsrB dans son contexte natif.

Nous avons ensuite cherché à tirer parti des informations structurelles pour déchiffrer le mécanisme de ciblage de l'ADN d'IsrB. L'hétéroduplex ARNg-ADN cible est entouré par S2/S3/S4/SL2/SL4/SL5 de l'ωARN ainsi que par le domaine RuvC et les régions BH/RECL/HNHL d'IsrB (Figs. 1e et 2b). SL2, SL4 et SL5 entrent directement en contact avec le squelette hétéroduplex via des liaisons hydrogène et des interactions de van der Waals (Fig. 3a, b). S2, S3 et S4 reconnaissent indirectement le squelette de l'hétéroduplex, en utilisant un court lieur peptidique, RECL, dans lequel les résidus 113 à 124 sont amenés à s'insérer dans les rainures de S2/S3/S4 et de l'hétéroduplex (Fig. 3b)11. La mutation de F119 et R124 en alanine a réduit l'activité de coupure de l'ADN d'IsrB, soulignant l'importance fonctionnelle de ces résidus dans le RECL (Fig. 3c). En plus de l'ωARN, la protéine IsrB se lie largement à l'hétéroduplex (Fig. 1e). Le HNHL reconnaît le petit sillon de l'hétéroduplex par des interactions avec les fragments ribose du squelette (Fig. 3d). Nous avons confirmé l'importance de cette interaction en supprimant les résidus V161 – F174 dans le HNHL, ce qui a aboli l'activité de coupure de l'ADN (Fig. 3c et Extended Data Fig. 5b). Plusieurs résidus d'arginine dans le BH entrent en contact avec le squelette phosphate du segment guide ωARN d'une manière similaire à celle du complexe Cas9-ARN guide, dans lequel les interactions ARN guide-BH préordonnent la région guide pour la reconnaissance et le déroulement de l'ADN12 (Fig. 3f ). La mutation de R104, mais pas de R100, en alanine a réduit l'activité de coupure de l'ADN d'IsrB, soulignant l'importance fonctionnelle de R104 dans la BH (Fig. 3c). En aval de la région cible (dG1 – dC20), le brin d'ADN complémentaire d'ωARN (c'est-à-dire le brin cible) s'est inversé et apparié en bases avec le brin d'ADN non cible pour former un duplex contenant du TAM (dA [−1] -dA[−10]–dT1*-dT10*) (Fig. 1c,e). Le groupe phosphate du squelette entre dC20 et dA (-1) dans le brin cible est reconnu par Asn265 dans la boucle phosphate-lock, facilitant ainsi la formation d'hétéroduplex (Fig. 3e). La mutation de N265 en alanine a réduit l'activité de coupure, suggérant l'importance de ce résidu pour le déroulement de l'ADN (Fig. 3c). Le domaine PLMP et le motif β7 dans le domaine TI sont les unités pivots de l'échafaudage RuvC – TI – PLMP (Extended Data Fig. 3a). La troncature de ces domaines / motifs a aboli l'activité de coupure d'ADN d'IsrB, indiquant l'importance de l'échafaudage rigide de RuvC – TI – PLMP (Fig. 3c et Extended Data Fig. 5b). Ces résultats montrent que l'IsrB et l'échafaudage ωARN contribuent considérablement à la reconnaissance de l'hétéroduplex guide-cible pour le ciblage de l'ADN.

L'encart montre l'emplacement des panneaux agrandis. a, Reconnaissance hétéroduplex par le pseudo-nœud de l'adaptateur. b, Reconnaissance hétéroduplex par SL4, S4 et RECL. Les volumes d'ARN et d'ADN sont générés à partir des coordonnées atomiques, à l'aide de Chimera X. c, DtIsrB-ωRNA reconstitué in vitro RNP entaillant des substrats d'ADNdb (avec TTGA TAM) avec DtIsrB de type sauvage (WT) ou mutant. n = 3 répétitions techniques indépendantes. ΔHNHL, mutant IsrB dans lequel les résidus 161 à 174 ont été remplacés par un lieur GSG. Δβ7, mutant IsrB dans lequel les résidus 341–353 ont été délétés. ΔPLMP, mutant IsrB dans lequel les résidus 1 à 52 ont été délétés. Pour confirmer la stabilité des protéines des mutants de délétion, nous avons vérifié l'expression des protéines dans un lysat bactérien surexprimant les mutants de délétion (Extended Data Fig. 5b). d, Reconnaissance hétéroduplex par HNHL. e, Reconnaissance du phosphate +1 (liaison phosphodiester entre les nucléotides dG1 et dA(-1) de l'ADN du brin cible) par la boucle phosphate-lock. f, Reconnaissance du segment guide par BH. g, reconnaissance de TAM par le domaine TI. h, spécificité TAM de DtIsrB. Encoche RNP DtIsrB-ωRNA reconstituée in vitro de substrats d'ADNdb (avec TAM TTGA/ATGA/TTGG/ATGG) avec WT ou DtIsrB mutant. n = 3 répétitions techniques indépendantes.

Nous avons précédemment trouvé que DtIsrB montre une préférence NTGA TAM4, mais étant donné que DtIsrB est une enzyme thermophile, nous avons répété le test d'identification TAM à 60 ° C. A cette température, nous avons observé une préférence TTGA TAM (Fig. 4b). Nous avons ensuite cherché à caractériser structurellement cette préférence. Le duplex contenant TAM est lié dans la fente entre les domaines WED et TI, dans laquelle les nucléobases TAM du brin non cible sont lues par les résidus du domaine TI (figures 1e et 3g). Bien que la nucléobase dT1 * n'entre pas directement en contact avec la protéine, le C5 de la nucléobase dT2 * forme des interactions de van der Waals avec celui de dT1 * et la partie aliphatique de la chaîne latérale Arg323, conformément à la préférence pour les premier et deuxième Ts dans le TAM. Les O6 et N7 de dG3* interagissent avec R323, en accord avec la préférence pour le troisième G du TAM. Le mutant R323A manquait d'activité de clivage, soutenant un rôle pour R323 dans la reconnaissance de TAM (Fig. 3c). Les N6 et N7 de dA4* interagissent avec Gln326, conformément à la préférence pour le quatrième A dans le TAM. Pour tester si Q326 reconnaît le quatrième nucléotide TAM, nous avons muté ce résidu en alanine et avons constaté que cette mutation supprimait le clivage cible (Fig. 3c). L'IsrB de type sauvage a montré une activité de clivage sur des cibles avec des TAM TTGA / ATGA, mais pas avec des TAM TTGG / ATGG (Fig. 3h). Cependant, le mutant Q326R était actif avec ces quatre TAM. Ces résultats indiquent que Q326 reconnaît le quatrième nucléotide dans le TAM. Dans SpCas9, la préférence PAM peut être modifiée par l'altération des interactions de liaison hydrogène entre l'acide aminé en position 1335 (Arg dans SpCas9 de type sauvage ou Gln dans SpCas9 VQR-variant) et le troisième nucléotide du PAM (G ou A, respectivement)13,14. De manière analogue, dans IsrB, la préférence TAM peut être modifiée par altération des interactions de liaison hydrogène entre l'acide aminé en position 326 et le quatrième nucléotide du TAM. Ensemble, ces résultats indiquent que DtIsrB reconnaît le TTGA TAM dans le brin non cible par une combinaison de liaisons hydrogène et d'interactions de van der Waals, et indiquent que la modification de ces interactions pourrait élargir la préférence TAM.

a, Arbre phylogénétique d'orthologues IsrB sélectionnés. Les tailles des protéines sont indiquées, avec des domaines mis en évidence dans des cases colorées et des séquences conservées en noir. Les tailles et les groupes d'ARN apparentés (Fig. 4d) sont indiqués. b, séquences TAM pour six orthologues IsrB en utilisant le clivage in vitro d'une banque de plasmides contenant des TAM randomisés et la séquence cible. c, entaille RNP IsrB-ωARN reconstituée in vitro de substrats d'ADNdb avec cinq orthologues IsrB. Pour CwIsrB, CsIsrB et K2IsrB, l'ADN cible contenait un TTGA TAM. Pour DsIsrB et BbIsrB, l'ADN cible contenait un ATGG TAM. n = 3 répétitions techniques indépendantes. d, Modèles structuraux des échafaudages ωARN pour six orthologues IsrB basés sur des prédictions de structure secondaire. Les échafaudages ωARN prédits sont classés en groupes A (sous-groupe A1, CsIsrB et K2IsrB ; sous-groupe A2, BbIsrB) et B (sous-groupe B1, DtIsrB ; sous-groupe B2, CwIsrB et DsIsrB). Dans le groupe A, SL2 et SL4 forment des pseudonœuds, et SL5 et la région intermédiaire entre S2 et SL7 forment des pseudonœuds. Les régions de connexion qui diffèrent du groupe B sont colorées en rose. La région intermédiaire entre SL5 et S3 ainsi que la région terminale après SL7 ("pas de motif", gris) sont censées être des nucléotides non appariés. Dans le groupe B, SL2 et SL5 forment des pseudonœuds, et SL4 et la région intermédiaire entre S2 et SL7 forment des pseudonœuds. Les régions de connexion (rouges) sont comme dans le groupe A. La région intermédiaire entre SL5 et S3 ainsi que la région terminale après SL7 sont censées être des boucles de tige (SL6 et SL8, gris). Dans les sous-groupes A1 et B1, la région intermédiaire entre S2 et S3 devrait être une tige-boucle (SL3, gris foncé), alors que dans les sous-groupes A2 et B2, cette région devrait être des nucléotides non appariés (« aucun motif », gris foncé ).

Pour étudier le mécanisme de coupure de l'ADN d'IsrB, nous avons identifié le site coupé dans l'ADN par séquençage Sanger. IsrB a entaillé le brin non cible 8 à 11 nt en amont du TAM (Extended Data Fig. 6a), contrairement à Cas9s, qui clivent le brin non cible 2 à 5 nt en amont du PAM15. Pour imiter le produit entaillé, nous avons ajouté 10 nt à l'extrémité 5 'du brin non cible dans la structure complexe IsrB tronquée SL1 (Extended Data Fig. 6b). Nous avons observé la densité EM de la partie étendue du brin non cible, qui est ancrée dans le domaine RuvC (Extended Data Fig. 6e). Dans les structures IsrB, les parties proximales TAM et TAM du brin non cible sont supprimées du domaine RuvC (données étendues Fig. 6e, f), alors que dans la structure SpCas9, la partie proximale PAM du brin non cible le brin interagit avec les domaines RuvC et HNH16 (Extended Data Fig. 6g). La différence conformationnelle entre les brins non cibles chargés sur les domaines RuvC explique l'emplacement distinct de la coupe d'ADN faite par IsrB par rapport à celle faite par SpCas9.

Pour évaluer la conservation de la structure ternaire de l'ωARN à travers les IsrB, nous avons identifié cinq orthologues (CwIsrB, IsrB de Crocosphaera watsonii ; DsIsrB, IsrB de Dolichospermum sp. ; CsIsrB, IsrB de Calditerricola satsumensis ; BbIsrB, IsrB de la bactérie Burkholderiales ; K2IsrB, Isr B découvert du contig k249_576930 de l'assemblage du métagénome viral) et leurs ωARN apparentés (Fig. 4a). Un test de découverte de TAM a montré que CwIsrB / K2IsrB / CsIsrB / DsIsrB reconnaît un NTG TAM, tandis que BbIsrB reconnaît un NTGG TAM (Fig. 4b). Nous avons confirmé la fonctionnalité de ces ωARN et validé les préférences TAM à l'aide d'un test de clivage d'ADN avec l'ADN cible contenant le TAM unique (Fig. 4c). Nous avons généré des modèles de structure 3D de ces orthologues IsrB et les modèles de structure bidimensionnelle (2D) pliés en covariance de leurs ωARN apparentés (Extended Data Fig. 7). Le modèle protéique 3D et le modèle ARN 2D étaient compatibles avec les structures déterminées expérimentalement de DtIsrB et de son ωARN apparenté, démontrant la fiabilité générale de la prédiction structurelle (Fig. 2a et Données étendues Fig. 7a, b). Dans la prédiction de la structure secondaire, les ωARN de DtIsrB et les cinq autres orthologues conservent la composition du domaine central composé de quatre tiges (S1–4) et de cinq boucles de tige (SL1/2/4/5/7) (Fig. 4d et Extended Données Fig. 7a). Dans la structure cryo-EM du DtIsrB ωRNA (DtRNA), SL3, SL6 et SL8 sont situés à la périphérie de l'échafaudage et ne contribuent pas à la formation du noyau (Fig. 2b). La troncature de SL8 n'a pas affecté de manière appréciable l'activité de clivage de DtIsrB, ce qui indique que les ωARN dépourvus de ce motif supportent au moins la fonctionnalité minimale de IsrB (Fig. 2d). Dans les ωARN de CwIsrB et DsIsrB, SL2 et SL5 ainsi que SL4 et la région simple brin adjacente à SL7 devraient former deux structures de pseudo-nœud, cohérentes avec la structure du DtRNA (Fig. 4d et Extended Data Fig. 7a) . En revanche, dans les ωARN de CsIsrB, K2IsrB et BbIsrB, deux structures de pseudo-nœuds devraient être formées par SL2 et SL4 ainsi que SL5 et la région simple brin adjacente à SL7 (Fig. 4d et Extended Data Fig. 7a). Ce remaniement SL4-SL5 impliqué dans la formation de pseudonœuds a été rapporté précédemment4 et met en évidence la robustesse structurelle des ωARN, qui conservent des structures globalement similaires malgré les réarrangements structurels. Pris ensemble, la fonctionnalité démontrée des orthologues IsrB et les similitudes structurelles prévues des IsrB et de leurs ωARN indiquent la généralité du mécanisme de ciblage de l'ADN guidé par l'ωARN suggéré par la structure cryo-EM actuelle.

Pour retracer l'évolution du domaine protéique d'IsrB à Cas9, nous avons comparé la structure d'IsrB avec la structure de l'un des plus grands IscB connus (OgeuIscB)17, un parent éloigné d'IsrB contenant le domaine de la nucléase HNH, et la structure prédite de YnpsCas9- 1 (un Cas9 à ramification précoce de sous-type II-D de Ga0315277_10040887 qui fait partie des Cas9 les plus similaires à IscB)4 (Extended Data Fig. 8). Outre le gain du domaine HNH dans IscB, nous observons également de grandes différences dans d'autres régions. Par exemple, le RECL dans certains clades d'IscB, mais pas tous, est plus grand que la région de liaison correspondante dans IsrB et se replie en une structure secondaire minimale, alors que dans YnpsCas9-1, un grand domaine globulaire a été acquis dans la région REC. Dans d'autres Cas9, comme SpCas9, ce domaine est encore plus vaste et plus complexe. Le domaine RuvC dans OgeuIscB contient quelques boucles plus grandes, alors que dans YnpsCas9-1, il contient de longues insertions qui semblent avoir évolué vers des domaines hautement structurés dans d'autres Cas9, y compris SpCas9. Cet élargissement du domaine RuvC dans Cas9 s'accompagne de la perte du domaine PLMP. De même, les domaines WED et TI ont une taille minimale dans les autres IsrB et IscB, sauf spécifiquement dans OgeuIscB et d'autres grands IscB dans lesquels ces domaines sont étendus. Les domaines WED et TI ont probablement continué à se développer dans les grandes versions globulaires trouvées dans YnpsCas9-1 et SpCas9. SpCas9 héberge un plus grand domaine d'interaction avec PAM qui contient une région globulaire supplémentaire située en aval du domaine commun d'interaction avec PAM. La réduction de taille et la division de l'ωARN en deux guides d'ARN dans Cas9 (par exemple, tracrRNA – crRNA) ont probablement accompagné l'acquisition du domaine REC et l'élargissement global de tous les domaines de Cas9.

Pour caractériser plus en détail la minimisation de l'ωARN au fur et à mesure de son évolution en cr/tracrARN, nous avons comparé la structure de l'ωARN DtIsrB (DtARN) avec celles de l'ωARN OgeuIscB (OgARN), de l'ARN monoguide CjCas9 (ARNCj) et de l'ARNsg SpCas9 dans leur états liés à l'ADN protéine/cible (Extended Data Fig. 9)16,17,18. Sur la base de la topologie, de l'emplacement et de la structure secondaire, nous avons cartographié les caractéristiques structurelles du DtRNA (S1–4 et SL1–8) sur d'autres espèces d'ARN et nommé des motifs structurels non identifiés comme motifs 1–5 (M1–5). Les structures de la région 5'-tige (S1 et SL1 dans DtRNA) et de la région de connexion (S2 dans DtRNA) sont conservées dans les quatre espèces d'ARN. Le brin ascendant de la région 5′-tige est remplacé par l'ARNc dans la transition évolutive d'OMEGA-IsrB/IscB vers CRISPR–Cas9. De plus, au fur et à mesure que les ωARN évoluaient en tracrARN, les hélices insérées (S3/S4/SL4/SL5/SL6 dans le DtRNA) dans la région du nexus ont dégénéré, contribuant au compactage et à la simplification de la structure de l'ARN. Les motifs SL4 de DtRNA et OgRNA forment des pseudonœuds de nexus qui sont conservés dans les ωARN, alors que certains appariements de bases dans CjRNA M3 sont bien superposés avec ces pseudonœuds de nexus. Une tige-boucle intégrée dans la région 5'-tige DtRNA (SL2) s'apparie avec l'une des tiges-boucles intégrées dans la région de connexion (SL5), formant un pseudo-nœud fonctionnel (pseudo-nœud adaptateur) qui reconnaît l'ADN cible. Une base adjacente au pseudonœud adaptateur (C198), forme plusieurs contacts entre 3 et 5 Å avec les fragments phosphate et désoxyribose de l'ADN en position 6 (G6) et 7 (T7) (Fig. 3a), conférant une adaptation unique dans lequel l'échafaudage ωARN peut reconnaître le duplex ARN-ADN. Le pseudonœud adaptateur est conservé dans les ωARN IsrB mais est dégénéré lors de la transition vers les ωARN IscB et les tracrARN Cas9, un changement qui est corrélé et probablement compensé par l'expansion de la région REC.

Nous avons également cherché à mieux comprendre les changements mécanistes associés aux acquisitions de domaines dans IsrB et Cas9 au cours de leur évolution à partir de l'ancêtre compact de type RuvC. À cette fin, nous avons comparé les structures liées à la cible de Thermus thermophilus RuvC (TtRuvC), IsrB, CjCas9 et SpCas9 (Fig. 5). Au fur et à mesure que les protéines contenant le domaine RuvC ont évolué pour interagir avec les ωARN, elles ont acquis les domaines TI/PI, PLMP et BH. Dans les structures d'IsrB et de Cas9, les domaines RuvC, WED, TI/PI et BH ainsi que la boucle phosphate-lock forment un noyau fonctionnel avec des configurations similaires ; l'hétéroduplex guide-cible et le duplex TAM/PAM sont liés à ce noyau dans une position et une orientation similaires. Le domaine TI/PI reconnaît les nucléobases TAM/PAM, fonctionnant probablement comme une amorce pour le déroulement de l'ADN cible et la formation d'hétéroduplex, avec l'aide de la boucle phosphate-lock, BH et ωRNA/gRNA. Bien que IsrB et Cas9 partagent des domaines RuvC et BH homologues, IsrB (ainsi que IscB) contient de manière unique le domaine PLMP, qui interagit directement avec RuvC I. L'examen de la structure IsrB révèle en outre un rôle du domaine PLMP dans la stabilisation de la base du épingle à cheveux terminale de l'ωARN et contactant la séquence Shine-Dalgarno. De plus, IsrB ne contient que des régions RECL et HNHL minimales (17 et 19 acides aminés, respectivement, dans DtIsrB), et elles jouent probablement des rôles différents dans le ciblage de l'ADN de ceux joués par le plus grand lobe REC et le domaine HNH dans Cas9 (par exemple, 625 et 135 acides aminés, respectivement, dans SpCas9). Dans SpCas9, le lobe REC sonde l'ADN cible par des interactions avec l'hétéroduplex, active la nucléase RuvC liée à l'ADN par la communication avec le domaine HNH et facilite la formation de boucles R19,20,21. Cependant, dans IsrB, cette communication interdomaine est probablement facilitée par l'ωARN à la fois par le biais d'interactions squelette-squelette et base-squelette car RECL et HNHL sont relativement petits.

Déterminants structuraux de l'évolution des nucléases RuvC ancestrales vers IsrB puis Cas9. Des exemples de descendants modernes (existants) de chaque famille sont présentés en commençant par T. thermophilus RuvC (TtRuvC, PDB 6S16), DtIsrB, CjCas9 (PDB 5X2G) et SpCas9 (PDB 7S4X). Les étapes critiques du processus évolutif proposé sont présentées, y compris les insertions des domaines TI, PLMP et BH, l'interaction avec l'ωARN, l'insertion du domaine HNH, la perte du domaine PLMP et le remplacement de diverses parties de l'ωARN par des régions REC (domaine les remplacements sont indiqués par une clé de couleur). La partie de REC2 dans CjCas9 et SpCas9 qui remplace SL2 dans l'ARN ω DtIsrB est colorée en gris foncé. L'appariement des bases connectées est affiché uniquement pour le duplex guide-ADN. L'appariement de bases déconnecté est illustré pour le pseudonœud de l'adaptateur ωARN afin de mettre en évidence sa position près du duplex ARN-ADN.

L'ωARN relativement grand (environ 300 nt par rapport à l'ARNsg de 100 nt utilisé par Cas9) semble contribuer à la connexion entre le ciblage de l'ADN et les activités de coupure, compensant les petites régions RECL et HNHL (Extended Data Fig. 10). Dans l'architecture ωARN multicouche, les hélices d'ARN de couche supérieure (S2/S3/S4/SL2/SL4/SL5), qui forment un réseau d'interaction pour la reconnaissance hétéroduplex pilotée par ωARN, sont associées aux hélices d'ARN de couche inférieure (SL7/ SL8) et interagissent largement avec le module de coupure (domaines PLMP/RuvC/TI) par les interactions de pseudo-nœud de nexus entre S2, SL4 et SL7. Étant donné que les mutations du pseudonœud adaptateur dans l'ωARN ont aboli l'activité de coupure d'IsrB (Fig. 2d), même si le pseudonœud est éloigné de l'ADN cible, les motifs structurels de l'ωARN pourraient être importants pour la régulation allostérique de la détection de l'ADN par l'ωARN/ RECL et coupure d'ADN par le domaine de la nucléase RuvC, offrant une voie pour intégrer d'autres formes de régulation. Ce mécanisme de régulation allostérique piloté par l'ωARN est soutenu par la charge de surface globale élevée et la zone à travers laquelle IsrB entre en contact avec l'ωARN. D'autres ARN non codants fonctionnels de grande taille (environ 400 à 900 nt), tels que l'intron du groupe I, l'intron du groupe II et la ribonucléase P, ont des structures ternaires complexes et leurs régions périphériques peuvent contrôler leurs noyaux catalytiques centraux par des mécanismes allostériques22,23,24 ,25. Les futures études structurales d'IsrB dans d'autres conformations, telles que le complexe de boucle R IsrB catalytiquement actif, aborderont cette hypothèse et approfondiront notre compréhension mécaniste des systèmes OMEGA.

Le gène codant pour DtIsrB pleine longueur (résidus 1 à 353) a été optimisé en codons, synthétisé (Twist Bioscience) et cloné dans un vecteur pC013 modifié (Addgene Plasmid n° 90097). La région codant pour DtIsrB comprend His6-Twinstrep-tag, SUMO-tag, DtIsrB et GFP-tag. Le DtIsrB de type sauvage a été exprimé à 18 ° C dans des cellules Escherichia coli Rosetta (DE3) pLysS (Novagen). E. coli a été cultivé à 37 ° C dans du milieu Luria-Bertani (contenant 100 mg l-1 ampicilline) jusqu'à ce que la DO600 atteigne 0,5, puis l'expression de la protéine a été induite par l'ajout de 0,1 mM d'isopropyl-β-d-thiogalactopyranoside et incubation à 18°C ​​pendant 20h. Les cellules d'E. coli ont été remises en suspension dans du tampon A (Tris-HCl 50 mM, pH 8,0, imidazole 20 mM et NaCl 1 M), lysées par sonication puis centrifugées. Le surnageant a été mélangé avec du Ni-NTA Agarose (Qiagen). La colonne liée aux protéines a été lavée avec le tampon A, le tampon B (50 mM Tris-HCl, pH 8,0, 20 mM imidazole et 0,3 M NaCl) et le tampon C (50 mM Tris-HCl, pH 8,0, 0,3 M imidazole et 0,3 M NaCl). La protéine a été éluée avec du tampon D (Tris-HCl 50 mM, pH 8,0, imidazole 0,3 M et NaCl 1 M). L'ωARN apparenté de DtIsrB a été transcrit in vitro avec l'ARN polymérase T7, en utilisant une matrice d'ADN amplifiée par PCR et le kit de synthèse d'ARN à haut rendement HiScribe T7 Quick High Yield (NEB). Le modèle se compose du promoteur T7 (TAATACGACTCACTATAGG), du guide (GCTTATTAAATGACTTCTC) (résidus 1 à 20) et de l'échafaudage ωARN (résidus 21 à 282). L'ARN transcrit a été purifié à l'aide d'un kit RNeasy (Qiagen) selon les instructions du fabricant. Les brins d'ADN cibles et non cibles (GATCAGCTCAAGAGGAAGTCATTTAATAAGGC et TTGAGCTGAT, respectivement) ont été achetés auprès de GENEWIZ. Pour la reconstitution du complexe A, la protéine DtIsrB purifiée a été mélangée avec l'ωARN, le brin d'ADN cible et le brin d'ADN non cible (le TTGA TAM) (rapport molaire, 2,3:1:7:7) dans le tampon E (10 Tris-HCl mM, pH 8,0 et NaCl 50 mM, MgCl2 5 mM) et incubés à 37 °C pendant 15 min. Le complexe A a été purifié par chromatographie de filtration sur gel sur une colonne Superose 6 Augmentation 10/300 (Cytiva) équilibrée avec du tampon F (HEPES-NaOH 20 mM, pH 7,0 et NaCl 50 mM, MgCl2 5 mM). Le complexe A (concentration finale : 0,1 mg ml-1) a été incubé avec BS3 (concentration finale : 0,5 mM) à 4 °C pendant 2 h. Pour la reconstitution du complexe B, la protéine lambda N (MDAQTRRRERRAEKQAQWKAAN) a été insérée entre DtIsrB et GFP-tag. Les résidus 34 à 67 de l'échafaudage ωARN (résidus 21 à 282) ont été remplacés par un lieur GAAA. L'ARN boxB fusionné avec le lieur GAAA (GAAAGCCCUGAAGAAGGGC) (résidus 283–302) a été ajouté à l'extrémité 3 'de l'échafaudage ωARN. Le même brin d'ADN cible a été utilisé pour cette reconstitution. Le brin d'ADN non cible étendu en 5 '(TACTGAAGAGTTGAGCTGAT) a été acheté auprès de GENEWIZ. La protéine DtIsrB purifiée a été mélangée avec l'ωARN, le brin d'ADN cible et le brin d'ADN non cible (le TTGA TAM) (rapport molaire, 2,3:1:1,5:1,5) dans du tampon G (Tris-HCl 10 mM, pH 8,0 et 50 mM NaCl) et incubé à 37 °C pendant 15 min. Le complexe B a été purifié par la même colonne d'exclusion de taille équilibrée avec le tampon G. Pour la préparation de la grille, des solutions de complexes A et B purifiées (0,1 mg ml-1, 3 µl) ont été appliquées sur UltrAuFoil 300 mesh R1.2 fraîchement déchargé. /1.3 grilles (Quantifoil) dans un Vitrobot Mark IV (FEI) à 4 °C avec un temps d'attente de 0 et 10 s et un temps de buvardage de 2 et 4 s sous 95 % d'humidité, respectivement.

Les données Cryo-EM pour le complexe A ont été collectées au HHMI Janelia Research Campus à l'aide d'un microscope Titan Krios G2 (Thermo), fonctionnant à 300 kV et équipé d'un filtre d'énergie Gatan Bioquantum (Gatan) et d'un détecteur d'électrons direct post-filtre K3 (Gatan) dans le mode de comptage des électrons. Chaque vidéo a été enregistrée à un grossissement nominal de × 105 000, correspondant à 0,839 Å par pixel physique (0,4195 Å par pixel de super-résolution) à l'exposition aux électrons de 12,075 électrons par Å2 par seconde et le temps d'exposition total était de 5,0 s, résultant en une exposition cumulée de 60 e−/Å2. Ensuite, 50 images par vidéo ont été collectées à 1,2 e-/Å2 dose par image pour un total de 60 e-/Å2 dose par vidéo. La plage de défocalisation nominale a été fixée entre -0,8 et -2,2 µm. La collecte automatisée des données a été effectuée à l'aide de scripts dans SerialEM. Pour chaque position de scène, le décalage d'image a été utilisé pour collecter les données de neuf trous avec deux acquisitions vidéo par trou. L'inclinaison du faisceau induite par le décalage d'image a été calibrée et la correction de l'inclinaison du faisceau a été appliquée lors de la collecte des données. Les données Cryo-EM pour le complexe B ont été collectées au MIT.nano à l'aide d'un microscope Talos Arctica G2 (FEI), fonctionnant à 200 kV et équipé d'un détecteur d'électrons direct Falcon 3EC (Thermo) en mode linéaire. Chaque vidéo a été enregistrée à un grossissement nominal de ×120 000, correspondant à une taille de pixel calibrée de 1,2550 Å à l'exposition aux électrons de 24,54 e−/pix s−1 pendant 3,99 s, résultant en une exposition cumulée de 62,53 e−/Å2. Ensuite, 20 images par vidéo ont été collectées à 3,1265 e-/Å2 dose par image pour un total de 62,53 e-/Å2 dose par vidéo. La plage de défocalisation nominale a été fixée entre -2,6 et -1,0 µm. La collecte automatisée des données a été réalisée à l'aide du logiciel EPU (Thermo). Pour chaque position de scène, le décalage d'image a été utilisé pour collecter les données de neuf trous. Pour obtenir la reconstruction 3D du complexe A, les données ont été traitées à l'aide de RELION-4.0 (réf. 26). Les images vidéo ont été alignées en patchs 5 × 5 et pondérées en fonction de la dose dans MotionCor2 (réf. 27). Les paramètres de défocalisation ont été estimés par CTFFIND-4.1 (réf. 28). À partir des 4 142 micrographies prétraitées, 1 626 574 particules ont été captées par auto-cueillette basée sur TOPAZ29 et extraites en 3,146 Å pixel-1. Les 107 066 particules sélectionnées ont ensuite été réextraites dans 1,144 Å pixel −1 et soumises à un cycle de raffinement 3D et de classification 3D sans alignement. Les 58 188 particules sélectionnées ont été soumises à une estimation de défocalisation par particule et à un polissage bayésien. Pour le raffinement de l'inclinaison du faisceau, le groupe optique de chaque micrographie est défini sur la base de la position de leur trou par rapport à la scène. Les particules polies ont été soumises à un raffinement 3D et ont donné une carte avec une résolution globale de 3,10 Å selon le critère de corrélation de coquille de Fourier 0,143. Pour obtenir la reconstruction 3D du complexe B, les données ont été traitées à l'aide des mêmes programmes. À partir des 2 542 micrographies corrigées en fonction du mouvement et pondérées en fonction de la dose, 1 595 800 particules ont été captées par une sélection automatique basée sur TOPAZ et extraites dans 3,138 Å pixel −1. Ces particules ont été soumises à plusieurs séries de classifications 2D et 3D. Les 50 661 particules sélectionnées ont ensuite été ré-extraites dans 1,255 Å pixel-1 et soumises à un raffinement homogène à l'aide de cryoSPARC30, donnant une carte avec une résolution globale de 6,85 Å selon le critère de corrélation de coquille de Fourier 0,143.

Le modèle protéique initial a été généré à l'aide d'AlphaFold2 (réf. 31) dans le cadre ColabFold en utilisant les paramètres par défaut et MMseqs2 pour rechercher des homologues dans la base de données ColabFold32, et modifié manuellement à l'aide de COOT33 et ISOLDE7 par rapport à la carte de densité du complexe A. L'acide nucléique initial Le modèle a été construit avec auto-DRRAFTER en utilisant la carte de densité du complexe A et le modèle de structure secondaire basé sur la covariance de ωRNA8. Les structures secondaires ωARN (requête) ont été prédites à l'aide de cmsearch34 avec l'option –max pour identifier le modèle de covariance IscB/IsrB ωARN le plus élevé d'une étude précédente4. Pour le meilleur modèle, les régions de requête alignées sur le modèle se sont vu attribuer des structures secondaires à partir des prédictions du modèle. Les structures secondaires de boucle de tige qui se sont révélées être attribuées par erreur à des paires de bases avec l'une des identités de base équivalant à un caractère d'espacement ont été réattribuées pour ne pas avoir de structure secondaire. Les structures secondaires des régions de requête sans couverture (≥ 8 pb sans correspondance avec le meilleur modèle de covariance), à ​​l'exception de la région de faible conservation à l'extrémité 3 'au-delà du nexus, ont ensuite été prédites à l'aide de mfold35. Les pseudo-nœuds ont été attribués manuellement en identifiant les paires de bases correspondantes aux emplacements des pseudo-nœuds attendus pour le type d'ARN ω donné. Les coordonnées ωARN ont été modélisées avec l'auto-DRRAFTER à partir d'une version légèrement modifiée du modèle de structure secondaire basé sur la covariance dans laquelle toutes les paires de bases non canoniques et la plupart des hélices constituées d'une seule paire de bases ont été supprimées. La notation entre crochets pour cette structure secondaire est fournie ci-dessous :

.((((((((((((((((((((.((.((((((((...(((((((. ...))))))))...))))))))).(((((({..{)))))))........ )).))))..((.((((((....))))))....(((((((((((..... (((..((((((...[[[[[.)))))).....)))((((...}..}... .))))..(((.((......)).)))..)))))))))))))))..]]] ]]......((((.....)))).(((.....)))..<<<<<<<<<<))))))) ))))))))))))))>>>>>>>>>>>

Tous les nucléotides d'ADN ont été modélisés en tant qu'ARN car l'auto-DRRAFTER ne peut pas modéliser les nucléotides d'ADN. L'échafaudage guide / ωARN / ADN cible / ADN non cible a été attribué aux résidus 1–20/21–282/283–313/314–323, respectivement. La séquence d'ARN complète utilisée pour la modélisation est fournie ci-dessous :

ggccuuauuaaaugacuucgucaaccaccccugacugaagucagaggcuugcuucuggccugaguugggggcccgguuuggcggggccggggcaacuggcugaccaggcggcccgguucgccgggcagggguccgcggggcuaccaaggacuuccggguguuucgccagcccggacuaucuccggcagaaccgcucaaugccgcggccggccaagaccggccuaagcccugc ggacagcgccgaggcgacaaucacuccgaaaggaggccguguaucggcgaucagcucaagagaagucauuuaauaaggcuugagcugau

La modélisation Auto-DRRAFTER a été réalisée en l'absence de coordonnées protéiques à l'aide de la carte de densité avec les régions correspondant à la densité protéique supprimées. Tous les cycles initiaux de modélisation ont été effectués dans une carte de densité de résolution préliminaire de 4,3 Å. La modélisation a été mise en place manuellement en ajustant les hélices correspondant aux résidus W :1–14 W:41–48 W:53–60 W:258–269 W:271–281 X:2–11 X:18-31 Y:1 -10 dans la carte de densité. Dans le deuxième cycle de modélisation auto-DRRAFTER, l'hélice correspondant aux résidus W : 41-48 et W : 53-60 a été autorisée à se déplacer de son emplacement initial. Cinq cycles de modélisation ont été effectués, suivis d'un dernier cycle de modélisation. Pour chaque tour, entre 2 000 et 6 000 modèles ont été construits. L'un des dix meilleurs modèles de notation a été sélectionné pour être affiné par ISOLDE et Phenix6, avec le modèle protéique, afin d'optimiser la géométrie et d'améliorer l'ajustement à la densité cryo-EM. Après avoir inspecté le modèle optimisé et la structure secondaire basée sur la covariance, deux autres cycles de modélisation auto-DRRAFTER, dont un dernier, ont été effectués dans lesquels l'appariement de bases pour le pseudonœud de l'adaptateur a été légèrement modifié de sorte que les résidus 81–84 et 194–197 ont été appariés plutôt que les résidus 81–84 et 193–196. Pour cette modélisation supplémentaire, seuls les résidus W:73–99 et W:186–206 ont été reconstruits ; tous les autres résidus sont restés fixés. Un dernier cycle de modélisation supplémentaire a été effectué en utilisant la carte de densité de résolution de 3, 1 Å filtrée passe-bas à 4 Å. La convergence finale de ces modèles (écart quadratique moyen par paire entre modèles) est de 4,1 Å. Les valeurs de convergence Auto-DRRAFTER se sont déjà avérées prédictives de la précision du modèle. En utilisant une relation linéaire déterminée précédemment entre la convergence et la précision du modèle (précision de 0,61 × convergence + 2,4 Å), la précision estimée de ces modèles initiaux générés par calcul est de 4,9 Å. Pour améliorer encore la précision, l'un de ces modèles a été affiné avec COOT, ISOLDE et Phenix avec la protéine pour produire le modèle complexe final d'ADN cible IsrB – ωARN. Le modèle final (sans résidus protéiques 1–5/211–224/348–353, résidus d'ARN 1–2/37–64/119–122/212–219/263–265 et résidus d'ADN cible 1/30–31, qui étaient mal résolus et omis du modèle final) a été évalué par MolProbity36 et Q-score37. Les graphiques moléculaires et les chiffres de densité EM ont été préparés avec CueMol (http://www.cuemol.org), PyMOL (https://pymol.org/2/), UCSF Chimera (https://www.cgl.ucsf.edu /chimera/) ou Chimera X (https://www.cgl.ucsf.edu/chimerax/).

La protéine IsrB et les matrices d'ARN ω ont été préparées pour un système d'expression de transcription/traduction in vitro. La matrice de protéine IsrB comprend le promoteur T7 et les séquences d'initiation de la traduction (GCGAATTAATACGACTCACTATAGGGCTTAAGTATAAGGAGGAAAAAAATATG), la séquence ORF IsrB et la séquence de terminaison T7 (CTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTG). La matrice d'ARN ω se compose de la séquence du promoteur T7 (GGAAATTAATACGACTCACTATAGG) et de la séquence d'ARN ω. La protéine IsrB et les matrices d'ARN ω ont été intégrées dans le vecteur pC013 modifié (Addgene Plasmid n° 90097) et le vecteur pCOLADuet-1. Des mutations dans la protéine IsrB et l'ωARN ont été introduites par une méthode basée sur la PCR et les séquences ont été confirmées par séquençage d'ADN. L'amplicon PCR de 320 pb (30 ng), qui contient la séquence cible de 20 nt et le TAM et a été marqué par fluorescence par 5 'IRDye 700 (IDT), a été incubé avec la matrice de protéine IsrB (50 ng) et le ωRNA matrice (125 ng) dans 12,5 μl de tampon de réaction, contenant 5 μl de solution A et 3,75 μl de solution B de PURExpress In vitro Protein Synthesis Kit (NEB). Les conditions de réaction ont été optimisées comme suit. Fig. 2d, 3 h : 2 h à 37 °C, 1 h à 60 °C ; Fig. 3c, 2,1 h : 2 h à 37 °C, 5 min à 60 °C ; Fig. 3h, 3h : 2h à 37°C, 1h à 60°C ; Fig. 4c (CwIsrB, DsIsrB et BbIsrB), 6 h à 37 °C ; Fig. 4c (CsIsrB), 6h : 2h à 37°C, 4h à 60°C ; Fig. 4c (K2IsrB) et 2 h à 37 °C. DtIsrB est dérivé d'un organisme thermophile, D. thermocuniculi, qui se développe à 60–80 ° C (réf. 38). La réaction a été stoppée par l'ajout de 3 ug de RNase A (Qiagen) et 0,24 unités de protéinase K (NEB). Les produits de la réaction ont été purifiés à l'aide d'un Wizard SV Gel and PCR Clean-Up System (Promega), résolus sur un Novex 10% TBE-Urea Gel (Invitrogen) puis visualisés à l'aide d'un ChemiDoc Imaging System (Bio-Rad). Pour examiner la stabilité des protéines des mutants de délétion, des protéines IsrB ont été produites dans le système d'expression bactérienne utilisé dans la préparation de l'échantillon cryo-EM. Les cellules d'E. coli ont été remises en suspension dans du tampon A (Tris-HCl 50 mM, pH 8,0, imidazole 20 mM et NaCl 1 M), lysées par sonication puis centrifugées. Le surnageant a été mélangé avec des billes MagneHis (Promega). La colonne liée aux protéines a été lavée avec le tampon A. La protéine a été éluée avec le tampon B (Tris-HCl 50 mM, pH 8, 0, imidazole 0, 3 M et NaCl 1 M) et analysée par SDS – PAGE (Extended Data Fig. 5b). Pour déterminer les sites de clivage de l'ADN IsrB, l'amplicon PCR de 816 pb (400 ng) contenant la séquence cible de 20 nt (GCCTATTAACCTCAGCCTC) et le TAM ont été incubés avec la matrice de protéine IsrB (100 ng) et la matrice d'ARN ω (125 ng ) dans 25 μl de tampon de réaction, contenant 10 μl de solution A et 7,5 μl de solution B de PURExpress In vitro Protein Synthesis Kit. Après purification du produit de réaction, le produit coupé a été clivé à l'aide de Nb.BbvCI (NEB). Les produits clivés ont été extraits sur gel, purifiés et analysés par séquençage d'ADN (GENEWIZ).

Des IsrB représentatifs avec des résidus de site catalytique actif RuvC intacts et aucun signe de troncatures ont été sélectionnés parmi les trois principaux clades d'IsrB identifiés dans une étude précédente4, correspondant aux IsrB avec des ωARN de type G1b, G1c et G1h. Les ωARN correspondant à chaque IsrB ont été tirés des prédictions d'une étude précédente4 et modifiés de sorte que la fin de l'ωARN se produise au début de l'IsrB. Les IsrB ont ensuite été rejetés si la structure secondaire de l'ωARN correspondante, telle que déterminée par mfold, ne contenait pas les boucles de tige conservées et les pseudonœuds (tels qu'identifiés manuellement) trouvés dans la structure secondaire de l'ωARN basée sur la covariance pour le type d'ωARN donné35. L'analyse a nommé les séquences CwIsrB, CsIsrB, DsIsrB, BbIsrB, K2IsrB et les ωARN correspondants. Les prédictions de structure secondaire et de pseudonœud basées sur la covariance ont été déterminées pour les ωARN correspondants, comme décrit pour le DtRNA. Tous les ωARN ont ensuite été visualisés à l'aide de forna39.

Pour l'analyse du domaine PLMP, le domaine PLMP DtIsrB a été recherché dans HHPred pour des homologues distants, identifiant IF-3 comme un homologue distant putatif. Des séquences représentatives contenant des régions IF-3-N-terminales et des domaines PLMP de la famille IscB/IsrB ont été obtenues auprès d'UniProt et du National Center for Biotechnology Information, et alignées à l'aide de MAFFT-einsi. Les représentants structurels ont été alignés et superposés à l'aide de la super fonction pymol.

Le test d'identification TAM a été réalisé à l'aide d'une bibliothèque TAM, préparée comme décrit précédemment4. Des oligonucléotides d'ADN simple brin (IDT), contenant huit nucléotides randomisés en aval d'une séquence cible de 20 nt (GCCTATTAACCTCAGCCTC), ont été convertis en ADNdb par remplissage avec PrimeSTAR Max DNA Polymerase (Takara) et clonés dans pUC19 par clonage Gibson (NEB ) pour générer une bibliothèque TAM. La banque (25 ng) a été digérée à l'aide d'un système d'expression de transcription/traduction in vitro contenant les matrices de protéine IsrB (50 ng) et ωARN (125 ng), comme décrit dans la section sur l'expérience de clivage in vitro. Les réactions de CwIsrB, DsIsrB, CsIsrB, BbIsrB et K2IsrB ont été incubées pendant 4 h : 2 h à 37 °C, 1 h à 50 °C et 1 h à 60 °C. La réaction de DtIsrB a été incubée pendant 3 h : 2 h à 37 °C et 1 h à 60 °C. Elle a ensuite été stoppée par l'ajout de 3 µg de RNase A (Qiagen) et 0,24 unités de Proteinase K (NEB). Les produits de réaction ont été purifiés à l'aide d'un système de nettoyage Wizard SV Gel et PCR (Promega) et digérés à l'aide de Nb.BbvCI (NEB). Les produits de réaction purifiés ont été soumis à un marquage final et à une ligature de l'adaptateur à l'aide d'un module NEBNext Ultra II End Repair/dA-Tailing (NEB), d'un kit de préparation de bibliothèque d'ADN NEBNext Ultra II pour Illumina (NEB) et d'un adaptateur NEBNext pour Illumina (NEB). . L'ADN digéré et purifié par l'enzyme USER (NEB) a été amplifié avec une PCR à 12 cycles en utilisant une amorce spécifique au squelette de la bibliothèque TAM et une amorce spécifique à l'adaptateur NEBNext, et avec une PCR à 18 cycles ultérieure pour ajouter l'Illumina i5 adaptateur. Pour normaliser la distribution des séquences flanquantes dégénérées 8N, le plasmide de la bibliothèque a été amplifié avec une PCR à 12 cycles en utilisant des amorces spécifiques au squelette de la bibliothèque et avec une PCR à 18 cycles ultérieure pour ajouter l'adaptateur Illumina i5. Les bibliothèques amplifiées ont été isolées sur des E-gels d'agarose à 2% (Invitrogen) et séquencées sur un séquenceur MiSeq (Illumina). Les données de séquence résultantes ont été analysées en extrayant les régions TAM à six nucléotides, en comptant les TAM individuels et en normalisant le TAM au total des lectures pour chaque échantillon. Les motifs de séquence ont été générés à l'aide des TAM sélectionnés dans la fraction supérieure avec le script Python personnalisé utilisé dans notre précédent rapport4.

De plus amples informations sur la conception de la recherche sont disponibles dans le résumé des rapports de recherche sur la nature lié à cet article.

Les coordonnées atomiques de la structure ternaire IsrB ont été déposées auprès de la Protein Data Bank (PDB) à l'adresse http://www.pdb.org (PDB 8DMB). Les reconstructions cryo-EM tridimensionnelles du complexe A et du complexe B ont été déposées auprès de la banque de données de microscopie électronique (complexe A EMD27533 ; complexe B EMD26723).

Zhang, F. Développement de systèmes CRISPR-Cas pour l'édition du génome et au-delà. Q. Rev. Biophys. 52, e6–e6 (2019).

Annonces d'article Google Scholar

Doudna, JA La promesse et le défi de l'édition thérapeutique du génome. Nature 578, 229-236 (2020).

Article ADS CAS Google Scholar

Nishimasu, H. & Nureki, O. Structures et mécanismes des nucléases effectrices guidées par l'ARN CRISPR. Courant. Avis. Structure. Biol. 43, 68–78 (2017).

Article CAS Google Scholar

Altae-Tran, H. et al. La famille répandue de transposons IS200/IS605 code diverses endonucléases programmables guidées par l'ARN. Sciences 374, 57–65 (2021).

Article ADS CAS Google Scholar

Kapitonov, VV, Makarova, KS & Koonin, EV ISC, un nouveau groupe de transposons d'ADN bactériens et archéens qui codent pour les homologues de Cas9. J. Bactériol. 198, 797–807 (2015).

Article Google Scholar

Afonine, PV et al. Raffinement de l'espace réel dans PHENIX pour cryo-EM et cristallographie. Acta Crystallogr. Secte. D., Structure. Biol. 74, 531-544 (2018).

Article CAS Google Scholar

Croll, TI ISOLDE : un environnement physiquement réaliste pour la construction de modèles dans des cartes de densité électronique à basse résolution. Acta Crystallogr. Secte. D., Structure. Biol. 74, 519-530 (2018).

Article CAS Google Scholar

Kappel, K. et al. Détermination accélérée guidée par cryo-EM de structures tridimensionnelles à ARN uniquement. Nat. Méthodes 17, 699–707 (2020).

Article CAS Google Scholar

Briner, AE et al. Les modules fonctionnels de l'ARN guide dirigent l'activité et l'orthogonalité de Cas9. Mol. Cellule 56, 333–339 (2014).

Article CAS Google Scholar

Lui, S. et al. La famille IS200/IS605 et le mécanisme de transposition simple brin "peler et coller". Spectre microbiologique. https://doi.org/10.1128/microbiolspec.MDNA3-0039-2014 (2015).

Juneau, K., Podell, E., Harrington, DJ & Cech, TR Base structurelle de la stabilité accrue d'un domaine ribozyme mutant et vue détaillée des interactions ARN-solvant. Structure 9, 221–231 (2001).

Article CAS Google Scholar

Jiang , F. , Zhou , K. , Ma , L. , Gressel , S. & Doudna , JA Un complexe d'ARN guide Cas9 préorganisé pour la reconnaissance de l'ADN cible . Sciences 348, 1477–1481.

Article ADS CAS Google Scholar

Hirano, S., Nishimasu, H., Ishitani, R. & Nureki, O. Base structurelle des spécificités PAM modifiées du CRISPR-Cas9 modifié. Mol. Cellule 61, 886–894 (2016).

Article CAS Google Scholar

Kleinstiver, BP et al. Nucléases CRISPR-Cas9 conçues avec des spécificités PAM modifiées. Nature 523, 481–485 (2015).

Annonces d'article Google Scholar

Ran, FA et al. Édition du génome in vivo à l'aide de Staphylococcus aureus Cas9. Nature 520, 186-191 (2015).

Article ADS CAS Google Scholar

Bravo, JPK et al. Base structurelle pour la surveillance des inadéquations par CRISPR-Cas9. Nature 603, 343–347 (2022).

Article ADS CAS Google Scholar

Schuler, G., Hu, C. & Ke, A. Base structurelle du clivage de l'ADN guidé par l'ARN par IscB-ωARN et comparaison mécaniste avec Cas9. Sciences 376, 1476-1481 (2022).

Article ADS CAS Google Scholar

Yamada, M. et al. La structure cristalline du Cas9 minimal de Campylobacter jejuni révèle la diversité moléculaire dans les systèmes CRISPR-Cas9. Mol. Cellule 65, 1109–1121.e3 (2017).

Article CAS Google Scholar

Chen, JS et al. Une relecture améliorée régit la précision du ciblage CRISPR–Cas9. Nature 550, 407–410 (2017).

Article ADS CAS Google Scholar

Sternberg, SH, LaFrance, B., Kaplan, M. & Doudna, JA Contrôle conformationnel du clivage cible de l'ADN par CRISPR–Cas9. Nature 527, 110-113 (2015).

Article ADS CAS Google Scholar

Pacesa, M. et al. Formation de boucles R et mécanismes d'activation conformationnelle de Cas9. Nature 609, 191-196 (2022).

Haack, DB et al. Structures Cryo-EM d'un épissage inverse d'intron du groupe II dans l'ADN. Cellule 178, 612–623.e12 (2019).

Article CAS Google Scholar

Reiter, NJ et al. Structure d'une holoenzyme bactérienne ribonucléase P en complexe avec l'ARNt. Nature 468, 784–789 (2010).

Article ADS CAS Google Scholar

Su, Z. et al. Structures Cryo-EM du ribozyme de Tetrahymena pleine longueur à une résolution de 3,1 Å. Nature 596, 603–607 (2021).

Article ADS CAS Google Scholar

Weinberg, Z., Perreault, J., Meyer, MM & Breaker, RR ARN non codants structurés exceptionnels révélés par l'analyse du métagénome bactérien. Nature 462, 656–659 (2009).

Article ADS CAS Google Scholar

Kimanius, D., Dong, L., Sharov, G., Nakane, T. & Scheres, SHW Nouveaux outils pour l'analyse automatisée de particules uniques cryo-EM dans RELION-4.0. Biochimie. J 478, 4169–4185 (2021).

Article CAS Google Scholar

Zheng, SQ et al. MotionCor2 : correction anisotrope du mouvement induit par le faisceau pour une cryomicroscopie électronique améliorée. Nat. Méthodes 14, 331–332 (2017).

Article CAS Google Scholar

Rohou, A. & Grigorieff, N. CTFFIND4 : estimation rapide et précise de la défocalisation à partir de micrographies électroniques. J. Structure. Biol. 192, 216-221 (2015).

Article Google Scholar

Bepler, T. et al. Réseaux de neurones convolutionnels positifs non marqués pour la cueillette de particules dans les micrographies cryo-électroniques. Nat. Méthodes 16, 1153–1160 (2019).

Article CAS Google Scholar

Punjani, A., Rubinstein, JL, Fleet, DJ & Brubaker, MA cryoSPARC : algorithmes pour la détermination rapide et non supervisée de la structure cryo-EM. Nat. Méthodes 14, 290–296 (2017).

Article CAS Google Scholar

Jumper, J. et al. Prédiction très précise de la structure des protéines avec AlphaFold. Nature 596, 583–589 (2021).

Article ADS CAS Google Scholar

Mirdita, M., et al. ColabFold : rendre le repliement des protéines accessible à tous. Nat. Méthodes 19, 679–682 (2022).

Emsley, P., Lohkamp, ​​B., Scott, WG & Cowtan, K. Caractéristiques et développement de Foulque. Acta Crystallogr. D., Biol. Cristallologue. 66, 486–501 (2010).

Article CAS Google Scholar

Nawrocki, EP & Eddy, SR Infernal 1.1 : Recherches d'homologie d'ARN 100 fois plus rapides. Bioinformatique 29, 2933–2935 (2013).

Article CAS Google Scholar

Serveur Web Zuker, M. Mfold pour le repliement des acides nucléiques et la prédiction de l'hybridation. Nucleic Acids Res. 31, 3406–3415 (2003).

Article CAS Google Scholar

Williams, CJ et al. MolProbity : des données de référence plus nombreuses et de meilleure qualité pour une meilleure validation de la structure de tous les atomes. Protéine Sci. 27, 293–315 (2018).

Article CAS Google Scholar

Pintilie, G. et al. Mesure de la résolvabilité des atomes dans les cartes cryo-EM avec Q-scores. Nat. Méthodes 17, 328–334 (2020).

Article CAS Google Scholar

Kaksonen, AH, Spring, S., Schumann, P., Kroppenstedt, RM et Puhakka, JA Desulfovirgula thermocuniculi gen. nov., sp. nov., un sulfate-réducteur thermophile isolé d'une mine souterraine géothermique au Japon. Int. J. Syst. Évol. Microbiol. 57, 98-102 (2007).

Article CAS Google Scholar

Kerpedjiev, P., Hammer, S. & Hofacker, IL Forna (ARN dirigé par la force): diagrammes de structure secondaire d'ARN en ligne simples et efficaces. Bioinformatique 31, 3377–3379 (2015).

Article CAS Google Scholar

Télécharger les références

Nous remercions E. Brignole, C. Borsa, X. Zhao et S. Yang pour leur aide à la préparation de la grille cryo-EM et à la collecte de données. Les échantillons ont été préparés et imagés à l'installation de microscopie cryogénique-électronique du MIT.nano, établie en partie avec le soutien financier de la Fondation Arnold et Mabel Beckman. Nous remercions tous les membres du laboratoire Zhang pour leurs discussions utiles et leur soutien. SH est soutenu par une bourse de recherche JSPS Overseas. KK est soutenu par les Schmidt Science Fellows, en partenariat avec le Rhodes Trust, et le HHMI Hanna H. Gray Fellows Program. FZ est soutenu par les National Institutes of Health (numéros de subvention 1DP1-HL141201 et 2R01HG009761-05); l'Institut médical Howard Hughes; le Poitras Center for Psychiatric Disorders Research au MIT; le Centre de recherche sur l'autisme Hock E. Tan et K. Lisa Yang au MIT ; le Yang-Tan Molecular Therapeutics Center à McGovern, la BT Charitable Foundation et par la famille Phillips et J. et P. Poitras.

Les auteurs suivants ont contribué à parts égales : Seiichi Hirano, Kalli Kappel

Broad Institute of MIT et Harvard, Cambridge, MA, États-Unis

Seiichi Hirano, Kalli Kappel, Han Altae-Tran, William Faure, Max E. Wilkinson, Soumya Kannan, F. Ezra Demircioglu, Rhiannon K. Macrae & Feng Zhang

McGovern Institute for Brain Research au MIT, Cambridge, MA, États-Unis

Seiichi Hirano, Kalli Kappel, Han Altae-Tran, William Faure, Max E. Wilkinson, Soumya Kannan, F. Ezra Demircioglu, Rhiannon K. Macrae & Feng Zhang

Département des sciences cérébrales et cognitives, Massachusetts Institute of Technology, Cambridge, MA, États-Unis

Seiichi Hirano, Kalli Kappel, Han Altae-Tran, William Faure, Max E. Wilkinson, Soumya Kannan, F. Ezra Demircioglu, Rhiannon K. Macrae & Feng Zhang

Département de génie biologique, Massachusetts Institute of Technology, Cambridge, MA, États-Unis

Seiichi Hirano, Kalli Kappel, Han Altae-Tran, William Faure, Max E. Wilkinson, Soumya Kannan, F. Ezra Demircioglu, Rhiannon K. Macrae & Feng Zhang

Institut médical Howard Hughes, Cambridge, MA, États-Unis

Seiichi Hirano, Kalli Kappel, Han Altae-Tran, William Faure, Max E. Wilkinson, Soumya Kannan, F. Ezra Demircioglu, Rhiannon K. Macrae & Feng Zhang

CryoEM Shared Resources, Howard Hughes Medical Institute, Janelia Research Campus, Ashburn, VA, États-Unis

Rui Yan, Momoko Shiozaki et Zhiheng Yu

National Center for Biotechnology Information, National Library of Medicine, National Institutes of Health, Bethesda, MD, États-Unis

Kira S. Makarova & Eugene V. Koonin

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

SH et FZ ont conçu le projet. SH, KK, GF, HA-T., MEW, SK, FED et KSM ont conçu et réalisé des expériences et analysé les résultats. RY, MS et ZY ont effectué la collecte des données. FZ a supervisé la recherche et la conception expérimentale avec le soutien de RKMSH, RKM, EVK et FZ a rédigé le manuscrit avec la contribution de tous les auteurs.

Correspondance avec Feng Zhang.

FZ est conseiller scientifique et cofondateur d'Editas Medicine, Beam Therapeutics, Pairwise Plants, Arbor Biotechnologies et Proof Diagnostics.

Nature remercie Malcolm White, David Taylor et les autres examinateurs anonymes pour leur contribution à l'examen par les pairs de ce travail. Les rapports des pairs examinateurs sont disponibles.

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

( a ) Schéma de traitement des données Cryo-EM pour l'analyse d'une seule particule du complexe A. Cartes non affinées (gauche) et affinées (droite) dans le raffinement 3D final. Répartition de l'orientation des particules (Centre). (b) Carte finale raffinée, colorée par résolution locale, calculée dans RELION-4.0 avec un seuil FSC de 0,5. (c) Courbes FSC calculées entre les demi-cartes du complexe A du tour final du raffinement dans RELION-4.0. (d) Courbes FSC calculées entre le modèle et la carte affinée finale, à l'aide de phenix.validation_cryoem. ( e ) Scores Q pour chaque résidu du modèle d'ADN IsrB-ωARN-brin cible-ADN non cible sur la carte 3, 1 Å du complexe IsrB-ωARN-ADN. Les lignes noires et grises en pointillés dans le tracé représentent les scores Q attendus basés sur la résolution de la carte globale (3,1 Å) et la résolution de la carte locale (4,5 Å), respectivement. Les scores Q pour les résidus d'ARN et d'ADN sont cohérents avec les valeurs attendues basées sur la résolution de la carte locale.

Cartes de densité Cryo-EM pour les résidus représentés dans les figures principales.

( a ) Vue rapprochée de la structure de la protéine IsrB. ( b ) Comparaison structurelle entre le domaine IsrB-TI lié à l'ADN et le domaine SpCas9-PI (PDB: 7S4X). Dans la structure Cas9, le sous-domaine inséré entre β6 et β7 est omis pour plus de clarté.

( a ) Les cinq premiers résultats de la recherche HHPred en utilisant la séquence de semences SITRVPVVGVDGRPLMPTTTPRKARLLIRDGLAVPRRNKLGLFYIQMLRPVGTRTQ correspondant au domaine PLMP de DtIsrB. ( b ) Comparaison structurelle du domaine PLMP de DtIsrB et du domaine N-terminal du facteur d'initiation de traduction 3 (IF-3) de Geobacillus stearothermophilus (PDB: 1TIF). ( c ) Alignement des domaines N-terminaux IF-3 représentatifs et des domaines PLMP liés à OMEGA.

( a ) Gels PAGE dénaturés pour résoudre les produits d'ADN coupés. ( b ) Un gel SDS-PAGE pour le contrôle de l'expression des mutants de délétion. Relatif à la figure 3c.

( a ) Sites de clivage dans l'ADN cible en tant qu'essai par séquençage de Sanger. Les sites d'entaille sont marqués par des triangles noirs. L'adénine supplémentaire sans modèle est indiquée par un astérisque dans la trace de séquençage de Sanger. ( b ) Structure du domaine de la protéine de fusion λN-IsrB (à gauche) et schéma du mutant ωARN et de l'ADN cible (à droite). Dans le mutant ωARN, les résidus 34 à 67 ont été remplacés par GAAA et l'ARN boxB a été ajouté à l'extrémité 3 'de l'échafaudage ωARN. ( c ) Schéma de traitement des données Cryo-EM pour l'analyse d'une seule particule du complexe B (à gauche). Carte finale raffinée (à droite). ( d ) Courbes FSC calculées entre les demi-cartes du complexe B du dernier tour de raffinement dans cryoSPARC v3.3. ( e ) Carte de densité Cryo-EM du complexe B. Sur la base de la superposition de la carte du complexe B et du modèle complexe A, des régions de protéine, d'ARN et d'ADN ont été attribuées. Une densité supplémentaire a été observée à proximité de la région ωARN SL8 et attribuée au complexe λN-boxB, conformément à la connectivité SL8-boxB et au volume λN-boxB (PDB : 1QFQ). TS, brin cible ; NTS, brin non cible. (f et g) Cartes de densité Cryo-EM du complexe A (f) et SpCas9 en complexe avec son ARN apparenté et son ADN cible (EMD : 24838) (g).

( a ) Prédiction de la structure secondaire et du pseudo-nœud des échafaudages d'ARN ω basé sur un modèle de covariance. Dans les ωARN CwIsrB/DsIsrB/BbIsrB, les motifs SL3 sont remplacés par des nucléotides non appariés. Dans les ωARN CsIsrB/K2IsrB/BbIsrB, les motifs SL6 sont dégénérés et les motifs SL8 sont remplacés par des nucléotides non appariés. (b) Superposition des structures AlphaFold (AF) et cryo-EM (EM) de DtIsrB. ( c ) Superposition des structures AlphaFold de six orthologues IsrB. CwIsrB/DsIsrB ont des insertions en épingle à cheveux β et en boucle dans le domaine RuvC et RECL, respectivement.

Comparaison structurelle entre DtIsrB, OgeuIscB (8CSZ), YnpsCas9-1 (modèle AF2) et SpCas9 (APB : 4OO8).

Comparaison structurelle entre les ARN apparentés de DtIsrB, OgeuIscB (8CSZ), CjCas9 (5X2G) et SpCas9 (7S4X) dans leurs états liés aux protéines/ADN. Structures générales (à gauche). Structures d'ARN (au centre). Diagrammes schématiques d'ARN (à droite).

Schéma mettant en évidence les similitudes et les différences mécanistiques entre IsrB et Cas9.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Hirano, S., Kappel, K., Altae-Tran, H. et al. Structure de l'oméga nickase IsrB en complexe avec ωARN et ADN cible. Nature 610, 575–581 (2022). https://doi.org/10.1038/s41586-022-05324-6

Télécharger la citation

Reçu : 20 avril 2022

Accepté : 06 septembre 2022

Publié: 12 octobre 2022

Date d'émission : 20 octobre 2022

DOI : https://doi.org/10.1038/s41586-022-05324-6

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

Nature (2023)

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.