Aug 06, 2023
Progettazione de novo di luciferasi utilizzando il deep learning
Nature volume 614, pages
Natura volume 614, pagine 774–780 (2023) Citare questo articolo
Accessi 68k
4 citazioni
495 Altmetrico
Dettagli sulle metriche
La progettazione dell'enzima de novo ha cercato di introdurre siti attivi e tasche di legame del substrato che si prevede catalizzano una reazione di interesse in scaffold nativi geometricamente compatibili1,2, ma è stata limitata dalla mancanza di strutture proteiche adeguate e dalla complessità della sequenza proteica nativa –relazioni strutturali. Qui descriviamo un approccio di "allucinazione familiare" basato sull'apprendimento profondo che genera un gran numero di strutture proteiche idealizzate contenenti diverse forme di tasche e sequenze progettate che le codificano. Utilizziamo questi scaffold per progettare luciferasi artificiali che catalizzano selettivamente la chemiluminescenza ossidativa dei substrati sintetici della luciferina difenilterazina3 e 2-deossicoelenterazina. I siti attivi progettati posizionano un gruppo arginina-guanidinio adiacente ad un anione che si sviluppa durante la reazione in una tasca di legame con elevata complementarità di forma. Per entrambi i substrati della luciferina, otteniamo luciferasi progettate con elevata selettività; il più attivo di questi è un enzima piccolo (13,9 kDa) e termostabile (con una temperatura di fusione superiore a 95 °C) che ha un'efficienza catalitica sulla difenilterazina (kcat/Km = 106 M−1 s−1) paragonabile a quella di luciferasi native, ma una specificità di substrato molto più elevata. La creazione da zero di biocatalizzatori altamente attivi e specifici con ampie applicazioni in biomedicina è una pietra miliare fondamentale per la progettazione di enzimi computazionali e il nostro approccio dovrebbe consentire la generazione di un’ampia gamma di luciferasi e altri enzimi.
La luce bioluminescente prodotta dall'ossidazione enzimatica di un substrato di luciferina da parte delle luciferasi è ampiamente utilizzata per test biologici e imaging nella ricerca biomedica. Poiché non è necessaria alcuna sorgente luminosa di eccitazione, i fotoni luminescenti vengono prodotti al buio; ciò si traduce in una sensibilità più elevata rispetto all'imaging a fluorescenza nei modelli animali vivi e nei campioni biologici in cui l'autofluorescenza o la fototossicità rappresentano un problema4,5. Tuttavia, lo sviluppo delle luciferasi come sonde molecolari è rimasto indietro rispetto a quello di toolkit di proteine fluorescenti ben sviluppati per una serie di ragioni: (i) sono state identificate pochissime luciferasi native6,7; (ii) molti di quelli che sono stati identificati richiedono molteplici legami disolfuro per stabilizzare la struttura e sono quindi soggetti a ripiegamento errato nelle cellule di mammifero8; (iii) la maggior parte delle luciferasi native non riconosce le luciferine sintetiche con proprietà fotofisiche più desiderabili9; e (iv) l'imaging multiplex per seguire più processi in parallelo utilizzando coppie luciferasi-luciferina reciprocamente ortogonali è stato limitato dalla bassa specificità del substrato delle luciferasi native10,11.
Abbiamo cercato di utilizzare la progettazione proteica de novo per creare luciferasi che siano piccole, altamente stabili, ben espresse nelle cellule, specifiche per un substrato e non necessitino di cofattori per funzionare. Abbiamo scelto una luciferina sintetica, la difenilterazina (DTZ), come substrato target a causa della sua elevata resa quantica, dell'emissione spostata verso il rosso3, della farmacocinetica in vivo favorevole12,13 e della mancanza di cofattori richiesti per l'emissione di luce. Precedenti sforzi di progettazione di enzimi computazionali hanno principalmente riproposto gli scaffold delle proteine native nella Protein Data Bank (PDB)1,2, ma ci sono poche strutture native con tasche di legame appropriate per DTZ, e gli effetti dei cambiamenti di sequenza sulle proteine native possono essere imprevedibili (progettati anche i fasci elicoidali sono stati utilizzati come impalcature enzimatiche14,15,16, ma questi sono in numero limitato e la maggior parte non ha tasche adatte al legame DTZ). Per aggirare queste limitazioni, abbiamo deciso di generare un gran numero di scaffold proteici piccoli e stabili con tasche di dimensioni e forma appropriate per DTZ e con chiare relazioni sequenza-struttura per facilitare la successiva incorporazione del sito attivo. Per identificare le pieghe proteiche in grado di ospitare tali tasche, abbiamo prima agganciato la DTZ a 4.000 proteine native che legano piccole molecole. Abbiamo scoperto che molte pieghe simili al fattore di trasporto nucleare 2 (NTF2) hanno tasche di legame con complementarità di forma e dimensioni adeguate per il posizionamento DTZ (trattini rosa in Fig. 1e), e quindi abbiamo selezionato la superfamiglia simile a NTF2 come topologia target.