Jan 26, 2024
La libreria di peptidi quantificabili colma il divario nella scoperta e nella validazione di biomarcatori basati sulla proteomica sul cancro al seno
Scientific Reports volume 13,
Rapporti scientifici volume 13, numero articolo: 8991 (2023) Citare questo articolo
358 accessi
3 Altmetrico
Dettagli sulle metriche
La proteomica basata sulla spettrometria di massa (MS) è ampiamente utilizzata per la scoperta di biomarcatori. Tuttavia, spesso, la maggior parte dei candidati biomarcatori provenienti dalla scoperta vengono scartati durante i processi di validazione. Tali discrepanze tra la scoperta e la validazione dei biomarcatori sono causate da diversi fattori, principalmente dovuti alle differenze nella metodologia analitica e nelle condizioni sperimentali. Qui, abbiamo generato una libreria di peptidi che consente la scoperta di biomarcatori nelle stesse impostazioni del processo di validazione, rendendo così la transizione dalla scoperta alla validazione più solida ed efficiente. La biblioteca dei peptidi è iniziata con un elenco di 3393 proteine rilevabili nel sangue provenienti da database pubblici. Per ciascuna proteina sono stati selezionati e sintetizzati peptidi surrogati favorevoli al rilevamento nella spettrometria di massa. Un totale di 4683 peptidi sintetizzati sono stati aggiunti a campioni di siero e plasma puri per verificarne la quantificabilità in un tempo di esecuzione di cromatografia liquida-MS/MS di 10 minuti. Ciò ha portato alla libreria PepQuant, composta da 852 peptidi quantificabili che coprono 452 proteine del sangue umano. Utilizzando la libreria PepQuant, abbiamo scoperto 30 biomarcatori candidati per il cancro al seno. Tra i 30 candidati, sono stati convalidati nove biomarcatori, FN1, VWF, PRG4, MMP9, CLU, PRDX6, PPBP, APOC1 e CHL1. Combinando i valori di quantificazione di questi marcatori, abbiamo generato un modello di apprendimento automatico che prevede il cancro al seno, mostrando un'area media sotto la curva di 0,9105 per la curva caratteristica operativa del ricevitore.
Le proteine del sangue sono analiti preziosi per la diagnosi e la prognosi di varie malattie1. In particolare, l'applicazione delle piattaforme proteomiche alle proteine del sangue ha ricevuto una crescente attenzione sia da parte del mondo accademico che dell'industria clinica2. Con lo sviluppo tecnologico della spettrometria di massa e dei metodi di analisi dei dati, le piattaforme di proteomica basate sulla MS hanno acquisito maggiore profondità e forza quantitativa per identificare e quantificare le proteine3. Di conseguenza, gli studi hanno utilizzato metodi basati su tag di massa tandem (TMT), metodi di quantificazione senza etichetta e metodi di acquisizione indipendente dai dati (DIA) per quantificare un gran numero di proteine da campioni complessi per identificare proteine e isoforme differenzialmente espresse come potenziali candidati per nuovi biomarcatori3,4,5. Tuttavia, solo una piccola percentuale dei biomarcatori candidati è stata identificata come efficace durante la fase di validazione1. Ciò è stato osservato anche nel numero di biomarcatori approvati e utilizzati clinicamente. Rispetto alle oltre 4.300 proteine plasmatiche identificate, solo circa 100 biomarcatori sono stati approvati o approvati dalla FDA, nonostante numerosi studi di scoperta2,6,7. La discrepanza tra le fasi di scoperta e validazione può essere dovuta a differenze nella dimensione, nel tipo e nel numero del campione, nel protocollo di preparazione e nell'attrezzatura1,8. Tra i processi tra le fasi di scoperta e validazione, la dimensione, il tipo e il numero del campione possono essere controllati meglio nella fase di progettazione sperimentale. Tuttavia, le differenze nei metodi di preparazione per le diverse apparecchiature non possono essere risolte mediante la progettazione sperimentale. Per un tipico processo di scoperta, viene utilizzato un approccio proteomico non mirato che utilizza la spettrometria di massa ad alta risoluzione con abbondante deplezione proteica, prefrazionamento e un lungo tempo di esecuzione del gradiente (1-3 ore) per massimizzare il numero di proteine profilate. Al contrario, il processo di validazione si basa su un approccio mirato su siero o plasma puro tramite cromatografia liquida-MS tandem triplo quadrupolo (LC-MS/MS), che è più focalizzato sulla misurazione quantitativa9. Le differenze tra i processi di scoperta e convalida aumentano i tempi e i costi per la scoperta di biomarcatori clinicamente utilizzabili.
Per superare questo problema, studi precedenti hanno suggerito di utilizzare protocolli che consentano analisi riproducibili in diversi tipi di apparecchiature, come il nanoflusso e il microflusso LC9,10. Questi studi si sono concentrati maggiormente sulla generazione di un candidato biomarcatore adatto all'interno di una tipica configurazione di scoperta utilizzando un approccio non mirato. Ciò potrebbe ridurre i tempi della fase di scoperta; tuttavia, non riduce il divario tra scoperta e convalida.