RISULTATI
L’algoritmo PC-IM è stato valutato sui dati di espressione genica della pianta Arabidopsis Thaliana, utilizzando le specifiche dell’organo del fiore della gene regulatory network (FOS-GRN).
Ci sono stati tre tipi di valutazione:
1. VALUTAZIONE PRELIMINARE
Sono stati studiati i dati di espressione in silico (generati da equazioni matematiche) e in vivo (dati reali disponibili in database pubblici), per trovare quelli più affidabili. Il metodo in silico ha mostrato più precisione e sensitività, ma i suoi risultati erano influenzati dall’algoritmo utilizzato; il metodo in vivo, invece, ha superato questo problema, e per questo motivo è stato scelto.
Inoltre, sono stati confrontati gli algoritmi PC e ARACNE, per trovare quello più efficiente nell’espansione di GNR. Il vincitore è stato il PC, che ha mostrato un migliore PPV e migliori prestazioni quando applicato ai dati di espressione genica.
2. VALUTAZIONE DEL PC-IM
Sono stati portati avanti quattro esperimenti per analizzare l’algoritmo PC-IM:
a. Dimensione dei blocchi: l’algoritmo è stato eseguito con blocchi di dimensioni diverse. I valori ottimali sono stati trovati usando 1000 geni
b. Numero di iterazioni: sono stati analizzati nove diversi valori di iterazione; le performance migliori sono state ottenute col valore 100
c. Robustezza: il PC-IM è stato eseguito con due input: una FOS-GRN e una GRN non reale. Nel primo caso ha ottenuto maggiori PPV e sensitività, mostrando la sua robustezza
d. Confronto con GENIES: l’algoritmo è stato confrontato con GENIES, un metodo competitore per l’espansione di LGN recentemente sviluppato. Quest’ultimo ha mostrato migliori prestazioni nell’espansione, ma non ha trovato geni extra. Il risultato del PC-IM, invece, era un numero maggiore di geni nella lista finale di espansione; perciò il PC-IM può essere considerato più efficiente nell’espansione di LGN
3. VALIDAZIONE BIOLOGICA
I risultati finali del PC-IM sono stati convalidati attraverso una ricerca bibliografica. Il processo ha trovato correlazioni o non-correlazioni certe per quasi il 50% dei geni; per quelli rimanenti invece non c’erano referenze bibliografiche utili per descrivere le funzioni. In conclusione, anche se non è possibile convalidare tutti i geni perché alcuni di loro non sono indirizzati dagli studi, quelli in cima alla lista di espansione sono strettamente correlati alla LGN.
Inoltre, i risultati sono stati valutati confrontandoli con quelli ottenuti usando geni casuali. L’output del PC-IM era significativo, al contrario di quello dei geni casuali (il valore LR+ era molto basso). Questo significa che i geni trovati dal PC-IM hanno buone probabilità di essere correlati a quelli della LGN, e basse probabilità di essere ottenuti a caso.