MOTIVAZIONI DELLA RICERCA
Ogni essere vivente ha un codice genetico e un insieme di
geni, che servono per produrre proteine partendo da informazioni codificate. I geni sono fondamentali per la vita e il mantenimento degli organismi, e vengono espressi all’interno delle cellule: le informazioni che contengono sono trascritte e tradotte in proteine.
Questo fenomeno di espressione genica,basato su una complessa catena di eventi in cui delle particolari proteine agiscono su regioni di geni, può essere semplificato tramite una relazione causale tra due geni.
La causalità è un tipo di legame causa-effetto tra due variabili: significa che l’accadere di una è causa dell’occorrenza dell’altra.
Le informazioni di espressione genetica vengono solitamente rappresentate in reti Gene Regulatory Networks (GRN), che utilizzano degli archi per indicare le relazioni causali tra due geni. Questa rappresentazione è molto utile per prevedere e manipolare il comportamento di un sistema.
Ogni GRN può essere espansa, in modo da aggiungere o suggerire nuovi geni correlati a quelli già noti; in questo modo si possono ampliare la ricerca e l’analisi di una rete. Tuttavia, non esistono molti metodi per eseguire l’espansione, che resta una sfida ancora aperta nel mondo della Bioinformatica.
Il progetto gene@home si occupa dell’espansione di GRN, e sfrutta un algoritmo chiamato PC-IM.
Si tratta di un’implementazione iterativa dell’algoritmo PC, che trova una rete di geni e studia le sue relazioni di causalità, finalizzata a valutare se una lista di nuovi geni può essere in relazione causale con una GRN già nota.
In particolare, i nuovi geni vengono partizionati in blocchi e fusi con la GRN già esistente; dopodiché il PC viene applicato su ogni blocco per cercare possibili relazioni. Alla fine del processo l’algoritmo auto-valuta le sue prestazioni, e in base a queste decide la rete finale da restituire come output.