Naslov (hrvatski) Premošćivanje jaza između tehnologije mikropostroja i rutinske kliničke dijagnostike: pristup smanjenju dimenzionalnosti profila genske ekspresije zasnovan na slučajnim šumama
Naslov (engleski) Bridging the gap Between Microarray Technology and Routine Clinical Diagnostics: a Random Forest Approach to the Gene Expression Profile Dimensionality Reduction
Autor Željko Debeljak MBZ: 296571
Autorova ustanova (Klinički bolnički centar Osijek)
Znanstveno / umjetničko područje, polje i grana BIOMEDICINA I ZDRAVSTVO Temeljne medicinske znanosti Genetika, genomika i proteomika čovjeka
Znanstveno / umjetničko područje, polje i grana PRIRODNE ZNANOSTI Biologija Biokemija i molekularna biologija
Sažetak (hrvatski) Uvod: Analiza genske ekspresije zasnovana na mikropostrojima je tijekom proteklog desetljeća prepoznata kao koristan alat od strane znanstvene zajednice, ali nije ušla u rutinsku dijagnostičku primjenu. Kako je skupa i podložna značajnim eksperimentalnim varijacijama, na trenutnom tehnološkom stupnju razvoja ta tehnologija nije prikladna za rutinske kliničko-dijagnostičke primjene. U svrhu premošćivanja jaza između mogućnosti navedene tehnologije i potreba kliničke dijagnostike razvijeni su različiti računalni alati za smanjenje dimenzionalnosti. Njihova osnovna svrha je odabir malog skupa kandidata za biomarkere iz ogromnog skupa sadržanog u profilima genske ekspresije prikladnog za rutinsko postavljanje dijagnoze.
Cilj: Slučajna šuma (engl. Random Forest, RF) se nametnula kao pouzdan pretkazatelj. Ipak, njene su mogućnosti u odabiru relevantnih gena privukle manje pažnje. Cilj ove studije je evaluacija prikladnosti na RF-u zasnovanoga odabira biomarkera iz skupova genskih profila. Tri takva skupa, preuzeta iz literature, prikupljena tijekom manjih kliničkih pokusa izabrana su u navedenu svrhu.
Rezultati: Dobiveni rezultati ukazuju da RF može lako identificirati dobre uni-varijatne klasifikatore, tj. pojedinačne biomarkere kada je složenost skupa mala. Za nešto složenije probleme pouzdani dvodimenzionalni klasifikator može se također pronaći. Ipak, ako je odnos između dijagnoze/prognoze i profila genske ekspresije vrlo složen ili ako je skup premalen, na RF-u zasnovano smanjenje dimenzionalnosti ne omogućava odabir pouzdanog skupa kandidata za biomarkere.
Zaključci: Unutar ograničenja zadanih složenošću skupa RF predstavlja prikladan alat za izbor kandidata za biomarkere.
Sažetak (engleski) Introduction: Although recognized as a valuable tool by scientific community, microarray based gene expression profiling has not accessed routine diagnostic application during the last decade. Since this approach is expensive and prone to substantial experimental variation, it is not suited for routine clinical diagnostic purposes at the current state of technology. In order to bridge that gap, different computational dimensionality reduction tools have been developed. The principle of their application is selection of a limited set of biomarker candidates from huge gene expression profiles appropriate for routine diagnostic assessment.
Aim: Random forest (RF) has been established as a reliable predictor. However, its relevant gene selection capabilities gained less attention. The aim of this study was to evaluate suitability of RF for biomarker selection from gene expression profile datasets. Three datasets taken from literature, obtained during small-scale clinical experiments, were chosen for that purpose.
Results: The results obtained show that RF could easily identify good uni-variate classifiers, i.e. single biomarkers when the problem at hand is of low complexity. For more complex problem a reliable two-dimensional classifier candidate could be also found by this approach. However, when the relationship between diagnosis/prognosis and gene expression profiling results are highly complex or the dataset is too small, RF-based dimensionality reduction fails to select a reliable set of biomarker candidates.
Conclusions: Within dataset complexity limitations, RF represents an appropriate tool for biomarker candidate selection.
Ključne riječi (hrvatski)
Genska ekspresija
Mikropostroj
Probiranje biomarkera
Slučajne šume
Izbor svojstava
Ključne riječi (engleski)
Gene expression
Microarray
Biomarker screening
Random forests
Feature selection
Jezik hrvatski
Vrsta publikacije Znanstveni rad - Izvorni znanstveni rad
Status objave Objavljen
Vrsta recenzije Recenziran - međunarodna recenzija
Verzija publikacije Objavljena verzija rada (izdavačev PDF)
Naslov časopisa Biochemia Medica
Brojčani podaci vol. 16, br. 2, str. 89-228
p-ISSN 1330-0962
e-ISSN 1846-7482
URN:NBN urn:nbn:hr:239:773081
Datum objave publikacije 2006
URL dokumenta https://hrcak.srce.hr/index.php?show=clanak&id_clanak_jezik=14797
Vrsta resursa Tekst
Prava pristupa Otvoreni pristup
Uvjeti korištenja
Datum i vrijeme pohrane 2020-05-11 10:22:24