In Silico
Statisztikai elemzés
Az elmúlt évtizedben a nagy áteresztőképességű mérési módszerek forradalmi változásokat idéztek elő a molekuláris biológia terén, nagyléptékű fejlődésnek indítva számos területet, úgymint genomika, proteomika, metabolomika. Az „omikák” fejlődése egyúttal utat nyitott a személyre szabott orvoslás előtt, melynek eléréséhez azonban további számottevő kutatás-fejlesztésre van szükség.
Elengedhetetlen egyrészt olyan új rendszerbiológiai modellezési módszerek kifejlesztése, amelyek képesek a sejtszintű molekuláris biológiai dinamikai modellek szintjétől a leíró klinikai szintig integrálni a kinyert tudást. Ennek megfelelően a tudásreprezentációs módszereknek az entitások és relációik nagy számával, az információ források sokaságával, és a bizonytalanság reprezentálásával kell megküzdeni. Ezek a kérdések aktívan kutatott területek, melyekre egy átfogó megoldást adható elsőrendű valószínűségi tudásbázisok formájában.
Másrészt olyan statisztikai elemzési módszerekre van szükség, melyek képesek kezelni a nagy változószám (akár több tízezer változó) mellett előálló relatíve kis mintaszámot (100-1000); illetve lehetővé teszik a háttértudás (apriori tudás) felhasználását. Klasszikus statisztikai módszerek egyedüli alkalmazása nem elegendő, mivel a többszörös tesztelési probléma miatt alkalmazott különféle korrekciók révén gyakran nem marad értékelhető szignifikáns eredmény. Erre a problémára nyújtanak megoldást a Bayes-háló alapú Bayes-statisztikai módszerek, melyek komplex modellek vizsgálata révén tudásgazdag, hipotézismentes elemzést tesznek lehetővé. Önmagában a komplex modellek vizsgálata ugyan kiküszöböli a többszörös tesztelési problémát, de felmerül a dimenzió átkaként ismert jelenség, vagyis minél több paraméterrel rendelkezik a modell, azaz minél nagyobb a dimenziószám, annál több mintára van szükség egy megfelelő pontosságú modell létrehozásához. (A nem megfelelő mintaszám pedig a bias-variancia dilemmát élezheti ki a modellben.) A Markov-lánc Monte Carlo szimuláció alapú bayesi modellátlagolás révén ez a probléma is kezelhető. Az ily módon kialakított módszer lehetővé teszi azt, hogy a kísérlettervezéstől az adatelemzésen át egészen a döntéstámogatásig egységes keretrendszerben lehessen az egyes entitások bizonyosságát-bizonytalanságát (valószínűségi értékek formájában) kezelni. Mindemellett alkalmas a háttértudás integrálására, illetve az oksági modellezésre.
A tudásgazdag elemzési módszerek jellemzően igen számítás-intenzívek, megvalósításokhoz különféle HPC és HTC rendszerek nyújtanak segítséget.


