English
Főoldal

Adatmérnökség

Az adatelemzés és döntéstámogatás alapfeltétele a megfelelő bemeneti adatok biztosítása. Ennek folyamata az adatok absztrakciós szintjének megválasztásától, a laboratóriumi mérőrendszerekhez való illeszkedésen át, az adatbázisok és a tágabb értelemben vett biobank kialakításáig, az adatok minőségbiztosításának megszervezéséhez, majd az adatok tisztításáig és transzformációjáig tart. A gyakorlatban a két utolsó fázis gyakran szokott az adatelemzési vagy a döntéstámogatási munkafolyamat részévé is válni, ami hozzájárulhatott ahhoz, hogy ez a két fázis az adatmérnökség szorosan vett értelmezése, amely az adatok szűrését, normalizálását, dimenziócsökkentését, esetleges pótlását jelenti.

Tapasztalatok szerint egy adatelemzési folyamat idejének túlnyomó részét az adatok elemzésre való felkészítése („preprocessing”) teszi ki, ami természetesen az értelmezés egy részét is magába kell, hogy foglalja. Az orvosbiológiai mérési technikák fejlődése és heterogenitása miatt ez a többfázisú előfeldolgozás nagyon sokféle, elég csupán az új generációs szekvenálásra, komparatív genomhibridizációra, genotipizálásra, génexpresszióra, monoklonális ellenanyag alapú proteomikára, lipidomikára gondolni.

Az előfeldolgozásban alkalmazott eszközök sokasága azonban megegyezik abban, hogy alkalmazásuk is sokféle lehet, azaz az eredményül előálló adatelemzésbe belépő adatoknak több alternatívája is lehetséges.

Megközelítésünkben az előfeldolgozás egy valószínűségi keretrendszerben kap helyet, amely átlagolást hajt végre a lehetséges adatok felett (pl. hiányzó adatok pótlásánál vagy hibás mérési eredmények becslésénél) - ha szükséges, számításintenzív technológiákkal.