IDA – Intelligent Data Analysis Research Group

Katedra počítačů, Karlovo náměstí 13
http://ida.felk.cvut.cz/

Kdo jsme?

Jakým výzkumem se zabýváme

Ve výzkumné skupině Inteligentní datové analýzy (IDA) pracujeme na několika základních tématech:

Učíme počítače nacházet znalosti ukryté v datech. Vyvíjíme algoritmy schopné detekovat v datech jisté zákonitosti (časté vzory, silné spojitosti), konstruovat prediktivní modely a identifikovat procesy, které vedly k jevům pozorovaným v datech. Přispíváme tím zejména do oborů statisticko-relačního strojového učení, data miningu a induktivního logického programování.
Vyvíjíme nekonvenční optimalizační techniky, jako např. nové typy evolučních a randomizovaných algoritmů, které poskytují rozumná řešení v přijatelném čase i u takových úloh, kde tradiční optimalizační metody selhávají.
Vyvinuté metody aplikujeme zejména v bioinformatických problémech. Vytvořili jsme například nástroj XGENE.ORG pro analýzu dat genové exprese metodami strojového učení nebo nástroj Prodigy pro statistickou analýzu struktury bílkovin.

K čemu to je

Vyvinuté metody aplikujeme zejména v bioinformatických problémech. Vytvořili jsme například nástroj XGENE.ORG pro analýzu dat genové exprese metodami strojového učení nebo nástroj Prodigy pro statistickou analýzu struktury bílkovin.

Na čem například pracujeme

Pomocí strojového učení konstruujeme prediktory interakcí mezi proteiny a DNA. Prediktory jsou učeny z dat o známých interakcích, popisujících 3D strukturu interagujícího proteinu a sekvenční strukturu cílové časti DNA. V budoucnu bychom chtěli využít strojového učení pro predikci míst v DNA, do nichž se integrují retroviry jako např. HIV.
Pracujeme na návrhu teoretického rámce a algoritmů pro agenty, které se učí ze směsi znalostí (teorií) a dat, čímž se snažíme napodobit netriviální scénaře lidského učení z reálného světa.

Kdo financuje náš výzkum

Grantová agentura ČR
Ministerstvo školství ČR
Evropská komise

S kým spolupracujeme

University of Minnesota, U.S., Division of Hematology-Oncology and Blood and Marrow Transplantation
Jozef Stefan Institute, Slovenia, Department of Knowledge Technologies
Université de Caen, France, GREYC lab.
Karlova univerzita, MFF
Technische Universität Wien, Austria, Institut für Softwaretechnik und Interaktive Systeme

Vybrané publikace

Kuzelka O., Zelezny F.: Block-Wise Construction of Tree-like Relational Features with Monotone Reducibility and Redundancy. Machine Learning 83(2):163-192, 2011
Zahalka J., Zelezny F.: An Experimental Test of Occam's Razor in Classification (Technical note). Machine Learning 82(3):475-481, 2011
Zakova M., Kremen P., Zelezny F., Lavrac N.: Automatic Knowledge Discovery Workflow Composition through Ontology-Based Planning. IEEE Trans. Automation Science and Engineering 8(2):253-264, 2011
Zelezny F., Lavrac N.: Guest editors' introduction: Special issue on Inductive Logic Programming (ILP-2008). Machine Learning 76(1):1-2, 2009
Kuzelka O., Zelezny F.: A Restarted Strategy for Efficient Subsumption Testing. Fundamenta Informaticae 89(1):95-109, 2008
Igor Trajkovski, Filip Železný, Nada Lavrač and Jakub Tolar. Learning Relational Descriptions of Differentially Expressed Gene Groups. IEEE Trans. Sys Man Cyb C, 38(1), 16-25, 2008.
Jiří Kléma, Lenka Nováková, Filip Karel, Olga Štěpánková and Filip Železný. Sequential Data Mining: A Comparative Case Study in Development of Atherosclerosis Risk Factors. IEEE Transactions on Systems, Man, and Cybernetics, Part C: Applications and Reviews, 38 :3--15, 2008.
Jiří Kléma, Sylvain Blachon, Arnaud Soulet, Bruno Cremilleux and Olivier Gandrilon. Constraint-Based Knowledge Discovery from SAGE Data. In Silico Biology, 8:14, 2008.
Jiří Kubalík, Richard Mordinyi and Stefan Biffl. Multiobjective Prototype Optimization with Evolved Improvement Steps. Evolutionary Computation in Combinatorial Optimization (EvoCOP 2008), 2008.
Petr Pošík. Preventing Premature Convergence in a Simple EDA via Global Step Size Setting. Parallel Problem Solving from Nature - PPSN X, 2008.
Petr Pošík and Vojtěch Franc. Estimation of Fitness Landscape Contours in EAs. GECCO 2007 - Proceedings of the 9th annual conference on Genetic and Evolutionary Computation, 2007.
Filip Železný and Nada Lavrač. Propositionalization-Based Relational Subgroup Discovery with RSD. Machine Learning, special issue on statistical relational learning, 62:33-63, 2006.
Filip Železný, Ashwin Srinivasan and C. David Page. Randomised Restarted Search in ILP. Machine Learning, 64:183--208, 2006.
Dragan Gamberger, Nada Lavrač, Filip Železný and Jakub Tolar. Induction of comprehensible models for gene expression datasets by subgroup discovery methodology. Journal of Biomedical Informatics, 37:269-284, 2004.

Další týmy

Za obsah odpovídá: RNDr. Patrik Mottl, Ph.D.

Fakulta elektrotechnická

České vysoké učení technické v Praze

ČVUT v Praze

Spojujeme elektrotechniku a informatiku.