IDA – Intelligent Data Analysis Research Group

Katedra počítačů, Karlovo náměstí 13
http://ida.felk.cvut.cz/

Kdo jsme?

Viz seznam clenu tymu.

Jakým výzkumem se zabýváme

Ve výzkumné skupině Inteligentní datové analýzy (IDA) pracujeme na několika základních tématech:

  • Učíme počítače nacházet znalosti ukryté v datech. Vyvíjíme algoritmy schopné detekovat v datech jisté zákonitosti (časté vzory, silné spojitosti), konstruovat prediktivní modely a identifikovat procesy, které vedly k jevům pozorovaným v datech. Přispíváme tím zejména do oborů statisticko-relačního strojového učení, data miningu a induktivního logického programování.
  • Vyvíjíme nekonvenční optimalizační techniky, jako např. nové typy evolučních a randomizovaných algoritmů, které poskytují rozumná řešení v přijatelném čase i u takových úloh, kde tradiční optimalizační metody selhávají.
  • Vyvinuté metody aplikujeme zejména v bioinformatických problémech. Vytvořili jsme například nástroj XGENE.ORG pro analýzu dat genové exprese metodami strojového učení nebo nástroj Prodigy pro statistickou analýzu struktury bílkovin.

K čemu to je

Vyvinuté metody aplikujeme zejména v bioinformatických problémech. Vytvořili jsme například nástroj XGENE.ORG pro analýzu dat genové exprese metodami strojového učení nebo nástroj Prodigy pro statistickou analýzu struktury bílkovin.

Na čem například pracujeme

  • Pomocí strojového učení konstruujeme prediktory interakcí mezi proteiny a DNA. Prediktory jsou učeny z dat o známých interakcích, popisujících 3D strukturu interagujícího proteinu a sekvenční strukturu cílové časti DNA. V budoucnu bychom chtěli využít strojového učení pro predikci míst v DNA, do nichž se integrují retroviry jako např. HIV.
  • Pracujeme na návrhu teoretického rámce a algoritmů pro agenty, které se učí ze směsi znalostí (teorií) a dat, čímž se snažíme napodobit netriviální scénaře lidského učení z reálného světa.

Kdo financuje náš výzkum

  • Grantová agentura ČR
  • Ministerstvo školství ČR
  • Evropská komise

S kým spolupracujeme

  • University of Minnesota, U.S., Division of Hematology-Oncology and Blood and Marrow Transplantation
  • Jozef Stefan Institute, Slovenia, Department of Knowledge Technologies
  • Université de Caen, France, GREYC lab.
  • Karlova univerzita, MFF
  • Technische Universität Wien, Austria, Institut für Softwaretechnik und Interaktive Systeme

Vybrané publikace

  • Kuzelka O., Zelezny F.: Block-Wise Construction of Tree-like Relational Features with Monotone Reducibility and Redundancy. Machine Learning 83(2):163-192, 2011
  • Zahalka J., Zelezny F.: An Experimental Test of Occam's Razor in Classification (Technical note). Machine Learning 82(3):475-481, 2011
  • Zakova M., Kremen P., Zelezny F., Lavrac N.: Automatic Knowledge Discovery Workflow Composition through Ontology-Based Planning. IEEE Trans. Automation Science and Engineering 8(2):253-264, 2011
  • Zelezny F., Lavrac N.: Guest editors' introduction: Special issue on Inductive Logic Programming (ILP-2008). Machine Learning 76(1):1-2, 2009
  • Kuzelka O., Zelezny F.: A Restarted Strategy for Efficient Subsumption Testing. Fundamenta Informaticae 89(1):95-109, 2008
  • Igor Trajkovski, Filip Železný, Nada Lavrač and Jakub Tolar. Learning Relational Descriptions of Differentially Expressed Gene Groups. IEEE Trans. Sys Man Cyb C, 38(1), 16-25, 2008.
  • Jiří Kléma, Lenka Nováková, Filip Karel, Olga Štěpánková and Filip Železný. Sequential Data Mining: A Comparative Case Study in Development of Atherosclerosis Risk Factors. IEEE Transactions on Systems, Man, and Cybernetics, Part C: Applications and Reviews, 38 :3--15, 2008.
  • Jiří Kléma, Sylvain Blachon, Arnaud Soulet, Bruno Cremilleux and Olivier Gandrilon. Constraint-Based Knowledge Discovery from SAGE Data. In Silico Biology, 8:14, 2008.
  • Jiří Kubalík, Richard Mordinyi and Stefan Biffl. Multiobjective Prototype Optimization with Evolved Improvement Steps. Evolutionary Computation in Combinatorial Optimization (EvoCOP 2008), 2008.
  • Petr Pošík. Preventing Premature Convergence in a Simple EDA via Global Step Size Setting. Parallel Problem Solving from Nature - PPSN X, 2008.
  • Petr Pošík and Vojtěch Franc. Estimation of Fitness Landscape Contours in EAs. GECCO 2007 - Proceedings of the 9th annual conference on Genetic and Evolutionary Computation, 2007.
  • Filip Železný and Nada Lavrač. Propositionalization-Based Relational Subgroup Discovery with RSD. Machine Learning, special issue on statistical relational learning, 62:33-63, 2006.
  • Filip Železný, Ashwin Srinivasan and C. David Page. Randomised Restarted Search in ILP. Machine Learning, 64:183--208, 2006.
  • Dragan Gamberger, Nada Lavrač, Filip Železný and Jakub Tolar. Induction of comprehensible models for gene expression datasets by subgroup discovery methodology. Journal of Biomedical Informatics, 37:269-284, 2004.

Za obsah odpovídá: RNDr. Patrik Mottl, Ph.D.