ALGORITMI STROJNOG UČENJA I NJIHOVA PRIMJENA
->english
|
Znanstveni skup e-Cardiology i sastanak radne skupine Europskog kardiološkog društva organizator: dr. G.Krstačić
|
|
Priručnik: Otkrivanje znanja dubinskom analizom podataka autor: D.Gamberger
|
|
Knjiga: Foundations of Rule Learnig autori: J.Fuernkranz, D.Gamberger, and N.Lavrac
|
|
Usporedba rezultata dvaju postupaka funkcionalne anotacije proteina
|
|
Primjer medicinskog plana u slučaju plućnog edema
|
|
Potpora odlučivanju zasnovana na ontološkom prikazu znanja
|
|
Proceduralno znanje integrirano u OWL ontologiju
|
Sažetak projekta
Efikasno rukovanje znanjem je ograničavajući faktor računarske inteligencije.
I premda je svrha projekta praktična realizacija zadataka tehnologija znanja,
naš glavni predmet istraživanja je strojno učenje. Razlog je to što naši prethodni
rezultati pokazuju da algoritmi strojnog učenja nisu samo moćni alati za inteligentnu
analizu podataka i otkrivanje znanja, već da nam oni mogu pomoći i u strukturiranju
postojećeg ljudskog znanja te da oni mogu biti pokretačka snaga postupaka pomoći
pri odlučivanju.
Predmet rada je teoretsko i praktično istraživanje algoritama strojnog učenja.
Posebna pažnja se posvećuje općenito problemu određivanju značajki, a posebno
onih za induktivno učenje iz različitih složenih oblika podataka, uključujući vremenske
signale, dvodimenzionalne slike, tekst i relacijske baze. Teoretski i praktično
nastojimo pokazati korisnost saturacijske teorije strojnog učenja.
Radit ćemo na postupcima eliminacije šuma i sprečavanja preprilagođenja podacima.
Cilj je razvoj algoritama koji se djelotvorno mogu primjeniti u inteligentnoj
analizi podataka i zadacima rukovanja znanjem. Primjene su u vrlo
različitim područjima kao što su medicina, kemija, biologija i društvene znanosti.
U svakom od tih područja usko surađajemo sa odgovarajućim ekspertima,
nastojeći doći do novih rezultata koji se ne mogu postići drugim metodama.
Cilj tih interdisciplinarnih istraživanja je postizanje rezultata koji su značajni
za razvoj područja primjene, ali i za računarske znanosti kao potvrda kvalitete
i primjenjivosti algoritama.
Između ostalog, važnost predloženog projekta je što on predstavlja nužnu
podršku europskim projektima u koje smo uključeni. Prvi je bio
EU FP6 projekt HEARTFAID
koji je trajao od veljače 2006 do travnja 2009. U suradnji sa još deset
europskih partnera unutar tri godine izgradili smo
platformu računarskih usluga
za pomoć pri kliničkim postupcima vezanim uz bolest zatajenja srca.
Unutar projekta koristili smo naše iskustvo u strojnom
učenju za zadatke otkrivanja znanja ali i za razvoj metodologije prikaza
znanja i za pomoć pri odlučivanju. Iako je projekt prvenstveno koristio i
razvijao suvremene računarske tehnike, on predstavlja interdisciplinarni
rad sa rezultatima koji mogu biti vrlo značajni za medicinu.
Trenutno radimo na EU FP7 projektu e-LICO: An e-Laboratory for Interdisciplinary Collaborative Research in Data Mining and Data-Intensive Sciences. U njegovim okvirima imamo intenzivnu suradnju sa nekoliko vodećih europskih centara u području strojnog učenja, planiranja odvijanja programa (Workflows), te primjeni na sustave za preporučivanje sadržaja (Recommender systems). Pored toga upravo smo započeli raditi na FP7 projektu
Forecasting Financial Crisis (FOC).
Suradnici
- Dragan Gamberger, dr. - www
- voditelj
- prof. Nikola Bogunović, dr. - www
- prof. Bojana Dalbelo Bašić, dr. - www
- Prim. dr. sc. Goran Krstačić, dr. med., FESC - www
- Nives Škunca, dipl. inž. - www , znanstveni novak
- Marin Prcela, dipl. inž - znanstveni novak (do rujna 2009)
Suradnici na HEARTFAID projektu
- Matko Bošnjak, dipl. inž - (do srpnja 2009)
Tehnička podrška
Aktivnosti
- [novo] Studeni 2013. započeo rad na EU FP7 projektu MULTIPLEX: Foundational Research on Multilevel Complex Networks and Systems.
- [novo] Održana radionica "Rule learning algorithms and their applications", Institut Rudjer Boškovic, 15. veljace 2013. Predavaci: Johannes Fuernkranz, Nada Lavrac i Dragan Gamberger.
- Objavljena knjiga Foundations of Rule Learning , Johannes Fuernkranz, Dragan Gamberger, Nada Lavrac.
- Organizirana Radionica o tehnologijama znanja, Mašun pri Ilirskoj Bistrici 27.-29. kolovoza 2012.
- Objavljen rad: Skunca, N., Altenhoff, A., Dessimoz, C. (2012) Quality of Computationally Inferred Gene Ontology Annotations. PLoS Comput Biol 8(5)
- [novo] Organiziran znanstveni skup e-Cardiology i sastanak radne skupine Europskog kardiološkog društva , Osijek, 15.-17. ožujka 2012.
- Organizirana Radionica o tehnologijama znanja, Poreč 19.-21. listopad 2011.
- Početkom rujna započeli smo raditi na FP7 FET projektu Forecasting Financial Crisis (FOC).
- Projekt Gene Ontology (GO) je najveći resurs za katalogiziranje funkcija gena. Ipak, njegova uporaba još nije sveprisutna i još je uvijek puna zamki. U našem preglednom radu dajemo kratak uvod u GO za bioinformatičare. Saželi smo važne aspekte strukture ontologije, opisujemo izvore i vrste funkcionalnih opisa, dajemo pregled mjera sličnosti opisa gena i opisujemo uobičajene načune upotrebe GO, te diskutiramo o drugim važnim aspektima korištenja GO u bioinformatici.
- Priručnik "Otkrivanje znanja dubinskom analizom podataka" na hrvatskom jeziku prikazuje postupke i alate strojnog učenja te načine njihovog korištenja za dubinsku analizu podataka s ciljem otkrivanje znanja. Iako je večina primjera i ilustracija iz područja medicine, svi prikazano se može primijeniti i u drugim područjima znanosti: od prirodnih i tehničkih znanosti do ekonomije i sociologije.
- Predložen EU FP7-ICT-2011-7 projekt: "Citizen oriented e-health environment supporting an innovative health management model for enhancing risk
assessment and handover process - CHEERS". Na prijedlogu je ukupno 11 europskih partnera.
Institut R. Bošković vodi dio pod nazivom "Knowledge management and decision support services".
- FP7 STREP projekt
"e-LICO: e-Laboratorij za interdisciplinarnu istraživačku suradnju u analizi podataka i podatkovno intezivnoj znanosti" započeo sa radom 1. lipnja. 2010. Pored sedam partnera uključenih u osnovni
e-LICO projekt, prošireni konzorcij uključuje i Institut J.Stefan, Ljubljana Slovenija, Poznansko tehnološko sveučilište, Poljska te Institut Rudjer Bošković.
- M.Bošnjak i D.Gamberger kao RandomGuy tim osvojili drugo mjesto na RSCTC'2010 Discovery Challenge: basic track. Challenge je organiziran u okviru konferencije: The Seventh International Conference on Rough Sets and Current Trends in Computing (RSCTC 2010), sudjelovalo je preko 80 timova, a zadatak je bila predikcija klasa na osnovi ekspresije gena.
- Marin Prcela obranio doktorsku disertaciju pod naslovom Predstavljanje znanja zasnovano na integraciji ontologija i Bayesovih mreža
- Informatički projekt GORBI: web aplikacija za funkcionalnu anotaciju proteina
- Javna web usluga: Saturacijski filter za detekciju i eliminaciju šuma u skupovima podataka
- HEARTFAID rezultati: Ontologija koncepata u domeni zatajenja srca , -- Pomoć u odlučivanju za bolničko okruženje , -- Alarmni sustav za vanbolničko okruženje
- Radionica "Računarski postupci otkrivanja znanja u znanstvenim primjenam" Poreč 17.-18. listopada 2008.
- zajednički slovensko-hrvatski projekt
"Inteligentno otkrivanje podgrupa"
- zajednički slovensko-hrvatski projekt
"Induktivno učenje pravila"
- stranice za suradnike
Radovi u 2013. godini
- Gamberger, D. Smuc, T. (2013) Good Governance Problems and Recent Financial
Crises in Some EU Countries. Economics: The Open-Access, Open-Assessment E-
Journal, 7:2013-41.
- Gamberger, D., Krstacic, G., Jovic, A. (2013) A novel way of integrating rule based knowledge into a web ontology language framework.
In Proc. of Thirteenth EFMI Special Topic Conference "Data and Knowledge for Medical Decision Support", IOS Press, pp. 51-55.
- Rios-Morales, R., Gamberger, D., Schweizer, M. Brennan, L. (2013) Institutional Environment Features and Swiss Foreign Direct Investment. Global Business and Economics Review, 15(2-3):196-209.
Radovi u 2012. godini
- Fuernkranz, J., Gamberger, D., Lavrac, N. (2012) Foundations of rule learning. Springer Verlag 2012.
- Gamberger, D., Lucanin, D., Smuc, T. (2012) Descriptive modeling of systemic banking crisies,
In Proc. of Fifteenth Internation Conference on Discovery Science (DS-2012), pp. 67-80.
- Skunca, N., Altenhoff, A., Dessimoz, C. (2012) Quality of Computationally Inferred Gene Ontology Annotations. PLoS Comput Biol 8(5): e1002533. doi:10.1371/journal.pcbi.1002533
Radovi u 2011. godini
- du Plessis, L., Skuca, N., Dessimoz, C. (2011) The what, where, how and way of gene ontology - a primer for bioinformaticians. Briefings in Bioinformatics.
- Jovic, A., Gamberger, D., Krstacic, G. (2011) Heart Failure ontology. Bio-Algorithms and Med-Systems, 7:101-110.
- Rios-Morales, R., Gamberger, D., Jenkins, I., Smuc, T. (2011) Modelling investment in the tourism industry using the World Bank's good governance indicators. Journal of Modelling in Management, 6(3):279-296.
Radovi u 2010. godini
- Prcela, M., Gamberger, D., Smuc, T., Bogunovic, N. (2010) Information gain of structured medical diagnostic tests: Integration of Bayesian networks and ontologies,
In Proc. of Third International Conference on Health Informatics HEALTHINF 2010, pp. 235-240.
- Lavrac, N., Fuernkranz, J., Gamberger, D. (2010) Explicit Feature Construction and Manipulation for Covering Rule Learning.
In Koronacki, J., Ras, Z., Wierzchon, S.T., Kacprzyk, J. editors:
Advances in Machine Learning I - Dedicated to the Memory of Professor Ryszard S. Michalski.
Springer, pp. 121-146.
- Kononowicz etal. (2009) HEARTFAID's ECRF: Lessons learnt from using a two-level data acquisition and storage system for knowledge discovery tasks within an electronic platform for managing heart failure patients. Bio-algorithms and med-systems, 5:59-69.
Radovi u 2009. godini
- Stajduhar, I., Dalbelo Basic, B., Bogunovic, N. (2009) Impact of censoring on learning Bayesian networks in survival modelling, Artificial Intelligence in Medicine. 47(3):199-217.
- Skunca N., Supek, F., Panov P., Dzeroski S., Smuc T. (2009) Functional annotation of orthologous groups by using hierarchical multi label classification, 17th Annual International Conference on Intelligent Systems for Molecular Biology (ISMB) & 8th European Conference on Computational Biology, Stockholm, Švedska, poster .
- Jagnjic, Z., Bogunovic, N., Pizeta, I., Jovic, F., (2009)
Time series classification based on qualitative space framentation , Advanced Ingenieering Informatics, 23:116-129.
- Kralj, P., Lavrac, N., Gamberger, D. and Krstacic, A. (2009)
CSM-SD: Methodology for contrast set mining through subgroup discovery,
Journal of Biomedical Informatics, 42:113-122.
- Rios-Morales, R., Gamberger, D., Smuc, T., Azuje, F. (2009)
Innovative methods in assessing political risk for business internationalization,
Research in International Business and Finance, 23:144-156.
Radovi u 2008. godini
- Gamberger, D., Lavrac, N., Fuernkranz, J. (2008)
Handling Unknown and Imprecise Attribute Values in Propositional Rule Learning:
A Feature-Based Approach
In Proc. of 10th Pacific Rim International Conference on Artificiel Intelligence,
PRICAI 2008, pp.636-645. (pdf)
- Skunca N., Supek F., Repar J., Smuc T. (2008) Evaluation of intergene distances across bacterial species. ECCB08 - European Conference on Computational Biology, sažetak .
- Gamberger, D., Prcela, M., Bosnjak M. (2008)
Attribute ranking for intelligent data analysis in medical applications.
In Proc. of ITI 2008 30th International Conference on Information Technology Interfaces, pp.323-328.
- Prcela, M., Gamberger, D., Jovic, A. (2008)
Semantic web ontology utilization for heart failure expert system design.
In Proc. of 21st International Congress of the European Federation for
Medical Informatics, MIE 2008, pp.851-856. (doc)
- Malenica, M., Smuc, T., Snajder, J., Dalbelo Basic, B. (2008)
Language Morphology Offset: Text Classification on a Croatian-English Parallel Corpus
, Information Processing and Management, 44:325-339.
- Gamberger, D., Prcela, M., Jovic, A., Smuc, T., Parati, G., Valentini, M., Kawecka-Jaszcz, K., Styczkiewicz, K., Kononowicz, A., Candelieri, A., Conforti, D., Guido, R. (2008)
Medical knowledge representation within Heartfaid platform , Proceedings of BIOSTEC 2008, 307-314.
- Lambach, D., Gamberger, D. (2008)
Temporal Analysis of Political Instability Through Descriptive Subgroup Discovery ,
Conflict Management and Peace Science, 25:19-32.
Radovi u 2007. godini
- Jovic, A., Bogunovic, N. (2007) Feature Extraction for ECG Time-Series
Mining Based on Chaos Theory , In Proc. of ITI 2007 29th International Conference on Information Technology Interfaces, pp. 63-68.
- Silic, A., Chauchat, J-H., Dalbelo Basic, B., Morin, A. (2007)
N-Grams and Morphological Normalization in Text Classification: A Comparison on a Croatian-English Parallel Corpus , Lecture Notes in Artificial Intelligence, Progress in Artificial Intelligence: 13th International Conference EPIA 2007; Proceedings ed. Neves, J., Santos, M.F., Machado, J.M.; Berlin, Heidelberg, Springer-Verlag, 2007. 671-682.
- Prcela, M., Gamberger, D., Bogunovic, N. (2007) Developing factual knowledge from medical data by composing ontology structures , In Proc. of 30th International Covention MIPRO 2007, part III, pp.145-150. (pdf)
- Kralj, P., Lavrac, N., Gamberger, D. (2007) Contrast set mining through subgroup discovery applied to brain ischaemia data , In Proc. of 11th Pacific-Asia Conference on Advances in Knowledge
Discovery and Data Mining (PAKDD 2007), pp.579-586.
- Jovic, A., Prcela, M., Gamberger, D. (2007) Ontologies in medical knowledge representation, In Proc. of ITI 2007 29th International Conference on Information Technology Interfaces, pp.535-540. (pdf)
- Lavrac, N., Kralj, P., Gamberger, D., Krstacic, A. (2007) Supporting factors to improve the explanatory potential of contrast set mining: Analyzing brain ischaemia data, In Proc. of 11th Mediterranean Conference on Medical and Biological Engineering (MEDICON 2007), pp.157-161.
- Jovic, A., Prcela, M., Krstacic, G. (2007) Medical Plans as a Middle Step in Building Heart Failure Expert System , In Proc. of 11th Mediterranean Conference on Medical and Biological Engineering (MEDICON 2007), pp.549-553. (pdf)
- Gamberger, D., Lavrac, N. (2007) Supporting factors in descriptive analysis of brain ischaemia, In Proc. of 11th Conference on Artificial Intelligence in Medicine (AIME 2007), pp.155-159.
- Kralj, P., Lavrac, N., Gamberger, D., Krstacic, A. (2007) Contrast Set Mining for Distinguishing between Similar Diseases , In Proc. of 11th Conference on Artificial Intelligence in Medicine (AIME 2007), pp.109-118.
- Gamberger, D., Lavrac, N., Krstacic, A., Krstacic, G. (2007) Clinical data analysis based on iterative subgroup discovery: Experiments in brain ischaemia data analysis,
Applied Intelligence, 27:205-217.