Seminar za računarstvo i primenjenu matematiku, 20. novembar 2018.

Naredni sastanak Seminara biće održan u utorak, 20. novembra 2018. u sali 301f Matematičkog instituta SANU sa početkom u 14:15.

Predavač: Vladisav Jelisavčić, Matematički institut SANU

Naslov predavanja: STRUKTUIRANO UČENjE NAD VELIKIM PODACIMA ZASNOVANO NA VEROVATNOSNIM GRAFOVSKIM MODELIMA

Apstrakt: Verovatnosni grafovski modeli su klasa algoritama za struktuirano učenje kod kojih je problem predstavljen pomoću slučajnih promenljivih. Markovljeva slučajna polja su verovatnosni grafovski modeli u kojima su promenljive predstavljene kao čvorovi, dok su interakcije između  promenljivih predstavljene kao grane neusmerenog grafa. Cilj istraživanja predstavljenog u ovom izlaganju je pronalaženje i analiza novih modela za struktuirano učenje i algoritama za njihovo obučavanje. Učenje ovakvih modela se najčešće obavlja pronalaženjem maksimalne verodostojnosti (eng. maximum likelihood), pomoću metoda konveksne optimizacije. Efikasnost učenja, kao i zaključivanja na osnovu naučenog modela, u  velikoj meri zavisi od osobina samog modela i pretpostavki nad kojima je  zasnovan, kao i prilagođenosti modela problemu. U sklopu ovog istraživanja, najpre je osmišljena  i realizovana generalizacija jedne postojeće GCRF formulacije. Zatim je izvršena eksperimentalna analiza predloženog modela na nekoliko sintetičkih i nekoliko stvarnih skupova podataka iz aktuelnih domena klimatologije i zdravstva, kao i analiza složenosti algoritma. Zatim je uočen tip problema koji je veoma zastupljen a nije dovoljno obrađen u literaturi, i za koji je moguće uvesti dodatne pretpostavke za koje je pokazano da mogu znatno olakšati problem učenja strukture iz mnogodimenzionalnih podataka. Predložena su i realizovana dva nova GMRF modela zasnovana na uvedenim pretpostavkama i L1 regularizacione norme, i razvijeni su brzi i skalabilni algoritmi za njihovo učenje. Pokazana je prednost predloženih modela nad postojećim rešenjima u vidu brzine i skalabilnosti. Predloženi algoritmi su eksperimentalno potvrđeni kroz poređenje sa najbržim postojećim rešenjima na nekoliko mnogodimenzionalnih sintetičkih problema kao i na pravim podacima iz oblasti ekspresije gena, DNK metilacije i EEG signala. Zatim je odrađena teorijska analiza složenosti algoritama i eksperimentalno potvrđena sposobnost paralelizacije. Za kraj su predložene još dve dodatne ekstenzije GCRF modela i postavljena je teorijska osnova za njihovo učenje.

 



Nažalost nije moguće ostaviti komentar.