matf logo

 Matematički fakultet Univerziteta u Beogradu

Seminar Katedre za računarstvo i informatiku


Zimski semestar akademske 2018/2019. godine


Četvrtak, 18. 10. 2018. u 18.15h, Studentski Trg 16, sala 718

Branislava Šandrih, Katedra za bibliotekarstvo i informatiku, Filološki fakultet, Univerzitet u Beogradu
Uticaj klasifikacije teksta na primene u obradi prirodnih jezika
prikaz oblasti

Prikaži apstrakt

U predavanju će biti prikazana tri klasifikaciona problema u kontekstu obrade prirodnih jezika: problem validacije bilingvalnih parova višečlanih leksema, problem identifikacije autora kratkih tekstova, kao i problem analize osećanja u kratkim porukama.

Jedan od ciljeva disertacije je razvijanje potpuno automatizovanog softverskog sistema za generisanje bilingvalne domenske terminologije. Što se resursa tiče, ovaj sistem oslanjao bi se samo na postojanje paralelnih, domenskih tekstova i, ne i nužno, liste domenskih pojmova na izvornom, engleskom jeziku. Sistem bi koristio postojeći alat LeXimir za ekstrakciju domenske terminologije na ciljnom, srpskom jeziku, a u slučaju nepostojanja liste domenskih pojmova na izvornom jeziku, koristio bi i postojeći alat FlexiTerm za ekstrakciju domenskih termina iz engleskog jezika. Sistem bi implementirao novi metod generisanja bilingvalne liste domenskih termina, uz automatsku validaciju dobijenih parova, kao i naknadno proširenje primerima upotrebe.

Drugi problem odnosi se na identifikaciju autora proizvoljnog kratkog teksta (SMS, Viber, Twitter itd.). U ovom slučaju, važno je modelovati sadržaj dokumenta na najadekvatniji način, odnosno prepoznati skup atributa koji najbolje karakterišu dati dokument i koji ga diskriminišu u odnosu na ostale dokumente te kolekcije.

Analiza stavova i raspoloženja kod kratkih tekstova, poput poruka sa različitih socijalnih mreža ili klijenata za razmenu poruka, predstavlja svojevrstan izazov. Takve poruke nose značajno manju količinu informacija u odnosu na, na primer, forumske diskusije. Uočen je trend da autori kratkih poruka teže ka tome da kroz specifičnu upotrebu znakova interpunkcije, ponavljanja slova i simbola, pisanjem samo velikim slovima, upotrebom specijalizovanih skraćenica i emotograma, ostvaruju sličnost pisanog sa govornim jezikom. Na taj način, autori izražavaju sebe, svoje stav i svoja osećanja.


Raniji sastanci

2017/2018 godina (letnji, zimski)
2016/2017 godina (letnji, zimski)
2015/16. godina (letnji, zimski)
2014/15. godina (letnji, zimski)
2013/14. godina (letnji, zimski)
2012/13. godina (letnji, zimski)
2011/12. godina (letnji, zimski)
2010/11. godina (letnji, zimski)
2009/10. godina (letnji, zimski)


Seminar

Seminar Katedre za računarstvo i informatiku vodi poreklo od Seminara za računarstvo i informatiku, osnovanog daleke 1977. godine. Od osnivanja Katedre, 1987. godine, Seminar radi, sa povremenim kraćim prekidima, pod sadašnjim imenom. Seminar je osnovao i prvi rukovodio njime prof. Nedeljko Parezanović. Kasniji rukovodioci Seminara bili su prof. Vojislav Stojković, prof. Gordana Pavlović- Lažetić, doc. Nenad Mitić, prof. Duško Vitas, prof. Miodrag Živković. Na Seminaru se izlažu naučni razultati iz različitih oblasti računarstva, istraživača sa Matematičkog fakulteta kao i gostujućih istraživača iz zemlje i inostranstva.

Sastanci se (uz izuzetke) održavaju svakog drugog četvrtka od 18h u prostorijama Matematičkog fakulteta na Studentskom trgu.


Aktuelni rukovodilac seminara je prof. Filip Marić.