Softver koji prati online diskusije i pritom izdvaja relevantne postove i najuticajnije učesnike mogao bi omogućiti automatizovani opis debata koje se vode u chat-sobama.
Softver je razvio Eduard Hovy i njegove kolege na Institutu za informatičke nauke univerziteta Južna Kalifornija. On je rekao da je uspeo izlučiti ključne postove i e-mailove iz hiljada poruka koje je obradio uz pomoć tog softvera..
Za početak, manuelno je kategorizovao poruke prema njihovim svrhama - na primer; identifikacija, zahtev za nekim informacijama, odgovori na ove zahteve i dokono društveno brbljanje.
Posle toga je koristio leksičku bazu podataka kako bi za svaku poruku istražio sličnosti u vokabularu (rečniku) te pronašao relacije između njih. Iduća leksička analiza imala je za cilj da izmeri verovatnoću s kojom će se poruka odgovoriti i to na temelju jezika koji se koristio u odgovorima.
Kako bi integrisao ove različite analize, tim naučnika je modifikovao algoritam nazvan Hypertext Induced Topic Selection (HITS), koji se obično koristi za rangiranje web stranica prema linkovima koji su postavljeni između njih. No, umesto da ga koriste za pretragu web stranica prema zadatim kriterijumima, oni su algoritam iskoristili za pronalaženje najuticajnijih postova u "konverzacijskim nitima".
U poredjenju sa ljudskim analizama, softver je bio u stanju da u 70% slučajeva izdvoji najrelevantniji post.
"Mislim da će ljudi želeti da pokušaju da koriste ovu tehniku kako bi razmrsili niti u sačuvanoj konverzaciji bilo koje vrste, uključujući u to i forume", rekao je Hovy.
Jon Kleinberg, računarski naučnik sa univerziteta Cornell u New Yorku, koji je razvio HITS algoritam, veruje da ovaj pristup ima budućnost.
"To je vrlo lepa aplikacija za analizu linkova", rekao je Kleinberg za New Scientist.
"Istražujući činjenicu da ljudska konverzacija ima bogatu strukturu iza sirovog teksta koji sadrži", Kleinberg ipak ističe da softver još nije u potpunosti automatizovan budući da poruke pre moraju biti "ručno" kategorizovane.
Ta kategorizacija i nije baš tako teška, priznaje Hovy. Kako bi se obavila, potrebno je da osoba "kombinuje broj odgovora, tip takvih odgovora i važnost nivoa svih učesnika u konverzaciji".
"Mi smo samo tek počeli razmrsivati niti", dodao je.
Istraživanje je prezentovano na konferenciji Human Language Technology koja je u o održana u NewYorku.