Tuesday, March 22, 2005

Feed-uri RSS pentru categoriile de pe MogNews

Asa cum am promis, am inceput sa mai adaug diferite feed-uri pentru MogNews. Pentru moment am mai adaugat feed-uri pentru fiecare categorie, astfel:

International : http://maglina.no-ip.org/news/rss.py/rss?categorie=1
Politica : http://maglina.no-ip.org/news/rss.py/rss?categorie=2
Economie : http://maglina.no-ip.org/news/rss.py/rss?categorie=3
Stiinta/Tehnica : http://maglina.no-ip.org/news/rss.py/rss?categorie=4
Sport : http://maglina.no-ip.org/news/rss.py/rss?categorie=5
Cultura : http://maglina.no-ip.org/news/rss.py/rss?categorie=6

Mentionez ca impartirea pe categorii se face automat, in urma unui "proces de invatare". Multi dintre voi s-ar putea intreba de ce sunt atat de putine articole la Stiinta/Tehnica. Raspunsul este ca la inceput a trebuit sa furnizez pentru fiecare categorie cate un numar de articolele de invatare ("baza de cunostinte"), de preferat cat mai mare. Atunci cand un articol nou intra in sistem si se pune problema carei categorii ii apartine, fiecare categorie compara elementele definitorii ale articolului in cauza cu articolele din baza sa de cunostinte, si daca rezultatul compararii e mai mare decat o anumita valoare prag atunci articolul are sanse mari sa apartina acestei categorii. Problema este ca pentru majoritatea categoriilor am reusit sa formez o baza de cunostinte de cate 150-200 de articole, insa pentru Cultura si mai ales pentru Stiinta/Tehnica mi-a fost mai greu la inceput si de atunci am tot amanat-o.

Maine dimineata (miercuri) sper sa adaug feed-uri rss si penru rezultatele cautarii.

PS: Problema impartirii pe categorii (text categorization) este in realitate putin mai complexa, gasiti o colectie de titluri aici

recomand mai ales Fabrizio Sebastiani: A Tutorial on Automated Text Categorisation

si Improving text categorization methods for event tracking

0 Comments:

Post a Comment

<< Home