Saturday, June 23, 2007

MogNews reloaded

Dupa luni intregi de stat in debara, la pastrat, MogNews se intoarce mai robust, cu mai multa informatie si cu cateva noi mini-aplicatii care sa-i aduca sporul de gust.


Mai intai despre robustete. MogNews poate fi accesat de acum incolo la o noua adresa: http://djapp.creditlink.ro/news/. Asta inseamna un server nou, de "firma" (cu cel putin 95% uptime), ruland un Debian, in locul celui vechi, de apartament, pe care chinuiam un Windows 2000 cu 128 RAM :). Dupa aceea, am hotarat ca e mai normal ca totusi sa folosesc Django ca web-framework, in loc sa ma chinuiesc cu request.write() direct din mod_python (am totusi circumstante atenuante pentru asta, acum doi si jumatate cand am inceput sa pun MogNews pe web nu existau prea multe web framework-uri Python "light-weighted" decente, sau cel putin care sa fie usor de utilizat).


De asemenea, am decis sa renunt la credinta "purista" ca as putea salva si manipula datele din spatele MogNews folosind numai fisiere text, si am decis sa folosesc MySQL pentru stocarea articolelor. Totusi, in continuare indexul pe care se bazeaza cautarea si categorizarea articolelor este pastrat in fisiere text.


Cautarea este mai rapida (sau cel putin asa imi arata testele mele :) ). Aceasta cu toate ca numarul de surse si implicit cantitatea de informatie a crescut, de la 13-15 la 28-30, cu un accent sporit pus pe ziarele cu aparitie locala si regionala (sunt un provincial care traieste in Bucuresti de 8 ani, stiu ce inseamna sa nu gasesti nici un articol despre orasul/judetul tau in presa centrala).


Am ajuns si la partea de mini-aplicatii noi, care sper ca vor mai aduce un pic de sare proiectului. Le puteti gasi in DevZone, asta deoarece pentru moment se afla intr-un stadiu "pre-beta".


In primul rand este vorba despre API-ul MogContext, cu ajutorul caruia puteti afla "programatically" cuvintele cheie ale oricarui text (de preferat scris in limba romana). Ca exemplu, puteti folosi acest API pentru a genera automat tag-uri pentru textele de pe site-urile/blogurile voastre. In caz ca nu stiati inca, MogContext este o unealta din seria "motoarelor de cautare contextuala" (puteti afla mai multe despre el aici).


Si "last but not least", este vorba despre MogNews Zeitgeist, o aplicatie ce face o analiza cantitativa a cuvintelor cheie din articolele pubilcate in ultimele 5 saptamani. In urma acestei analize sunt intocmite niste clasamente ce corespund ultimelor 5 saptamani, cu cele mai "hot" cuvinte cheie aparand primele in lista. De asemenea, puteti vizualiza si evolutia evolutia unui anumit cuvant cheie, cum ar fi basescu, tariceanu, becali sau tiff (asta in caz ca va place filmul :) ).


Si care ar fi fost hazul intocmirii unui zeitgeist daca nu as fi dat posibilitatea efectuarii de comparatii :) . De exemplu, pasionatii de politica poate vor fi interesati de basescu vs. tariceanu vs. voiculescu vs. geoana, in timp ce microbistii vor putea raspunde la intrebarea "ce echipa este favorita presei?": dinamo vs. steaua vs. rapid vs. poli. Cativa dintre noi vor fi interesati de lucruri mai inalte (plesu vs. liiceanu vs. cartarescu vs. dinescu), in timp ce micul grup al cinicilor anonimi inevitabil va ajunge aici: becali vs. plesu vs. liiceanu vs. cartarescu :) .


In concluzie, iata o lista de linkuri care va va ajuta sa stiti si mai multe despre MogNews si MogContext:

2 Comments:

Blogger Dragos Novac said...

intrebare, sau un fel de gand cu voce tare: de ce nu gasesti si tu un nume simplu si la obiect si iti iei domeniul astfel incat de mognews sa afle mai multi decat cei ce iti citesc blogul, de exemplu? :)

12:04 PM  
Blogger Catalin Fest... said...

Trebuie sa recunosc ca Dragos are dreptate!

Intai am fost uimit ca mai exista cineva care se joaca cu "python" , in plus stie si Django ... asa ceva cam rar prin Romania , punel pe prima pagina ;)

Buna treaba !

12:22 AM  

Post a Comment

<< Home