MogNews este un agregator de stiri aparute in ziarele din Romania. Stirile sunt impartite automat in clustere, pe baza unui algoritm ce calculeaza gradul de asemanare dintre doua sau mai multe articole. Pe baza unui algoritm asemanator stirile sunt impartite automat in diferite categorii (
Economie,
Politica etc.).
La momentul de fata MogNews include aproximativ 30 de surse (cotidiene si saptamanale, cu aparitii locale sau nationale). Vezi
aici pentru o lista a surselor. Stirile sunt updatate zilnic.
In spatele MogNews se afla cod scris in limbajul
Python si am folosit
Django ca web framework (mai precis, pentru a afisa stirile parsate si categorizate intr-o pagina web). Oricat ar parea de ciudat, mare parte din core-ul engine-ului de parsare-clustering-categorizare pe care l-am scris acum 3 ani (primavara-vara 2004) este inca prezent in versiunea aceasta a MogNews, cu evidentele imbunatatiri ale stilului codului :). Am spus "ciudat" pentru ca la inceput MogNews rula ca o aplicatie desktop, scrisa in
Tkinter, pe masini Windows '98. Abia mai tarziu mi-am dat seama ca fara mari batai de cap as putea publica stirile/clusterele intr-o pagina web, si asa s-a nascut prima versiune a
MogNews. Din punct de vedere al design-ului vechea versiune nu difera mai deloc de cea noua, dar din punct de vedere tehnic era un pic mai "rudimentara", in sensul ca foloseam direct
mod_python pentru a genera paginile web. Nu foloseam nici o baza de date pentru stocare, ci doar fisiere text, dar incepand cu aceasta versiune am decis sa folosesc
MySql pentru salvarea articolelor. In continuare indexul cuvintelor este pastrat in mai multe fisiere text.
Pe langa faptul ca in dreptul fiecarui articol este afisat numele sursei, extrasele din articole au o lungime maxima de 300 de caractere si exista link-uri directe catre articolele originale. Nu sunt avocat, dar cred ca acestea sunt conditii suficiente pentru a spune ca MogNews se foloseste de surse intr-un mod "fair". Totusi, daca sunteti reprezentantul unuia dintre ziarele ale caror articole apar pe acest site si nu sunteti de acord cu acest lucru, atunci nu trebuie decat sa ma contactati si in cel mai scurt timp posibil voi face astfel incat articolele incriminate sa nu mai apara in MogNews (vezi sectiunea
contact pentru adresa de email).
Puteti folosi
feed-ul RSS pentru principalele articole ale zilei, pentru un anumit sir de cautare (de exemplu pentru
basescu,
tariceanu sau chiar
basescu tariceanu) fie pentru o anumita categorie, cum ar
Economie sau
Politica. Cat mai curand posibil voi incerca sa adaug si posibilitatea de a primi "news alerts" prin email, e doar o chestiune de gasire a timpului liber pentru implementare.
Doua lucruri cu adevarat noi le veti gasi in sectiunea
DevZone. Este vorba despre
MogNews Zeitgeist si
MogContext API. Sunt doua proiecte aflate inca in stadiul "pre-beta", de aceea le-am pus in
DevZone, dar ca un mic "teaser" folosind
Zeitgeist-ul puteti vedea de exemplu cum fluctueaza popularitatea termenului
basescu in presa romaneasca sau puteti face o
comparatie a popularitatii operatorilor de telefonie mobila.
Pentru cei care ma voi intreba, le raspund inca de pe acum: "da, am scris MogNews cu
Google News in minte, si stiu ca nu am fost prea original la intocmirea design-ului :) ".