Skip to content

PFE Avancement sur l'annotation du flux rss et premier prototype de transformation

descl edited this page Nov 28, 2012 · 1 revision

Ces deux derniers jours j’ai réalisé un prototype fonctionnel en java permettant de transformer des flux xml/rss en fichier RDF contenant en plus des news les informations de géolocalisation.
Mon fichier rdf de sortie est pour l’instant basé sur un schéma RDF imaginaire (+ le schéma de l’insee pour les données géographiques) cependant dans la future version il faudrait pouvoir diffuser tout le flux rdf selon le schéma de l’ontologie newsML.

Ce que j’obtiens:

J’ai donc actuellement réussi à annoter un flux rss en l’agrémentant de données géographiques à l’aide de l’api OpenCalais pour l’analyse de texte et la base de données de l’insee ( au format RDF avec interrogations en sparql) pour l’annotation formelle.

Nous obtenons donc un flux rdf de news dans lequel les news sont liées entre elles au niveau géographique.

source:ZeOntologyNewsExtractor/out/output.rdf@5

Ce que je souhaite faire maintenant:

  1. Avoir en sortie un fichier RDF répondant à l’ontologie newsML.
  2. Trouver des références bibliographiques sur l’annotation de news (rien de concluant trouvé en francais pour l’instant)
  3. Travailler sur la partie ligne de produit
  4. Ajouter une autre annotation sur le theme des news.
  5. Avoir une interface graphique (web) pour mettre en valeur mon travail. (Actuellement on peut dire que j’ai qu’une API).