-
Notifications
You must be signed in to change notification settings - Fork 1
PFE Avancement sur l'annotation du flux rss et premier prototype de transformation
Ces deux derniers jours j’ai réalisé un prototype fonctionnel en java permettant de transformer des flux xml/rss en fichier RDF contenant en plus des news les informations de géolocalisation.
Mon fichier rdf de sortie est pour l’instant basé sur un schéma RDF imaginaire (+ le schéma de l’insee pour les données géographiques) cependant dans la future version il faudrait pouvoir diffuser tout le flux rdf selon le schéma de l’ontologie newsML.
J’ai donc actuellement réussi à annoter un flux rss en l’agrémentant de données géographiques à l’aide de l’api OpenCalais pour l’analyse de texte et la base de données de l’insee ( au format RDF avec interrogations en sparql) pour l’annotation formelle.
Nous obtenons donc un flux rdf de news dans lequel les news sont liées entre elles au niveau géographique.
source:ZeOntologyNewsExtractor/out/output.rdf@5
- Avoir en sortie un fichier RDF répondant à l’ontologie newsML.
- Trouver des références bibliographiques sur l’annotation de news (rien de concluant trouvé en francais pour l’instant)
- Travailler sur la partie ligne de produit
- Ajouter une autre annotation sur le theme des news.
- Avoir une interface graphique (web) pour mettre en valeur mon travail. (Actuellement on peut dire que j’ai qu’une API).