Accueil > Vie de l’Université > Vie scientifique > Témoignages > Faire parler les données

Faire parler les données

Web sémantique, métadonnées, ontologies, « mashups »… autant de termes que l’internaute rencontre de plus en plus fréquemment au gré de ses navigations sur le web, grâce à l’émergence de nouveaux outils qui rendent finalement complètement transparent l’accès au concept de « web sémantique ».

L’objectif est de faciliter et d’automatiser l’accès aux contenus du web par l’usage d’éléments descripteurs qui permettent leur mise en relation : « on peut ainsi déduire des informations par le principe de l’inférence : si M.X est le frère de M.Y, que M.Y est le père de M.Z, alors M.X est l’oncle de M.Z… et tout cela sans pour autant que cette information ait été révélée au sein d’un même document… uniquement par croisement.  »

« Après le web des humains nous vivons enfin aujourd’hui le temps du web des données, le temps des agents logiciels, un temps pourtant annoncé dès 1998 par Tim Berners-Lee… dix années, le temps nécessaire entre la formalisation des idées par les chercheurs et leur démocratisation à travers ces nouveaux outils » précise Frédéric Bertrand, maître de conférences en informatique et chercheur au Laboratoire Informatique, Image et Interaction (L3I) .

Ce laboratoire du domaine STIC (Sciences et Technologie de l’Information et de la Communication), à travers son équipe SIDO (Sémantique et Intermédiation de Données), s’est très tôt intéressé à la recherche dans le domaine de la modélisation et de la métamodélisation dans les systèmes d’information, et donc, du web sémantique.

« Des concepts qui pourraient paraître abstraits mais qui trouvent tout leur intérêt dans l’industrie de l’information, dès lors qu’il s’agit, par exemple, d’extraire, de croiser, de lier automatiquement ou semi-automatiquement des données afin d’enrichir l’expérience de l’utilisateur et de lui délivrer un contenu qui soit le plus personnalisé possible. »

L’AFP et l’agence de presse RelaxNews ont ainsi fait appel aux membres de l’équipe SIDO à travers le projet « RelaxMultimédias 2 » pour, littéralement, faire parler leurs données. Ce projet, subventionné par l’Agence Nationale pour la Recherche, et réalisé en collaboration avec le laboratoire MoDyCo de l’Université Paris 13, doit permettre d’exploiter et d’analyser des sources multiples (Pages web, flux RSS, données papiers scannées…) dans le secteur des loisirs afin d’en produire un nouveau flux d’informations.

« Il s’agit d’arriver à établir des règles de correspondance entre ce monde des données qui proviennent du web avec des modèles objets qui permettent de spécifier un logiciel ou des connaissances d’un domaine au sein d’une organisation. Ainsi, nos travaux portent par exemple sur le facteur temporel des informations : la capacité de modélisation d’expression de règles temporelles, la détection des dates » afin d’en faciliter le traitement automatique, et de réduire les coûts de traitement car « produire de l’information coûte cher  ».

Pour en savoir plus :

publié le lundi 7 octobre 2013