Storm « Sémantisation et triplestore multilingue pour la gestion et la diffusion de fonds patrimoniaux numérisés en langues française, anglaise et arabe, vers un open data culturel »

 Read this article in English

Le projet Storm (Sémantisation et triplestore multilingue pour la gestion et la diffusion de fonds patrimoniaux numérisés en langues française, anglaise et arabe, vers un open data culturel) est un projet déposé dans le cadre des Investissements d’avenir, développement de l’économie numérique, « Technologies de numérisation et de valorisation des contenus culturels, scientifiques et éducatifs ». Prévu sur une durée de 36 mois, à compter de septembre 2012, il repose sur un partenariat entre la société Armadillo, spécialisée dans le domaine des bases de données documentaires, l’agence web Ebizproduction, et les laboratoires InVisu (CNRS/INHA) et ELLIADD (Edition, littérature, langages, informatique, arts, didactiques, discours, université de Franche-Comté).

Retrouvez le projet sur http://www.projet-storm.fr/ 

Partant du constat que beaucoup de ressources sur le monde arabe ne sont pas valorisées par les institutions en Europe, en raison des difficultés de traitement de ce type de fonds, faute d’outils d’indexation, de translittération et de traduction, le projet Storm consiste à construire un système de gestion de bases de données universel triplestore permettant le stockage de données, le développement d’applications multilingues et la sémantisation de contenus en trois langues : français, anglais et arabe, en s’appuyant sur les technologies du web sémantique. Ses résultats seront rendus visibles par la mise en place d’une plateforme, gérée par les sociétés Armadillo et Ebizproduction.

Dans une perspective de valorisation des ressources patrimoniales (dessins, photographies, écrits) conservées en France et plus largement en Europe, le projet Storm concerne directement, pour InVisu, la topographie monumentale de la ville du Caire en Égypte à travers les sources européennes depuis le début du XIXe siècle. Il part de la problématique de la translittération des toponymes (noms de quartiers, de rues, d’édifices religieux et civils) et s’appuie sur un travail préparatoire qui a donné lieu à l’établissement d’une table de concordance permettant d’identifier, au travers de sources variées, les lieux ou les monuments appelés très différemment. L’enjeu sera de parvenir à créer des ontologies multilingues (français, anglais, arabe, éventuellement à terme d’autres langues à graphie latine), avec des couches de variantes historiques superposées, afin de parvenir à identifier sans ambiguïtés les objets nommés.

D’autres partenaires sont associés au projet Storm pour le traitement de leurs corpus : le département des arts de l’Islam du musée du Louvre, l’Institut du monde arabe, l’Institut français, le Centre national de documentation pédagogique, le musée des Civilisations de l’Europe et de la MéditerranéeRadio France internationale et le Centre français d’études éthiopiennes.