Description

Développement d’une plateforme collaborative de transcription et d’annotation intégrée à la
base numérique Anareo

Dans la démarche générale de structuration des humanités numériques engagée et soutenue par la Maison des Sciences de l’Homme du Pacifique, le projet ReoScript vise à développer une plateforme collaborative de transcription et d’annotation qui permette la conversion d’images de documents
écrits vers le format texte, avec l’ajout de métadonnées et d’annotations. Cette plateforme sera intégrée à la base numérique Anareo, laquelle est dédiée à l’étude des langues de Polynésie française.
Il s’agit de maîtriser l’intégralité de la chaîne de production et de gestion de corpus authentiques de documents écrits en tahitien, référencés et corrélés au dictionnaire tahitien-français de l’Académie tahitienne. Le développement de cet outil s’inscrit dans le prolongement du projet Concordance, lauréat de l’AAP CollEx-Persée 2019, qui a permis de corréler un premier corpus de textes
authentiques du XIXe siècle avec le dictionnaire en ligne de l’Académie tahitienne. Le présent projet prendra pour cible un échantillon de documents écrits en tahitien de natures diverses disponibles au format image dans la Bibliothèque scientifique numérique polynésienne Ana’ite. L’aide sollicitée permettra de financer la programmation de l’outil collaboratif et les heures de transcription réalisées en phase de test par des étudiants.

Membres