"La Collection Pangloss : une archive ouverte de langues peu documentées, conçue pour favoriser une utilisation en Traitement Automatique des Langues" - Inalco - Institut National des Langues et Civilisations Orientales Accéder directement au contenu
Poster De Conférence Année : 2019

The Pangloss Collection: an open archive of under-documented languages designed with Natural Language Processing in view

"La Collection Pangloss : une archive ouverte de langues peu documentées, conçue pour favoriser une utilisation en Traitement Automatique des Langues"

Résumé

Dans le cadre de l'Année internationale des langues autochtones 2019, une conférence internationale de trois jours a été organisée par l’UNESCO. L'objectif principal de l'événement était de promouvoir les droits de l'homme et les libertés fondamentales de tous les utilisateurs de langues pour accéder à l'information et au savoir dans les langues les mieux comprises. Il visait également à encourager toutes les parties prenantes concernées à prendre des mesures concrètes pour promouvoir la diversité linguistique, l'Internet véritablement multilingue et les technologies linguistiques, en accordant une attention particulière aux langues autochtones. Lors de l’événement, à travers la présentation de ce poster, le LACITO a souhaité exposer le travail réalisé au sein de la Collection Pangloss de documentation fondamentale pour la sauvegarde et la diffusion de langues minoritaires, et pour certaines menacées d’extinctions. En complément de cette action pérenne d’archivage et de valorisation, les membres du LACITO et l’équipe Pangloss, participent au développement d’outils numériques pour enrichir la base de donnée de la Collection Pangloss, mais également faire avancer la recherche à travers des technologies de la parole pour les langues peu dotées (e.g. mise à disposition de corpus pour le développement d’outil de transcription automatique de la parole, de traduction automatique…). Sans oublier, l’importance du développement de ces outils pour l’enseignement et l’information au public de ces langues sous-documentées.
Fichier principal
Vignette du fichier
UNESCO_2019_A1.pdf (5.01 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-02415045 , version 1 (16-12-2019)

Licence

Paternité - Pas d'utilisation commerciale - Partage selon les Conditions Initiales

Identifiants

  • HAL Id : hal-02415045 , version 1

Citer

Séverine Guillaume, Balthazar Do Nascimento, Alexis Michaud. "La Collection Pangloss : une archive ouverte de langues peu documentées, conçue pour favoriser une utilisation en Traitement Automatique des Langues". Conférence internationale sur les technologies linguistiques pour tous (LT4AII) : Favoriser la diversité linguistique et le multilinguisme dans le monde (UNESCO), Dec 2019, Paris, France. , 2019. ⟨hal-02415045⟩
126 Consultations
29 Téléchargements

Partager

Gmail Facebook X LinkedIn More