Integrating automatic transcription into the language documentation workflow: Experiments with Na data and the Persephone toolkit - Inalco - Institut National des Langues et Civilisations Orientales Accéder directement au contenu
Article Dans Une Revue Language Documentation & Conservation Année : 2018

Integrating automatic transcription into the language documentation workflow: Experiments with Na data and the Persephone toolkit

Résumé

Automatic speech recognition tools have potential for facilitating language documentation, but in practice these tools remain little-used by linguists for a variety of reasons, such as that the technology is still new (and evolving rapidly), user-friendly interfaces are still under development, and case studies demonstrating the practical usefulness of automatic recognition in a low-resource setting remain few. This article reports on a success story in integrating automatic transcription into the language documentation workflow, specifically for Yongning Na, a language of Southwest China. Using PERSEPHONE, an open-source toolkit, a single-speaker speech transcription tool was trained over five hours of manually transcribed speech. The experiments found that this method can achieve a remarkably low error rate (on the order of 17%), and that automatic transcriptions were useful as a canvas for the linguist. The present report is intended for linguists with little or no knowledge of speech processing. It aims to provide insights into (i) the way the tool operates and (ii) the process of collaborating with natural language processing specialists. Practical recommendations are offered on how to anticipate the requirements of this type of technology from the early stages of data collection in the field.
Les outils de reconnaissance automatique de la parole possèdent un fort potentiel pour faciliter le travail de documentation linguistique, mais dans la pratique, ces outils restent peu utilisés par les linguistes, pour diverses raisons. Tout d’abord, ces technologies sont encore nouvelles ; elles évoluent rapidement, et il n’existe pas encore d’interfaces conviviales qui y donnent accès. En outre, les études de cas qui établiraient l’utilité pratique de la reconnaissance automatique dans un contexte de faibles ressources sont encore peu nombreuses. Le présent travail rend compte d’une expérience réussie d'intégration de la transcription automatique dans le travail de linguistique de terrain, avec pour objet le na de Yongning, une langue du sud-ouest de la Chine. À l'aide de Persephone, un outil dont le code source est ouvert, un modèle acoustique mono-locuteur permettant la transcription automatique de fichiers audio a été entraîné sur cinq heures de parole transcrite manuellement. Le taux d’erreur obtenu est remarquablement bas (de l'ordre de 17%), et les transcriptions automatiques s’avèrent utiles en tant que canevas pour le linguiste. Le présent rapport s’adresse aux linguistes novices en matière de traitement de la parole. Il vise à donner un aperçu du fonctionnement de l’outil, ainsi que du déroulement d’une collaboration avec des spécialistes du Traitement Automatique des Langues (TAL). Des recommandations pratiques sont proposées afin d’anticiper, dès les premières étapes de la collecte de données sur le terrain, l’éventualité d’un usage de ces outils.
Fichier principal
Vignette du fichier
AutomaticTranscription_Persephone_LDC2018.pdf (1.3 Mo) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Licence : CC BY NC - Paternité - Pas d'utilisation commerciale
Loading...

Dates et versions

halshs-01841979 , version 1 (17-07-2018)
halshs-01841979 , version 2 (06-09-2018)

Licence

Paternité - Pas d'utilisation commerciale

Identifiants

  • HAL Id : halshs-01841979 , version 2

Citer

Alexis Michaud, Oliver Adams, Trevor Cohn, Graham Neubig, Séverine Guillaume. Integrating automatic transcription into the language documentation workflow: Experiments with Na data and the Persephone toolkit. Language Documentation & Conservation, 2018, 12, pp.393-429. ⟨halshs-01841979v2⟩
513 Consultations
1159 Téléchargements

Partager

Gmail Facebook X LinkedIn More