Accéder directement au contenu Accéder directement à la navigation
Pré-publication, Document de travail

La transcription du linguiste au miroir de l’intelligence artificielle : réflexions à partir de la transcription phonémique automatique

Résumé : Les systèmes de reconnaissance automatique de la parole atteignent désormais des degrés de précision élevés sur la base d'un corpus d'entraînement limité à deux ou trois heures d'enregistrements transcrits (pour un système mono-locuteur), au lieu de dizaines d'heures pour les outils antérieurs. Au-delà de l'intérêt pratique que présentent ces avancées technologiques pour les tâches de documentation linguistique, se pose la question de leur apport pour la réflexion du linguiste. En effet, le logiciel réalise son entraînement sur la base de transcriptions fournies en entrée par le linguiste, transcriptions qui reposent sur un ensemble d'hypothèses plus ou moins élaborées, et plus ou moins explicites. Le modèle acoustique, décalqué (par des méthodes statistiques) de l'écrit du linguiste, peut-il être interrogé par ce dernier, en un jeu de miroir ? Que peut nous apprendre la confrontation ainsi renouvelée avec le signal acoustique ? La présente étude s'appuie sur des exemples de langue na (famille sino-tibétaine) pour illustrer la façon dont l'analyse d'erreurs permet une confrontation renouvelée avec les données. Quelques réflexions au sujet d'expériences de transcription automatique de la langue tsuut'ina (famille dene) sont également présentées.
Type de document :
Pré-publication, Document de travail
Liste complète des métadonnées

Littérature citée [63 références]  Voir  Masquer  Télécharger

https://halshs.archives-ouvertes.fr/halshs-02881731
Contributeur : Alexis Michaud <>
Soumis le : vendredi 26 juin 2020 - 08:36:15
Dernière modification le : jeudi 2 juillet 2020 - 03:46:37

Fichiers

TranscriptionAutomatique_BullS...
Fichiers produits par l'(les) auteur(s)

Licence


Distributed under a Creative Commons Paternité - Pas d'utilisation commerciale - Partage selon les Conditions Initiales 4.0 International License

Identifiants

  • HAL Id : halshs-02881731, version 1

Citation

Alexis Michaud, Oliver Adams, Christopher Cox, Séverine Guillaume, Guillaume Wisniewski, et al.. La transcription du linguiste au miroir de l’intelligence artificielle : réflexions à partir de la transcription phonémique automatique. 2020. ⟨halshs-02881731⟩

Partager

Métriques

Consultations de la notice

86

Téléchargements de fichiers

63