Détection d'anomalies textuelles à base de l'ingénierie d'invite - Inalco - Institut National des Langues et Civilisations Orientales Accéder directement au contenu
Communication Dans Un Congrès Année : 2022

Prompt Engineering-Based Text Anomaly Detection

Détection d'anomalies textuelles à base de l'ingénierie d'invite

Résumé

Text anomaly detection is an important text mining task. Many outlier identification methods have been applied in this field. However, these approaches have hardly benefited from recent Natural Language Processing (NLP) advances. The advent of pre-trained language models like BERT and GPT-2 has given rise to a new machine learning paradigm called prompt engineering, which has shown good performance on many NLP tasks. This article presents an exploratory work aimed at examining the possibility of detecting text anomaly using prompt engineering. In our experiments, we have examined the performance of different prompt templates. The results showed that prompt engineering is a promising method for text anomaly detection.
La détection d'anomalies textuelles est une tâche importante de la fouille de textes. Plusieurs approches générales, visant l'identification de points de données aberrants, ont été appliqués dans ce domaine. Néanmoins, ces approches exploitent peu les nouvelles avancées du traitement automatique des langues naturelles (TALN). L'avènement des modèles de langage pré-entraînés comme BERT et GPT-2 a donné naissance à un nouveau paradigme de l'apprentissage automatique appelé ingénierie d'invite (prompt engineering) qui a montré de bonnes performances sur plusieurs tâches du TALN. Cet article présente un travail exploratoire visant à examiner la possibilité de détecter des anomalies textuelles à l'aide de l'ingénierie d'invite. Dans nos expérimentations, nous avons examiné la performance de différents modèles d'invite. Les résultats ont montré que l'ingénierie d'invite est une méthode prometteuse pour la détection d'anomalies textuelles.
Fichier principal
Vignette du fichier
2022.jeptalnrecital-taln.4.pdf (305.37 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-04053932 , version 1 (31-03-2023)

Identifiants

  • HAL Id : hal-04053932 , version 1

Citer

Yizhou Xu, Kata Gábor, Leila Khouas, Frédérique Segond. Détection d'anomalies textuelles à base de l'ingénierie d'invite. TALN 2022 - 29e Conférence sur le Traitement Automatique des Langues Naturelles, Association pour le Traitement Automatique des Langues, Jun 2022, Avignon, France. ⟨hal-04053932⟩
145 Consultations
143 Téléchargements

Partager

Gmail Facebook X LinkedIn More