TALEP - Traitement Automatique du Langage Écrit et Parlé

The team develops and releases the following software and linguistic resources for NLP applications:

Les données de la campagne d'évaluation CCCS sur le résumé de conversations (Fr, En, It)

Base de connaissances (synthèses, bilans critiques) sur les acquis descriptifs en grammaire et linguistique du français.

Une initiative pour le développement, l'enrichissement et la diffusion de ressources linguistiques fondamentales pour le TAL

Lexique électronique des valences verbales du français

Enregistrements et transcriptions du corpus Orfeo (environ 400h d'audio)

A neural network tagger based on LSTM-CRF for MWE identification.

Automatic classification of speech acts in child-caregiver conversations using CRFs, LSTMs and Transformers.

A generic tool for the automatic discovery of multiword expressions in corpora.