The team develops and releases the following software and linguistic resources for NLP applications:

Call-Center Conversation Summarization data (CCCS)

Les données de la campagne d'évaluation CCCS sur le résumé de conversations (Fr, En, It)

Encyclopédie grammaticale du français

Base de connaissances (synthèses, bilans critiques) sur les acquis descriptifs en grammaire et linguistique du français.

FondamenTAL

Une initiative pour le développement, l'enrichissement et la diffusion de ressources linguistiques fondamentales pour le TAL

LEXVALF

Lexique électronique des valences verbales du français

Orfeo

Enregistrements et transcriptions du corpus Orfeo (environ 400h d'audio)

Veyn

A neural network tagger based on LSTM-CRF for MWE identification.

childes-speech-acts

Automatic classification of speech acts in child-caregiver conversations using CRFs, LSTMs and Transformers.

mwetoolkit

A generic tool for the automatic discovery of multiword expressions in corpora.