Resources
The team develops and releases the following software and linguistic resources for NLP applications:
Call-Center Conversation Summarization data (CCCS)
Les données de la campagne d'évaluation CCCS sur le résumé de conversations (Fr, En, It)
Encyclopédie grammaticale du français
Base de connaissances (synthèses, bilans critiques) sur les acquis descriptifs en grammaire et linguistique du français.
FondamenTAL
Une initiative pour le développement, l'enrichissement et la diffusion de ressources linguistiques fondamentales pour le TAL
LEXVALF
Lexique électronique des valences verbales du français
Orfeo
Enregistrements et transcriptions du corpus Orfeo (environ 400h d'audio)
Veyn
A neural network tagger based on LSTM-CRF for MWE identification.
childes-speech-acts
Automatic classification of speech acts in child-caregiver conversations using CRFs, LSTMs and Transformers.
mwetoolkit
A generic tool for the automatic discovery of multiword expressions in corpora.