Calame: Un outil de transcription pour tout le monde

Tout ce dont un flux de recherche ou d'application a besoin, de l'audio brut à la transcription structurée.

Calame preview
Calame preview
Calame preview
Calame preview
Calame preview

Pourquoi Calame

La pipeline de transcription
à l'état de l'art

Calame transforme vos entretiens et enregistrements terrain en transcriptions propres et structurées avec séparation des locuteurs, anonymisation et confidentialité complète.

Transcription

Transformez vos entretiens, groupes de discussion et enregistrements terrain en transcriptions précises en quelques minutes.

Whisper
Séparation de locuteurs

Identifiez et étiquetez automatiquement chaque locuteur pour savoir précisément qui a dit quoi.

Pyannote
Anonymisation

Calame détecte et masque les noms, lieux et informations identifiantes pour protéger les données personnelles.

Stanza

Tous les outils sont en libre accès sur Hugging Face

Performance

Transcription rapideen local

Temps de traitement (minutes) pour la transcription, la séparation de locuteurs, et au total pour des fichiers audio de différentes durées.
Hardware File tTRS tDIA t
i7-1260P 5 min 5.51 3.41 8.92
30 min 26.34 22.72 49.06
60 min 51.31 39.45 90.76
RTX 2070 5 min 3.24 0.39 3.63
30 min 24.99 4.30 29.29
60 min 38.32 13.24 51.56
RTX 4060 5 min 1.02 0.24 1.26
30 min 3.72 1.36 5.08
60 min 6.99 2.83 9.82

Configuration requise

Conçu pour tournersur une machine récente

12 Go

RAM

GPU / CPU

Supporté

Docker

Environnement

Directions futures

Axes de recherche actuels

Langues peu dotées

Extension du support au-delà du français québécois vers d'autres dialectes et langues sous-représentées.

Diarisation ciblée

Concentrer l'identification des locuteurs sur une seule personne participante ou sur l'ensemble du groupe, pour les entretiens individuels.

Multi-modèles

Choisir parmi plusieurs modèles de transcription ou de séparation de locuteurs pour améliorer la précision dans des conditions audio variées.

Collaboration

Partagez des projets, révisez les transcriptions ensemble et gérez les accès pour un travail de recherche collaboratif.

Nos Partenaires