Voxygen STT Studio

Voxygen STT Studio est une solution d'alignement permettant de retrouver les instants où sont prononcés des mots dans un fichier audio. A partir de l'audio et de sa transcription,Voxygen STT Studio fournit les instants de début et de fin de chaque mot. Il devient alors très facile de générer des sous-titres automatiquement ou alors de retrouver l'endroit précis où un mot-clé a été prononcé.

 

Ce service est disponible en SaaS ou peut être installé sur vos serveurs.

 

Caractéristiques techniques :

 

Protocole :

 

HTTP-REST, intégration rapide grâce aux standards d'Internet

Authentification: 

 

Par HMAC

Format audio-visuels :

 

La majorité des formats audio-visuels. Liste complète sur https://ffmpeg.org/general.html#File-Formats

Format de sortie :

 

fichier SRT, XML ou TXT contenant les mots et les time-codes

 

Pour en savoir plus, contactez-nous.