Blog

Voxygen Cloud

Simplifiez-vous la vie et utilisez la synthèse vocale de Voxygen en mode SaaS : avec Voxygen Cloud, vous n’avez aucune intégration à réaliser.

Banque

Description de la solution

Pour un usage de la synthèse vocale en mode SaaS

Voxygen Cloud est un service SaaS disponible en 24/7 vous permettant de concevoir facilement et rapidement des applications vocales. Aucune intégration logicielle n’est requise ; vous sollicitez simplement notre API en envoyant des requêtes contenant le texte à vocaliser. Voxygen Cloud vous retourne alors la sortie audio en streaming pour qu’elle soit jouée instantanément et en temps réel par votre application. Vous pouvez également utiliser Voxygen Cloud pour produire vos contenus vocaux en toute autonomie en récupérant l’audio par un lien URL.Voxygen Cloud est la solution SaaS pour déployer simplement vos applications vocales automatisées, quel que soit votre cas d’usage : assistant vocal, publication de contenus vocaux, messages d’information ou d’alerte, applications d’e-learning, et bien d’autres encore.

Depositphotos_636873454_XL Moyenne

Fonctionnalités

Accès sécurisé par identifiant et mot de passe

Restitution au fil de l’eau avec faible latence (streaming)

Téléchargement des audios produits

Sélection de la langue et choix des voix

Contrôle des pauses, du débit, du timbre de la parole

Prise en compte de lexiques personnalisés

Ajout d’une musique de fond

Informations de synchronisation pour animation vidéo

La différence Voxygen

Souplesse d’intégration, sécurité et robustesse, personnalisation

Souplesse d’intégration

Nous rendons l'intégration de nos solutions aussi simple que possible. Avec des API standardisées et des interfaces conviviales, notre technologie s'intègre facilement à vos plateformes et applications existantes. Notre support est réactif et humain. Vous pouvez ainsi déployer rapidement et sereinement la synthèse vocale dans votre système pour apporter une nouvelle dimension à vos communications et interactions clients.

Sécurité et robustesse

Voxygen vous fournit un compte sécurisé par identifiant unique et mot de passe. Notre infrastructure est hébergée sur un cloud souverain européen. Nous nous engageons à ne pas stocker vos données d’interactions sauf si vous nous le demandez pour des raisons d’assistance. Notre infrastructure est haute disponibilité vous garantissant un accès permanent à notre service.

Personnalisation

Vous pourrez personnaliser votre synthèse vocale en associant aux voix des paramètres SSML pour adapter le rendu audio et des lexiques pour une prononciation correcte de vos termes métier. Vous pourrez synchroniser l’audio avec vos visuels grâce à la récupération d’événements liés au texte : marques de début/fin de phrases et mots.Voxygen fournit toute la documentation et le support nécessaire à la prise en main de la solution.

« L’interface Voxygen Studio est pratique et facile à utiliser. Elle répond tout à fait à mes besoins en termes de personnalisation et de flexibilité »

Capture d’écran 2023-11-17 à 14.54.35

Jean Philippe CHANTECAILLE

Chef de projet annonces sonores 

Identité de marque et Design

“L’interface Studio est user-friendly et la collaboration avec Voxygen est fluide”

photo moi valide

Marie Marquet

Administratrice Contact - Organisatrice déploiement 

« La collaboration avec Voxygen pendant ce projet de création de voix a été efficace, constructive, sympathique. »

Elsa Sibileau-Verdon

Marketing & communication

Marque et Médias

Intégration

Description de l’API

Format du texte d’entrée

Sortie audio

API REST

L’API de Voxygen Cloud est une API de type REST permettant à une application cliente d’envoyer une requête HTTPS contenant toutes les informations utiles à la vocalisation (texte à vocaliser, voix, format audio, …). Les requêtes HTTPS de type GET ou POST sont traitées instantanément et l’audio produit peut être immédiatement joué par l’application cliente.

Documentation technique

URL et compte utilisateur

Une URL spécifie l’adresse de l’API de Voxygen Cloud.

Pour accéder à Voxygen Cloud il faut disposer d’un compte utilisateur défini par un identifiant et un mot de passe.

Formats du texte

  • Texte brut encodé en UTF-8
  • Document SSML (versions 1.0 et 1.1)

 

Lexiques

  • Format PLS version 1.0

Sortie audio

  • Fréquence d’échantillonnage de 6 kHz à 48 kHz
  • Formats

           - PCM (RAW, WAV et AU) en linéaire 16 bits ou en G.711 (loi A, loi μ)

           - MP3 : débit 16, 31, 64, 96, 128, ou 160kbit/s ; qualité de 0 à 9

           - OGG : qualité de 0.0 à 1.0

Evénements de synchronisation

  • Visèmes
  • Mots

Transformez le texte en parole instantanément !

Découvrez notre solution TTS de pointe, parfaitement adaptée à vos besoins et facilement intégrable.

Personnalisable

100 % français

Scalable

Design_sans_titre__7_-removebg-preview