Blog

Voxygen TTS Cloud

Simplifiez-vous la vie et utilisez la synthèse vocale de Voxygen en mode SaaS : avec Voxygen Cloud, vous n’avez aucune intégration à réaliser.

Banque

Description de la solution

Pour un usage de la synthèse vocale en mode SaaS

Voxygen Cloud est un service SaaS disponible en 24/7 vous permettant de concevoir facilement et rapidement des applications vocales. Aucune intégration logicielle n’est requise ; vous sollicitez simplement notre API en envoyant des requêtes contenant le texte à vocaliser. Voxygen Cloud vous retourne alors la sortie audio en streaming pour qu’elle soit jouée instantanément et en temps réel par votre application. Vous pouvez également utiliser Voxygen Cloud pour produire vos contenus vocaux en toute autonomie en récupérant l’audio par un lien URL. Voxygen Cloud est la solution SaaS pour déployer simplement vos applications vocales automatisées, quel que soit votre cas d’usage : assistant vocal, publication de contenus vocaux, messages d’information ou d’alerte, applications d’e-learning, et bien d’autres encore.

Depositphotos_636873454_XL Moyenne

Fonctionnalités

Nuage_orange_petit

Accès sécurisé par identifiant et mot de passe

Nuage_rose_petit

Restitution au fil de l’eau avec faible latence (streaming)

Nuage_violet_petit

Téléchargement des audios produits

Nuage_bleu_F_petit

Sélection de la langue et choix des voix

Nuage_bleu_C_petit

Contrôle des pauses, du débit, de l'intonation et du timbre de la parole

Nuage_vert

Prise en compte de lexiques personnalisés

Nuage_orange

Ajout d’une musique de fond

Nuage_rose_petit

Informations de synchronisation pour animation vidéo

Pourquoi Voxygen TTS

Souplesse d’intégration, sécurité et robustesse, personnalisation

Nuage_rose-Feb-29-2024-05-06-46-3690-PM

Souplesse d’intégration

Nous rendons l'intégration de nos solutions TTS aussi simple que possible. Avec des API standardisées et des interfaces conviviales, notre technologie s'intègre facilement à vos plateformes et applications existantes. Notre support est réactif et humain. Vous pouvez ainsi déployer rapidement et sereinement la synthèse vocale dans votre système pour apporter une nouvelle dimension à vos communications et interactions clients.

Nuage_violet-Feb-29-2024-03-51-12-3433-PM

Sécurité et robustesse

Voxygen vous fournit un compte sécurisé par identifiant unique et mot de passe. Notre infrastructure est hébergée sur un cloud souverain européen. Nous nous engageons à ne pas stocker vos données d’interactions sauf si vous nous le demandez pour des raisons d’assistance. Notre infrastructure est haute disponibilité vous garantissant un accès permanent à notre service TTS.

Nuage_bleu-Feb-29-2024-03-52-23-5042-PM

Personnalisation

Vous pourrez personnaliser votre synthèse vocale en associant aux voix des paramètres SSML pour adapter le rendu audio et des lexiques pour une prononciation correcte de vos termes métier. Vous pourrez synchroniser l’audio avec vos visuels grâce à la récupération d’événements liés au texte : marques de début/fin de phrases et mots.

« Voxygen nous propose des solutions fiables et personnalisées pour couvrir l'ensemble de nos besoins »

Capture d’écran 2023-11-17 à 14.54.35

Jean Philippe CHANTECAILLE

Chef de projet annonces sonores 

Identité de marque et Design

« La collaboration avec Voxygen pendant ce projet de création de voix a été efficace, constructive, sympathique. »

Elsa Sibileau-Verdon

Marketing & communication

Marque et Médias

Intégration

Description de l’API

Format du texte d’entrée

Sortie audio

API REST

L’API de Voxygen Cloud est une API de type REST permettant à une application cliente d’envoyer une requête HTTPS contenant toutes les informations utiles à la vocalisation (texte à vocaliser, voix, format audio, …). Les requêtes HTTPS de type GET ou POST sont traitées instantanément et l’audio produit peut être immédiatement joué par l’application cliente.

Documentation technique

URL et compte utilisateur

Une URL spécifie l’adresse de l’API de Voxygen Cloud.

Pour accéder à Voxygen Cloud il faut disposer d’un compte utilisateur défini par un identifiant et un mot de passe.

Formats du texte

  • Texte brut encodé en UTF-8
  • Document SSML (versions 1.0 et 1.1)

 

Lexiques

  • Format PLS version 1.0

Sortie audio

  • Fréquence d’échantillonnage de 6 kHz à 48 kHz
  • Formats

           - PCM (RAW, WAV et AU) en linéaire 16 bits ou en G.711 (loi A, loi μ)

           - MP3 : débit 16, 31, 64, 96, 128, ou 160kbit/s ; qualité de 0 à 9

           - OGG : qualité de 0.0 à 1.0

Evénements de synchronisation

  • Visèmes
  • Mots

Transformez le texte en parole instantanément !

Découvrez notre solution TTS de pointe, parfaitement adaptée à vos besoins et facilement intégrable.

Personnalisable

100 % français

Scalable

Design_sans_titre__7_-removebg-preview