Voxygen Cloud - synthèse vocale

Voxygen Cloud est un service qui transforme le texte en parole expressive comparable à la voix humaine et génère des messages audios de haute qualité dans une variété de langues.

Grâce à son API facile à utiliser, Voxygen Cloud peut vous aider à enrichir vos interactions vocales, à apporter de la couleur et de la personnalité à vos contenus et à vous permettre de vous connecter avec vos clients comme jamais auparavant.

Extrêmement facile à intégrer à toutes les solutions et produits existants, Voxygen Cloud vous permet de réinventer l'expérience client et de créer de nouveaux services.

Description de l'API TTS

L'API Voxygen Cloud est une API de type "REST". Toute application cliente peut envoyer du texte à vocaliser par le biais d'une requête HTTP contenant toutes les informations nécessaires et des paramètres optionnels (voix, format audio, débit de parole, accord de hauteur, ...). Le service répond immédiatement avec les données audios vocales correspondantes.

Une URL principale spécifie l'adresse réseau du service API.

Un compte utilisateur est nécessaire pour accéder au service Voxygen Cloud. Le compte utilisateur est défini par un login et un mot de passe. L'application cliente doit définir la valeur du login dans chaque requête au service. Le mot de passe ne doit jamais être envoyé à Voxygen Cloud. L'application cliente utilise le mot de passe pour calculer un HMAC et définit cette valeur HMAC dans chaque demande.

Texte d'entrée, SSML et PLS

Voxygen Cloud est conforme aux recommandations Speech Synthesis Mark-up Language (SSML 1.0 et 1.1) et Pronunciation Lexicon Specification (PLS 1.0) définies par le W3C.

L'API accepte les entrées sous forme de texte brut ou de SSML (codé UTF-8), ce qui vous permet de contrôler entièrement plusieurs aspects de la parole, tels que les pauses, les prononciations spécifiques, les acronymes, les chiffres, les dates, etc.

Vous pouvez également régler le débit, la hauteur ou le volume de la parole.

Des balises SSML supplémentaires peuvent également être ajoutées dans le texte afin de personnaliser davantage la sortie des messages audio, comme l'ajout d'une musique de fond, les commandes de fondu audio ou la synchronisation.

Flexibilité des formats audio

Voxygen Cloud vous permet de choisir parmi plusieurs formats audios tels que .RAW, .WAV, .AU, .MP3 ou .OGG.

Formats Codage
.RAW, .WAV, .AU 16 bits, PCM, G.711 (A-law, μ-law)
.MP3 Bitrate 16,31, 64, 96, 128 ou 160. Qualité de 0 à 9
.OGG Qualité de 0.0 à 1.0

Pour tous les formats, la sortie du signal vocal peut être échantillonnée à n'importe quelle fréquence de 6kHz à 48kHz. Le signal vocal peut être mélangé avec des fichiers audio externes.

Langues prises en charge dans la synthèse vocale

Les langues suivantes sont prises en charge par Voxygen Cloud :

Langues Variante
Français France, Belgique, Suisse,
Sénégal, Côte d’Ivoire, Cameroun, Niger
accent américain
Anglais Royaume-Uni, États-Unis
Allemand
Espagnol
Italien
Néerlandais Pays-Bas, Belgique flamande
Portuguais Brésil, Portugal
Arabe MSA, Maroc
Turc
Wolof
Swahili

Voxygen Server - TTS

Voxygen Server est votre solution de synthèse vocale on-premise. Elle offre les mêmes fonctionnalités que Voxygen Cloud en vous assurant une maîtrise totale sur le contrôle et le traitement de vos données. Hautement scalable, elle vous permet de dimensionner votre service selon l'évolution de vos besoins en terme de volume de requêtes, langues, voix...

Voxygen Studio

Voxygen Studio est le compagnon idéal de Voxygen Cloud. Il offre une interface utilisateur graphique facile à utiliser qui vous permet de préparer le texte, d'adapter les silences et les pauses, de modifier la prononciation de mots spécifiques et d'introduire d'autres balises SSML, afin de créer des messages audios de haute qualité, avec les voix expressives de Voxygen.

Son interface graphique facile à utiliser, accessible via un navigateur web, vous donne accès à de nombreuses fonctions d'édition et d'optimisation de l'audio afin de tirer pleinement parti du TTS de Voxygen.

Une interface de TTS SaaS facile à utiliser

interface

Principales fonctionnalités

Une fois la langue et la voix choisies, vous pouvez commencer à éditer le texte de votre message et :

  • écouter l'audio généré pour le message complet ou une partie du message
  • changer la voix utilisée pour le message complet ou une partie du message
  • éditer et modifier le texte
  • ajouter, supprimer ou modifier la durée des silences
  • modifier la phonétique des mots
  • ajouter des exceptions phonétiques dans les lexiques
  • accorder la sélection acoustique
  • modifier le débit de la voix
  • ajouter un fond musical
  • régler le volume audio final
  • écouter le résultat audio final avant de l'exporter
  • exporter le résultat du réglage dans un fichier SSML
  • exporter l'audio généré dans l'un des nombreux formats disponibles

Votre voix personnalisée

Expertise et réactivité

Au fil des années, Voxygen a développé un savoir-faire et une expertise uniques pour produire des voix personnalisées et des voix de marque de la plus haute qualité, adaptées aux besoins des clients. Le processus de création de voix de Voxygen a été éprouvé et optimisé pour vous proposer un service fluide et rapide pour le lancement de votre Voix de marque dans le respect vos contraintes.

Enrichissement de la voix

Une fois développées, les voix expressives de Voxygen peuvent aussi être encore enrichies en incorporant du vocabulaire spécifique à un domaine, des éléments paralinguistiques ou une expressivité supplémentaire grâce à des fonctionnalités de pointe (lexiques intelligents, corpus spécifiques au domaine, voix multilingues). Votre investissement est toujours protégé.

Un contrôle total de votre voix

Non seulement votre voix personnalisée est créée pour refléter votre identité et enrichie pour répondre à vos besoins, mais la technologie et les outils de Voxygen vous donnent également un contrôle total pour affiner vos messages, grâce à des interfaces standard de haut niveau (SSML, PLS).

En savoir plus sur la conformité aux normes SSML.