Texto a audio
Con Texto a audio conviertes texto en un archivo de audio. Esto es útil para locuciones, videos instructivos, comunicación interna, material de capacitación y guiones.
Comienzo desde el panel
En el panel, selecciona bajo el campo de entrada Texto a audio. El campo de entrada se agranda para que puedas introducir guiones más largos con comodidad. Después puedes completar el texto y generar el audio.
Configuraciones
A través del botón de configuración junto al campo de entrada puedes ajustar las configuraciones de voz.
| Configuración | Explicación |
|---|---|
| Modelo | Elige el modelo de texto-a-voz. |
| Idioma | Elige el idioma en el que debe leerse el texto. |
| Voz | Elige una voz adecuada para el idioma seleccionado. |
| Systeemprompt | Proporciona instrucciones sobre pronunciación, tono, tempo, acento y términos especiales. |
| Referencia de estilo | Añade indicaciones adicionales sobre el estilo de habla deseado. |
La lista de voces se filtra por el idioma seleccionado. Si una voz está destinada solo a ciertos idiomas, verás ese idioma indicado junto a la voz.
Pronunciación y estilo
El systeemprompt indica cómo debe sonar la voz. Aquí, por ejemplo, puedes indicar:
- que el hablante suene como nativo del neerlandés;
- que palabras como AI, AI-Corporate, ChatGPT, OpenAI y Gemini se pronuncien en inglés;
- que Claude se pronuncie como un nombre francés;
- o que el tono deba ser tranquilo, cálido, profesional, informal, bajo o enérgico.
Cuando elijas otro idioma, AI-Corporate ajustará las instrucciones estándar a ese idioma.
Guardar y restaurar
Puedes guardar tus configuraciones en tu cuenta. AI-Corporate recordará entre otras cosas el modelo, el idioma, la voz y el systeemprompt. Con Restaurar predeterminado eliminarás estas preferencias guardadas.
Resultado
Después de generar, el archivo de audio aparece directamente en el chat. Puedes reproducirlo allí con el reproductor de audio y descargarlo con el botón de descarga.
Durante la generación, el formulario de entrada se desactivará temporalmente. Esto evita que múltiples generaciones de audio se superpongan.