Ir al contenido principal

Texto a audio

Con Texto a audio conviertes texto en un archivo de audio. Esto es útil para locuciones, videos instructivos, comunicación interna, material de capacitación y guiones.

Comienzo desde el panel

En el panel, selecciona bajo el campo de entrada Texto a audio. El campo de entrada se agranda para que puedas introducir guiones más largos con comodidad. Después puedes completar el texto y generar el audio.

Configuraciones

A través del botón de configuración junto al campo de entrada puedes ajustar las configuraciones de voz.

ConfiguraciónExplicación
ModeloElige el modelo de texto-a-voz.
IdiomaElige el idioma en el que debe leerse el texto.
VozElige una voz adecuada para el idioma seleccionado.
SysteempromptProporciona instrucciones sobre pronunciación, tono, tempo, acento y términos especiales.
Referencia de estiloAñade indicaciones adicionales sobre el estilo de habla deseado.

La lista de voces se filtra por el idioma seleccionado. Si una voz está destinada solo a ciertos idiomas, verás ese idioma indicado junto a la voz.

Pronunciación y estilo

El systeemprompt indica cómo debe sonar la voz. Aquí, por ejemplo, puedes indicar:

  • que el hablante suene como nativo del neerlandés;
  • que palabras como AI, AI-Corporate, ChatGPT, OpenAI y Gemini se pronuncien en inglés;
  • que Claude se pronuncie como un nombre francés;
  • o que el tono deba ser tranquilo, cálido, profesional, informal, bajo o enérgico.

Cuando elijas otro idioma, AI-Corporate ajustará las instrucciones estándar a ese idioma.

Guardar y restaurar

Puedes guardar tus configuraciones en tu cuenta. AI-Corporate recordará entre otras cosas el modelo, el idioma, la voz y el systeemprompt. Con Restaurar predeterminado eliminarás estas preferencias guardadas.

Resultado

Después de generar, el archivo de audio aparece directamente en el chat. Puedes reproducirlo allí con el reproductor de audio y descargarlo con el botón de descarga.

Durante la generación, el formulario de entrada se desactivará temporalmente. Esto evita que múltiples generaciones de audio se superpongan.