- Introducción.
- Seis herramientas gratuitas de IA para generar discursos
- VOICEVOX | Síntesis de voz para cantar gratis
- CoeFont | Crea gratis tu propia voz AI
- Speechify | también disponible como extensión de Google Chrome
- SoftTalk | Disponible en portátiles antiguos
- Mr. Read Aloud | Generación de voz en el navegador
- VALL-E X (Microsoft)| Traducción al inglés y al chino también disponible
- Textok | Software de lectura de documentos en japonés que funciona sólo en sistemas operativos Windows.
- 9 herramientas de pago de IA generada por voz
- VOICEPEAK | Juego de 6 narradores de modelos de compra
- CoeStation | Audio de famosos disponible
- AITalk | Generación de habla japonesa más humana
- Murf.AI | Para los que quieren crear vídeos al mismo tiempo
- ReadSpeaker | 45 idiomas
- Espacio de voz | También es posible cambiar la voz y generar avatares.
- Text-to-Speech AI | Herramientas de IA de alto rendimiento para la generación de voz de Google
- Koemotion | Puede combinarse con Face Motion
- VoxBox | Convertir imágenes/PDF/texto en audio
- resumen
Introducción.
En este artículo se enumeran las herramientas de IA generada por voz, divididas en gratuitas y de pago, y se presentan sus características, tarifas y URL de los sitios web oficiales. Utilízalo como referencia para elegir una herramienta.
Seis herramientas gratuitas de IA para generar discursos
nombre del servicio | Características | Cargos. | localizador de recursos uniformes |
---|---|---|---|
VOICEVOX. | Se pueden probar la generación de voces de personajes y versiones prototipo de voces cantadas. Compatible con Windows / Mac / Linux. | Totalmente gratuito (para uso comercial y no comercial) | https://voicevox.hiroshiba.jp/ |
CoeFont STUDIO | Puede sintetizarse utilizando las voces de locutores y actores de doblaje. También puede generar su propia voz. | Plan gratuito: el audio generado no puede utilizarse con fines comerciales. Plan estándar: 3.300 yenes al mes. Plan Plus: consultar. | https://coefont.cloud/ |
Speechify | Especializado en conversión de texto a voz. Se puede utilizar soporte multilingüe para apoyar el aprendizaje. Extensión de Google Chrome incluida. | Plan gratuito Plan de pago (139 $ al año) | https://speechify.com/ja/ |
SoftTalk | Una sencilla herramienta de generación de voz que funciona a la ligera. | totalmente gratis | https://w.atwiki.jp/softalk |
leer en voz alta | Fácil generación de audio en el navegador. Puede utilizarse con fines comerciales. | Plan de prueba: gratuito Los planes varían en función del número de caracteres leídos. Plan básico: 980 yenes al mes Plan Value: 1.980 yenes al mes Plan Premium: 2.980 yenes al mes | https://ondoku3.com/ja/ |
VALL-E X | Puede reflejar tanto la expresión emocional como la conversión de la voz – Generación de voz a partir de muestras de voz de 3 segundos – Traducción al inglés y al chino | gratis | https://www.microsoft.com/en-us/research/project/vall-e-x/overview/ |
VOICEVOX | Síntesis de voz para cantar gratis
Características
- Generación gratuita de voces de personajes. Se pueden probar voces de UI y de canto sencillas. Síntesis de texto a voz y voz cantada de calidad media.
- Hay 30 personajes disponibles como altavoces, que pueden utilizarse según las características del habla de cada personaje.
Tarifa: Totalmente gratuita.
URL:https://voicevox.hiroshiba.jp/
CoeFont | Crea gratis tu propia voz AI
Características
- Es posible generar narraciones utilizando la voz de un locutor o actor de doblaje.
- También puedes crear una voz AI simplemente grabando 50 frases y 5 minutos de tu propia voz.
Tarifa: Planes gratuitos disponibles (el audio generado no puede utilizarse con fines comerciales).
URL:https://coefont.cloud/
Speechify | también disponible como extensión de Google Chrome
Características
- Texto a voz (TTS), que lee el texto en voz alta. Puede leer en voz alta información textual variada, incluidos artículos y PDF.
- Puede añadirse como extensión a Google Chrome, así como a iPhone, por lo que también es adecuado para quienes deseen leer texto en inglés en su PC.
Cuota: Planes gratuitos disponibles. Plan de pago (139 $ al año).
URL:https://speechify.com/ja/
SoftTalk | Disponible en portátiles antiguos
Características
- Herramienta de generación de voz sencilla y ligera. Puede utilizarse en PC antiguos.
- Función de lectura de frases que contienen caracteres chinos e ingleses.
- Una función de “oreja en blanco” que obliga al motor de síntesis de voz “Microsoft Sam”, que sólo puede hablar inglés, a hablar japonés.
- MeCab: motor de análisis morfológico y tdmelodic: compatible con el diccionario de acentos altos y bajos del dialecto de Tokio.
Tarifa: Gratuita
URL:https://w.atwiki.jp/softalk
Mr. Read Aloud | Generación de voz en el navegador
Características
- Fácil generación de voz en el navegador sin necesidad de instalación.
- El audio generado puede descargarse en formato mp3.
- SSML, un lenguaje de marcado del habla, está disponible.
- disponible para uso comercial
Cargos.
- Plan de prueba: gratuito
- Plan básico: ¥ 980/mes (lectura de 200.000 caracteres/mes)
- Plan Value: 1.980 yenes al mes (450.000 caracteres legibles al mes)
- Plan Premium: ¥ 2.980/mes (1.000.000 caracteres legibles/mes)
URL:https://ondoku3.com/ja/
VALL-E X (Microsoft)| Traducción al inglés y al chino también disponible
Características
- 2023 La IA generada por voz de Microsoft disponible públicamente, que no sólo convierte voces sino que también puede reflejar la expresión emocional.
- Puede sintetizar el habla a partir de muestras de voz de sólo tres segundos.
- Traducción al inglés y al chino (introduciendo “English speaking voice” y “Chinese text”, se puede hacer que la voz reproducida lea en chino).
- disponible para uso comercial
Tarifa: Gratuita
URL:https://www.microsoft.com/en-us/research/project/vall-e-x/overview/
Textok | Software de lectura de documentos en japonés que funciona sólo en sistemas operativos Windows.
Características
- Herramienta gratuita de inteligencia artificial para japonés.
- Las voces que se pueden generar son voces masculinas y femeninas.
- Sólo compatible con los sistemas operativos Windows 10/8/7/Vista (no compatible con Mac).
Tarifa: Gratuita
URL:https://gui.jp.net/textalk/
9 herramientas de pago de IA generada por voz
nombre del servicio | Características | Cargos. | localizador de recursos uniformes |
---|---|---|---|
VOZ ALTA. | Voces de personajes ricas en emociones. | Edición normal: 29.800 yenes (precio de compra) Versión para descargar: 23.800 yenes (buy-out) | https://www.ah-soft.com/voice/6nare/ |
Estación de Coe | Se pueden crear voces de famosos y voces personalizadas. También es compatible con una aplicación para smartphone. | Desde 55.000 yenes al mes | https://coestation.jp/ |
AITalk | Sistema de síntesis de voz para el mercado japonés, capaz de generar una gran variedad de patrones de voz. | Solicitud de información | https://www.ai-j.jp/ |
Murf.AI | Posibilidad de narración de vídeo y expresión emocional de tipo humano. Admite el ajuste del tono de voz. | Desde 19 $/mes. | https://murf.ai/ |
ReadSpeaker | Servicio multilingüe de generación de voz, para educación y marketing. | Solicitud de información | https://readspeaker.jp/ |
Espacio de voz | Ofrece traducción multilingüe y cambio de voz, y más de 200 voces de IA. | Solicitud de información | https://www.voice-space.com/ |
AI de texto a voz | La herramienta de inteligencia artificial generada por voz de alto rendimiento de Google. | Se cobra mensualmente en función del número de caracteres enviados al servicio de texto a voz | https://cloud.google.com/text-to-speech?hl=ja |
Koemotion. | Funciona con el movimiento facial para generar voces de personajes realistas. | – Koemotion Trial: gratis – Koemotion Light: 550 yenes / mes – Koemotion Standard: 3.300 yenes / mes – Koemotion Business: a partir de 18.000 yenes / mes | https://koemotion.com/ |
VoxBox | Herramienta multifuncional con excelentes capacidades de edición de audio. | – Versión de prueba gratuita: 0 yenes (hasta 2.000 caracteres) – Versión completa: a partir de 2.580 yenes (más de 260.000 caracteres) | https://www.imyfone.com/voice-generator/ |
VOICEPEAK | Juego de 6 narradores de modelos de compra
Características
- 6 juegos de narradores disponibles para uso comercial.
- Aunque la mayoría de los servicios comerciales tienen un modelo de suscripción o pago por uso
Tarifa: a partir de 23.800 yenes (buy-out).
URL:https://www.ah-soft.com/voice/6nare/
CoeStation | Audio de famosos disponible
Características
- Puede crear voces personalizadas de famosos y originales. También disponible en aplicaciones para smartphone.
Cargos.
- CoeStation (aplicación para smartphone): gratuita.
- Editor: ¥ 55.000/mes (con 2 koe japonesas, uso ilimitado)
- Web API: 77.000 yenes/mes (con 2 coeficientes japoneses, hasta 100.000 solicitudes) *11.000 yenes por 100.000 solicitudes a partir de entonces (impuestos incluidos).
URL:https://coestation.jp/
AITalk | Generación de habla japonesa más humana
Características
- Sistemas de conversión de texto en voz para el mercado japonés. Admite diversas situaciones de habla.
- Combina el “método de síntesis de conexión de forma de onda” convencional con el “nuevo método de síntesis del habla DNN” que utiliza la última tecnología de aprendizaje profundo, lo que permite una generación del habla más parecida a la humana.
Tasa: previa solicitud.
URL:https://www.ai-j.jp/
Murf.AI | Para los que quieren crear vídeos al mismo tiempo
Características
- Es posible la conversión de voz en tiempo real.
- Texto a voz preciso en más de120 voces y 20 idiomas
- Procesamiento de vídeo y audio en tiempo real, funciones de tono y énfasis y controles de puntuación para mayor realismo.
- Adecuado para personas que desean crear vídeo al mismo tiempo, ya que también se puede crear vídeo.
Precio: desde 19 $/mes (también se ofrecen planes gratuitos a modo de prueba).
URL:https://murf.ai/
ReadSpeaker | 45 idiomas
Características
- Servicio multilingüe de generación de voz, utilizado para aplicaciones educativas y de marketing.
- Generación global de voz para 45 idiomas.
- Alrededor de 80 altavoces para una gran variedad de situaciones
Tasa: previa solicitud.
URL:https://readspeaker.jp/
Espacio de voz | También es posible cambiar la voz y generar avatares.
Características: traducción multilingüe y cambio de voz; proporciona más de 200 voces de IA; puede utilizarse con una amplia gama de idiomas; puede utilizarse con una amplia gama de idiomas; puede utilizarse con una amplia gama de voces.
Cargos.
- Plan libre: gratuito
- Plan Creador: ¥ 3.000/mes (pago único anual) Uso comercial permitido.
- Plan de negocio: 21.000 JPY/mes (pago único anual)
- Plan de empresa: previa solicitud.
URL:https://voicespace.ai/
Text-to-Speech AI | Herramientas de IA de alto rendimiento para la generación de voz de Google
Características
- Dispone de varias funciones, como la conversión de texto a voz en tiempo real, la salida con entonación natural y la generación multilingüe.
- Tarifas de pago por uso basadas en el número de caracteres de texto a voz, con un precio razonable
Cargos.
- Se cobra mensualmente en función del número de caracteres enviados al servicio para la síntesis de voz.
- El primer millón de caracteres de audio WaveNet son gratis cada mes
- Los primeros 4 millones de caracteres al mes son gratuitos para todas las voces estándar excepto WaveNet
- Se cobra por millón de caracteres después de la cuota gratuita
URL:https://cloud.google.com/text-to-speech?hl=ja
Koemotion | Puede combinarse con Face Motion
Características
- Es posible la generación de voz combinada con el movimiento de la cara.
- Se puede generar la función de síntesis del habla AI y el movimiento de la cara sincronizado con el habla sintetizada, y combinado con modelos 2D, modelos 3D y AI de generación de imágenes, se pueden mover las expresiones faciales del personaje de acuerdo con el habla generada.
Cargos.
- Prueba de Koemotion: gratuita.
- Koemotion Light: 550 yenes / mes
- Koemotion Standard: 3.300 yenes / mes.
- Koemotion Business: desde 18.000 JPY / mes
URL:https://koemotion.com/
VoxBox | Convertir imágenes/PDF/texto en audio
Características
- Puede convertir imágenes/PDF/texto a voz y admite más de 70 idiomas
Cargos.
- Versión de prueba gratuita: 0 yenes (hasta 2.000 caracteres para leer en voz alta).
- Versión completa: a partir de ¥2.580 (compra; más de 260.000 palabras por leer).
URL:https://jp.imyfone.com/voice-generator/
resumen
Aunque las herramientas gratuitas son fáciles de probar, suelen estar limitadas en el número de usos y funciones. Las herramientas de pago, en cambio, son muy personalizables y pueden utilizarse con fines comerciales, lo que las hace ideales para la creación de marcas corporativas y la atención al cliente. En función de su aplicación y presupuesto, debe elegir correctamente entre herramientas gratuitas y de pago.