Círculo Plus Sanborns» Revista

VALL-E: La IA capaz de imitar voces

Entretenimiento

16 ene 2023 Iván González

VALL-E es el nombre de la nueva aplicación de Inteligencia Artificial que pronto lanzará Microsoft y que es capaz de imitar cualquier voz a partir de apenas 3 segundos de una grabación cualquiera.

Las utilidades de esto pueden ser infinitas, hace tiempo se busca que los asistentes personales como Alexa o Google Home puedan tener la voz que deseen sus dueños, al punto de fantasear con poder revivir la voz de personas ya fallecidas.

VALL-E logra todo esto con tan poca información porque es capaz de reunir herramientas de otras inteligencias como la síntesis de texto a voz (TTS), edición de discursos e imitadores de la estructura del habla humana. Esto le permite tener claro cuál es el orden lógico de un discurso y los patrones que existen al mostrar emociones en la forma de pronunciarlo como el enojo o el cansancio, emociones que puede imitar de igual manera.

Además, la idea es que cuando esta inteligencia artificial esté lo suficientemente desarrollada, esta pueda combinarse con la tecnología de los ChatGPT, famosos por su capacidad de crear texto con información básica y simular una conversación con otra persona.

Here’s the recipe to make Siri/Alexa 10x better:

1. Whisper to convert speech to text. Best open-source speech model out there.
2. ChatGPT to generate smart home API calls and/or text response.
3. VALL-E to synthesize speech. It can mimic anyone’s voice sample!

Quick figure 1/3 pic.twitter.com/6JlkdwOpS6
— Jim Fan (@DrJimFan) January 9, 2023

Es decir, con el tiempo, este simulador de voz también podrá simular una conversación, haciendo sentir al usuario que está hablando con la persona cuya voz ha sido registrada, incluso si ambos estímulos provienen, más bien, de la inteligencia artificial.

La compañía responsable de VALL-E ha hecho una fuerte apuesta a productos con Inteligencia Artificial, incorporándolos a sus productos tradicionales: su primer lanzamiento fue DALL-E capaz de generar imágenes inéditas con unas pocas indicaciones, la cual fue incorporado a la App Designer, el segundo Chat GPT que será incorporado al buscador Bing este año y competirá duramente contra Google en un terreno en el que parecía no tener competidor.

Otras utilidades tendrán obviamente que ver con la generación de contenido de todo tipo (contenido por redes sociales, podcasts, por ejemplo, entre otras posibilidades) pero dispararán unos cuántos debates interesantes: ¿Es la voz de una persona algo propio que puede usarse sin su permiso? ¿Se termina las grabaciones de voz como una prueba? ¿Cualquiera puede usar la voz de otra persona sin su permiso?

El modelo aún no se encuentra disponible para su uso, pero sí existen ejemplos para consulta de como VALL-E logra registrar emociones humanas reflejadas en el discurso con tan solo tres segundos de audio y manifestarlas en su simulación de voz.

Surprised there isn't more chatter around VALL-E

This new model by @Microsoft can generate speech in any voice after only hearing a 3s sample of that voice 🤯

Demo → https://t.co/GgFO6kWKha pic.twitter.com/JY88vf4lYc
— Steven Tey (@steventey) January 9, 2023

Mantente conectado con lo que sucede en el mundo con la mejor tecnología que sólo Sanborns tiene para ti, da click AQUÍ.

VALL-E: La IA capaz de imitar voces

Recomendado

FYJA presenta Inmersiones FYJA 2026. Miradas del jardín mexicano: casa, ciudad y territorio

Descubren contexto ritual maya milenario en Yaxché de Peón, Yucatán

"La niña en el altar", de Marina Carr, llega al Teatro El Galeón bajo la dirección de Enrique Singer

Cineteca Nacional presenta muestra de patrimonio fílmico colombiano

Vapors of Morphine tocará por primera vez en México en el Circo Volador

La Orquesta Escuela Carlos Chávez interpretará "La consagración de la primavera" en Los Pinos y el Cenart

Vans celebra 60 años con un festival de skate, BMX, rock y freestyle en el Monumento a la Revolución

La Compañía Nacional de Ópera estrena en México "Ascenso y caída de la ciudad de Mahagonny"

VALL-E: La IA capaz de imitar voces

Relacionado

Yung Beef cierra su etapa creativa con "EL PLUGGG 3: OVA 2"

"Dedo de Novia", de Giselle Elías Karam, llega a cines

AMENTAL presenta Dixon x Jimi Jules en Frontón Bucareli

"No Se Requieren Traducciones", de Rafael Altamira, llega a la sección Hecho en Jalisco del Festival Internacional de Cine en Guadalajara

"Los Domingos", drama sobre fe y familia de Alauda Ruiz de Azúa, llega a cines el 1 de abril

Christopher Lloyd viaja en el tiempo hasta CCXPMX26

"Juana", ópera prima de Daniel Giménez Cacho, llega a la selección oficial del Festival de Málaga

"Psicópata: El Asesino del Conejo Blanco" llega a cines el 19 de marzo

Recomendado

FYJA presenta Inmersiones FYJA 2026. Miradas del jardín mexicano: casa, ciudad y territorio

Descubren contexto ritual maya milenario en Yaxché de Peón, Yucatán

"La niña en el altar", de Marina Carr, llega al Teatro El Galeón bajo la dirección de Enrique Singer

Cineteca Nacional presenta muestra de patrimonio fílmico colombiano

Vapors of Morphine tocará por primera vez en México en el Circo Volador

La Orquesta Escuela Carlos Chávez interpretará "La consagración de la primavera" en Los Pinos y el Cenart

Vans celebra 60 años con un festival de skate, BMX, rock y freestyle en el Monumento a la Revolución

La Compañía Nacional de Ópera estrena en México "Ascenso y caída de la ciudad de Mahagonny"