• anteayer
La voz humana es el sello que nos distingue como especie y la clave evolutiva de nuestra supervivencia. El deseo de reproducirla mecánicamente ha dado sus frutos pero aún resulta imposible conseguir una voz totalmente humana debido a su complejidad física y al poder emocional de su expresión.
Transcripción
00:00La voz humana. Una maravilla de la anatomía. La firma de nuestra identidad.
00:14La voz es el espejo del alma. Las voces son como las huellas dactilares, únicas.
00:22Es la clave evolutiva para la supervivencia de nuestra especie.
00:27Existe ese hilo que se remonta hasta nuestros antepasados, primates.
00:33Con nuestra voz establecemos contacto con el mundo exterior.
00:38Elegimos a nuestra pareja sentimental, a nuestros amigos y a nuestros líderes,
00:44y expresamos nuestras emociones más profundas.
00:47Expreso mis sentimientos.
00:49Vivo.
00:51Hoy los científicos están en una carrera para crear nuevas tecnologías sin voz
00:57y voces artificiales como si fueran reales.
01:02Ante cualquier cosa que suele remotamente como una voz humana,
01:06nuestro cerebro dice, eso es una persona.
01:10¿Estamos en el amanecer de una nueva era en la que nos comunicamos más
01:15con robots y ordenadores que con humanos?
01:20¿Queremos de verdad hablar a un ser completamente inanimado?
01:30Incluso antes de nacer, reconocemos la voz humana.
01:37Mientras se encuentra todavía en el útero, el feto responde al tono,
01:42al ritmo y a la entonación de la voz de su madre, que resuena a través de su cuerpo.
01:47Cuando oye su voz, su ritmo cardíaco aumenta
01:54y disminuye ante la voz de un extraño.
02:03El primer llanto de un recién nacido es un reflejo para despejar sus vías respiratorias y respirar.
02:11Pero pronto la emergente voz humana tendrá un variable de sonido.
02:14La emergente voz humana tendrá un variado repertorio de gritos
02:18para comunicar hambre, dolor, ira y miedo.
02:23La capacidad de un recién nacido para emitir sonidos está limitada por la forma de su tracto vocal.
02:32Pero a los tres meses comienza una transformación que le permite producir una amplia variedad de nuevos sonidos.
02:41¿Cantamos una canción diferente?
02:45Es sorprendente.
02:47En los primeros cuatro años, la forma cambiante del tracto vocal de un bebé
02:52repetirá la historia entera de la evolución humana.
03:03Nuestra voz ha tardado millones de años en evolucionar.
03:08Nuestros antepasados primates carecían de lenguaje
03:11y sólo podían producir una gama limitada de sonidos.
03:15Pero sus voces realizaban otra función vital, la comunicación de las emociones.
03:21En especies sin un lenguaje léxico, el contenido emocional podría ser el elemento más importante de la interacción
03:28porque, esencialmente, cada uno tiene que comprender el estado emocional del otro
03:33e intentar crear una relación interindividual sin palabras.
03:36El lenguaje corporal y la vocalización tienen que haber estado estrechamente relacionados,
03:41volviéndose más eficientes a la hora de comunicar aprobación, placer, desaprobación o disgusto.
03:48Cuando nuestros parientes prehumanos salieron de los bosques y comenzaron a caminar erguidos,
03:54se produjeron unos cambios críticos en su anatomía que mejoraron su capacidad para emitir sonidos.
04:00La forma de su tracto vocal de un bebé
04:02mejoraron su capacidad para emitir sonidos.
04:05La forma de su cabeza se transformó.
04:08Su cara se aplanó.
04:10Su lengua se desplazó hacia atrás y la laringe, que contiene las cuerdas vocales, descendió,
04:17abriendo un tracto vocal más grande y cerrado, capaz de producir una profusión de nuevos sonidos.
04:25Unidos al rápido desarrollo del cerebro humano,
04:28estos cambios físicos permitieron a nuestra especie
04:32generar una compleja variedad de sonidos necesaria para el lenguaje.
04:43Sin embargo, nuestro cerebro conservó su capacidad para descifrar mensajes profundos y primordiales.
04:52Y la manera en que nuestro cerebro procesa estos mensajes
04:55apenas ha cambiado a lo largo de toda la historia de la evolución humana.
05:05En el interior de este escáner de resonancia magnética,
05:09en la Universidad College de Londres,
05:12la profesora Sophie Scott está investigando
05:15cómo nuestro cerebro procesa los sonidos producidos por la voz humana.
05:19El hemisferio izquierdo del cerebro se ocupa de la parte lingüística de la voz
05:23y el derecho, aunque sea un poco exagerado decirlo, de casi todo lo demás.
05:31Se ocupa de quién es la persona que habla, de su estado emocional.
05:35Y en particular, le gusta la prosodia, la melodía.
05:39Para identificar con precisión la región del hemisferio derecho del cerebro
05:44que responde a las emociones en la voz más que al lenguaje,
05:47los sujetos del experimento escucharon voces sin palabras.
05:51Si nos cuentan un chiste, nos reímos.
05:55Si nos asustamos, seguramente gritaremos.
06:01Parecen gritos de animales, más que un lenguaje humano.
06:04La investigación de la profesora Scott revela que la parte del cerebro
06:09que responde a los sonidos emocionales
06:12se encuentra en la misma región del lóbulo temporal
06:15que en nuestros antepasados primates.
06:17Y en ambas especies, la habilidad para detectar estos sonidos
06:21es clave para la supervivencia.
06:23Es importante saber si algo sabe mal sin tener que probarlo.
06:29Poder evaluar si alguien está enfadado con nosotros y supone una amenaza.
06:36Poder valorar si alguien está asustado.
06:42Y hay un sonido particularmente similar entre ambas especies.
06:47La manera de reírnos es casi exacta como ríen los chimpancés.
06:54Nosotros hacemos...
06:56Los chimpancés hacen...
06:59Pero su risa tiene un sonido fantástico.
07:02Y ese sonido se reconoce como una carcajada, son muy similares.
07:09Sigue existiendo ese hilo que se remonta hasta nuestros antepasados primates.
07:14La comunicación tonal y emocional de nuestro estado anímico
07:18es muy importante en las relaciones entre individuos.
07:21Somos mucho más similares a nuestros ancestros homínidos
07:24de lo que la gente imagina.
07:28Uno de los primeros libros de Darwin
07:30fue la expresión de las emociones en animales y humanos
07:33sobre la teoría de que ser capaz de manifestar las emociones
07:37es muy importante para las relaciones sociales.
07:40De manera que la parte emocional de la voz
07:41evoluciona por ese motivo.
07:44Está diseñada para comunicar, resonar
07:48y para que el otro sienta lo que sentimos nosotros.
07:53Es esa entonación de la voz
07:55lo que indica que alguien no está contento, está muy feliz
07:58o enamorado, o a punto de casarse, o enojado.
08:01Si no pudieras verme, ¿podrías saber por mi voz
08:04la edad que tengo, de dónde procedo?
08:07¿Podría saber si estoy de mal humor, si estoy enferma?
08:09La voz es una traducción para los demás
08:13de nuestra personalidad.
08:16Si nos preguntan, ¿cómo estás?
08:19Y respondemos, bien, gracias.
08:21Y nos contestan, no, creo que no estás bien,
08:23nuestra voz nos ha traicionado.
08:27Puede que llevemos la huella de nuestros antepasados primates,
08:31pero la evolución nos ha dotado
08:33con una voz única y exclusiva de nuestra especie.
08:36Somos unos instrumentos vocales asombrosos.
08:39Dos terceras partes de nuestro cuerpo,
08:42miles de millones de señales eléctricas de nuestro cerebro
08:45y cientos de músculos entran en acción
08:48cuando emitimos sonidos.
08:52Cuando expelemos aire de nuestros pulmones,
08:55este se transforma en sonido
08:57gracias a dos minúsculas cuerdas vocales
09:00que pueden vibrar hasta mil veces por segundo.
09:03Las frecuencias generadas por nuestras cuerdas vocales
09:06pasan por la boca, que les da forma,
09:09y las convierte en más de 300 sonidos diferentes,
09:12necesarios para el lenguaje hablado.
09:15Hola, ¿cómo estás?
09:17¿Eres una niña buena?
09:19¿A que sí?
09:21Eres una niña buena.
09:24La psicóloga Christine Kitamura
09:26es una experta en los sonidos del corazón.
09:29La psicóloga Christine Kitamura
09:31es una experta en el lenguaje infantil.
09:35Este es el diálogo no verbal entre madres y bebés
09:38que se cree juega un papel
09:40en el desarrollo de las habilidades y el lenguaje social.
09:45El bebé no entiende las palabras de su madre.
09:48Todo se basa en el tono de su voz.
09:50Mami, ¿puedes aplaudir?
09:52¿Dónde está tu sonrisa?
09:54Es increíblemente primitivo.
09:56Puedes sentir ese vínculo
09:58que remonta a una forma de comunicarse
10:00en la que se utilizaban las emociones.
10:05A esta interacción universal entre madre y bebé
10:09que se da en casi todas las culturas,
10:11los lingüistas la llaman habla dirigida al bebé.
10:15Es muy exagerada.
10:18Tiene un tono más alto.
10:21Tiene contornos de entonación exagerados.
10:28Y mantiene a la madre en sintonía con las emociones del bebé.
10:32¿Y tu sonrisa?
10:34Y sus estados de excitación.
10:37El habla dirigida al bebé es como música.
10:43Es el fertilizante de todo lo que viene después.
10:48Para el lenguaje.
10:50¿Estás cansadita?
10:52Para su relación con su madre
10:54y con todos los demás seres humanos.
10:58De ahí es de donde proviene todo.
11:02Pero a medida que crecemos
11:04y nos dicen cómo debemos comportarnos,
11:06aprendemos a esconder las emociones.
11:15La foniatra Isobel Kirk
11:17hace ejercicios vocales clásicos
11:19para liberar la voz humana,
11:21como hablar con la lengua afuera.
11:26Los actores se supone
11:28que deben liberar las tensiones físicas y mentales
11:31que inhiben su habilidad para expresar emociones.
11:38Lo maravilloso es que es como
11:40si tuvieras un aparato ortopédico en la boca
11:42y te lo quitaras.
11:44La boca dice, oh, muchas gracias.
11:46¡Sí!
11:48Mi paladar quiere elevarse cuando bostezo.
11:50¡Al fin libre!
11:51Isobel trabaja con un grupo de actores
11:53que ensaya un musical
11:55sobre los secretos
11:57y los demonios más profundos del hombre.
11:59Su reto es conseguir
12:01que estos actores liberen
12:03lo que tienen dentro.
12:06La gente se autocensura
12:08porque teme convertirse en un bebé
12:10de dos años otra vez.
12:12Si eliminan sus impulsos censores,
12:14serán como un perro.
12:16¡Au, au, au!
12:18¡Au, au, au!
12:19Y lo que les pase por dentro
12:21¡saldrá!
12:23¡Au, au, au!
12:25¡Au, au, au!
12:27¡Au, au, au!
12:29Tensamos los músculos de nuestro cuerpo,
12:31especialmente alrededor de la caja torácica.
12:33En cualquier parte de nuestro cuerpo
12:35podemos sentir emociones
12:37y somos capaces de reprimirlas.
12:39Es así de simple.
12:41Cuando decimos que sonreímos y aguantamos,
12:43apretamos los dientes,
12:45nos mordemos la lengua o expresiones así,
12:47nos tragamos las palabras
12:49o nos tragamos la lengua.
12:51El lenguaje está lleno de expresiones
12:53que tienen una manifestación física.
13:00Nuestras voces y nuestras emociones
13:02son lo mismo.
13:09Expreso mis sentimientos.
13:11Vivo.
13:17Los grandes oradores
13:19saben tan bien
13:21que la capacidad de nuestra voz
13:23para expresar emociones
13:25tiene un efecto muy poderoso
13:27sobre los demás.
13:29La doctora Branca C. Pollerman,
13:31psicóloga,
13:33está interesada en las neuronas espejo.
13:35Los neurocientíficos
13:37las han estudiado
13:39en primates, aves y humanos.
13:50Pollerman afirma que desempeñan
13:52un papel importante
13:54en la manera en que las voces
13:56de los líderes desatan emociones
13:58en grupos grandes.
14:00Las neuronas espejo
14:02son las neuronas que se activan
14:04cuando vemos o cuando oímos
14:06a los líderes.
14:10Nuestras neuronas espejo
14:12están activadas
14:14y hasta cierto punto
14:16sentimos como si nosotros mismos
14:17fuéramos palabras.
14:24Según la doctora Pollerman,
14:26uno de los factores
14:28que activan las neuronas espejo
14:30es la calidad musical
14:32de la voz del orador.
14:34Y se sabe que en la música,
14:36el crescendo,
14:38ya sea en el tono,
14:40en el volumen o en el ritmo,
14:42provoca reacciones físicas
14:44como temblores y escalofríos.
14:48Obama, por ejemplo,
14:50utiliza más el crescendo
14:52en el volumen que en el tono.
14:55Con una parte del discurso
14:57de aceptación del presidente Obama
14:59en 2008,
15:03la doctora Pollerman revela
15:05cómo las voces de la persuasión
15:07son esencialmente musicales,
15:09transformándolas en instrumentos.
15:18El objetivo de un discurso
15:20es desatar las emociones de la gente.
15:22Cuando se acompaña de tono,
15:24volumen y crescendo,
15:26se convierte en una forma muy poderosa
15:28de influir en los sentimientos.
15:48La voz humana
15:50es un poderoso instrumento musical
15:52que no solo desata emociones,
15:54sino que revela quiénes somos
15:56y de dónde venimos.
16:00La cantante africana Angelique Killo
16:02ha puesto su voz en manos
16:04del doctor Jan Abitbol,
16:06otolaringólogo de renombre mundial.
16:08Para un cantante,
16:10la voz es su vida.
16:12Si le hubiéramos preguntado
16:14a Yehudi Menuhin
16:15quién le gustaría ser,
16:17estoy seguro de que habría contestado.
16:19Un Estradivarius.
16:21Pero la diferencia es que
16:23en el caso de la cantante,
16:25el Estradivarius está aquí.
16:27La forma en que Killo actúa
16:29desde los tres años
16:31se parece a la actuación de un deportista.
16:33Es una armonía entre
16:35su respiración abdominal,
16:37su respiración torácica,
16:39la musculación de sus cuerdas vocales
16:41y la ubicación de su cámara de resonancia.
16:43Esto es el fibroscopio,
16:45el que puede ayudar en todas las direcciones.
16:47¿Quieres que cante la misma canción?
16:49Si puedes.
16:51El doctor Abitbol es pionero
16:53en el uso del fibroscopio
16:55para investigar las cuerdas vocales
16:57de algunos de los cantantes más importantes del mundo.
16:59Estas son sus cuerdas vocales.
17:01Se ven muy bien.
17:03La voz de Angelique
17:05es un producto de su anatomía vocal única,
17:07así como de sus orígenes en Benin,
17:09África Occidental.
17:11Tengo que decir que mi voz
17:13está también basada en mis idiomas,
17:15en mi manera de cantar en Benin,
17:17en nuestra forma de cantar en África.
17:19La mayoría de nosotros,
17:21los artistas africanos,
17:23empezamos cantando sin micrófono,
17:25así que aprendimos de forma natural
17:27a proyectar la voz.
17:37Al tener una voz natural,
17:39puede jugar con ella
17:41como si fuese un tambor.
17:46Es el universo cultural de Kidjo,
17:48quien habla a través de su voz.
17:50Son sus antepasados
17:52los que hablan a través de su voz.
17:57Para mí,
17:59la voz es el espejo del alma.
18:01Las voces son parte de mí.
18:03La voz es el espejo del alma.
18:05Las voces son parte de mí.
18:07La voz es el espejo del alma.
18:09La voz es la forma de cantar.
18:11La voz es la forma de cantar.
18:13La voz es la forma de cantar.
18:15Es como las huellas dactilares,
18:17únicas.
18:22No importa dónde vivas,
18:24tu voz llevará impresa
18:26y reflejará tu cultura
18:28en el idioma que hables,
18:30en tu forma de cantar.
18:38La cultura da forma a la voz
18:40de otras maneras también.
18:42Las mujeres japonesas
18:43tienen las voces más agudas del mundo.
18:47Pueden alcanzar un descomunal pico
18:49de 450 hercios,
18:51dos veces más alto
18:53que el de la mujer europea media.
18:58Y, sin embargo,
19:00no existe diferencia
19:02en el tamaño de sus cuerdas vocales.
19:06Es un despliegue de feminidad
19:08con profundas raíces en la tradición.
19:14Maho Kurashima es foniatra
19:16y trabaja con profesionales en Tokio.
19:20Primero vamos a desentumecer nuestro cuerpo
19:22para poder utilizar nuestra voz
19:24con más facilidad.
19:26¿Podéis poneros todos de pie, por favor?
19:29Muchos son periodistas
19:31de radio y televisión.
19:35Si tomamos, por ejemplo,
19:37una sociedad como la japonesa,
19:39remontándonos hasta hace unos diez años
19:41y las personas
19:43poniendo la voz ideal del hombre
19:45y la de la mujer
19:47eran ampliamente divergentes.
19:49La voz de la mujer
19:51era tan aguda que casi parecía doloroso
19:53para las mujeres
19:55tener que ajustar su voz
19:57a esos parámetros.
19:59Alguien lo describió como
20:01el equivalente vocal
20:03al vendado de pies en China.
20:06Cuando eres joven
20:08tienes una voz aguda.
20:10Por eso, de una manera instintiva,
20:11los hombres prefieren
20:13las voces agudas.
20:17Pero recientemente
20:19ha habido una moda inversa en Japón
20:21a favor de voces más graves en la mujer.
20:25Algunas profesionales japonesas
20:27se han hecho la cirugía bucal
20:29para bajar la tonalidad de su voz,
20:31aunque la mayoría han acudido
20:33a foniatras como la señora Kurashima.
20:38Hay historias extraordinarias
20:39de mujeres en Japón,
20:41principalmente presentadoras,
20:43pero también de otras profesiones
20:45que ahora intentan forzar su voz
20:47en la dirección contraria.
20:52Tomamos como ejemplo
20:54la voz de una oficina.
20:57Si es una voz madura y baja,
20:59transmite confianza
21:01y también transmite autoridad.
21:07Pero Maho Kurashima
21:09está empujando a sus estudiantes
21:11contra las fuerzas de la evolución.
21:15Los científicos han descubierto
21:17que las preferencias
21:19por las voces agudas en las mujeres
21:21y las graves en los hombres
21:23pueden estar relacionadas
21:25con la supervivencia de nuestra especie.
21:30Estudios sobre la tribu Himba,
21:32en Namibia,
21:34revelaron que los hombres con voces graves
21:36y las mujeres con voces agudas
21:37tienen niveles más altos
21:39de hormonas reproductivas
21:41y más descendencia.
21:46No se sabe si el tono de voz
21:48sigue influyendo en el éxito reproductivo
21:50en las sociedades modernas,
21:52pero cuando desafiamos
21:54las convenciones vocales,
21:56las cosas se pueden descontrolar.
21:58Por fin con nosotros,
22:00se denominan a sí mismos
22:02la Organización para la Liberación de Barbie,
22:04la BLEO.
22:05¿G.I. Joe quiere ir de compras?
22:07Cuando un grupo feminista clandestino
22:09violó los estereotipos vocales
22:11en Estados Unidos,
22:13se desató una guerra cultural.
22:15Los hombres muertos no cuentan cuentas.
22:18En 1989,
22:20nació un nuevo grupo guerrillero
22:22en Nueva York,
22:24el Frente para la Liberación de Barbie.
22:26Un G.I. Joe víctima
22:28de una emboscada de la Organización
22:30para la Liberación de Barbie.
22:32Descubrieron que las Barbies
22:33y los G.I. Joe,
22:35los que hablaban,
22:37tenían los mismos chips de voz.
22:40Así que fueron a varios
22:42grandes almacenes de Nueva York,
22:44compraron 300 Barbies y G.I. Joe
22:47e intercambiaron sus chips de voz.
22:51Observen cómo otros dos miembros
22:53de la BLEO reemplazan
22:55al menos media docena de muñecas Barbie
22:57en otra tienda cercana.
22:59Y los G.I. Joe, cuando hablaban,
23:01decían cosas como
23:03que no tendríamos nuestro sueño de boda
23:05o nunca tendremos ropa suficiente.
23:07Me encanta el colegio y a ti,
23:09cantemos con el grupo.
23:11Y las Barbies, en cambio,
23:13decían cosas como
23:15al ataque, venganza.
23:17¡Soldados, ataquen!
23:19El alboroto que produjo
23:21aquel intercambio fue extraordinario.
23:25La gente se sintió indignada,
23:27se sintió ofendida,
23:29hubo protestas.
23:31Habla como una chica.
23:33¿Le va el rollo raro?
23:36A mí me parece muy interesante
23:38que algo así nos perturbe tanto.
23:41¡Atacad!
23:43¡Fuego directo contra el Escuadrón Cobra!
23:45Es muy triste
23:47que encorsetemos a la gente
23:49en estereotipos vocales.
23:55Puede que estemos atrapados
23:57en nuestros propios estereotipos vocales.
24:01Pero nadie está más aislado
24:03que aquellos que han perdido
24:05la voz por completo.
24:10Al exjuez Phil Miyamoto
24:12le extrajeron la laringe
24:14con las cuerdas vocales
24:16como consecuencia de un cáncer.
24:18Los aísla en muchos aspectos.
24:20Por ejemplo, de algo tan sencillo
24:22como ir a un restaurante
24:24y mantener una conversación.
24:26Di hola.
24:28No pueden hablar por teléfono.
24:32El destacado patólogo del habla,
24:34Krzysztof Izdebski,
24:36tiene que lidiar con algo más
24:38que los problemas físicos de sus pacientes.
24:43Los pacientes que se han sometido
24:45a una laringectomía
24:47han formado el club de la cuerda perdida.
24:49Porque literalmente está perdida.
24:51Estaba, me desperté y ya no estaba.
24:58Pierden todo el mecanismo
25:00para producir sonido.
25:03Phil habla hoy a través
25:05de una electrolaringe.
25:07Genera eléctricamente un zumbido
25:09que sustituye al sonido
25:11que producían sus cuerdas vocales perdidas.
25:17Otras personas reaccionan
25:19a la electrolaringe
25:21como podríais esperar.
25:23Siempre preguntan
25:25¿Eres R2D2?
25:28Todo cambia.
25:30Todo el mecanismo
25:32que permite hablar cambia.
25:34¿Quieres reírte a carcajadas?
25:36¿Quieres susurrar?
25:38No puedes hacerlo.
25:40¿Quieres llorar con sonidos
25:42o yozar y no puedes?
25:44¿Quieres gritar?
25:46Tampoco puedes.
25:48Si me enfado,
25:50algo que no sucede a menudo,
25:52no puedo decir
25:54¡Deja de hacer eso!
25:56Es un doble contratiempo.
25:58Primero porque no pueden producir la voz bien
26:00y segundo porque no se les escucha.
26:06Actualmente los científicos
26:08están en una carrera global
26:10para replicar la voz humana.
26:12En la Universidad de York,
26:14el profesor de electrónica David Howard
26:16desarrolla un sistema sintetizador de voz
26:19que podría ser utilizado por personas
26:21que han perdido su capacidad de hablar.
26:22Y está decidido a conseguir
26:24que suene humano.
26:26Lo más importante es la investigación.
26:28Estoy intentando comprender
26:30qué es lo que hace
26:32que un sonido suene natural.
26:34Se puede beneficiar la gente
26:36que ha perdido parte de su aparato fonador
26:38a causa del cáncer
26:40o cualquier otro accidente.
26:42En principio se les podría devolver la voz
26:44que tenían antes de sufrir el trauma.
26:46Ese sería para mí un objetivo maravilloso,
26:48ser capaz de dejar eso como legado.
26:50La mayoría de los actuales
26:52sistemas electrónicos de voz
26:54están basados en voces humanas reales.
27:01Así pues, replicar artificialmente
27:03la voz humana
27:05constituye un enorme desafío.
27:07Es una búsqueda
27:09que se remonta a siglos atrás.
27:13A finales del siglo XVIII,
27:15los científicos
27:17un excéntrico inventor australiano
27:19Wolfgang von Kempelen
27:21diseñó este modelo
27:23del tracto vocal humano.
27:29Estos son los pulmones.
27:31Dentro de la caja hay una caña
27:33y esa caña es la fuente de sonido.
27:35Los modificadores de sonido
27:37están representados por esta bolsa de cuero
27:39y cuando apriete
27:41oiréis un sonido vocálico
27:43que intentaré modificar.
27:45El invento de la exposición de Frisco,
27:47el robot parlante.
27:49Ha habido varios intentos
27:51hasta la edad moderna
27:53de la electrónica y la informática.
27:55El aparato utiliza dos sonidos
27:57producidos eléctricamente.
27:59Uno representa la respiración.
28:02El vocoder fue el primer
28:04aparato sintetizador de voz.
28:07Lo inventó a finales
28:09de la década de 1920
28:11el ingeniero Erich von Kempelen
28:12y en 1920 el ingeniero
28:14electrónico estadounidense
28:16Homer Dudley.
28:19Una mujer intentaba manejar
28:21el aparato
28:23y era capaz de sacar
28:25un par de frases.
28:27¿A quién vio?
28:29¿Te vio o te oyó?
28:35Así es como se han creado
28:37hasta hoy la mayoría
28:39de las voces electrónicas.
28:41Estos botones grises
28:43representan un grupo de vocales
28:45y están dispuestos de la forma clásica
28:47en la que se disponen
28:49desde el siglo XIX.
28:51Se llama síntesis deformantes
28:53y utiliza frecuencias fijas
28:55para reproducir electrónicamente
28:57los sonidos vocales que hacemos
28:59cuando cambiamos la forma
29:01de nuestra boca.
29:03De modo que si hago la vocal I
29:06y la cambio a A
29:08y vuelvo, vuelvo,
29:12ahora hago U y A.
29:15Suena electrónico,
29:17tiene un sonido robótico.
29:19Es el tipo de sintetizador
29:21que tiene Stephen Hawking
29:23con un sonido electrónico.
29:25Se basa en los mismos principios.
29:27Si me coloco esto...
29:29El profesor Howard está desarrollando
29:31algo mejor.
29:33Utiliza su propio tracto vocal
29:35como modelo para producir
29:37el sonido de la boca.
29:43Primero graba los sonidos
29:45producidos por sus cuerdas vocales.
29:53Luego, mediante la imagen
29:55de una resonancia magnética
29:57de su garganta y boca,
29:59hace un modelo de plástico en 3D
30:01de su propio tracto vocal.
30:04Estos son mis labios.
30:05Mi laringe, que se ve en el fondo,
30:07donde está este plato redondo,
30:09está situada donde se encuentran
30:11los electrodos,
30:13y los labios están situados
30:15donde están mis labios.
30:17Esta es la vista lateral
30:19y la vista frontal.
30:21El modelo de su tracto vocal
30:23se coloca entonces en un amplificador
30:25que repite la grabación
30:27de sus cuerdas vocales.
30:29El altavoz es ahora mi laringe
30:31y obtenemos esto.
30:36Todo esto resulta un tanto siniestro.
30:38Si miro el dispositivo,
30:40se me antoja realmente así
30:42porque es una parte de mí
30:44totalmente expuesta
30:46y resulta bastante extraño.
30:48Pero lo interesante es que
30:50lo único que tenemos como instrumento
30:52es un tubo blando de goma
30:54de esta longitud y un zumbador.
30:56Con el tiempo,
30:58el profesor Howard espera utilizar
31:00estos sonidos para crear
31:02una voz de ordenador
31:03que sabe que tiene
31:05un largo camino por delante.
31:07Puedo conectar a seres humanos
31:09y medir su tono de voz así.
31:16Cuando lo resintetizo todo,
31:18sigue faltando algo.
31:23Y eso, para mí,
31:25es la humanidad mágica.
31:27Así me gusta denominarlo,
31:29la huella vocal como la dactilar,
31:31lo que significa que mis oídos
31:33tienen un sonido
31:35que proviene de otro ser humano
31:37y no de un ordenador.
31:56En ningún lugar trabajan tanto
31:58los informáticos para reproducir
32:00la voz humana como en Japón.
32:04El doctor Hideyuki Sawada
32:06ha tomado un enfoque
32:08totalmente distinto
32:10para reproducir la voz.
32:14Ha creado una máquina parlante
32:16mecánica robótica
32:18que se mueve
32:20como una boca humana.
32:23La voz humana
32:25no es un instrumento blando
32:27de goma de goma,
32:29sino una voz de ordenador
32:31que se mueve
32:33como una boca humana.
32:35El robot es un modelo
32:37de un mecanismo
32:39con una voz humana.
32:41Aquí,
32:43hay un compresor de aire
32:45equivalente a un pulmón.
32:49Este robot es capaz
32:51de recrear sonidos vocales
32:53básicos del idioma japonés.
33:04Para crear diferentes sonidos,
33:06la boca tiene que estar
33:08construida de cierta manera.
33:11Tiene que poder adoptar
33:13las mismas formas
33:15que una boca humana.
33:20Aunque todavía se encuentra
33:22en un estado inicial,
33:24el doctor Sawada está convencido
33:26de que este modelo físico
33:28de la boca humana
33:30es superior a cualquier sonido
33:31que pueda ser reproducido
33:33por un ordenador.
33:35Como solo es una boca
33:37y una nariz,
33:39a algunas personas les resulta
33:41repulsivo y a otras fascinante.
33:46En este tipo de investigaciones
33:48no se reciben muchos elogios,
33:50por eso cualquier reacción
33:52me hace feliz.
33:58El doctor Sawada ha enseñado
33:59a su boca parlante
34:01a cantar una canción
34:03popular japonesa
34:05y la canta bastante bien.
34:14Cuando su tecnología
34:16esté perfeccionada,
34:18su objetivo final
34:20es que sea utilizada
34:22por androides.
34:27En el interior
34:29robótico de Tokio,
34:31los límites entre lo humano
34:33y lo no humano se confunden.
34:39Andrew y Andro
34:41son dos de los androides
34:43más avanzados verbalmente del mundo.
34:45Colaboramos en una investigación
34:47entre la Universidad de Osaka
34:49y otras universidades.
34:52Son los retoños
34:54del ingeniero en robótica
34:56Yoshio Matsumoto.
34:58Los hemos programado.
35:00Andrew y Andro
35:02están programados
35:04para que hablen como humanos.
35:12La apariencia de un robot
35:14es muy importante.
35:16Si el robot parece humano
35:18pero la voz no es humana,
35:20la impresión que produce
35:22es muy extraña.
35:25Son similares a zombies
35:27o personas muertas.
35:34Tenemos un programa
35:36que permite al robot
35:38tener una voz muy parecida a la humana.
35:47No creo que haga falta mucho tiempo
35:49para que podamos duplicar
35:51una voz humana.
35:54Los científicos quieren conseguir
35:55que las voces de estos androides
35:57suenen reales.
36:00Pero el esfuerzo por replicar
36:02una voz humana a la perfección
36:04puede que no sea tan importante.
36:06¿Quieres hacerte una foto conmigo?
36:13Aquí comenzó todo.
36:16Es el lugar de nacimiento de Kismet,
36:18el primer robot social con voz.
36:23Actualmente Kismet
36:25vive en una vitrina de Plexiglas
36:27en el Instituto Tecnológico
36:29de Massachusetts.
36:31¡Qué robot más bonito!
36:33Eres monísimo.
36:36Aunque no hablaba ningún idioma,
36:38Kismet parecía comunicarse
36:40estrictamente con sonidos.
36:44Tú y yo.
36:46Kismet tiene una voz cantarina,
36:49una voz humana sin palabras
36:52y de vez en cuando emite
36:54una palabra.
36:57Pero no demasiadas.
36:59Es una especie de balbuceo incoherente,
37:03asintiendo con la cabeza
37:05con sus pequeñas expresiones.
37:07No, no, voy a tocar eso.
37:09No, no, para.
37:11Escúchame, escúchame.
37:13La gente interactúa.
37:16La gente quiere entablar relaciones.
37:19Estoy deprimida, Siri.
37:20Sherry Tarkel es psicóloga
37:22del Laboratorio de Inteligencia Artificial
37:24del Instituto Tecnológico
37:26de Massachusetts.
37:28Ha estudiado cómo interactúa
37:30la gente con voces robóticas.
37:32He estudiado los pequeños tamagotchis
37:35y he estudiado los aibos.
37:38Por favor, abrázame, abrázame.
37:40También he estudiado los furbis
37:42porque quería ver realmente
37:44hasta dónde somos capaces de llegar
37:46para obtener una respuesta.
37:48Debido a que las voces
37:50y los gestos de los robots
37:52desencadenan respuestas inconscientes
37:54en nosotros,
37:56la profesora Tarkel
37:58los ha llamado botones darwinianos.
38:03Acuñé el término botones darwinianos
38:05para tratar de describir
38:07cómo la robótica social
38:09provoca en nosotros reacciones.
38:12Reacciones que nos llevan
38:14a la realidad.
38:16Reacciones que nos hacen retroceder
38:18hasta las respuestas animales
38:20más primitivas
38:22a la hora de reconocer
38:24a otras criaturas
38:26e identificarnos con ellas,
38:28como son el contacto visual,
38:30la imitación de gestos
38:32y la emisión de sonidos.
38:35Y ahora triste.
38:38Y la voz, sea del tipo que sea,
38:40incluso la voz más primitiva
38:42y en particular cuando posee
38:43algún tipo de cadencia,
38:45es uno de esos botones.
38:52En el Laboratorio de Medios Interactivos
38:54de la Universidad de Stanford,
38:56el psicólogo Clifford Nash
38:58ha estado estudiando
39:00cómo las personas interactúan
39:02con voces artificiales.
39:04Prepárese para tomar la salida de San Diego.
39:06En sus experimentos
39:08coloca a grupos de estudiantes
39:10dentro de simuladores de conducción
39:11para medir cómo responden
39:13a las voces de navegación del coche.
39:15Sitúese en el carril derecho.
39:17Y los resultados han sido sorprendentes.
39:19Hemos llevado a cabo una serie de estudios
39:21utilizando varios tipos
39:23de lo que llamamos voces sintéticas,
39:25aquellas en las que resulta obvio
39:27que no se trata de una persona real del tipo.
39:29Son las 12 horas y 43 minutos.
39:31La típica voz que uno nunca confundiría
39:33con una voz humana real.
39:35A tres kilómetros,
39:37gire a la izquierda por Main Street.
39:39El cerebro no está diseñado
39:41para distinguir entre humano y no humano
39:43en lo que se refiere al habla.
39:45Continúe para tomar la salida de San Diego.
39:48Nuestro cerebro reacciona igual
39:50ante una voz tecnológica y una humana.
39:52Gire a la izquierda al llegar.
39:54Ante algo que suene vagamente
39:56como una voz humana,
39:58por muy remota que sea,
40:00nuestro cerebro dice,
40:02eso es una persona,
40:04y activa todos los mecanismos de la personalidad.
40:06Por eso es tan importante saber
40:08cuáles escogerías y cuáles de todos descartarías.
40:10El profesor Nas
40:12ha llevado su investigación un paso más allá.
40:14Está realizando experimentos
40:16con un robot llamado Nao
40:18programado para jugar a supervivencia en el desierto.
40:21En el juego,
40:23un avión se estrella en el desierto
40:25y el único superviviente
40:27tiene que escoger entre diversos objetos
40:29para intentar mantenerse con vida.
40:31¿Estás listo para jugar al juego
40:33supervivencia en el desierto?
40:35Puedes orientarte de noche con la linterna,
40:37pero no creo que esa sea la mejor opción.
40:39La idea del estudio es hacer que,
40:41mientras yo estoy hablando,
40:43Nao esté analizando mi voz
40:45y vaya cambiando para parecerse más a mí.
40:47La gente no suele pensar
40:49en prepararse ante situaciones peligrosas.
40:51La premisa es que cuanto más se asemeje
40:53el ritmo y el tono de Nao
40:55a la voz del superviviente,
40:57más dispuesto estará éste
40:59a aceptar sus opiniones
41:01a la hora de tomar decisiones vitales.
41:03La primera elección que debes hacer
41:05es la categoría de refugio,
41:07a tu izquierda.
41:09¿El lienzo o la lona?
41:11Es otro ejemplo de mirroring,
41:13o imitación espejo.
41:15¿Por qué hacemos mirroring?
41:17Bueno, hay argumentos evolucionistas
41:19que dicen que es una manera de demostrar
41:21que nos preocupamos por una persona
41:23y somos compatibles.
41:25En algunos estudios adaptamos la tecnología
41:27para que suene más parecida al interlocutor
41:29y a la gente le gusta más.
41:31Nao, me gustaría llevarme el lienzo.
41:35El lienzo se desgarra en trozos más pequeños
41:37y se utiliza para otros fines.
41:39Gracias, Nao.
41:41Nao está de acuerdo conmigo
41:43y eso está muy bien.
41:45También resulta muy agradable
41:47que su voz cambie para parecerse a la mía.
41:49No podrías transportarlo todo tú solo
41:51en el desierto.
41:53El profesor Nas ha descubierto
41:55que no solo nuestros cerebros
41:57confunden a este robot con una persona real,
41:59sino que hemos evolucionado genéticamente
42:01hasta el punto de considerarlo un semejante.
42:04Hasta un cierto nivel
42:06somos conscientes de que las voces
42:07se definen por todo tipo de características,
42:09pero una de ellas es de tipo genético.
42:11Así que no es absurdo usar la voz
42:13como una de las medidas
42:15para indicar las similitudes
42:17o las diferencias que hay entre nosotros.
42:19En el caso de Nao,
42:21mi cerebro interpreta
42:23si su voz se parece a la mía,
42:25es como yo.
42:27Compartimos genes.
42:31Los científicos están aprovechando
42:33el poder de las voces artificiales
42:35para interactuar con los humanos.
42:37Esta es la razón
42:39por la que androides como estos
42:41están empezando a ocupar
42:43el puesto de acompañantes humanos
42:45en consultorios médicos
42:47y residencias de ancianos.
42:49Las personas hablan con el robot
42:51con toda naturalidad.
42:53No les tienen miedo.
42:55Es más, les acarician la mano
42:57y les miran a los ojos cuando hablan.
42:59Un hombre llegó a pedir a un robot
43:01que se casara con él.
43:03Y cuando traigo el robot joven y guapo,
43:06las mujeres se interesan
43:08y se ponen guapas.
43:15Creo que los robots
43:17serán pronto una realidad cotidiana
43:19en nuestras sociedades.
43:23Si deseas tener una relación,
43:25un amigo,
43:27un compañero,
43:29si quieres hablar sobre tu vida,
43:30busca a una persona.
43:33Si tienes a tu cargo personas mayores
43:35que desean contar la historia de su vida,
43:37déjales que hablen.
43:39Muéstrales respeto
43:41y ofréceles la posibilidad
43:43de hablar con una persona.
43:45¿Queremos realmente hablar
43:47a un ser completamente inanimado?
43:50¿Contarle nuestra vida?
43:55¿Por qué a la gente
43:57le parece una buena solución?
43:58¿Por qué les parece
44:00una buena solución?
44:05A medida que nos relacionamos
44:07cada vez más con robots
44:09y voces sintéticas,
44:11¿estarán ahí para ayudarnos
44:13o acabarán reemplazando
44:15el contacto humano real?
44:19Esta cuestión podría quedar eclipsada
44:21a medida que entramos
44:23en una nueva era
44:25en la que la propia voz humana
44:26puede quedar obsoleta.
44:29Solo el año pasado
44:31se enviaron más de 6 billones
44:33de mensajes de texto
44:35en todo el mundo.
44:37Hoy, un adolescente estadounidense
44:39recibe de promedio
44:41más de 1.700 mensajes al mes.
44:43Y en Japón,
44:45el 85% de los consumidores
44:47afirma que prefieren comunicarse
44:49con un ordenador
44:51más que con una persona.
44:53Todos los operadores están ocupados.
44:55Cuando conocemos a una persona
44:57la asociamos inmediatamente a una voz.
44:59Es un instrumento realmente potente.
45:01Sin embargo,
45:03en Facebook estas señales desaparecen.
45:05Recibimos un aluvión de datos,
45:07de nombres.
45:09Es tanta la información
45:11que nos cuesta hacer un seguimiento
45:13de todas las personas.
45:15Algunas nunca llegamos a conocerlas.
45:17¿Pero importa realmente?
45:19Bueno, para mí tiene una gran importancia
45:21y creo que también la tiene
45:22la sociedad humana.
45:24Por lo que sabemos,
45:26todas las sociedades humanas
45:28han atribuido una enorme importancia
45:30a esas señales emocionales.
45:32Ahora bien, los cambios suceden.
45:34Las revoluciones se producen.
45:36Hoy la gente casi prefiere
45:38comunicarse por escrito
45:40antes que hablar.
45:42Y cuando les pregunto
45:44cuál es el problema, te contestan.
45:46Te voy a decir el problema
45:48que tiene una conversación.
45:50Requiere tiempo
45:52para que la gente
45:54comience a hablar.
45:56Si no prestamos una atención constante
45:58al rostro de nuestro interlocutor
46:00al tiempo que escuchamos su voz,
46:02¿perdemos esa capacidad?
46:04Es un hecho preocupante.
46:06Si me envían información
46:08y yo no me hago eco de ella,
46:10mi interlocutor acabará desistiendo.
46:12De esa forma entramos
46:14en una espiral descendente
46:16donde este aparato increíble,
46:18la voz humana,
46:20diseñada para producir
46:22información,
46:24deja de tener importancia.
46:26Esa perspectiva es aterradora para mí.
46:36La voz humana.
46:38Dos pequeños músculos
46:40que se ponen en movimiento
46:42por el flujo del aire.
46:44Oscilan y son increíblemente hermosos.
46:49El vehículo que nos permite
46:50expresar nuestras emociones
46:52más profundas
46:54y comprender los sentimientos
46:56de los demás
46:58es el sello
47:00que nos distingue como especie.
47:08Pero a medida que los sistemas informáticos
47:10aprenden a pulsar
47:12nuestros botones emocionales
47:14más primitivos,
47:16¿de qué modo influirán
47:18en nuestra forma de convivir juntos
47:20y relacionarnos?
47:24¿Olvidaremos cómo expresar
47:26la ira,
47:28el respeto
47:30o el amor mediante la voz humana?
47:33¿Y cuál será su impacto
47:35sobre las voces
47:37de las generaciones futuras?
47:39La voz ya no es un atributo
47:41exclusivo de los seres humanos
47:43a pesar de que hemos evolucionado
47:45con esa asunción
47:47y nuestro cerebro
47:48está funcionando con esa asunción.
47:52El listón de lo que representa
47:54la voz humana ha caído muy bajo
47:56y la robótica lo celebra
47:58como un gran logro.
48:00Dios mío, qué fácil es recrear
48:02la voz humana, qué maravilla.
48:04Un robot no tiene por qué ser sofisticado
48:06y yo me digo, ¿para qué?
48:08¿Para engañarnos a nosotros mismos
48:10más fácilmente?
48:15¿Pueden hacerlo también
48:16como un ser humano?
48:18No.
48:20¿Serán capaces?
48:22Sin duda.
48:24¿Tendrá implicaciones
48:26en nuestra forma de relacionarnos?
48:28Es una pregunta difícil de responder.
48:30Un ordenador,
48:32ya sea un robot o un androide,
48:34nunca reemplazará la voz humana.
48:36Nunca.
48:38La voz humana, cuando habla,
48:40crea algo nuevo a cada instante.
48:42No podemos decir lo mismo
48:44dos veces
48:46porque las dos copias
48:48somos los originales.

Recomendada