• hace 6 meses
Si alguna vez has jugado con la función Generative Fill de Adobe Photoshop o has trabajado en la plataforma Omniverse de Nvidia, entonces conoces el trabajo que Patrick Hebron ha hecho posible.

Patrick, con doble especialización en filosofía y producción cinematográfica, aborda las actividades creativas con una profunda curiosidad.
Transcripción
00:00¿Cómo se traduce el uso de la AI generativa en los campos creativos a las oportunidades para el futuro?
00:07Encontradlo en el episodio de hoy.
00:10Soy Patrick Hebron, autor de Machine Learning for Designers, y estáis escuchando a mí, a mí mismo y a la AI.
00:17Bienvenidos a mí, a mí mismo y a la AI, un podcast sobre inteligencia artificial y negocio.
00:22En cada episodio, os presentamos a alguien innovador con la AI.
00:27Soy Sam Ransbotham, profesor de analítica en el Colegio de Boston.
00:31También soy el editor de guestos de la estrategia de la AI y el negocio en la revisión de la gestión de riesgo de MIT.
00:36Y yo soy Shervin Korubande, compañero senador con BCG y uno de los líderes de nuestro negocio de la AI.
00:43Juntos, MIT, SMR y BCG han estado investigando y publicando sobre la AI desde 2017,
00:49entrevistando a cientos de profesionales y investigando a miles de empresas
00:54sobre lo que demora para construir y desplegar y escalar las capacidades de la AI
00:58y realmente transformar la forma en que las organizaciones operan.
01:02Hola a todos. Hoy, Sam y yo estamos emocionados por hablar con Patrick Hebron.
01:07Es el autor de Machine Learning for Designers
01:10y tiene un papel en NVIDIA Omniverse, Stability AI y Adobe.
01:15Patrick, gracias por tomar el tiempo de hablar con nosotros.
01:18Gracias por tenerme. Es un placer estar aquí.
01:20Tengo que decir, de inmediato, estoy curioso de por qué Machine Learning es diferente para los diseñadores.
01:25¿Qué significa la parte de los cuatro diseñadores?
01:28Cuando escribí el libro, esta no era una intersección que era muy sensible para la mayoría de la gente.
01:33Así que he estado trabajando en esa intersección desde la época de mis maestros
01:38y me di cuenta de la idea de que en el diseño puede haber problemas de configuración realmente desafiantes
01:45y que las máquinas pueden ayudar a jugar un papel en descubrir cómo rellenar muchas diferentes permutaciones
01:52y llegar a un arreglo que pueda ser útil para la gente.
01:55Así que eso fue lo que estaba sucediendo en mi propio trabajo en ese momento.
01:58Y luego, a medida que la tecnología comenzó a avanzar bastante,
02:02me pareció que había que haber algunas grandes diferencias
02:06en cómo pensábamos sobre la producción de software a causa de la AI.
02:10El software convencional siempre es correcto sobre cosas mundanas, como, por ejemplo, 2 plus 2.
02:15Y Machine Learning, por supuesto, te permite hacer cosas mucho más complejas,
02:19como identificar frases y fotos, o un millón de cosas.
02:23Pero no siempre está bien sobre esas cosas.
02:25Hay una imprecisión inherente a eso.
02:27Y este hecho en sí lleva a una gran implicación cuando estás diseñando software,
02:31pensando en cómo el usuario navega por un proceso
02:35y, en particular, lo que sucede cuando alcanzan un final desesperado o un entendimiento incorrecto.
02:39O'Reilly me acercó a escribir ese libro y estuve muy emocionado por abordar este tema
02:44y empezar a ayudar a los diseñadores a pensar en cómo esto transformaría su práctica.
02:49Esa es una aproximación fundamentalmente diferente,
02:51porque nos acostumbramos a que el software es muy determinista,
02:55nos acostumbramos a que los procesos funcionen de la misma manera
02:58cuando los pruebas en el laboratorio,
03:00pero luego funcionan de una manera diferente
03:02cuando introducimos ruido y oscuridad en todo el proceso.
03:06Entonces, ¿cómo las personas se tratan del hecho de que lo que prueban y lo que trabajan
03:11no es necesariamente lo que sucede cuando se introducen en la producción?
03:14Sí, es gracioso porque,
03:16no quiero apreciar a los modelos de aprendizaje de máquinas demasiado a un humano,
03:20pero creo que una cosa que tenemos en común con ellos es este tipo de imprecisión.
03:24Somos capaces de nociones grandes,
03:26pero nunca podemos garantizar que lo que está en la cabeza de alguien
03:30es cohesivo exactamente de la misma manera que lo es en tu cabeza.
03:34Y la mayoría de las personas no son cohesivas con lo que yo pienso.
03:37Sí, lo mismo.
03:39Una cosa es recordar que todavía hay software convencional,
03:44así que tener una especie de plan de apoyo
03:46o revertir a la funcionalidad convencional
03:48cuando un sistema AI más complejo fallece es una mitigación.
03:52Por supuesto, hay un desafío con eso,
03:55que es que probablemente si lo que tu software está haciendo requiere AI en primer lugar,
03:59entonces el fallo puede ser difícil
04:02porque el software convencional no es apto para el trabajo.
04:05Pero tener la máquina presentándole al usuario lo que ha entendido
04:10creo que es muy importante,
04:12para que no vaya y actúe en una disconcepción.
04:16Otro desafío es la disponibilidad de descubrir.
04:18Vemos esto con, por ejemplo, Alexa.
04:20Hay todas estas funciones, pero están escondidas en algún lugar.
04:23Entonces, ¿cómo sabes qué eres o no puedes hacer?
04:26Creo que esto es, en ciertas maneras,
04:29una regresión del software tradicional,
04:31porque los sistemas de menú gigantes han sido el enemigo de mi carrera, creo.
04:35Pero al mismo tiempo, tienen un desafío determinado,
04:38que es que hay un camino obvio para aprender
04:41qué puede hacer el software.
04:43Entonces, vas a encontrar alguna función en particular que necesites en este momento,
04:46la encuentras en este sistema de menú
04:48y probablemente está adjacente a algunas funciones relacionadas,
04:51y esto te expone al menos a ver sus nombres
04:54y tal vez esto te llevará a explorarlo hacia ellos.
04:58No necesariamente tienes eso con, por ejemplo,
05:00la capacidad de hablar a tu computadora y pedir algo.
05:03Es una dimensión interesante.
05:05No había pensado en eso,
05:07pero mientras estabas diciendo eso,
05:09estaba pensando de vuelta en mi propia vida pasada
05:12y había un producto llamado Microsoft Fox Pro,
05:15que era uno de los sistemas de database inicios.
05:18Y yo, en ese momento, estaba súper interesado
05:20en saber cada posible cosa que ese piso de software podría hacer.
05:23Y una de las cosas que hicimos fue abrir el executable
05:27y buscar signos de comandos que estaban ahí,
05:30incluso si no estaban en la documentación.
05:33Pero eso no existe.
05:35El mundo que estás hablando aquí es muy diferente.
05:38No hay un executable para abrir.
05:40A menudo no hay documentación para ir a través.
05:43Entonces, esta evolución rápida de todo al mismo tiempo
05:46parece realmente fascinante.
05:48No había pensado en eso.
05:50Sí, y hay otro tipo de punto débil
05:53que viene con lo que estás diciendo,
05:55que es que el software podría trabajar de vez en cuando
05:58en relación a, digamos, algún tipo particular de cuestión,
06:01y luego, por la milésima vez,
06:03no lo entiende correctamente,
06:05va en una dirección completamente diferente.
06:07Creo que esa es la naturaleza del aprendizaje inductivo.
06:10Nunca tienes una fuerte garantía
06:13de que has visto todas las cosas posibles.
06:16Al aprender de experiencia,
06:18vemos, digamos, dos autos
06:20y ahora tenemos algún sentido de la variedad de tamaños de autos.
06:23Vemos, digamos, un millón de autos
06:25y ahora nos sentimos bastante confiantes
06:27de que tenemos una verdadera comprensión,
06:29un mapeamiento de la variedad de tamaños que un auto podría tener.
06:32Pero realmente nunca tenemos una garantía
06:34de que hemos visto el más grande o el más pequeño auto.
06:37Y este tipo de oscuridad en las fronteras
06:40es un reto, pero al mismo tiempo
06:42nos da todo lo que tenemos con la AI.
06:45Sí, eso es bastante fascinante también.
06:47De nuevo, no había pensado en eso,
06:49en cómo pasamos por ese proceso inductivo.
06:52Patrick, ¿cómo te interesaste en estos tipos de problemas?
06:55¿Puedes contarnos un poco más sobre tu origen?
06:58Mi camino es probablemente un poco inconvencional.
07:01Como estudiante, estudié filosofía,
07:03en particular estética y semiología,
07:06y luego también hice un segundo maestro en producción de películas.
07:10Para mi trabajo de producción de películas,
07:12terminé haciendo un filme narrativo,
07:14así que no estaba tan conectado con este trabajo.
07:16Para mi trabajo de filosofía,
07:18me interesé especialmente
07:20en el filósofo estadounidense Charles Peirce,
07:23un semiólogo que trabaja con la teoría de los signos.
07:26Para ese proyecto, hablé de efectos especiales,
07:29básicamente, como un medio artístico,
07:31pensando en la implicación de un medio
07:33en el que tienes la capacidad de portar
07:35cualquier cosa imaginable, como lo haces en la pintura,
07:38pero con la credibilidad aparente de la fotografía.
07:41Esa combinación es realmente interesante,
07:44poderosa, quizás incluso peligrosa.
07:47En ese momento, estaba imaginando
07:49cómo esto se reuniría
07:51básicamente con un avance en gráficos computadores.
07:53La inteligencia artificial no estaba en mi radar en ese momento,
07:56y también hubo un largo tiempo
07:58desde que llegué a ese tipo de habilidad,
08:00pero esto fue realmente interesante para mí.
08:02Y así, cuando salí de la universidad,
08:04la gente me preguntó,
08:06¿qué tipo de filme me apuntarías
08:08que se acompañe de lo que dices?
08:10Y yo dije, bueno, no sé si haya sido hecho en realidad,
08:13si esta descripción corresponde.
08:15Empecé a intentar hacer esos filmes,
08:17y muy rápidamente, esto me llevó a sentir
08:20que las herramientas que estaban disponibles
08:22para la producción de CG
08:24no estaban realmente diseñadas para las cosas que intentaba hacer.
08:27Y así, como niño,
08:29había hecho un poco de experimentación electrónica
08:31y un poco de programación y tal,
08:33pero no un montón.
08:35Así que fue entonces que empecé a aprender
08:37cómo escribir software
08:39para, básicamente, crear estas herramientas de diseño
08:41para hacer los filmes que intentaba hacer.
08:43Y luego, muy rápidamente,
08:45me di cuenta de que ese era mi interés real,
08:47pensando en cómo las herramientas de diseño,
08:49y en particular, las herramientas de diseño y la inteligencia artificial,
08:51podían funcionar, y eso fue mi interés central.
08:53Y ese interés te ha pagado un poco.
08:56¿Puede que nos cuentes un poco
08:58sobre algunos de los proyectos que has trabajado en el pasado?
09:03Gracias por escuchar a mí, a mí mismo y a la inteligencia artificial.
09:05Nuestro programa fue capaz de continuar,
09:07en gran parte, gracias al apoyo de los escuchadores.
09:09Tus streamings y descargas hacen una gran diferencia.
09:11Si tienes un momento, por favor considera dejarnos
09:13una revisión de un podcast de Apple,
09:15o un rating en Spotify,
09:17y compártelo con otros que crean que es interesante y útil.
09:25Claro.
09:27Poco después de escribir el libro de O'Reilly,
09:29fui acercado a Adobe.
09:31Y, en ese momento,
09:33los vicepresidentes de investigación y diseño
09:35estaban hablando, y estaban
09:37anticipando lo que iba a venir
09:39en los próximos años con la Inteligencia Artificial.
09:41Podían ver que había
09:43muchos lugares en los que la Inteligencia Artificial
09:45podía entrar bajo el anillo de los productos de Adobe
09:47y tener una transformación
09:49de la calidad
09:51de la capacidad
09:53sin necesariamente cambiar la experiencia del usuario
09:55de una manera particularmente significativa.
09:57Un ejemplo de eso podría ser
09:59algo como Content Aware Fill.
10:01Antes de los últimos años,
10:03esa función fue implementada
10:05usando un tipo de algoritmo de extensión de patrón.
10:07Esto funcionaría muy bien
10:09si, por ejemplo,
10:11tratabas de quitar un balón de playa
10:13de sal. Porque, por supuesto,
10:15el sal es un patrón que extiende
10:17perfectamente bien, así que funciona bien.
10:19Pero si, por algún motivo, tratabas de
10:21llenar una región de boca
10:23de una cara humana,
10:25la extensión de los labios, por supuesto,
10:27no te daría lo que quieres.
10:29Entonces, en lugar de usar la pintura neural,
10:31podrías hacerlo mucho mejor,
10:33porque, por supuesto, estás aprendiendo
10:35qué pintar allí desde un gran
10:37ejemplo estatístico sobre cómo estas diferentes
10:39funciones de imagen se relacionan con una a otra,
10:41y así, por supuesto, puedes obtener
10:43una funcionalidad mucho mejor. Pero desde la perspectiva del usuario,
10:45este tool no necesita operar de una manera muy distinta.
10:47Eso es lo que sería fácil
10:49para Adobe para integrarlo a sus productos.
10:51Las cosas que serían más difíciles
10:53son las cosas que estamos empezando a ver ahora,
10:55que no tienen un predecesor
10:57directo, porque las tecnologías anteriores
10:59simplemente no podían
11:01acercarse a ellas.
11:03Oh, claro. Por ejemplo,
11:05poder generar una imagen
11:07de texto, o
11:09hacer algo como
11:11reposar completamente un cuerpo humano.
11:13Tal vez otra área que debería tocar
11:15en respuesta a tu pregunta es
11:17navegación de espacio lenta.
11:19Entonces, dentro del mente de un modelo de aprendizaje
11:21de máquinas, produce
11:23una especie de representación interior
11:25de la variabilidad
11:27en las cosas que se ve y que se aprende.
11:29Entonces, ese espacio
11:31puede ser navegado
11:33en transversal lineal.
11:35En una parte de ese espacio,
11:37podrías tener cosas que parecen
11:39zapatos, y luego, cerca de ahí,
11:41podrías tener cosas que parecen zapatos,
11:43y luego, muy lejos, podrías tener
11:45cosas que parecen, no sé, pájaros.
11:47Entonces, navegando
11:49de una a la otra es un proceso
11:51por el que puedes explorar
11:53y descubrir lo que estás buscando.
11:55Esto podría ser un mecanismo de diseño muy útil,
11:57porque es como, bueno,
11:59eso no está muy bien, pero quiero algo
12:01cerca de eso. Ser capaz de mirarlo
12:03y moverme en ese espacio,
12:05realmente baja la barrera
12:07de exploración y experimentación en el diseño,
12:09donde, tradicionalmente, quizás dibujaste
12:11un zapato, y ahora quieres
12:13probar un zapato de trabajo. Tienes que
12:15completamente redirigir tu entero dibujo,
12:17y es un proceso muy involucrante.
12:19Es una fuente muy poderosa.
12:21Pero, por supuesto, este modo de pensar
12:23en diseñar algo
12:25es sin precedentes,
12:27quizás, y así, pensando en
12:29cómo deberían parecer las interfaces
12:31es un ejercicio de diseño nuevo.
12:33Eso parece interesante también,
12:35porque, si volvemos a tu filo generativo,
12:37sí, es bastante claro que, hey,
12:39solo quiero filar este área, y puedes usar
12:41un nuevo algoritmo para hacerlo
12:43mejor, más fuerte, más rápido,
12:45más rápido, a través de algún ML,
12:47pero no hay una analogía
12:49en la interfaz del usuario para algunas de estas otras herramientas
12:51o algunas de estas otras formas de trabajar.
12:53Así que parece complicado
12:55para un usuario.
12:57Al final, hay un ser humano sentado allí.
12:59¿Cómo les puedes dejar saber que
13:01pueden rotar a una persona,
13:03o que pueden mover algo en el espacio,
13:05o que pueden hacer que un zapato
13:07parezca un zapato de trabajo,
13:09o que lo muevan hacia el espectro de un tiburón?
13:11¿Cómo les puedes dejar saber eso en una interfaz
13:13sin que los envergure?
13:15Sí, es una buena pregunta. Es divertido
13:17porque tengo opiniones sobre esto
13:19que van en dos direcciones completamente opuestas.
13:21En un caso...
13:23Siempre es divertido cuando hay tensión.
13:25Exactamente.
13:27Necesitas la tensión, especialmente en el diseño.
13:29Desde un lado,
13:31como mencionaba un momento antes,
13:33quieres usar la familiaridad
13:35donde la tienes.
13:37Si hay algún truco de algún área relacionada,
13:39entonces, ¿por qué no ayudar a aclamar
13:41al usuario a eso?
13:43En el caso de algo como navegación lenta,
13:45esto podría parecer un mapa.
13:47Estas destinaciones de zapatos
13:49y zapatos de trabajo.
13:51Es como si el sistema existiera en una superficie
13:53y te dirigieras un poco más al oeste
13:55si quieres llegar a la playa.
13:57O, similarmente,
13:59te dirigirías un poco más en esta dirección
14:01si quieres llegar a este tipo de zapatos.
14:03Entonces, creo que esos tipos de cues son muy útiles.
14:05Al mismo tiempo,
14:07creo que tienes que tener cuidado
14:09porque un medio artístico
14:11o un medio de diseño
14:13es algo donde las propiedades del medio
14:15en sí mismo van a tener
14:17un gran impacto en la naturaleza de la salida.
14:19Volviendo a Clement Greenberg,
14:21el teórico de arte,
14:23quien básicamente dijo
14:25que no se debería hacer una escultura
14:27que debería ser una pintura
14:29para truncar eso.
14:31Creo que, al mismo tiempo,
14:33no quieres necesariamente
14:35que la gente haga arte con la AI
14:37en la misma mentalidad
14:39que lo harían con Photoshop antes de la AI.
14:41Creo que quieres
14:43intentar engendrar
14:45una especie de abiertura
14:47para poder hacer
14:49la mayoría del trabajo para ti.
14:51Porque, generalmente,
14:53lo primero que harán
14:55es algo muy cercano
14:57al paradigma anterior,
14:59como las herramientas de edición de películas
15:01que se borran de los editores
15:03de tabletop de Steam.
15:05Al mismo tiempo, la generación de la AI
15:07primero ve muy cercano
15:09a lo que hacían con las herramientas
15:11de la generación anterior
15:13y luego empiezan a explorar hacia afuera.
15:15Para mí, como creador de herramientas,
15:17lo más importante
15:19es que siempre hablamos
15:21de casos de uso,
15:23necesidades de usuario y puntos de daño de usuario
15:25y intentamos desarrollar
15:27trabajos que estén bien investigados
15:29en términos de lo que un usuario intenta hacer.
15:31Pero siempre siento que
15:33si la herramienta se utiliza
15:35exactamente como lo esperábamos,
15:37entonces realmente hemos fallado
15:39catastróficamente.
15:41Creo que las cosas más interesantes
15:43de las herramientas de la generación anterior
15:45son las cosas que están cerca
15:47de lo que deberían ser.
15:49Un ejemplo que me gusta dar con eso
15:51son las personas que construyen cosas
15:53como computadoras de 8 bits en Minecraft.
15:55Es un poco loco desde una perspectiva práctica.
15:57Obviamente, esta es una de las maneras
15:59más ineficientes de poder producir
16:01la simulación de un procesador,
16:03pero al mismo tiempo es tan genial.
16:05Es fascinante.
16:07De hecho, ¿puedes volver y explicar
16:09un poco sobre eso?
16:11Porque hay gente que entiende
16:13lo que es, pero tal vez
16:15explícanos el procesador de 8 bits en Minecraft,
16:17tal vez para las personas que no lo conocen.
16:19Sí, absolutamente.
16:21Minecraft es un juego
16:23con una visión de fidelidad baja,
16:25creo que podríamos decir que es un juego
16:27de mundo abierto.
16:29En él, el usuario puede poner estos bloques
16:31o remover los bloques,
16:33y la mayoría de ellos son estáticos,
16:35para representar el concreto y cosas así.
16:37Pero también puede haber bloques de agua
16:39y sistemas dinámicos.
16:41Esto significa que
16:43puedes mover bloques alrededor del espacio.
16:45Como resultado,
16:47puedes simular el flujo de datos.
16:49Y como resultado,
16:51es posible crear
16:53una especie de simulación
16:55de cómo los electrones se moverían
16:57a través de un chip.
16:59Por lo tanto, puedes crear
17:01una especie de emulación
17:03de un procesador de computadores.
17:05Estos tipos de proyectos
17:07son, para mí, los mejores
17:09de una herramienta abierta.
17:11Mucho de lo que se está enfrentando aquí es
17:13que voy a definirlo
17:15como una explotación
17:17donde quieres hacer fácil
17:19estas mejoras incrementales
17:21porque eso es el rellenar
17:23el balón de la playa y el sal.
17:25Por otro lado, quieres
17:27también apoyar la capacidad
17:29de hacer algo loco.
17:31Y parece que la mayoría de lo que has hablado
17:33está en el espacio del diseño visual.
17:35¿Esta tensión se realiza en otros lugares?
17:37¿Qué otras maneras
17:39podemos...
17:41Empezamos con el aprendizaje de máquinas
17:43para clasificar el spam, sí o no,
17:451-0, sí o no,
17:47¿es esto spam, es esto fraude?
17:49Y ahora estamos hablando de llenar
17:51la boca y la cara.
17:53¿A dónde va este diseño?
17:55¿Qué más podemos usar estos
17:57herramientas para diseñar?
17:59Hemos visto durante los últimos dos o más años
18:01esta explosión de aplicabilidad
18:03en nuestro sistema educativo.
18:05Hemos venido a ver un contraste
18:07entre los artes y las ciencias,
18:09o entre diseño y ingeniería,
18:11o arte y ciencia, o lo que quieras.
18:13Voy a usar un ejemplo de arte, porque creo que es más fácil
18:15de hablar aquí, pero si estás intentando dibujar
18:17una portada de una cara humana,
18:19creo que la mayoría de los artistas dirían
18:21que sería un error intentar dibujar
18:23la nariz a resolución completa
18:25y detalle antes de pasar
18:27a la próxima forma de la cara.
18:29En lugar de eso, es probable que sea
18:31posible dibujar
18:33los nostriles aproximadamente aquí y aquí,
18:35y los dos ojos aproximadamente aquí y aquí.
18:37Ahora pasamos un paso atrás
18:39y miramos la imagen en general.
18:41Estos parecen ser correctos en relación a uno al otro.
18:43Ahora empezamos a bajar
18:45a una de esas funciones y añadir detalles,
18:47tal vez uno de los ojos.
18:49Ahora volvemos a la vista de la gran imagen
18:51y realizamos que el ojo ahora parece bien,
18:53pero está un poco equivocado en proporción a la nariz,
18:55así que tenemos que ajustarlo.
18:57Siempre estamos mudando
18:59entre estas diferentes consideraciones.
19:01Y creo que eso es muy cierto en la ingeniería de software
19:03o en el trabajo científico,
19:05que tenemos que rellenar
19:07todas las piezas en relación a uno al otro
19:09y luego siempre volver a
19:11cómo todo esto se conecta.
19:13Si piensas en una tecnología
19:15que puede reasonar desde el primer principio,
19:17no es solo leer libros
19:19que hemos escrito sobre una enfermedad,
19:21puede hacer un trato y un error
19:23desde cero y llegar a soluciones de esa manera.
19:25Naturalmente, esto sería
19:27algo que nos llevaría a las ciencias
19:29y quizás nos llevaría a todas las cosas
19:31sobre las que tenemos espacios ocultos.
19:33Así que, en términos de proceso,
19:35creo que hay mucho que aprender
19:37de las herramientas de diseño
19:39y de cómo pensamos en herramientas
19:41para la ingeniería y las ciencias.
19:43Creo que estamos realmente en el precipicio
19:45de la AI jugando un papel muy,
19:47muy transformador en esos campos también.
19:49Estoy particularmente emocionado por esto
19:51porque parece a mí que, naturalmente
19:53y entendiblemente,
19:55es el papel que juega la AI en el mundo.
19:57Creo que, particularmente,
19:59si miramos su embedimiento
20:01en productos consumidos hoy en día,
20:03mucho de eso se siente
20:05como una especie de reemplazamiento
20:07del papel humano.
20:09Esta cosa puede escribir un esfuerzo
20:11para ti, esta cosa puede dibujar una foto
20:13para ti, así que parece como
20:15uno dentro y uno fuera.
20:17Pero, ya sabes, no debe ser un juego
20:19de cero suma, y particularmente
20:21cuando pensamos en cosas como
20:23ayuda, y creo que esto puede ser
20:25un juego de cero suma
20:27en el que usamos
20:29esta tecnología para ayudarnos
20:31en áreas en las que no podemos
20:33lidiar con la complejidad
20:35del espacio de posibilidades.
20:37Nosotros, por supuesto,
20:39por diseño, somos las personas
20:41que apuntan esto hacia
20:43algo, ¿verdad? Así que creo que la motivación,
20:45la etosa, si lo dices, viene de nosotros,
20:47pero la AI puede
20:49jugar un papel muy significativo
20:51para nosotros.
20:53Entonces, ¿qué lo hace difícil?
20:55Todo esto suena maravilloso, pero todos sabemos
20:57que no es fácil. ¿Qué lo hace difícil?
20:59Buena pregunta.
21:01Una cosa que en realidad ha sido un problema
21:03en la aplicación a las ciencias
21:05es la capacidad de simular
21:07el sistema
21:09en el que estamos actuando.
21:11Si miramos algo como aprendizaje de reemplazamiento
21:13y, digamos, la aplicación de DeepMind
21:15a juegos como Go y Chess,
21:17estos juegos son muy fácilmente simulados,
21:19sus reglas no son
21:21muy complicadas, así que, por supuesto,
21:23el juego puede ser simulado completamente.
21:25Entonces, un sistema de aprendizaje de reemplazamiento,
21:27que es básicamente un sistema de aprendizaje
21:29que opera similarmente a
21:31cómo entrenar a un perro,
21:33donde si toma la acción correcta, le da una recompensa,
21:35y si toma la acción errada, le da
21:37una recompensa. En el caso de un modelo de aprendizaje de máquinas,
21:39es una recompensa numérica,
21:41en lugar de comida,
21:43pero la misma idea básica.
21:45Estos tipos de sistemas son
21:47capaces de navegar espacios de posibilidades
21:49que son astronómicamente grandes.
21:51El espacio de posibilidades en Go
21:53es más grande que el número de átomos
21:55en el universo. En Go,
21:57solo tienes que jugar millones
21:59y millones de juegos dentro de un computador.
22:01Yo pienso que, comparado
22:03con los modelos de lenguaje grandes actualmente,
22:05esas cosas han leído más
22:07de lo que yo nunca leeré.
22:09Fundamentalmente, ellos han ingerido
22:11mucho más entendimiento
22:13de lenguaje que yo nunca,
22:15ni de cualquiera humano.
22:17Y aún así,
22:19he ayudado a su ejecución
22:21en mucho de lo que escribí.
22:23Debe haber algún enlace falso
22:25que no estamos muy conectados,
22:27y tal vez sea ese escándalo y el transferir
22:29que es un trozo de eso.
22:31Es cierto. Tu punto me lleva a algo
22:33que me parece muy, muy interesante.
22:35Algo que no sé que
22:37hubiera sido de alguna manera obvio
22:39para mí, si no hubiera sido por
22:41lo que ha pasado en los últimos años de la A.I.,
22:43que es que la omnisciencia
22:45en realidad tiene algunos desventajas.
22:49Estoy muy consciente de eso.
22:51Es como, resulta que
22:53leer todo
22:55puede ser
22:57una forma de ser
22:59un poco inopinionado
23:01o de no tener realmente
23:03una perspectiva en el mundo.
23:05Hay este proceso que se usa
23:07como parte del
23:09entrenamiento de modelos de lenguaje
23:11llamado RLHF,
23:13que significa Reinforcement Learning from Human Feedback.
23:15Y se usa para
23:17múltiples propósitos. Uno de ellos es
23:19para condicionar al modelo para hablar
23:21de una manera más conversacional,
23:23en lugar de una manera autocompleta
23:25en la que te termina la frase.
23:27Y eso es importante desde el punto de vista
23:29de experiencia del usuario. Pero también
23:31ayuda a perspectivizar al modelo
23:33para entender qué es una buena respuesta.
23:35La manera en que este proceso funciona
23:37es básicamente que tomas
23:39un modelo que ya está muy entrenado,
23:41le das un indicador,
23:43algún tipo de encuaderno,
23:45le pidas que genere múltiples respuestas,
23:47y luego te da un humano
23:49para dar una escala a cuál respuesta
23:51les pareció preferible. Así que esto
23:53puede ayudar a condicionar cosas como
23:55cuánto son conversacionales, chatos, amigables
23:57o no amigables para estar en la respuesta.
23:59Pero también tiene el efecto
24:01de singularizar la perspectiva
24:03del modelo. Así que no está
24:05mirando todo desde todos los ángulos,
24:07lo cual es equivalente a mirarlo
24:09desde todos los ángulos.
24:11Esa es una análoga interesante.
24:13Déjame transitar, teniendo en cuenta
24:15tus omnisiones. Tenemos un segmento
24:17donde intentamos hacer preguntas rápidas.
24:19Así que estamos buscando la primera
24:21cosa que nos venga a la mente.
24:23¿Qué crees que es la mayor oportunidad
24:25para la inteligencia artificial ahora?
24:27La ciencia avanzada.
24:29¿Cuál es la mayor preconcepción
24:31que la gente tiene?
24:33Que no hay futuro para los humanos.
24:35¿Cuál fue la primera carrera que querías?
24:37Cuando tenía cinco años,
24:39fue cuando la virtual realidad
24:41comenzó por primera vez.
24:43Y estaba muy emocionado
24:45por eso. Pensé que era muy guay
24:47y que haría replicas de
24:49capas de VR de aluminio,
24:51no funcionales, pero de diseño.
24:53Así que el diseñador de VR
24:55fue mi primera
24:57aspiración de carrera.
24:59¿Cuándo es demasiado
25:01inteligencia artificial?
25:03Buena pregunta.
25:05Cuando llegamos al punto en que
25:07no sentimos la motivación
25:09de intentar mejorar el mundo nosotros mismos.
25:11Si perdemos contacto con eso,
25:13entonces no hay sentido en la inteligencia artificial
25:15poder hacerlo.
25:17¿Cuál es una cosa que deseas que la inteligencia artificial
25:19pueda hacer ahora que no puede?
25:21Es divertido porque
25:23en mi propia vida me siento bastante contento
25:25con las cosas. No siento que hay
25:27alguna capacidad perdida.
25:29Así que me siento muy emocionado
25:31con la tecnología, pero al mismo tiempo
25:33es casi por el bien de ver
25:35lo que es posible, más que sentir
25:37que algo está faltando.
25:39Pero quizás más tangiblemente.
25:41¿Puedes construir un computador de 8 bits en Minecraft?
25:43Exactamente, exactamente.
25:45Sí, una especie de conquista intelectual,
25:47supongo.
25:49Pero no, creo que sería muy guay
25:51tener robots en casa.
25:53Esto es bastante fascinante.
25:55No puedo creer todos los temas que hemos cubierto.
25:57Creo que has abierto mis ojos
25:59con el diseño.
26:01Hay mucho que hemos hecho hasta ahora con el diseño,
26:03pero el potencial es realmente bastante fascinante.
26:05Gracias por tomar el tiempo de hablar con nosotros hoy.
26:07Muchas gracias por tenerme.
26:09Ha sido un placer.
26:11Ha sido una conversación muy divertida.
26:13Gracias por escuchar.
26:15La próxima vez que Sam y yo cerremos la temporada 9
26:17hablando con Joel Pinault,
26:19vicepresidente de investigación artificial en Meta.
26:21Por favor, acompáñanos.
26:23Gracias por escuchar a mí, a mí mismo y a la inteligencia artificial.
26:25Creemos, como ustedes,
26:27que la conversación sobre implementación artificial
26:29no empieza y no termina con este podcast.
26:31Es por eso que creamos un grupo en LinkedIn
26:33específicamente para escuchadores como ustedes.
26:35Se llama AI por Líderes.
26:37Y si se unen a nosotros, pueden hablar con los creadores y hosts del programa,
26:39preguntar sus propias preguntas,
26:41compartir sus conocimientos
26:43y obtener acceso a recursos valiosos
26:45sobre implementación artificial de MIT-SMR y BCG.
26:47Pueden acceder a ello
26:49visitando
26:51mitsmr.com
26:53forward slash AI for Leaders.
26:55Gracias por escucharnos y esperamos verte allí.
27:25www.mitsmr.com

Recomendada