Gabriela Salas logró incorporar la lengua Náhuatl en Google traductor. En entrevista para MILENIO habla sobre cómo surgió esta iniciativa y cómo se llevó a cabo este proceso.
Category
🗞
NoticiasTranscripción
00:00Bueno, regresamos con más temas de inclusión, porque las lenguas indígenas de México son de gran relevancia para la identidad, para la cultura del país,
00:09y el que no estuvieran en Google, pues era una carencia que afortunadamente se ha resuelto en el caso de la lengua náhuatl,
00:18en particular de una zona del país, sabemos que hay varias variantes, y de otras lenguas.
00:24¿Quién ha hecho posible esto? Pues una joven, Gabriela Salas, que es programadora y científica de datos, que nos acompaña esta tarde,
00:33le agradecemos mucho que esté con nosotros vía Zoom. Hola, Gabriela.
00:37Bienvenida.
00:38Hola, hola, buenas tardes, muchísimas gracias.
00:41Pues primero, compartirte el gusto que nos da saber que una de nuestras lenguas indígenas ya está considerada entre las opciones de Google.
00:50Y segundo, pues que nos cuentes cómo nació esta iniciativa, cómo se consiguió.
00:57Bueno, la iniciativa fue que más que nada uno es preservar nuestras lenguas.
01:04Siempre hemos pensado que poco a poco se nos van perdiendo, es cierto, de 248 lenguas nada más hay 68.
01:14Y bueno, dije tengo que hacer algo, uno de ellos es la inteligencia artificial que está de moda,
01:20y qué mejor una traducción automática que sería con Google, ¿no?
01:24Y que una base de datos, tener toda la traducción completa del náhuatl.
01:29Hay muchas variantes, creo que hay más de 20, 30 más o menos.
01:34Entonces, pues dije, tengo la base de datos y puedo ser voluntaria en esto de las traducciones, pues qué mejor que participar.
01:44Bien, y platícanos un poquito más, ¿cómo fue todo este proceso? ¿Cuánto tiempo te llevó? ¿Fue complicado?
01:53La verdad sí es complicado, porque como lo mencioné, hay muchas variantes.
01:58De hecho, mi náhuatl es de la huasteca italiense y fotocina.
02:03Y bueno, es recabar toda la información, los documentales, libros, cuentos.
02:10Náhuatl fue muy tedioso, porque hay cuentos que supongamos que los libros,
02:17o que están en una imagen escaneados, pues tienes que estar escribiendo de nuevo, ¿no?
02:25Y los videos, pues tienes que pasar todos los guiones, ver qué palabras son más o nada, son más similares,
02:33para que se pueda hacer ahora sí que un náhuatl que sea entendible para todos, para todos los variantes, claro.
02:40Es decir, Gabriela, que tú trabajaste la base de datos con diversas fuentes,
02:45y la fuiste mejorando para que ya pudiera utilizarse con el traductor de Google, según entendemos.
02:53Así es. La base de datos yo la tenía como hace aproximadamente dos años, la estuve como mejorándolo,
03:00y pues además en estos años que se está implementando mucho la tecnología,
03:08pues se me dio la oportunidad de encontrar más base de datos, y dije, no, pues lo voy a implementar.
03:14Y así fue empezando a crecer mi base de datos.
03:17Lo que hacía ahora sí que en tiempos extras, pues era que hacía mis predicciones de cómo sería como una traducción automática,
03:26porque hasta de eso tenemos que hacer como modelados.
03:29Google ya tiene, perdón, tiene sus propios modelados,
03:32entonces pues solo es ingresar la base de datos, toda la información que ellos requerían,
03:37y pues ahora sí que ya se hizo todo lo que es el traductor de Google en náhuatl.
03:43Bueno, ¿y cómo te sientes ahora de verlo concluido?
03:46Tú dices que también apoyaste para algunas otras lenguas, tú hiciste náhuatl,
03:52pero ¿apoyaste también de alguna otra manera a que se sumaran otras?
03:58Así es. Hay unos, por ejemplo el zapoteco, pero aún así se sigue trabajando.
04:05¿Por qué? Porque no hay tanta información como debería.
04:08En este caso el náhuatl, pues hay muy poca información,
04:12pero se trata de ahora sí que recuperar todo y no dejar como que nada la deriva,
04:17no dejar escapar ningún video, y pues qué mejor hacer la difusión,
04:22porque pues estamos en la agenda 2022-2032 sobre el rescate de lenguas indígenas.
04:29Oye, Gaby, y el hecho de que ya esté la traducción escrita,
04:35¿va acompañada del audio o todavía hay que trabajar la parte del audio?
04:42Nada más se encuentra lo que es la traducción.
04:45No, no se cuenta todavía con el audio, porque bueno, todavía se tiene que trabajar en ello.
04:51¿Es posible que sí se pueda incluir? ¿Tardaría mucho tiempo?
04:55¿O sí es algo que se puede hacer a corto plazo?
04:59Se puede hacer a largo plazo, de que se puede incluir, se puede incluir.
05:04Como verán, la traducción del náhuatl, pues te da como se pronuncia,
05:11entonces pues no hay tanto problema.
05:13Entonces aquí la pronunciación sería como algo extra,
05:17pero sí se tiene que implementar para que se escuche ahora sí que las entonaciones,
05:23la gramática y cosas así de nuestro náhuatl.
05:27Bueno, y esta es parte de tu trabajo como científica de datos.
05:31¿Qué otras ocupaciones o áreas de interés te llaman como programadora?
05:39Bueno, estoy trabajando sobre inteligencia artificial,
05:45sobre igual de lenguas indígenas con chat GPT,
05:48porque aquí mi prioridad es rescatar las lenguas que están en peligro de extinción,
05:53pero me han dicho, me han dado consejos que no solo me enfoque en las lenguas que están en peligro de extinción,
05:59sino que me enfoque también en todas las lenguas,
06:02con la finalidad que pues ahora sí que desde tu teléfono puedas ver, puedas traducir,
06:07puedas escuchar un cuento en náhuatl, zapoteco, en otras lenguas.
06:12Entonces esa es una de ellas,
06:15y ahorita pues también estoy trabajando con la detección temprana de leucemia,
06:21ahora sí que en varones, porque son los casos que se han dado mucho en donde vivo,
06:26entonces estoy trabajando en una inteligencia artificial que me pueda ayudar a detectar y prevenir la leucemia.
06:33También los casos de depresión en jóvenes,
06:36porque bueno, siempre lo diré que los jóvenes son el futuro del país.
06:42Y en el tema de género,
06:46¿qué tanto te has enfocado, por ejemplo, en apoyar a las mujeres de la Huasteca,
06:53de Hidalguense, que es tu lugar de origen?
06:56¿Crees que es relevante también?
06:59Sí, es muy relevante, aunque sí he escuchado comentarios que las mujeres de la Huasteca
07:06no estamos destinadas a ser programadoras o científicas, que nos dedicamos a la cocina o casarnos.
07:13Para mí es importante porque vamos a romper brechas de género,
07:18en el sentido de que toda mujer indígena pueda hacer muchas cosas,
07:23y pues también que ellas saben que yo soy mentora,
07:26y pues uno de mis sueños es poder impulsar a más mujeres y niñas indígenas
07:32en lo que son las ramas del STEM, de la ciencia, tecnología, ingeniería y matemáticas.
07:37Y bien que lo estás haciendo, Gabriela, gracias por compartir esta información con nosotros,
07:41y seguramente eres inspiración para muchas otras mujeres,
07:44de que sí podemos dedicarnos a lo que nosotros queramos sin ningún problema. Gracias.
07:49Gracias a ustedes.
07:51Pues un saludo a Chapulhuacán, ¿así se pronuncia?
07:55Así es, así se pronuncia Chapulhuacán.
07:58¿Chapulhuacán es algo?
07:59Nada más porque está el acento, que es en la A, es Chapulhuacán,
08:04Chapul es, quiere decir lugar de saltamontes, de chapulines, y Cán es el lugar, ¿no?
08:10Es lugar de chapulines, porque aquí donde yo vivo hay muchos saltamontes, muchos chapulines,
08:15y bueno, cuando gusten venir, ahora sí que es uno de los animalitos más representativos de mi municipio.
08:22Gracias.
08:23Te lo agradecemos.
08:25Gracias.