domingo, 25 de septiembre de 2022

Con tecnologías de Reconocimiento del Habla y Comprensión del Lenguaje Natural, los estudiantes del Laboratorio del Procesamiento de Lenguaje Natural (PLN) construyeron un prototipo que permite a las personas con ceguera o debilidad visual comprar y vender productos en línea

 Hackatón de Facebook; Jason Angel, Sabur Butt y Christian E. Maldonado, alumnos del CIC-IPN, obtuvieron mención honorífica y premio


Jason Angel, Sabur Butt y Christian E. Maldonado, alumnos del CIC-IPN, obtuvieron mención honorífica y un premio monetario en el Hackatón F8 de Facebook por su prototipo «VOISELL – Marketplace for the Visually Impaired». 

Utilizando las tecnologías de Reconocimiento del Habla y Comprensión del Lenguaje Natural, los estudiantes del Laboratorio del Procesamiento de Lenguaje Natural (PLN) construyeron un prototipo que permite a las personas con ceguera o debilidad visual comprar y vender productos en línea, en una competencia donde participaron más de 200 proyectos de todo el mundo, en el evento co-patrocinado por BeMyApp. Los alumnos planean seguir desarrollando su prototipo con miras a volverlo un producto de innovación.

Este galardón se suma a los múltiples premios obtenidos por los miembros del Laboratorio en competencias internacionales auspiciadas por Google, Microsoft, Facebook, Oracle y Yahoo!, entre otros. Los galardonados son asesorados por el reconocido Dr. Alexander Gelbukh -líder del Laboratorio- así como a los Doctores Grigori Sidorov y a Olga Kolesnikova de la ESCOM, egresada de este mismo centro.

Los alumnos planean seguir con el desarrollo de su prototipo con miras a volverlo un producto de innovación.

La meta del reto lanzado por Facebook fue promover la utilización de Wit.AI el framework de Procesamiento de Lenguaje Natural de la compañía, para desarrollar aplicaciones con las cuales las capacidades de reconocimiento de voz y comprensión de lenguaje de ésta tecnología se aprovechen al máximo. La tarea fue revelada solo al arranque de la competencia dejando un poco más de 6 días para definir, desarrollar e implementar el prototipo.

Este reconocimiento eleva no solo los nombres del laboratorio de PLN, del CIC y del IPN, sino de Colombia, Pakistán y México, los países de origen de los alumnos premiados. El ambiente internacional del laboratorio de PLN y el entorno competitivo del Centro de Investigación en Computación impulsan a sus estudiantes en estas iniciativas.


Alumnos de más de 30 países acuden a México para integrarse en el Laboratorio de Procesamiento de Lenguaje Natural del CIC-IPN.

El Hackatón se llevó a cabo de manera remota debido a las limitaciones impuestas por la pandemia de COVID-19 y fue la oportunidad para trabajar en equipo y atraer talento de todo el mundo a la competencia, enriqueciendo las propuestas. Los participantes del CIC trabajaron remotamente, en tanto se restableció la normalidad al interior del instituto y el centro de investigación.

El ser becarios permite a los estudiantes del CIC participar en las competencias con la tranquilidad de no tener que trabajar y estudiar. Esto es posible por el nivel de excelencia del Centro de Investigación que asegura un gran número de becas CONACyT para sus estudiantes, al tener sus tres programas de posgrado con nivel de competencia internacional —el más alto— en el Programa Nacional de Posgrados de Calidad (PNPC). Asimismo, los profesores del centro tienen una alta tasa de aceptación de proyectos ante la Secretaría de Investigación y Posgrado del IPN, permitiendo que los alumnos accedan a becas BEIFI.

Falta de mecanismos efectivos para su documentación, lenguas en declive y alto riesgo de extinción. Alumnos del IPN desarrollan app.

 Alumnos del IPN desarrollan app para el fortalecimiento de lenguas indígenas mexicanas


Existen 68 lenguas indígenas en México que suman más de 7 millones de hablantes y 25 millones de personas que se identifican con dichos grupos lingüísticos aún sin hablar la lengua. Así mismo, las lenguas indígenas han sido reconocidas por la UNESCO como “herencia insustituible para la humanidad y […] un patrimonio invaluable para la sociedad”. Debido a falta de mecanismos efectivos para su documentación, estas lenguas se encuentran en declive y alto riesgo de extinción.

    “En este proyecto utilizaremos técnicas de programación novedosas que permitan brindar a los hablantes bilingües –indígena/español–, una manera sencilla y rápida de registrar traducciones, y realizar anotaciones de multimedia en su lengua y variante indígena. La información recolectada por INDLEX servirá a investigadores de humanidades y de inteligencia artificial que requieran mayores recursos léxicos y desarrollar tecnologías del lenguaje en beneficio de las comunidades indígenas de México, explicó Christian Efraín Maldonado Sifuentes.

En el mundo existen cerca de 7000 lenguas habladas y se estima que la mitad están en peligro de desaparecer en el transcurso de este siglo. Por ello se han desarrollado esfuerzos como los de Broadwell et al, 2020 y Harrison et al 2019, para el rescate de las lenguas en peligro de desaparecer.

La aplicación INDLEX busca simplificar la recolección de traducciones de palabras y recursos multimedia representados en múltiples lenguas indígenas de México y sus más de 360 variantes lingüísticas. Permitirá interfaz sencilla y amigable para ser usada por cualquier persona bilingüe (indígena/español); operar en condiciones de baja conectividad, o utilizar la app sin conexión a internet empleando tecnología de sincronización de datos; Implementar una base de datos abierta que almacene múltiples traducciones de cada vocablo por lengua y variante, permitiendo la expresión natural de los hablantes; desarrollar un sistema multi-usuario para que diversos hablantes puedan trabajar con un solo dispositivo. Asimismo, fácil acceso a los datos para que investigadores de diferentes áreas y disciplinas puedan hacer uso de los mismos con fines académicos y de preservación de lenguas.

En el equipo, cuyo co-responsable técnico es el Dr. Grigori Sidorov, del Centro de Investigación en Computación del IPN, participan los alumnos Jason Efrain Angel Gil, José Eduardo Valdés Rojas, José Ricardo Jimenez Yáñez, Alain Pacchiano Alemán, Sergio Gabriel Sánchez Valencia, Christen Danae Maldonado Ortega. Han participado como autores, co-organizadores y asistentes en prestigiosos congresos internacionales de la inteligencia artificial, y el procesamiento de datos donde se resaltan las aplicaciones a comunidades de lenguas entre las que destacan AmericasNLP y la Escuela de verano de NAACL.

Así mismo, son organizadores del 2do. congreso de Procesamiento de Lenguaje Natural para Lenguas Indígenas (PLN Indígenas), colaboradores en la asociación de NLP for Social Good y fundadores de AMNLP, asociación que busca el avance de las minorías mediante el procesamiento de lenguaje natural. Tiene una colaboración cercana con el equipo de activistas, investigadores, y desarrolladores de Miyotl, una comunidad de programadores y hablantes de lenguas indígenas que desarrollan un App para la preservación de estas lenguas y ha causado un gran impacto en diversas partes del mundo con más de 30,000 descargas y 2,500 usuarios activos diariamente

aplicación que ayudará a los hablantes de inglés aprender español... Estudiantes del IPN desarrollan sistema para aprendizaje de lenguas basado en IA.

 Estudiantes del IPN desarrollan sistema para aprendizaje de lenguas basado en IA

Será básicamente una aplicación móvil que, en su primera etapa, ayudará a los hablantes de inglés a aprender español

Al laboratorio de lenguaje natural y procesamiento de texto del Centro de Investigación en Computación (CIC) del Instituto Politécnico Nacional (IPN), llegan estudiantes de todo el mundo para aprender del multipremiado doctor, Alexander Gelbukh, un matemático ruso que desde hace 25 años vive en México porque, dice, es el mejor país para hacer investigación.

“He viajado por 60 países y conozco muchas universidades de todos los continentes y en ningún lugar del mundo hay condiciones para estudiar y condiciones para la investigación tan buenas como en México”, comentó Alexander Gelbukh.

El doctor Gelbukh puso a México en el mapa internacional de la lingüística computacional, gracias a las investigaciones que se realizan en este laboratorio que desde hace años dirige.

Actualmente, uno de los proyectos que aquí se desarrollan es un sistema para facilitar el aprendizaje de lenguas.

Será básicamente una aplicación móvil que, en su primera etapa, ayudará a los hablantes de inglés a aprender español.

“En estos momentos tenemos un prototipo funcional de la app, la cual funciona tanto en interfases móviles como en sitios web y la gran parte del proyecto está aún en desarrollo. Por ejemplo, creando ejercicios que los usuarios puedan contestar preguntas o puedan marcar en una selección múltiple”, señaló Jason Ángel, estudiante de doctorado en el CIC.

Sin embargo detrás de esta app, llamada Vocab Trainer, hay mucho trabajo de investigación en inteligencia artificial y ciencia de datos, lo que permite que las preguntas y ejemplos en la app se generen automáticamente.

“Aquí te tengo digamos como un ejemplo de qué es lo que hace “cómo se le dice a una mujer que es rey” o sea cuál es el equivalente de rey para una mujer, entonces al modelo se le pregunta aquí con esta línea de código y te debería dar como respuesta reina”, comentó Carlos Alberto Rodríguez Díaz, estudiante de doctorado en el CIC.

Este modelo de inteligencia artificial también toma en cuenta el cambio semántico, es decir, cómo el significado de las palabras ha variado a lo largo del tiempo.>

Si no entendemos los cambios semánticos no podemos entender cómo el vocabulario, y lo que las palabras y enunciados significan. Así que para entender el significado detrás de las palabras, tú tienes que entender el contexto detrás de ellas y el cambio semántico nos permite entender ese contexto explicó Sabur Butt, estudiante de doctorado en el CIC.

Esta app ayudará a docentes y estudiantes de español con ejemplos actuales que elaborará a partir de la información que encuentra en Internet.

“Lo que está sucediendo en internet en la actualidad, se convierte en parte de las preguntas que tú estás teniendo para tus alumnos como profesor, para el estudiante esto también es muy importante. Para el profesor es importante porque tiene menos trabajo y tiene más recursos, se pueden generar preguntas de manera automática para que cada alumno tenga un examen independiente, por ejemplo”, puntualizó Christian Maldonado Cifuentes, estudiante de doctorado en el CIC.

La app podría estar lista para ser usada por el público en unos ocho meses.