WEBINARS – lenguajenatural

Seminarios de Inteligencia Artificial (AI) y Procesamiento del Lenguaje Natural (NLP)

ChatNatural & LeNIA: Transformación Empresarial con Modelos de Lenguaje, Técnicas y Estrategias Clave

En esta charla en AFI DataTalks Alejandro Vaca nos cuenta cómo hemos desarrollado en LenguajeNatural.AI los modelos de lenguaje del Estado del Arte en Español, algunos de los cuales hemos liberado públicamente: LeNIA. Para ello nos explica las diferencias entre la comprensión y la generación de texto, las diferentes sub-tareas que forman cada campo y nos ayuda a navegar por el fascinante mundo de los modelos de lenguaje.

Adicionalmente, enseña una demo de ChatNatural, el sistema de RAG propio de LenguajeNatural.AI, con el que ayudamos a empresas y organismos públicos a desarrollar sistemas de chat con una base de datos documental.

Tutorial Entrenamiento Instrucciones LLMs - SomosNLP Hackathon (Marzo 2024)

En esta charla Alejandro Vaca nos cuenta cómo entrenar LLMs para tareas de instrucción y modelos de chat, descubriendo los trucos, técnicas y estrategias más importantes a seguir para lograr este objetivo. Todo ello se muestra con el uso de la librería autotransformers, la cual facilita el entrenamiento, optimización y comparación de modelos de NLP, tanto en tareas de comprensión de texto (NLU) como en tareas de generación de texto (NLG).

Todo ello se engloba en el contexto del Hackathon SomosNLP 2024, en el cual LenguajeNatural.AI tuvo un papel muy relevante, donando corpus para la evaluación de LLMs en español.

RigoChat: LLMs del Estado del Arte en Español - SpainAI Webinars (Febrero 2024)

En esta charla junto a Álvaro Barbero, Alejandro Vaca nos habla de RigoChat, el modelo de lenguaje desarrollado para el IIC, que resulta ser un hito en español a fecha de Febrero 2024, obteniendo resultados del Estado del Arte. En esta charla se detallan técnicas como Low Rank Adaptation (LoRA), cuantización y Quantized LoRA (QLoRA) para el entrenamiento por instrucciones y conversacional de grandes modelos del lenguaje (LLMs).

Además, durante la última media hora del seminario online Alejandro nos muestra las habilidades del modelo desarrollado RigoChat, mediante una demo en la que se pone a prueba el modelo, primero con un ejemplo seleccionado por él mismo y posteriormente con preguntas y ejemplos del público.

ChatGPT, LLMs y el Futuro de la Generación del Lenguaje: AFI DataTalks (Julio 2023)

En este seminario, Alejandro Vaca nos cuenta cómo alinear grandes modelos de lenguaje (Large Language Models – LLMs) con las preferencias humanas. A partir de ChatGPT, el mejor ejemplo de cómo se han empleado estos métodos para crear sistemas de chat potentes, exploramos cómo hacer que los LLMs se acerquen más a los usuarios, tanto en términos de habilidades concretas como de capacidad de comunicación.

Tecnologías clave de chatgpt - Hackaton SomosNLP 2023 (Mar. 2023)

En este webinar de Marzo de 2023, durante el hackaton de SomosNLP, Alejandro Vaca nos cuenta las tecnologías que hay detrás de ChatGPT. Para ello, indaga en la intrahistoria de este modelo que revolucionó para siempre el mundo de la Inteligencia Artificial Generativa y el Procesamiento de Lenguaje Natural, para después explicar los detalles de Reinforcement Learning from Human Feedback, la tecnología que permite a los modelos de lenguaje alinearse con las preferencias humanas.

Entrenando un modelo de lenguaje en español del Estado del Arte - Hackaton SomosNLP 2022 (Mar. 2022)

En esta charla junto a las lingüistas Helena Montoro y Nuria Aldama, así como el Data Scientist Álvaro Barbero, Alejandro Vaca nos cuenta cómo se llevó a cabo el desarrollo del modelo RigoBERTa. En concreto, el foco en este caso está en el filtrado del corpus y su proceso de limpieza.

Estado del arte en modelos de lenguaje en español - SpainAI (Feb. 2022)

En este seminario de SpainAI, Alejandro Vaca nos cuenta, junto al jefe de proyecto Álvaro Barbero, cómo lideró el desarrollo del modelo de lenguaje RigoBERTa, publicado en este paper, que obtuvo resultados del Estado del Arte en español. No te pierdas esta charla en la que descubrirás cómo entrenar un modelo de lenguaje en español para comprensión de tareas de lenguaje (NLU) del Estado del Arte.

Destripando los retos del Hackaton de SpainAI 2021 con el Mejor Data Scientist - SpainAI (Mayo 2021)

En este seminario, Alejandro Vaca, como ganador del Premio a Mejor Data Scientist del Hackaton de SpainAI 2021, nos cuenta cómo llevó a cabo cada uno de los retos. Para ello, nos enseña el código que utilizó para ello, además de compartir algunas lecciones interesantes aprendidas durante aquél Hackaton.

Neuraculus: Resolviendo dudas sobre COVID-19 con NLP - SpainAI (Nov. 2020):

En este seminario de SpainAI, Alejandro Vaca nos cuenta el sistema que Neuraculus. Neuraculus es un sistema desarrollado por este Data Scientist para resolver dudas científicas sobre el COVID-19. Para ello, el sistema utiliza métodos de recuperación de información a partir de Sentence Transformers, además de modelos de respuesta extractiva a preguntas. Todo ello partiendo de una base de datos de artículos científicos del COVID-19. Además, también se lleva a cabo el desarrollo de un grafo de conocimiento dinámico sobre los artículos recuperados para cada pregunta planteada al sistema, mediante modelos de detección de entidades de tipo biomédico tales como enfermedades, síntomas o medicamentos.

Ask me Anything - Hackaton SomosNLP 2023

Sesión de resolución de cualquier tipo de dudas sobre procesamiento de lenguaje natural con Alejandro Vaca, durante el Hackaton de SomosNLP 2023.

Éxito CUNEF Alejandro Vaca

En este vídeo creado para CUNEF, universidad donde se graduó, Alejandro Vaca Serrano nos cuenta su camino hacia el éxito.

Entrega de Premios a los mejores Data Scientists - Hackaton SpainAI 2021 (Abr. 2021):

Entrega de premios del Hackaton de SpainAI 2021, donde Alejandro Vaca es galardonado con el primer premio en el reto de visión por ordenador (computer vision), el primer premio en el reto de series temporales y el tercer premio del reto de Procesamiento de Lenguaje Natural (NLP).