Idea: RAG con la información de las conferencias de prensa

Una de las ideas que se me antoja hacer con el dataset de las conferencias de prensa es una base de conocimiento a la cual podamos preguntarle por cosas que dice la presidenta, secretarios y reporteros. Obtener una idea los temas que se tratan a diario, a la semana, al mes.

Una forma que se ocurre es alimentar una LLM (Large Language Model) con el contexto de las conferencias de prensa, una técnica para hacer esto se conoce como RAG (Retrieval-Augmented Generation). Leer más …

Dataset Conferencias de Presidenta de México en Kaggle

Después de crear el scrapper para sacar las versiones estenográficas de todas las conferencias de prensa de la Presidenta de México Claudia Sheinbaum ya subí la primera versión del dataset a kaggle.

Cualquier sugerencia en cuanto a formato, metadata e ideas para usar este dataset son bienvenidas. Leer más …