Después de crear el scrapper para sacar las versiones estenográficas de todas las conferencias de prensa de la Presidenta de México Claudia Sheinbaum ya subí la primera versión del dataset a kaggle.
Cualquier sugerencia en cuanto a formato, metadata e ideas para usar este dataset son bienvenidas.
https://www.kaggle.com/datasets/keogh24/presidencia-de-mexico-blog-archive
Por el momento son archivos de texto organizados por fecha, un archivo por conferencia disponible en el archivo del blog. Agregué descripción en español e inglés y tags.
También tengo planeado sacar otros formatos como JSON y HTML.
Intentaré actualizar el dataset el menos semanalmente.
2 Replies to “Dataset Conferencias de Presidenta de México en Kaggle”