Scripts de R para la generación automática de reportes sobre consultas en el portal de Datos Abiertos. En la carpeta reportes_por_nodo, hay scripts que permiten la generación de un reporte por nodo, en la carpeta reporte_general, hay scripts para la generación de un reporte general.
En ambas carpetas se conseguirán dos tipos de scripts.
Main.R
-Los archivos main primero procesan un archivo con extensión .log con las queries hechas a datos.gob.ar en el mes en cuestión. El mismo se debe conseguir de antemano haciendo una extracción de los logs del servidor. -Luego generan agregaciones y gráficos que las plasman en un archivo word, usando las plantillas de la carpeta assets ("plantilla_general.doc" para informe general y "plantilla_nodo.doc" para informe de nodo). Esto es posible gracias a la librería "officer" que permite mapear a distintos lugares de un documento word gráficos, tablas y otros elementos. -El texto final de el/los informe/s es extraido del archivo txt "apuntes_categorias.txt" que está también en la carpeta assets.
Utils.R
Los archivos utils, contienen la definición de las funciones usadas en los main
Assets
Además de las plantillas, en assets también se encuentra en documento "datasets_en_andino.csv" con los datasets presentes en la plataforma Andino y la base "info_ips.csv" con ips conocidas. Ambos archivos son usados para procesar el archivo .log
Se debe tener acceso al servidor que alberga el portal. Esto significa que debemos figurar como usuarios del servidor y tener pares de llaves para la conexión ssh. Si se cumplen estas condiciones se pueden extraer los logs con un comando como este: ssh -i ~/.ssh/id_rsa usuario@iportal "grep '[[0-9]{2}/Feb/[0-9]{4}:' ruta/access.log" > february_logs.log. Se sustituye "usuario", "iportal" y "ruta" por los valores reales. En vez de Feb se pone el abreviado del mes de interés. De esta forma copiaremos los logs de un mes a nuestra computadora.