Skip to content

Scripts de R para la generación automática de reportes por nodo sobre consultas en el portal de Datos Abiertos

Notifications You must be signed in to change notification settings

datosgobar/reportes-nodos-datosgobar

Repository files navigation

reportes-nodos-datosgobar

Scripts de R para la generación automática de reportes sobre consultas en el portal de Datos Abiertos. En la carpeta reportes_por_nodo, hay scripts que permiten la generación de un reporte por nodo, en la carpeta reporte_general, hay scripts para la generación de un reporte general.

En ambas carpetas se conseguirán dos tipos de scripts.

Main.R

-Los archivos main primero procesan un archivo con extensión .log con las queries hechas a datos.gob.ar en el mes en cuestión. El mismo se debe conseguir de antemano haciendo una extracción de los logs del servidor. -Luego generan agregaciones y gráficos que las plasman en un archivo word, usando las plantillas de la carpeta assets ("plantilla_general.doc" para informe general y "plantilla_nodo.doc" para informe de nodo). Esto es posible gracias a la librería "officer" que permite mapear a distintos lugares de un documento word gráficos, tablas y otros elementos. -El texto final de el/los informe/s es extraido del archivo txt "apuntes_categorias.txt" que está también en la carpeta assets.

Utils.R

Los archivos utils, contienen la definición de las funciones usadas en los main

Assets

Además de las plantillas, en assets también se encuentra en documento "datasets_en_andino.csv" con los datasets presentes en la plataforma Andino y la base "info_ips.csv" con ips conocidas. Ambos archivos son usados para procesar el archivo .log

Cómo se obtiene archivo logs

Se debe tener acceso al servidor que alberga el portal. Esto significa que debemos figurar como usuarios del servidor y tener pares de llaves para la conexión ssh. Si se cumplen estas condiciones se pueden extraer los logs con un comando como este: ssh -i ~/.ssh/id_rsa usuario@iportal "grep '[[0-9]{2}/Feb/[0-9]{4}:' ruta/access.log" > february_logs.log. Se sustituye "usuario", "iportal" y "ruta" por los valores reales. En vez de Feb se pone el abreviado del mes de interés. De esta forma copiaremos los logs de un mes a nuestra computadora.

About

Scripts de R para la generación automática de reportes por nodo sobre consultas en el portal de Datos Abiertos

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •