Skip to content

DiegoCivi/tp1-sistemas-distribuidos

Repository files navigation

Trabajo Practico 1: Escalabilidad

Integrantes

  • Facundo Aguirre Argerich: 107.539
  • Diego Civini: 107.662

Instructivo de uso

Para poder ejecutar el books analyzer, se debe insertar primero manualmente los datasets deseados a probar en la carpeta datasets/. Luego, se debe ejecutar el script run.sh con el siguiente comando:

bash run.sh

Puede que tengamos que darle permisos suficientes debido a docker si es que no lo tenemos en un grupo de usuarios que tenga permisos de ejecución. Para ello, podemos usar el siguiente comando:

sudo bash run.sh

Una vez ejecutado, deberemos esperar el tiempo correspondiente al procesamiento de los datos proveidos por los datasets. Pasado el tiempo vamos a poder ver como respuesta los integrantes o filas de los datasets que cumplan con las condiciones de las queries solicitadas. Esto se imprimirá en el contenedor del cliente, quien es el que inicialmente provee los datasets a analizar.
Para poder detener la ejecución del proyecto podemos simplemente usar un Ctrl+C por consola, o utilizar el comando bash stop.sh para detener el contenedor de forma segura.
Para más detalles sobre la arquitectura propuesta ver el archivo Informe.md.

Generador de Samples del Dataset

Para generar un sample reducido del dataset se creo un generador de samples. Por consola se debera ejecutar el comando:

python3 dataset_sample_generator.py [fraccion_del_dataset] [path_dataset]

De esta manera en fraccion_del_dataset tiene que in un float indicando que fraccion se quiere del dataset pasado que se encuentra en path_datatset. Este generador creara en la carpeta /datasets un archivo con el nombre books_rating_sample-[fraccion_del_dataset].csv. Esto nos permite generar distintos samples para tener en la carpeta y poder usar cuando se quiera.

IMPORTANTE: Si se quiere usar uno de estos datasets nuevos, habra que agregar su nombre en el container del cliente en la env var REVIEWS_FILEPATH para que el sistema se ejecute con ese nuevo dataset.

Video de ejecución con dataset original

A continuación se adjunta el link al video donde se corre el programa con la totalidad de datos del dataset original y se muestran los resultados obtenidos por consola.
Video de ejecución con dataset original- 1hr

Video de ejecución con dataset original rentrega- 30min

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •