Trabajo Practico 1: Escalabilidad

Integrantes

Facundo Aguirre Argerich: 107.539
Diego Civini: 107.662

Instructivo de uso

Para poder ejecutar el books analyzer, se debe insertar primero manualmente los datasets deseados a probar en la carpeta datasets/. Luego, se debe ejecutar el script run.sh con el siguiente comando:

bash run.sh

Puede que tengamos que darle permisos suficientes debido a docker si es que no lo tenemos en un grupo de usuarios que tenga permisos de ejecución. Para ello, podemos usar el siguiente comando:

sudo bash run.sh

Una vez ejecutado, deberemos esperar el tiempo correspondiente al procesamiento de los datos proveidos por los datasets. Pasado el tiempo vamos a poder ver como respuesta los integrantes o filas de los datasets que cumplan con las condiciones de las queries solicitadas. Esto se imprimirá en el contenedor del cliente, quien es el que inicialmente provee los datasets a analizar.
Para poder detener la ejecución del proyecto podemos simplemente usar un Ctrl+C por consola, o utilizar el comando bash stop.sh para detener el contenedor de forma segura.
Para más detalles sobre la arquitectura propuesta ver el archivo Informe.md.

Generador de Samples del Dataset

Para generar un sample reducido del dataset se creo un generador de samples. Por consola se debera ejecutar el comando:

python3 dataset_sample_generator.py [fraccion_del_dataset] [path_dataset]

De esta manera en fraccion_del_dataset tiene que in un float indicando que fraccion se quiere del dataset pasado que se encuentra en path_datatset. Este generador creara en la carpeta /datasets un archivo con el nombre books_rating_sample-[fraccion_del_dataset].csv. Esto nos permite generar distintos samples para tener en la carpeta y poder usar cuando se quiera.

IMPORTANTE: Si se quiere usar uno de estos datasets nuevos, habra que agregar su nombre en el container del cliente en la env var REVIEWS_FILEPATH para que el sistema se ejecute con ese nuevo dataset.

Video de ejecución con dataset original

A continuación se adjunta el link al video donde se corre el programa con la totalidad de datos del dataset original y se muestran los resultados obtenidos por consola.
Video de ejecución con dataset original- 1hr

Video de ejecución con dataset original rentrega- 30min

Name		Name	Last commit message	Last commit date
Latest commit History 112 Commits
client		client
consumer		consumer
images		images
lib		lib
producer		producer
query_coordinator		query_coordinator
rabbitmq		rabbitmq
server		server
workers		workers
workers_dockerfiles		workers_dockerfiles
.gitignore		.gitignore
Informe.md		Informe.md
Makefile		Makefile
README.md		README.md
config_file_queries.config		config_file_queries.config
dataset_sample_generator.py		dataset_sample_generator.py
docker-compose-dev.yaml		docker-compose-dev.yaml
docker-compose-dev1.yaml		docker-compose-dev1.yaml
generate_compose.py		generate_compose.py
run.sh		run.sh
stop.sh		stop.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Trabajo Practico 1: Escalabilidad

Integrantes

Instructivo de uso

Generador de Samples del Dataset

Video de ejecución con dataset original

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

DiegoCivi/tp1-sistemas-distribuidos

Folders and files

Latest commit

History

Repository files navigation

Trabajo Practico 1: Escalabilidad

Integrantes

Instructivo de uso

Generador de Samples del Dataset

Video de ejecución con dataset original

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages