- Poetry
- Python 3.11 o superior
poetry installPara activar el entorno virtual:
poetry shellJupyter lab lo podemos utilizar para ejecutar los notebooks.
poetry run jupyter labEsto abrirá una sesión interactiva en tu navegador.
Puedes ejecutar el entorno completo dentro de un contenedor Docker. Existen dos variantes:
-
CPU: entorno ligero, sin soporte para GPU.
-
GPU: entorno con PyTorch CUDA y posibilidad de usar torch.cuda (requiere drivers NVIDIA y nvidia-container-toolkit en el host).
CPU:
make docker-buildGPU:
make docker-build-gpuCPU (corre en http://localhost:8888):
make docker-runGPU (corre en http://localhost:8888):
make docker-run-gpuUna vez ejecutado el comando puedes entrar al navegador y acceder a jupyter lab
Validación de GPU
Dentro de un notebook, ejecuta:
import torch
print("CUDA disponible:", torch.cuda.is_available())
if torch.cuda.is_available():
print("GPU:", torch.cuda.get_device_name(0))Si aparece tu tarjeta NVIDIA, el contenedor está usando la GPU correctamente.
Este proyecto incluye un lector de archivos .lag que convierte los datos en un DataFrame y los guarda como archivo .parquet.
make read-data file=./data/20210518_142318.lagEsto ejecutará el lector y guardará el archivo como
output/instrument_readings_YYYYMMDDHHMM.parquet.
poetry run python scripts/run_lag_reader.py ./data/20210518_142318.lagEl archivo generado tendrá este formato:
output/instrument_readings_202503291230.parquet