Полнофункциональная среда для изучения анализа данных и работы с большими данными. Всё необходимое уже настроено и готово к работе — просто запустите Docker и начните экспериментировать:
- Jupyter-ноутбуки для экспериментов
- PySpark для обработки данных
- Локальный MinIO для хранения данных (S3)
- Lakekeeper — REST-каталог Iceberg с UI
- PostgreSQL 18 в качестве базы данных
- Быстрый старт через Docker Compose
Установите Docker и Docker Compose, если они ещё не установлены.
Клонируйте репозиторий и перейдите в папку проекта:
git clone https://github.com/Inzhenerka/mydatalab
cd mydatalabПодтяните готовый образ mydatalab из интернета
docker compose pull Запустите контейнер mydatalab из образа в синхронном режиме:
docker compose upЛоги будут выводиться в терминал, в котором запущен контейнер, что поможет в случае непредвиденных ошибок.
Начните работу с главной страницы: http://localhost:1111
Остановить контейнер можно комбинацией клавиш Ctrl+C.
Поднять контейнер в фоне, чтобы не держать терминал занятым:
cd mydatalab
docker compose up -dВременная остановка контейнера, чтобы освободить ресурсы компьютера:
docker compose stopПолностью остановить и удалить контейнер (данные в примонтированных папках сохранятся):
docker compose downПодтянуть свежий образ:
docker compose pullПересобрать образ после изменений в проекте: docker compose build