Lasagna v2 — Brain-Inspired Time-Series Compressor

🧠🍝 Lasagna v2 è un codec sperimentale per serie temporali univariate: segmentazione adattiva, predittori multipli, quantizzazione percettiva e un primo strato di “pattern tagging” semi-cognitivo.

⚠️ Stato del progetto: MVP di ricerca, non ancora pensato per produzione. Formato e API possono cambiare senza preavviso.

Obiettivi

Lasagna v2 nasce da tre idee:

Non comprimere solo i bit, ma anche la struttura temporale. Segmenti “lunghi e tranquilli” vanno trattati in modo diverso da tratti rumorosi o oscillatori.
Separare pattern e residuo. Prima si cattura il pattern principale (trend, flat, oscillazione), poi si impacchetta l’errore con una quantizzazione controllata.
Tenere un occhio al “cervello”, ma parlare con le macchine. Non è un codec percettivo umano, ma prende spunto da concetti come: chunking, priming, multi-livello, salienza.

Per la parte concettuale vedi anche 📄 docs/manifesto.md.

Funzionalità principali (MVP v2)

Serie temporali univariate (TimeSeries):
- valori float,
- dt (passo temporale), t0 (timestamp di inizio), unit.
Segmentazione:
- fixed: segmenti di lunghezza costante,
- adaptive: segmenti variabili in base al MSE del modello.
Predittori per segmento:
- mean — livello costante,
- linear — retta (trend),
- rw — random-walk (dipendenza forte dal punto precedente),
- auto — selezione automatica per segmento (MSE post-decode).
Codifica dei residui:
- raw — interi 32 bit,
- varint — ZigZag + varint (più compatto quando i residui sono piccoli).
Pattern tagging per segmento:
- patt ∈ {flat, trend, oscillation, noisy},
- sal ∈ {0, 1, 2} (salienza “energetica” del segmento).
Formato binario .lsg2:
- header con meta-info (JSON compresso),
- tabella segmenti,
- sezione residui con blocchi per segmento.

Installazione

Consigliato usare una virtualenv.

git clone https://github.com/<TUO_USER>/lasagna-v2.git
cd lasagna-v2
python3 -m venv .venv
source .venv/bin/activate

# installa runtime + strumenti di sviluppo
python -m pip install --upgrade pip
python -m pip install -e ".[dev]"

La installazione in modalità editable ti dà:

il package lasagna2,
lo script CLI lasagna2,
gli strumenti dev (black, ruff, pre-commit, pytest, detect-secrets, …).

Quick demo

Per vedere Lasagna v2 in azione senza dover preparare dati reali, il repo include una demo completa basata su tre serie sintetiche:

trend.csv → regime a trend quasi puro
sine_noise.csv → sinusoide + trend + rumore
flat_spike.csv → plateau con gradino centrale (spike)

La pipeline della demo è:

CSV → .lsg2 → profiles.csv → events.csv + clusters.csv → PNG

Esecuzione

Clona il repo, installa il pacchetto (in editable mode) e lancia la demo:

git clone https://github.com/…/lasagna-v2.git
cd lasagna-v2

python -m venv .venv
source .venv/bin/activate

pip install -e .

make demo

Il target demo esegue:

generazione dei CSV demo (data/demo/*.csv)
encoding in formato binario .lsg2
calcolo dei profili (profiles.csv)
eventi semantici + cluster (events.csv, clusters.csv)
export dei tag di segmento (*_tags.csv)
generazione delle immagini PNG per flat_spike:
- data/demo/flat_spike_tags.segments.png
- data/demo/flat_spike_tags.energy.png

Per maggiori dettagli sulla pipeline demo vedi docs/PIPELINE.md.

Use case: sequenze di allarmi (multivalore)

La demo include anche un caso d’uso per sequenze di allarmi (eventi con più attributi per riga: timestamp, type, severity).

Il flusso è:

alarms.csv → alarms_intensity.csv → alarms_intensity.lsg2 → profiles/events/clusters

In particolare:

tools/generate_fake_alarms.py genera un log sintetico di allarmi: data/demo/alarms.csv.
tools/prep_alarms.py converte il log multivalore in una serie univariata di intensità allarmi: data/demo/alarms_intensity.csv.
make demo si occupa di encodare anche alarms_intensity.lsg2 e includerlo automaticamente in profiles.csv, events.csv e clusters.csv.

Quickstart

1. Esempio `trend` (CSV → LSG2 → CSV)

Encode (trend quasi perfettamente lossless):

lasagna2 encode   --dt 1   --t0 0   --unit step   data/examples/trend.csv   data/tmp/trend.lsg2

Ispeziona il file .lsg2:

lasagna2 info data/tmp/trend.lsg2 -v

Output tipico (estratto):

Time series :
  points    : 200
  dt        : 60.0 s
  t0        : 2025-01-01T00:00:00Z
  unit      : kW
  segments  : 3

Segments overview:
  id  start   end   len  pred  patt  sal   mean        slope       Q
  --- ------- ----- ---- ----- ----- --- ----------- ----------- -----------
    0       0    79   80 linear trend  2    3.950000    0.100000       1e-06
    1      80   159   80 linear trend  2   11.950000    0.100000       1e-06
    2     160   199   40 linear trend  1   17.950001    0.100000       1e-06

Decode:

lasagna2 decode   data/tmp/trend.lsg2   data/tmp/trend_decoded.csv

Il file CSV risultante contiene l’header # value e 200 valori ricostruiti, uno per riga.

2. Esempio `sine_noise` (codec lossy controllato)

Encode (sinusoide + rumore, con soglia MSE più alta):

lasagna2 encode   --dt 1   --t0 0   --unit step   data/examples/sine_noise.csv   data/tmp/sine_noise.lsg2

Decode:

lasagna2 decode   data/tmp/sine_noise.lsg2   data/tmp/sine_noise_decoded.csv

In questo caso il codec è intenzionalmente lossy: la serie ricostruita ha la stessa lunghezza e la stessa forma globale, ma i valori non coincidono esattamente punto per punto (RMSE moderata).

Utilizzo da codice Python

from pathlib import Path
from lasagna2 import TimeSeries, encode_timeseries, decode_timeseries

# Costruisci una piccola serie
values = [0.1 * i for i in range(200)]
ts = TimeSeries(
    values=values,
    dt=60.0,
    t0="2025-01-01T00:00:00Z",
    unit="kW",
)

# Encode in memoria
encoded = encode_timeseries(
    ts,
    segment_mode="adaptive",
    min_segment_length=30,
    max_segment_length=80,
    mse_threshold=0.01,
    predictor="auto",
    residual_coding="varint",
)

Path("trend.lsg2").write_bytes(encoded)

# Decode
decoded = decode_timeseries(encoded)
print(len(decoded.values), decoded.dt, decoded.unit)

Esportare i tag dei segmenti

lasagna2 export-tags data/tmp/trend.lsg2 data/tmp/trend_tags.csv
head data/tmp/trend_tags.csv

Output:

seg_id,start,end,len,pred,patt,sal,energy,mean,slope,Q
0,0,63,64,linear,trend,2,6.40006,3.15,0.1,1e-06

Struttura del progetto

lasagna-v2/
  lasagna2/
    __init__.py        # API pubblica (TimeSeries, encode_timeseries, decode_timeseries)
    core.py            # motore del codec (formato .lsg2, segmentazione, predittori, quantizzazione)
    cli.py             # implementazione CLI

  lasagna_mvp.py       # wrapper CLI compatibile: python lasagna_mvp.py ...

  data/
    examples/          # esempi di serie (trend, sin+noise, ...)

  docs/
    manifesto.md       # “Brain-Inspired Compressor Manifesto”
    examples-trend-sine.md

  tests/
    test_core_roundtrip.py
    test_cli_encode_decode_info.py
    test_decode_malicious.py

  .github/workflows/
    ci.yml             # lint + test (runner hardened)
    security.yml       # CodeQL, dependency-review
    supply-chain.yml   # Scorecard, pip-audit

  pyproject.toml
  requirements-dev.txt
  .pre-commit-config.yaml
  .secrets.baseline
  LICENSE
  README.md

Strumenti ausiliari (`tools/`)

Nella cartella tools/ trovi alcuni script di supporto:

batch_profile.py Profilazione semantica batch di file .lsg2:

python tools/batch_profile.py data/tmp -o data/tmp/profiles.csv

lasagna_viewer.py Visualizza i segmenti (output di lasagna2 export-tags) con grafici semplici:
```
python tools/lasagna_viewer.py data/tmp/sine_noise_tags.csv
```

semantic_events.py Estrae “eventi” semantici da un profiles.csv:

python tools/semantic_events.py data/tmp/profiles.csv data/tmp/events.csv

cluster_profiles.py Aggiunge una colonna cluster a profiles.csv:

python tools/cluster_profiles.py data/tmp/profiles.csv data/tmp/clusters.csv

generate_fake_alarms.py Genera un log sintetico di allarmi multivalore per la demo:
```
python tools/generate_fake_alarms.py data/demo/alarms.csv
```
prep_alarms.py Converte un log di allarmi (timestamp,type,severity) in una serie univariata di intensità allarmi compatibile con lasagna2 encode:
```
python tools/prep_alarms.py data/demo/alarms.csv data/demo/alarms_intensity.csv --dt 60
```

Qualità & Sicurezza

Pre-commit:
- black, ruff, detect-secrets, controlli standard su YAML / whitespace / file grossi.
Test:
- roundtrip encode/decode su serie sintetiche,
- CLI encode/info/decode,
- test su file .lsg2 corrotti / malevoli (decode deve fallire con ValueError e non esplodere).
CI (GitHub Actions):
- runner hardened con egress policy e allowlist stretta,
- actions pinmate a SHA,
- pre-commit + pytest su ogni push/PR.
Security pipeline:
- CodeQL per Python,
- dependency-review su PR,
- pip-audit sulle dipendenze dev,
- OpenSSF Scorecard periodico.

Roadmap

MVP attuale copre solo univariato. Idee per le prossime iterazioni:

supporto multivariato (più serie correlate),
pattern tagging più ricco (eventualmente supervisionato),
livelli di “profilo” (--profile=human, --profile=machine),
strumenti di visualizzazione per segmenti, residui e pattern,
specifica del formato .lsg2 più formale / “da paper”.

Contributi, discussioni e idee sono benvenuti, ma il progetto resta dichiaratamente sperimentale.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Lasagna v2 — Brain-Inspired Time-Series Compressor

Obiettivi

Funzionalità principali (MVP v2)

Installazione

Quick demo

Esecuzione

Use case: sequenze di allarmi (multivalore)

Quickstart

1. Esempio `trend` (CSV → LSG2 → CSV)

2. Esempio `sine_noise` (codec lossy controllato)

Utilizzo da codice Python

Esportare i tag dei segmenti

Struttura del progetto

Strumenti ausiliari (`tools/`)

Qualità & Sicurezza

Roadmap

About

Uh oh!

Releases 1

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
.github/workflows		.github/workflows
data/examples		data/examples
docs		docs
lasagna2		lasagna2
tests		tests
tools		tools
.gitattributes		.gitattributes
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
.secrets.baseline		.secrets.baseline
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md
RELEASE_NOTES.md		RELEASE_NOTES.md
config.example.env		config.example.env
pyproject.toml		pyproject.toml
requirements-dev.txt		requirements-dev.txt

License

gcomneno/lasagna-v2

Folders and files

Latest commit

History

Repository files navigation

Lasagna v2 — Brain-Inspired Time-Series Compressor

Obiettivi

Funzionalità principali (MVP v2)

Installazione

Quick demo

Esecuzione

Use case: sequenze di allarmi (multivalore)

Quickstart

1. Esempio trend (CSV → LSG2 → CSV)

2. Esempio sine_noise (codec lossy controllato)

Utilizzo da codice Python

Esportare i tag dei segmenti

Struttura del progetto

Strumenti ausiliari (tools/)

Qualità & Sicurezza

Roadmap

About

Topics

Resources

License

Contributing

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Languages

1. Esempio `trend` (CSV → LSG2 → CSV)

2. Esempio `sine_noise` (codec lossy controllato)

Strumenti ausiliari (`tools/`)

Packages