1. Glossario/

SCD

Slowly Changing Dimension

SCD (Slowly Changing Dimension) indica un insieme di tecniche usate nel data warehouse per gestire i cambiamenti nei dati delle tabelle dimensionali nel corso del tempo.

I tipi principali #

  • Tipo 1: sovrascrittura del valore precedente. Nessuna storia conservata
  • Tipo 2: inserimento di una nuova riga con date di validità (data inizio, data fine). Conserva tutta la storia
  • Tipo 3: aggiunta di una colonna per il valore precedente. Conserva solo l’ultimo cambiamento

Perché serve #

In un database transazionale, quando un cliente cambia indirizzo si aggiorna il record. In un data warehouse questo significherebbe perdere la storia: tutte le vendite precedenti risulterebbero associate al nuovo indirizzo.

La SCD Tipo 2 risolve questo problema mantenendo una riga per ogni versione del dato, con date di validità che permettono di ricostruire la situazione a qualsiasi punto nel tempo.

Quando si usa #

La scelta del tipo dipende dal requisito di business. Se serve solo il dato corrente, il Tipo 1 basta. Se il business ha bisogno di analisi storiche accurate — e nella maggior parte dei data warehouse reali è così — il Tipo 2 è la scelta standard.