1. Glosar/

SCD

Slowly Changing Dimension

SCD (Slowly Changing Dimension) se refera la un set de tehnici folosite in data warehouse pentru gestionarea modificarilor in datele tabelelor dimensionale de-a lungul timpului.

Tipurile principale #

  • Tipul 1: suprascrierea valorii anterioare. Nicio istorie conservata
  • Tipul 2: inserarea unui rand nou cu date de valabilitate (data inceput, data sfarsit). Conserva toata istoria
  • Tipul 3: adaugarea unei coloane pentru valoarea anterioara. Conserva doar ultima modificare

De ce conteaza #

Intr-o baza de date tranzactionala, cand un client isi schimba adresa se actualizeaza inregistrarea. Intr-un data warehouse acest lucru ar insemna pierderea istoriei: toate vanzarile anterioare ar aparea asociate noii adrese.

SCD Tipul 2 rezolva aceasta problema mentinand un rand pentru fiecare versiune a datelor, cu date de valabilitate care permit reconstructia situatiei in orice moment in timp.

Cand se foloseste #

Alegerea tipului depinde de cerinta de business. Daca conteaza doar valoarea curenta, Tipul 1 este suficient. Daca business-ul are nevoie de analize istorice precise — si in majoritatea data warehouse-urilor reale asa este — Tipul 2 este alegerea standard.