1. Glosario/

SCD

Slowly Changing Dimension

SCD (Slowly Changing Dimension) indica un conjunto de tecnicas usadas en data warehouse para gestionar los cambios en los datos de las tablas dimensionales a lo largo del tiempo.

Tipos principales #

  • Tipo 1: sobreescritura del valor anterior. No se conserva historia
  • Tipo 2: insercion de una nueva fila con fechas de validez (fecha inicio, fecha fin). Conserva toda la historia
  • Tipo 3: adicion de una columna para el valor anterior. Conserva solo el ultimo cambio

Por que es importante #

En una base de datos transaccional, cuando un cliente cambia de direccion se actualiza el registro. En un data warehouse esto significaria perder la historia: todas las ventas anteriores aparecerian asociadas a la nueva direccion.

La SCD Tipo 2 resuelve este problema manteniendo una fila por cada version del dato, con fechas de validez que permiten reconstruir la situacion en cualquier punto en el tiempo.

Cuando se usa #

La eleccion del tipo depende del requisito de negocio. Si solo importa el dato actual, el Tipo 1 es suficiente. Si el negocio necesita analisis historicos precisos — y en la mayoria de los data warehouses reales asi es — el Tipo 2 es la eleccion estandar.