1. Glosario/

RTO

Recovery Time Objective

RTO (Recovery Time Objective) es el tiempo maximo aceptable para restaurar el servicio despues de un fallo o desastre. Se mide desde el momento del fallo hasta el momento en que el sistema vuelve a estar operativo.

Como se determina #

El RTO depende de la estrategia de recuperacion y la infraestructura disponible:

EstrategiaRTO tipico
Restore desde backup en cinta4-12 horas
Restore desde backup en disco1-4 horas
Data Guard con switchover manual1-5 minutos
Data Guard con Fast-Start Failover10-30 segundos

RTO vs RPO #

  • RTO: cuanto tiempo se necesita para reiniciar (mira hacia adelante)
  • RPO: cuantos datos puedes perder (mira hacia atras)

Son metricas independientes. Un restore desde backup puede tener RTO=2 horas y RPO=24 horas. Un Data Guard sincrono puede tener RTO=30 segundos y RPO=0.

El impacto en el negocio #

El RTO tiene un impacto directo y medible: cada minuto de parada se traduce en operaciones bloqueadas, clientes no atendidos, ingresos perdidos. La diferencia entre RTO=6 horas y RTO=42 segundos — como en el caso del paso de single instance a Data Guard — puede valer mas que el coste de toda la infraestructura.