MTBF — Mean Time Between Failures

tiempo promedio entre una falla y la siguiente; indica confiabilidad.

MTBF — Mean Time Between Failures

El MTBF (Tiempo Medio Entre Fallas) cuantifica la confiabilidad de un equipo o sistema reparable: es el tiempo promedio de operación sin fallas entre dos eventos de falla consecutivos. Un MTBF alto indica que el activo puede trabajar largos periodos sin interrupciones, estabilizando la producción y reduciendo costos de emergencia.

¿Qué mide?

Mide el intervalo medio de “uptime” (tiempo útil) entre fallas. Para que sea comparable, define el alcance con precisión:

  • Inicio del intervalo: momento en que el equipo vuelve a estado operativo tras una reparación (liberación a producción).
  • Fin del intervalo: momento en que se declara la siguiente falla que impide cumplir la función (paro funcional).
  • Tiempo considerado: normalmente tiempo de operación (horas de equipo en marcha). Evita mezclar horas sin carga o paros planificados, salvo que tu política así lo defina.
  • Ambito: por equipo, subsistema, línea o modo de falla (rodamientos, eléctrico, sensores) para priorizar acciones.
  • Diferencia con MTTF: MTTF aplica a ítems no reparables (p. ej., un fusible). MTBF es para ítems reparables.

Fórmulas y definiciones

  • MTBF = Σ(Tiempo de operación) / Nº de fallas
  • Tasa de falla (λ, asumiendo exponencial) ≈ 1 / MTBF
  • Disponibilidad intrínseca ≈ MTBF / (MTBF + MTTR)

Política recomendada: contabiliza como “tiempo de operación” las horas en que el equipo puede cumplir su función a velocidad y calidad nominales. Excluye paros planificados (mantenimientos, almuerzo) para que MTBF refleje confiabilidad, no calendario. Mantén esta política consistente para poder comparar periodos.

Ejemplo rápido (paso a paso)

En 6 semanas, un equipo tenía 720 h programadas. Hubo 60 h de mantenimientos planificados y 15 h de setup largo (planificado). Se registraron 3 fallas.

  • Tiempo de operación = 720 − 60 − 15 = 645 h
  • Nº fallas = 3
  • MTBF = 645 / 3 = 215 h

Si el MTTR promedio es 0,75 h (45 min), la disponibilidad intrínseca ≈ 215 / (215 + 0,75) = 99,65%.
La tasa de falla estimada λ ≈ 1 / 215 = 0,00465 fallas/h.

¿Cómo implementarlo bien?

  • Trazabilidad automática: captura de estados desde PLC/SCADA/MES (RUN/STOP/FAULT) con sellos de tiempo para evitar errores manuales.
  • Diccionario de fallas: códigos normalizados por modo de falla, severidad y ubicación; facilita el análisis de causa raíz.
  • Política de tiempo: documenta qué cuenta como operación, qué es paro planificado y qué es falla funcional. Capacita al equipo.
  • Ventana móvil: usa MTBF “rolling” (p. ej., últimas 12 semanas) para detectar mejoras o deterioros sin esperar cierres anuales.
  • Segmentación: calcula MTBF por equipo crítico y por modo de falla (rodamientos, motores, sensores) para focalizar inversiones.
  • FRACAS/RCFA: sistema de registro y análisis (Failure Reporting, Analysis and Corrective Action System) para que cada falla frecuente deje aprendizaje.

Buenas prácticas

  • Mantenimiento basado en condición (PdM): vibraciones, temperatura, ultrasonido, aceite, termografía para anticipar desgaste.
  • Elimina causas de “infancia”: gestión de comisionamiento, checklists de arranque y entrenamiento para bajar fallas tempranas.
  • Diseño para confiabilidad: redundancias donde el paro es crítico, protección eléctrica adecuada, sellos y alineaciones correctas.
  • Gestión de repuestos: calidad equivalente/OEM, almacenamiento 5S, kitting para modos de falla recurrentes.
  • Estabiliza la operación: variaciones agresivas de velocidad o sobrecargas reducen MTBF; respeta límites de operación.
  • Verificación post-reparación: pruebas funcionales y run-in para evitar “fallas de taller” inmediatamente después de intervenir.

Objetivo de referencia

Fija metas por criticidad del activo y costo de paro. Un criterio práctico es buscar un incremento de +15–30% anual en MTBF de equipos cuello de botella y, en paralelo, reducir la dispersión (P10/P90) de los intervalos entre fallas. Evalúa el impacto combinado con MTTR usando la disponibilidad intrínseca. Si tu línea exige ≥ 99,5% de disponibilidad, dimensiona el binomio MTBF–MTTR para superar ese umbral (p. ej., elevar MTBF a > 200 h y bajar MTTR < 0,5 h).

En síntesis, un MTBF alto y estable significa menos interrupciones, mejor cumplimiento de plan y menores costos de emergencia. Lograrlo requiere datos confiables, disciplina en la estandarización y una combinación de diseño robusto, operación estable y mantenimiento predictivo.