Análisis de eventos raros utilizando gráficos de control de Shewhart.

Artículo: [39] DONALD J. WHEELER: "Trabajar con eventos raros". Fuente: www.qualitydigest.com
Traducción, notas y material gráfico adicional con explicaciones: Director Científico del Centro AQT Serguéi P. Grigoriev , utilizando material del artículo y el permiso que Donald Wheeler le proporcionó amablemente.

El libre acceso a los artículos no disminuye en modo alguno el valor de los materiales contenidos en ellos.

¿Qué sucede cuando la cantidad promedio se vuelve muy pequeña?

Desde una perspectiva de análisis de datos, los eventos raros son problemáticos. Hasta que tengamos un evento, no hay nada que contar y, como resultado, muchos de nuestros períodos de tiempo terminarán con valores cero. Dado que los valores cero no contienen información real, debemos considerar alternativas al recuento de eventos raros. Este artículo analizará formas simples y complejas de abordar eventos raros.

Nuestro primer ejemplo involucrará derrames en una planta química. Aunque los derrames son indeseables y aunque se hacen todos los esfuerzos posibles para evitarlos, ocasionalmente ocurren. En los últimos años, una sola planta ha experimentado un promedio de un derrame cada ocho meses. Por supuesto, si una planta experimenta un derrame en promedio una vez cada ocho meses, ¡entonces 1 derrame por mes sería un 700% más que el promedio! (Cuando se trata de eventos raros, un cambio de una unidad puede marcar una enorme diferencia porcentual). En los primeros cuatro años se produjeron un total de seis derrames. Seis derrames en 48 meses dan un promedio de 0,125 derrames por mes.

¿Qué tal si usamos un gráfico XmR para valores individuales y rangos móviles con estos recuentos, como sugerí anteriormente en el artículo? Gráficos de control para datos alternativos (atributos, recuentos) gráfico p, gráfico np, gráfico C y gráfico u o un gráfico XmR de valores individuales ? Utilizando los primeros cuatro años como referencia, el límite de control superior para el gráfico de rango móvil es: 0,83, y para el mapa X de valores individuales: 0,80. ¡Esto convierte cada mes con un derrame en una señal de un cambio en el sistema! Claramente se trata de una mala interpretación de estos datos. El problema es que esta tarjeta XmR sufre falta de datos en este caso. (Los datos dispersos pueden ocurrir con cualquier tipo de datos. Los datos de conteo tienden a fragmentarse si el número promedio de conteos cae por debajo de 1,00. Los datos dispersos estrechan artificialmente los límites del diagrama de comportamiento del proceso y conducen a un número excesivo de falsas alarmas).

Error probable de un sistema de medición estable

Figura 1. Número de derrames por mes en tarjetas XmR

Cuando se cuentan los eventos raros, las tarjetas especiales se vuelven insensibles y la tarjeta XmR falla. Este no es un problema con los gráficos de control, sino con los datos en sí. Contar eventos raros es inherentemente insensible y débil. No importa cómo se analicen estos recuentos, colocar estos datos en cualquier tipo de gráfico de control no revelará nada. Pero hay otras formas de caracterizar sucesos raros. En lugar de contar el número de derrames cada mes (recuento de eventos), podría medir el número de días entre derrames (midiendo el rango entre eventos raros). Para estos datos, los intervalos de tiempo entre derrames se calculan de la siguiente manera.

Error probable de un sistema de medición estable

Figura 2. Determinación del tiempo entre derrames.

Un derrame en 322 días se traduce en una tasa de derrame de 0,0031 derrames por día: 1⁄322=0,0031

Si multiplicamos la tasa de derrame diario por 365, obtenemos 1,13 derrames por año: 0,0031×365=1,1315

Así, el intervalo entre el primer y el segundo derrame equivale a un derrame a razón de 1,13 derrames por año. Asimismo, el intervalo de 247 días entre el segundo y tercer derrame se traduce en una tasa de derrame de 1,48 derrames por año. Siguiendo de esta manera, cada vez que tenemos un evento, obtenemos una tasa de derrame instantánea.

Error probable de un sistema de medición estable

Figura 3. Tasas de derrame instantáneo

Error probable de un sistema de medición estable

Figura 4. Gráfico XmR para la tasa de derrame

La tasa promedio de derrames durante los primeros cuatro años es de 1.418 derrames por año. El rango móvil promedio es 0,244. Aunque el uso de cinco valores para crear un gráfico XmR es mínimo, ¡se necesitaron cuatro años para obtener estos cinco valores!

Si el punto futuro está por encima del límite superior de control, esto indicará que la tasa de derrame está aumentando. En el futuro, un punto por debajo del límite inferior de control indicará que la tasa de derrame está disminuyendo. Se interpretará que los puntos en el área entre los límites de control significan que la tasa de derrame no ha cambiado. Los dos derrames de 2005 tuvieron intervalos de 172 y 115 días, respectivamente. Estos intervalos se traducen en tasas de derrame (tasas) de 2,12 derrames por año y 3,17 derrames por año. Cuando estos valores se agregan al gráfico XmR, obtenemos el resultado que se muestra en la Figura 5.

Error probable de un sistema de medición estable

Figura 5. Gráfico XmR completo para tasas de derrame

Aunque el primer vertido en 2005 estuvo fuera del límite, apenas lo superó. Dada la suavidad de los límites basados ​​en cinco valores, podemos dudar en interpretar el sexto punto como una señal clara de cambio. Sin embargo, el séptimo punto está lo suficientemente fuera de los límites como para poder interpretarlo con seguridad como una señal clara: este año se ha producido un aumento en el nivel del derrame. Si volvemos a la Figura 1, vemos que los derrames se están acercando, pero no seremos capaces de detectar este cambio hasta que pasemos de contar eventos raros a medir la ventana de oportunidad entre eventos.

Tenga en cuenta que aunque las Figuras 1 y 5 analizan las tasas de derrames, hubo un cambio en la variable entre las Figuras 1 y 5. En la Figura 1, la variable fue el número de derrames por mes. Aquí el numerador podría cambiar (número de derrames) mientras que el denominador se mantendría constante (un mes). La Figura 5 muestra tasas de derrames instantáneos donde el numerador permanece constante (un derrame) pero el denominador puede variar (días entre derrames).

En lugar de utilizar tasas de derrames instantáneos en la Figura 6, se utiliza el número de días entre derrames para construir el gráfico XmR. Este gráfico de control es un gráfico de medidas inversas. A medida que los derrames se vuelven más frecuentes, los puntos de la Figura 6 se mueven hacia abajo. Esta simple inversión crea una disonancia cognitiva para quienes deben interpretar este gráfico de control. Si bien esto no es un obstáculo insuperable, sigue siendo un obstáculo innecesario. Las tasas de derrame instantáneo que se muestran en la Figura 5 son más fáciles de usar y de interpretar que el número de días entre derrames en la Figura 6.

Error probable de un sistema de medición estable

Figura 6. Gráficos XmR para días entre derrames

Además del hecho de que el tiempo entre eventos es una medida inversa, el gráfico es menos sensible que el gráfico de tasas de derrame instantáneo. En la Figura 5, se encontrará una mayor tasa de derrames siempre que la tasa exceda los 2,066 derrames por año. El límite inferior en la Figura 6 corresponde a una tasa de derrame de 2.714 (365 x 1/134.475) derrames por año. Dado que estos son métodos de eventos raros y que queremos detectar cualquier aumento en la tasa de derrame lo más rápido posible, la baja sensibilidad que se muestra en la Figura 6 no es deseable.

Aunque la gráfica de control de velocidad instantánea suele ser la gráfica de control preferida, hay una situación en la que una gráfica de tiempo hasta el evento es útil. Aquí es cuando el límite inferior de la Figura 5 cae por debajo de cero. Cuando esto suceda, la tabla de control de velocidad instantánea ya no mostrará mejoras. Si está involucrado en la adopción de medidas para reducir la frecuencia de eventos raros, de modo que detectar mejoras sea importante, entonces es posible que deba recurrir a la construcción de gráficos de control tanto de tasas instantáneas como de tiempos entre eventos. Un gráfico de control de velocidades instantáneas le permitirá detectar aumentos en la frecuencia de eventos raros y un gráfico de control de tiempo entre eventos le permitirá, en este caso, detectar disminuciones en la velocidad como puntos por encima del límite de control superior. Esto se ilustrará con el siguiente ejemplo.

Resumen

Cuando el recuento promedio durante un período de tiempo cae por debajo de 1,0 (unidades), se trata de eventos raros. Cuando esto sucede, p -chart, np -chart, c -chart y u -chart se volverán muy insensibles. Al mismo tiempo, el problema de la escasez de datos le impedirá utilizar un gráfico XmR con recuentos de elementos o recuentos de eventos. Cuando esto sucede, debes dejar de contar eventos durante un período de tiempo y en su lugar medir el dominio entre eventos raros. Aquí es donde dejas de obtener el valor cada vez y, en cambio, obtienes el valor cada vez que tienes un evento. (Este cambio en la forma de recopilar datos es un argumento en contra del uso de este enfoque, excepto en casos excepcionales).

Cuando trabaja con tiempos entre eventos, puede calcular las tasas instantáneas para cada evento y colocarlas en un gráfico XmR, como se muestra en las Figuras 4 y 5, o puede trabajar directamente con tiempos entre eventos, como se muestra en la Figura 6. Cuando estos gráficos de control se vuelven unilaterales, es posible que necesite trabajar con ambos tipos de gráficos de control para identificar tanto las mejoras como los deterioros.

Sergey P. Grigoryev: Por ejemplo, para analizar los datos de los lanzamientos espaciales de emergencia, se puede utilizar el dominio de definición: el número de lanzamientos exitosos entre los de emergencia, donde los lanzamientos de emergencia se utilizan como eventos poco comunes. Como velocidad de los lanzamientos de emergencia se puede utilizar el valor obtenido al dividir 1 lanzamiento de emergencia por el número de lanzamientos exitosos de la emergencia anterior. O puede trabajar directamente con la cantidad de inicios exitosos entre fallas.