tarjeta XMR
en lugar de p-, np-,
Tarjetas C y U

¿Gráficos de control para datos alternativos (atributos, recuentos), gráfico p, gráfico np, gráfico C y gráfico u o un gráfico XmR de valores individuales?

"La dificultad con el uso de gráficos p, gráficos np, gráficos C o gráficos u es que es difícil determinar si los modelos binomiales o de Poisson son apropiados para los datos".

- [31] Donald Wheeler

Presentamos una traducción del artículo de Donald Wheeler: "¿Qué pasa con el gráfico p? ¿Cuándo debería utilizar los gráficos de control p-chart, np-chart, C-chart y u-chart para datos alternativos (recuentos)?" / Donald J. Wheeler, artículo: "¿Qué pasa con los gráficos p? ¿Cuándo debemos utilizar los gráficos especiales p-chart, np-chart, c-chart y u-chart para los datos de recuento?" [31]

Traducción y notas: Director Científico del Centro AQT Serguéi P. Grigoriev .

El libre acceso a los artículos no disminuye en modo alguno el valor de los materiales contenidos en ellos.

Contenido

Todos los gráficos de control basados ​​en datos de conteo son gráficos de valores discretos. Ya sea que estemos trabajando con cantidades o fracciones, recibimos un valor por período de tiempo y queremos trazar un punto en la gráfica cada vez que recibimos un valor. Es por eso que se desarrollaron cuatro gráficos de control específicos para datos basados ​​en recuentos, incluso antes de que se descubriera el enfoque para construir gráficos de control XmR de valores individuales y rangos móviles. Estos cuatro tipos de tarjetas de control son tarjeta p, tarjeta np, tarjeta C y tarjeta u. Este artículo pregunta cuándo utilizar estos y otros gráficos de control especiales con datos basados ​​en recuentos.

El primero de estos gráficos de control especiales, el gráfico p, fue creado por Walter Shewhart en 1924. En ese momento, había surgido la idea de utilizar un rango deslizante de dos puntos para medir la dispersión de un conjunto de valores individuales. aún no ha surgido (W. J. Jennett propuso esta idea en 1942). Entonces, el problema que enfrentó Shewhart fue cómo crear un diagrama de comportamiento del proceso para valores discretos basado en recuentos. Aunque podía trazar los datos como un registro actual y aunque podía utilizar la media como línea central para ese registro actual, el obstáculo era cómo medir la varianza para filtrar las variaciones normales. Con valores discretos, no veía manera de explotar la variación dentro de los subgrupos, pero sabía que no debía intentar utilizar una estadística de desviación estándar global, que estaría inflada por cualquier variación excepcional en los datos disponibles. Por lo tanto, decidió utilizar límites de control teóricos basados ​​en un modelo probabilístico.

Los modelos de probabilidad clásicos para datos de recuento simple son el binomial y el de Poisson, y Shewhart sabía que ambos modelos tenían un parámetro de varianza que era función de su parámetro de ubicación. Esto significó que la estimación de la media obtenida a partir de los datos también podría usarse para estimar la varianza. Por lo tanto, sólo con estadísticas de ubicación, pudo estimar tanto la línea central como la distancia tres sigma.

Gráficos de control de Shewhart especiales para estos cálculos.

Figura 1: Gráficos de control especiales de Shewhart para estos cálculos.

Este uso dual de la media para caracterizar tanto la ubicación como la varianza significa que los gráficos p, np, C y u tienen límites de control que se basan en la relación teórica entre la media y la varianza.

Por tanto, se puede decir que todos los gráficos de control especiales utilizan límites de control teóricos. Si los recuentos se pueden modelar razonablemente utilizando una distribución binomial o una distribución de Poisson, entonces se pueden obtener límites de control apropiados para los gráficos de valores discretos.

En los últimos años, muchos libros de texto y normas han olvidado que la suposición de un modelo binomial o de Poisson es un requisito principal para el uso de estos gráficos de control especiales. Esto es un problema porque hay muchos tipos de datos basados ​​en recuentos que no pueden caracterizarse como distribuciones binomiales o de Poisson. Al colocar dichos datos en un gráfico p, un gráfico np, un gráfico C y un gráfico u, los límites de control teóricos resultantes serán incorrectos.

¿Entonces, qué debemos hacer? El problema con los límites de control teóricos es la suposición de que conocemos la relación exacta entre la línea central y la distancia tres sigma. La solución es obtener una estimación separada de la varianza, que es lo que hace el gráfico XmR: mientras que la media caracterizará la ubicación y servirá como línea central para el mapa X de valores individuales, el rango de promedio móvil del gráfico mR caracterizará la varianza y servirá como base para calcular la distancia tres sigma para X-map.

Por lo tanto, la principal diferencia entre los gráficos de control de conteo dedicados y el gráfico XmR de valores individuales y rangos móviles es la forma en que se calcula la distancia tres sigma. Los gráficos p, np, C y u de referencia tendrán la misma entrada actual y esencialmente las mismas líneas centrales que el mapa X. Pero cuando se trata de calcular los límites de control tres sigma, los gráficos de control dedicados utilizan la relación teórica estimada para calcular los valores teóricos, mientras que el gráfico XmR en realidad mide la variación presente en los datos y construye límites de control empíricos.

Para comparar las tarjetas de control personalizadas con la tarjeta XmR, usaremos tres ejemplos. El primero utilizará los datos que se muestran en la Figura 2. Estos valores provienen del departamento de contabilidad, que rastrea cuántas cuentas se cierran "a tiempo" cada mes. Los recuentos mostrados representan el número mensual de cierres que se completaron a tiempo por cada 35 cierres (igual área de definición).

Gráficos de control de Shewhart especiales para estos cálculos.

Arroz. 2: Tarjeta X y gráfico np del número mensual de cuentas cerradas a tiempo de cada 35 cuentas.
Las líneas de puntos rojas son los límites de control superior e inferior para el mapa X, y las azules para el gráfico p.

Aquí, los cálculos tanto para el gráfico np como para el mapa X de valores individuales arrojan límites de control casi idénticos (el límite de control superior de 36,8 no se muestra porque excede el valor máximo de 35 cierres a tiempo). Aquí los dos enfoques son esencialmente idénticos porque estos recuentos parecen estar modelados apropiadamente mediante la distribución binomial. Si tiene la habilidad suficiente para reconocer cuándo sucede esto, sabrá cuándo funcionará la tarjeta np y podrá utilizarla con éxito. Por otro lado, si no tiene suficiente experiencia para saber cuándo es apropiado el modelo binomial, aún puede utilizar el gráfico XmR. Como se puede ver aquí, cuando el gráfico np funcionara, los límites de control empíricos del gráfico X serían idénticos a los límites de control teóricos del gráfico np, y no se perdería nada al usar el gráfico XmR en lugar del np-gráfico.

En nuestro siguiente ejemplo, usaremos entregas a tiempo para una planta. Los datos del porcentaje de entrega a tiempo por mes durante dos años se muestran en la Figura 3, junto con un mapa X de valores individuales y un gráfico p para estos datos.

Mapa X y gráfico p para el porcentaje de entrega a tiempo por mes durante dos años

Figura 3: Mapa X y gráfico p para el porcentaje de entrega a tiempo por mes durante dos años.

El mapa X muestra un proceso con tres puntos en o por debajo del límite de control inferior. Los límites de control del gráfico p de ancho variable son cinco veces más amplios que los límites de control del mapa X encontrados utilizando tramos deslizantes. Ningún punto se extiende más allá de estos límites de control del gráfico p. Esta discrepancia entre los dos conjuntos de límites de control indica que los datos de la Figura 3 no satisfacen las condiciones binomiales. En particular, la probabilidad de que un envío llegue a tiempo no es la misma para todos los envíos en un mes determinado. Debido a que el modelo binomial no es adecuado para estos datos, los límites de control teóricos del gráfico p son incorrectos. Sin embargo, los límites de control empírico del gráfico XmR, que no dependen del ajuste de un modelo probabilístico particular, son correctos.

Nuestra comparación final utilizará los datos de la Figura 4. Aquí tenemos el porcentaje de envíos entrantes para una planta de ensamblaje de productos electrónicos que se enviaron mediante transporte aéreo. Dos puntos quedan fuera de los límites de control del gráfico p de ancho variable, pero ningún punto queda fuera de los límites de control del mapa X.

Figura 4: Mapa X de valores individuales y gráfico p para el porcentaje de envíos que utilizan transporte aéreo.

Figura 4: Mapa X de valores individuales y gráfico p para el porcentaje de envíos que utilizan transporte aéreo.

La Figura 4 es típica de lo que sucede cuando el "área de oportunidad" para contar artículos se vuelve excesivamente grande. El modelo binomial requiere que todos los elementos en un período de tiempo determinado tengan las mismas posibilidades de poseer el atributo que se está contando. Este requisito no se cumple aquí. Con miles de envíos cada mes, la probabilidad de que un envío se realice por vía aérea no es la misma para todos los envíos. Por lo tanto, el modelo binomial no es adecuado y los límites de control teóricos del gráfico p que dependen del modelo binomial son incorrectos. Los límites de control del mapa X, que aquí son dos veces más anchos que los límites de control del gráfico p, caracterizan correctamente tanto la ubicación como la dispersión de estos datos y son los límites de control correctos a utilizar.

Por lo tanto, la dificultad con el uso de gráficos p, gráficos np, gráficos C o gráficos u es que es difícil determinar si los modelos binomiales o de Poisson son apropiados para los datos. Como puede ver en las Figuras 3 y 4, si no cumple con las condiciones principales para los gráficos de control especiales, corre el riesgo de cometer un error grave en la práctica. Es por eso que debe evitar el uso de gráficos de control ad hoc a menos que sepa cómo evaluar el ajuste de los datos a estos modelos probabilísticos.

A diferencia del uso de modelos teóricos que pueden ser correctos o no, el gráfico XmR nos proporciona límites de control empíricos que en realidad se basan en la variación presente en los datos. Esto significa que puede utilizar el gráfico XmR con datos basados ​​en recuentos en cualquier momento. Dado que los gráficos p, np, C y u son casos especiales de gráficos de valores discretos, el gráfico XmR imitará estos gráficos especiales cuando sean apropiados y se diferenciará de ellos cuando fallen.

En el caso de tarjetas de control especiales que tienen límites de control de ancho variable, el XmR-cut simulará límites de control basados ​​en el área de definición promedio de las tarjetas de control para conteos. Además, al hacer estas comparaciones, prefiero tener al menos 24 conteos en el período base.

Un enfoque libre de suposiciones para los datos basados ​​en recuentos.

Figura 5: Enfoque sin suposiciones para datos basados ​​en recuentos.

Por lo tanto, si no tiene títulos avanzados en estadística, o si simplemente tiene problemas para determinar si sus conteos pueden caracterizarse mediante una distribución binomial o de Poisson, aún puede probar su elección de un gráfico especial para su cálculo basado en conteos. datos comparando los límites de control teóricos con los límites de control empíricos del gráfico XmR. Si los límites de control empíricos son aproximadamente los mismos que los teóricos, entonces el modelo probabilístico funciona. Si los límites de control empíricos no coinciden con los límites de control teóricos, entonces el modelo probabilístico es incorrecto.

Siempre puede estar seguro de que tiene los límites de control correctos para sus datos basados ​​en recuentos si utiliza un gráfico XmR desde el principio. El enfoque empírico siempre será correcto.

Nota (S. Grigoriev)

En su libro “Control estadístico de procesos. Optimización empresarial utilizando gráficos de control de Shewhart”, Donald Wheeler define otra condición necesaria para minimizar el impacto de la discreción de los datos de cálculo en los límites de control empíricos del gráfico XmR de valores individuales:

"Se puede construir un gráfico XmR para datos discretos en todos los casos en los que el valor de conteo promedio sea mayor que uno. Si es mayor que dos, entonces el efecto de la discreción en los límites de control será insignificante.

Dado que rara vez tiene sentido utilizar cantidades discretas cuando se pueden obtener resultados de medición, el uso de atributos generalmente se limita a situaciones en las que se pueden contar errores. Sin embargo, definir un "error garrafal" suele ser extremadamente difícil.

La principal dificultad para definir un “error garrafal” es el problema definiciones operacionales ".

- [31] Donald Wheeler

Así, si tienes un promedio de conteos por dominio de definición menor a dos, puedes neutralizar fácilmente este problema aumentando el dominio de definición para obtener el promedio de los conteos a un valor igual o mayor a 3 (tres), lo cual Esto es especialmente cierto para eventos con distribución de Poisson (se cuentan los defectos, y no los productos defectuosos, y solo se pueden contar los defectos, pero en ningún caso el número de “no defectos”).

Por ejemplo

Si se tiene un número promedio de conteos de defectos por área de definición igual a un metro cuadrado de tela igual a 1 (uno), se puede utilizar un área de definición de tres metros cuadrados, obteniendo un número promedio de defectos por nueva área de definición igual a 3 (tres) metros cuadrados. Utilice el área de definición que puede seleccionar fácilmente para realizar comprobaciones (pruebas), por ejemplo, para un rollo de tela de 1,2 metros de ancho, puede utilizar un área de definición de 3 metros lineales.

Fórmula para calcular el dominio de definición mínimo requerido:

Si el promedio de los recuentos de datos históricos es <3, entonces
el nuevo dominio mínimo de definición se obtiene multiplicando el dominio de definición actual por un coeficiente (k):

k = 3/valor promedio de los recuentos de datos históricos;

nuevo dominio mínimo = k × dominio actual.

Seleccione el dominio de definición (=) o (>) del nuevo dominio de definición mínimo resultante que sea conveniente para el control.

Para valores binomiales (sí/no, defectuoso/no defectuoso, fuera de tiempo/a tiempo), puede utilizar el gráfico XmR para los valores de resultados positivos en lugar de negativos, como se implementa en el ejemplo 1 (Figura 2) y 2 (Figura 3) de este artículo Donald Wheeler. El efecto de la discreción de los datos del modelo binomial en el gráfico XmR de valores individuales sigue las mismas reglas que para los modelos de Poisson: mantenga el promedio de los recuentos de resultados (sí/no) en al menos tres (3).

¡Atención!

Si los alcances son diferentes, no puede comparar los recuentos sin convertirlos a fracciones de los alcances correspondientes. Si aún le resulta difícil interpretar las acciones, puede llevar los valores de cálculo obtenidos a un área de definición, como en el ejemplo 1 de este artículo de D. Wheeler usando el ejemplo de un gráfico de control de cierre oportuno. cuentas. Para hacer esto, puede utilizar la fórmula que se muestra a continuación.

Qué estás buscando:

X i - el número de cuentas reducido a un dominio de definición constante.

Un ejemplo de cálculo de la proporción de productos defectuosos por área de definición.

“Todas las fracciones son fracciones, pero no todas las fracciones son fracciones. Una fracción puede considerarse fracción cuando el denominador describe el dominio de definición de los valores del numerador”.

[4] Donald Wheeler, Control estadístico de procesos.
Optimización empresarial mediante gráficos de control de Shewhart"
(Donald J. Wheeler, "Comprensión del control estadístico de procesos")

Un ejemplo de cálculo de la proporción de productos defectuosos por área de definición.

Figura 6: Ejemplo de cálculo de la proporción de productos defectuosos por área de definición. Sólo la proporción 3/20 es una fracción.

Debes tener cuidado de seguir todas las recomendaciones de este artículo. en la etapa de planificación recopilación de datos. En la gran mayoría de los casos, si los datos no representan el resultado de un control del 100%, cualquier manipulación de los datos históricos disponibles para aumentar el alcance de la definición utilizando las matemáticas distorsionará la imagen de lo que está sucediendo.