Gráficos de control de Shewhart
Analista PRO +IA
para Windows, Mac, Linux

Registro de software ruso (entrada No. 18857 del 05/09/2023)

Comprar software

Gráficos de correlación de pares (gráficos de dispersión) con histogramas de distribución y matriz de correlación térmica para un número ilimitado de factores

Análisis estadístico multivariado MSA (Análisis Estadístico Multivariado).

Botón [Análisis estadístico multivariado]

La función de diagrama de dispersión, con histogramas de distribución y mapa de calor de correlación, proporciona una forma eficaz de representar visualmente las relaciones funcionales estadísticas entre los numerosos factores (mediciones y recuentos) representados en sus datos. Cada gráfico muestra la ecuación de la línea de tendencia, el coeficiente de correlación de Pearson [R] y el coeficiente de determinación [R²].

Puede descargar un ejemplo de un archivo de hoja de cálculo estructurado para crear diagramas de dispersión con histogramas de distribuciones de valores y un gráfico de correlaciones: XLSX .

Se pueden utilizar datos estructurados de archivos de tablas para importar: libro de Excel (*.xlsx); Libro binario de Excel (*.xlsb); Hoja de cálculo OpenDocument (*.ods).

Es importante señalar que un coeficiente de correlación alto no prueba una relación de causa y efecto entre los factores analizados, pero indica su conexión estadística funcional. Por ejemplo, ambos factores pueden depender de algún otro o grupo de otros factores.

Se abre el menú de la ventana principal del programa para ir al panel de control de análisis de datos multidimensionales.

Figura 1. Se abre el menú de la ventana principal del programa para ir al panel de control de análisis de datos multidimensionales.

Análisis de correlación multifactorial de características cualitativas-1.

Figura 2. Se muestra una información sobre herramientas desplegable cuando pasa el mouse sobre el botón para ir al panel de control para el gráfico de correlación de pares (diagramas de dispersión) con histogramas de la distribución de valores individuales.

Análisis de correlación multivariante de características cualitativas-2.

Figura 3. Panel de control del diagrama de dispersión con histogramas. Al hacer clic con el botón izquierdo del mouse en un punto seleccionado por el usuario en el gráfico del diagrama de dispersión, se muestra un título con el número del punto de datos (fila). Al hacer clic con el botón izquierdo del mouse en el área coloreada seleccionada por el usuario en el mapa de calor, se muestra un título con los nombres de las columnas de datos de origen a lo largo de los ejes Y, X y el coeficiente de correlación. Para ocultar las firmas, haga clic derecho en el área de la firma.

Con una gran cantidad de factores medibles monitoreados, es difícil incluso para un tecnólogo experimentado mantener una comprensión de las posibles relaciones entre las características del proceso monitoreado. Con nuestro software, puede analizar una cantidad ilimitada de factores con un solo clic, prestar atención a valores atípicos anómalos (puntos fuera de la población general en el gráfico) o discrepancias en el tamaño esperado y la dirección de la correlación (negativa, cero, positiva) en pares de los valores analizados.

Análisis de correlación multivariante de características cualitativas Viscosidad y pH.

Figura 4. Panel de control del diagrama de dispersión con histogramas. Se abrió el menú desplegable de información sobre herramientas al pasar el mouse sobre el botón Ir en el control del gráfico de calor.

Análisis de correlación multivariante Conjunto de datos de vivienda de Ames

Figura 5. Panel de control del gráfico de calor. Las etiquetas de coeficientes de correlación en el gráfico de calor están deshabilitadas. En el panel de control del gráfico de calor, se selecciona el rango de las 35 columnas de datos de origen. Se muestra un título para el área de correlación seleccionada por el usuario en el mapa de calor. Fuente de datos: Conjunto de datos de vivienda de Ames.

La expresión "4.552e+04" significa el número 45.520. Este número se representa en notación científica, donde “e+04” significa multiplicar por 10 elevado a 4, es decir, el número se multiplica por 10, cuatro veces.

Análisis de correlación multivariante Conjunto de datos de vivienda de Ames

Figura 6. Panel de control del gráfico de calor. En el área de control del gráfico de calor, se habilitan las etiquetas de valores de correlación y se selecciona el rango de la columna 25 a la columna 35 (inclusive) de los datos de origen. Fuente de datos: Conjunto de datos de vivienda de Ames.

Definiciones

El coeficiente de correlación y el coeficiente de determinación están relacionados entre sí y ambos se utilizan para medir el grado de relación entre dos variables.

El coeficiente de correlación (denotado como R o r) mide el grado de relación lineal entre dos variables (x) e (y). Toma valores de -1 a 1, donde -1 significa una relación lineal negativa completa, 1 significa una relación lineal positiva y 0 significa que no hay relación lineal. El coeficiente de correlación muestra qué tan cerca están los puntos de datos de una línea de tendencia o de regresión. Por lo tanto, cuanto más cerca estén los puntos de datos de la línea de tendencia, mayor será el coeficiente de correlación y más fuerte será la relación entre las variables (x) e (y).

El coeficiente de determinación (denotado como R² o r²) es el cuadrado del coeficiente de correlación. Muestra qué parte de la varianza de la variable dependiente (y) puede explicarse por la variable independiente (x). El coeficiente de determinación varía de 0 a 1, donde 0 significa que la variable independiente no explica la variabilidad de la variable dependiente y 1 significa que la variable independiente explica completamente la variabilidad de la variable dependiente.

Así, el coeficiente de correlación muestra el grado de relación entre variables, mientras que el coeficiente de determinación muestra qué tan bien la variable independiente explica la variabilidad de la variable dependiente.

Definición de emisiones

A menudo, con la ayuda de métodos gráficos simples, es posible comprender cuál de los dos factores de un par es el culpable del valor atípico observado; para ello, basta con mirar los gráficos de correlación con los histogramas de cada factor y consigo mismo. ver Figura 6.

Análisis de correlación multivariante: gráficos de correlación del factor 1 y del factor 3 consigo mismo

Figura 7. Panel de control del gráfico de calor de correlación: gráficos de correlación de todos los factores y el Factor-1 consigo mismos. Existe un problema al registrar dos valores del Factor-1.

Nariz significado operativo Tal comprensión del "culpable del valor atípico" sólo puede ser confirmada o refutada por el gráfico XmR de control de Shewhart para valores individuales, construido de acuerdo con los datos iniciales del Factor-1, consulte la Figura 5 a continuación.

Controle el gráfico XmR de valores individuales, creado de acuerdo con los datos iniciales del Factor-1 (antes de eliminar los valores atípicos).

Figura 8. Gráfico XmR de control de valores individuales, construido de acuerdo con los datos iniciales del Factor-1 (antes de eliminar los valores atípicos).

Control XmR-map de valores individuales, construido de acuerdo con los datos iniciales de Factor-2

Figura 9. Gráfico XmR de control de valores individuales, construido de acuerdo con los datos iniciales del Factor-2. La serie de puntos rojos del 81 al 89 en el gráfico del mapa mR es una razón para comprender las razones especiales que aparecieron en estos puntos. Es importante destacar que el análisis multivariado de la Figura 4 no tiene esta capacidad.

Control XmR-map de valores individuales, construido de acuerdo con los datos iniciales de Factor-3

Figura 10. Gráfico XmR de control de valores individuales, construido de acuerdo con los datos iniciales del Factor-3.

Importante

A veces, eliminar solo un punto atípico puede cambiar la dirección de la correlación (la dirección de la línea de tendencia) de una correlación positiva a una negativa. Se debe tener en cuenta la posibilidad de que se produzca tal comportamiento de la línea de tendencia y de todas las derivadas calculadas automáticamente, por ejemplo: la ecuación de la función de tendencia, el coeficiente de determinación R2 (el valor de la fiabilidad de la aproximación) y la correlación R. Esta observación también se aplica a la ecuación de regresión lineal y otros tipos de regresión construida a partir de los datos originales. El primer paso es observar sus datos, presentados gráficamente en un gráfico de control de Shewhart. Preste atención al proceso de entrada de datos inicial del operador y mejórelo mediante la validación automática de los valores introducidos.

Ejemplo. En una gran empresa manufacturera que produce un tipo de producto, ligeramente diferente sólo en longitud y diámetro, los resultados de un análisis de correlación multivariante de un par de indicadores de redondez del producto demostraron direcciones opuestas de correlación de estos indicadores, sin evidencia de valores atípicos en el original. datos. Me permitió señalar a la dirección de producción las diferentes formas en que un operador de línea puede controlar los mismos procesos dependiendo del tamaño del producto, lo que llevó a una investigación sobre lo que realmente hace el operador.

A menudo, las emisiones son causadas por razones triviales, por ejemplo, un error al registrar los valores leídos de los dispositivos por los controladores (y esta es una razón especial). Los gráficos de control de Shewhart hacen frente fácilmente a entradas erróneas que se encuentran fuera de la zona limitada por los límites de control superior e inferior del proceso, por ejemplo, el signo que separa las partes enteras y fraccionarias se desplaza un dígito. Por ejemplo, en lugar de 0,232, se escribe 0,0232 o 2,32.

Pero hay casos en los que el controlador comete un error al registrar un valor, que al mismo tiempo permanece en el área limitada por los límites de control superior e inferior del proceso, en caso de un error al registrar un dígito. Por ejemplo, en lugar de (0,232) se escribe (0,282). En este caso, las funciones estadísticas multivariadas tendrán más posibilidades de identificar una fila de datos con un error de escritura. Pero debe comprender que la solidez (aplicabilidad universal) de los gráficos de control de Shewhart se debe al hecho de que dichos errores no tendrán ningún impacto significativo en el cálculo de los límites de control del proceso, y esta es la propiedad más importante de los gráficos de control de Shewhart.

Los expertos en números pueden utilizar las funciones de aprendizaje automático para modelos de regresión (que predicen variables continuas) en nuestro software, o el paquete de análisis de datos incluido con Microsoft Excel para calcular un modelo de regresión lineal de los datos. A continuación, puede utilizar el gráfico de control de Shewhart (XmR o XbarR) para analizar los residuos (la diferencia entre los valores reales y predichos por el modelo). Si el gráfico de control muestra subgrupos (puntos rojos) con signos de causas especiales de variabilidad, que también pueden indicar una falta de coincidencia entre el modelo de datos y el proceso actual, estas causas deberán abordarse y eliminarse.

Por ejemplo, un gráfico XmR de control de valores individuales y rangos móviles, construido a partir de los valores de los [residuales] del modelo de regresión, servirá como definición operacional , en lugar de un juicio subjetivo sobre los valores atípicos observados en los diagramas de dispersión (valores atípicos o no atípicos).

Además, dicho análisis retendrá información sobre el sesgo del valor real en relación con los valores predichos por la función de regresión lineal, lo que facilita enormemente la interpretación de sus datos y es una diferencia importante con respecto al análisis de datos utilizando gráficos T2 de Hotelling.

Sobre la pasión por el SPC multifactorial

No tiene sentido la afirmación de muchos especialistas a quienes les gusta trabajar con números, y no con procesos a nivel de taller, sobre el propósito del control estadístico multivariante de procesos para un control más efectivo de los procesos multifactoriales, en contraste con los gráficos de control convencionales de Shewhart. Como si Shewhart, Deming y Wheeler construyeran sus gráficos de control para procesos de un solo factor, tales procesos simplemente no existen. Además, los procesos de producción, si ni siquiera ha comenzado a gestionarlos utilizando los gráficos de control de Shewhart, lo más probable es que se encuentren en un estado estadísticamente incontrolable (impredecible). Los gráficos de control de Shewhart para tales procesos ya tendrán señales que deberán abordarse para eliminar causas especiales y llevar los procesos a un estado controlado estadísticamente.

Si bien el análisis multivariado puede parecer vanguardista para la gerencia, explicar a los trabajadores en el taller lo que se ha aprendido utilizando el control estadístico multivariado sólo los confundirá, confirmará la "muy difícil" tarea de mejorar los procesos del taller y desalentará aún más el proceso de la empresa. empleados a nivel de piso.