Aprendizaje automático (ML). Entrenamiento de modelos matemáticos con un algoritmo. Árboles de decisión métodos de regresión y clasificación

Botón [Entrenamiento y aplicación de un modelo matemático mediante el método del árbol de decisión (regresión y clasificación).]

Los árboles de decisión se clasifican como algoritmos de aprendizaje automático (ML) supervisados y se utilizan para predecir variables de salida tanto continuas (regresión) como categóricas (clasificación). Esta característica de nuestro software hace que la tecnología de aprendizaje automático sea accesible para una amplia gama de usuarios.

Puede descargar un ejemplo de un archivo de hoja de cálculo estructurado para crear un modelo matemático y predecir un algoritmo de árbol de decisión para análisis de regresión: XLSX y para la clasificación XLSX .

Se pueden utilizar datos estructurados de archivos de tablas para importar: libro de Excel (*.xlsx); Libro binario de Excel (*.xlsb); Hoja de cálculo OpenDocument (*.ods).

¿Dónde se usa?

Se puede utilizar el análisis de datos mediante el método del árbol de decisión:

como una alternativa efectiva (coste, tiempo, recursos)" Experimentos de planificación "buscar modos óptimos de parámetros de entrada;
para la evaluación preliminar o alternativa de los parámetros de salida cuando los procedimientos de medición de dichos parámetros se llevan a cabo mediante pruebas costosas y/o que requieren mucho tiempo;
para sistemas expertos de soporte a decisiones (DSS), cuando las decisiones están asociadas con el riesgo de errores humanos.

Archivos de modelo de datos

Nuestro software puede utilizar modelos matemáticos entrenados de árboles de decisión para la biblioteca scikit-learn, creados en otras computadoras y guardados en archivos (*.sav).

Árboles de decisión por método de regresión para cantidades (mediciones) continuas en la entrada y salida

Ejemplo de uso de uno de nuestros clientes:
Usted gestiona el desarrollo del diseño y la producción de ensamblaje, y solicita piezas a un gran centro metalúrgico. El número de solicitudes para calcular el coste de un centro metalúrgico supera significativamente el número de pedidos reales del mismo. Los responsables del centro del metal ya se muestran reacios y tardos en responder a sus peticiones. Le ofrece al centro del metal que le proporcione un algoritmo de cálculo para que pueda calcular rápidamente el costo del trabajo del centro del metal sin distraer a sus empleados del trabajo, pero, naturalmente, recibe una negativa.

El historial de sus pedidos con la cantidad, las características técnicas de las piezas (que son la base para calcular el costo de los servicios del centro de metal) y el costo proporcionado es una base excelente para crear un modelo de regresión y usarlo para obtener de forma independiente un centro de metal muy cercano. precios sin enviar solicitudes de cálculo. Función de aprendizaje automático Árboles de decisión mediante regresión de software Gráficos de control de Shewhart +AI demostrarán una evaluación de la precisión del modelo matemático al construirlo. Un análisis gráfico del error de los precios del centro del metal pronosticado utilizando el modelo matemático construido "Valores actuales versus valores pronosticados" le mostrará una evaluación de los posibles riesgos, tanto en la dirección "peligrosa" como en la "segura", que puede tener en cuenta. cuenta en su precio. Para actualizar su modelo matemático, podrá complementarlo con órdenes que realmente llegarán a ejecutarse en el centro del metal.

Ventana para saltar a funciones de aprendizaje automático (ML)

Figura 1. Ventana para acceder a funciones de aprendizaje automático (ML). Se muestra una lista de menús desplegables cuando pasa el mouse sobre el elemento del menú principal.

Figura 2. Ventana de funciones de aprendizaje automático (ML). Se muestra información sobre herramientas cuando pasa el mouse sobre el botón para ir a las funciones de los árboles de decisión (regresión y clasificación).

Ventana de transición a las funciones de aplicación de algoritmos de aprendizaje automático mediante métodos de árbol de decisión (regresión y clasificación).

Figura 3. Ventana de transición a funciones de gestión de algoritmos de aprendizaje automático mediante árboles de decisión (regresión y clasificación). Aparece una información sobre herramientas desplegable cuando pasa el mouse sobre el botón para ir al panel de control de algoritmos del árbol de decisión (regresión).

Figura 4. Ventana de la función de control del algoritmo de aprendizaje automático mediante el método del árbol de decisión (regresión). Se abre una lista desplegable para seleccionar la variable prevista.

Ventana de la función de control del algoritmo de aprendizaje automático mediante el método del árbol de decisión (regresión)-2.

Figura 5. Ventana de la función de control del algoritmo de aprendizaje automático mediante el método del árbol de decisión (regresión). La casilla de verificación para eliminar restricciones sobre la profundidad del árbol de decisión está marcada. La casilla de verificación está marcada para guardar el modelo al cambiar los parámetros del modelo en la carpeta de la aplicación correspondiente (SCCPython\resources\Model_AI).

Figura 6. Ventana de la función de control del algoritmo de aprendizaje automático mediante el método del árbol de decisión (regresión). Se abre una lista desplegable con tipos de gráficos de evaluación de modelos matemáticos. El área de trazado muestra el gráfico "Valores reales frente a valores previstos" para el conjunto de datos de prueba.

Ventana de la función para controlar el algoritmo de aprendizaje automático mediante el método del árbol de decisión (regresión)-4.

Figura 7. Ventana de la función de control de aplicación del modelo matemático del árbol de decisión (regresión). El gráfico se escala en el eje X para mostrar menos puntos (de 140 a 196) usando la herramienta Zoom debajo del gráfico. Se muestra una información sobre herramientas desplegable cuando pasa el cursor sobre el botón para ir a la función de seleccionar un modelo matemático entrenado para aplicarlo a los nuevos datos seleccionados en los siguientes pasos.

Ventana de la función para controlar el algoritmo de aprendizaje automático mediante el método del árbol de decisión (regresión)-5.

Figura 8. Ventana de la función de gestión de selección del modelo matemático del Árbol de Decisión (regresión). Se muestra una información sobre herramientas desplegable cuando pasa el cursor sobre el campo con la ruta al modelo matemático entrenado seleccionado.

Ventana de la función para controlar el algoritmo de aprendizaje automático mediante el método del árbol de decisión (regresión)-7.

Figura 9. Ventana de la función de gestión de selección del modelo matemático del Árbol de Decisión (regresión). Se muestra una información sobre herramientas desplegable cuando pasa el cursor sobre el botón para ir a la función de seleccionar datos para usar en un modelo matemático.

Ventana de la función para controlar el algoritmo de aprendizaje automático mediante el método del árbol de decisión (regresión)-8.

Figura 10. Ventana de la función para gestionar la selección de un archivo con datos y aplicarles el modelo matemático del Árbol de Decisión (regresión). Aparece una información sobre herramientas desplegable cuando pasa el cursor sobre el botón "Predecir resultados".

Ventana de la función para controlar el algoritmo de aprendizaje automático mediante el método del árbol de decisión (regresión)-9.

Figura 11. Ventana para controlar la aplicación de un modelo matemático de árbol de decisión (regresión) a los datos importados. Al hacer clic en el botón "Predecir resultados", el modelo se aplica a los datos importados y al finalizar la operación, se abre una ventana de notificación para guardar los valores predichos en un archivo de Excel con los datos de origen.

Si sus datos importados contienen una o más columnas de variables explicativas con valores categóricos, como [masculino, femenino], se realizará un procedimiento automático de codificación One-Hot para convertir los datos en nuevas columnas codificadas numéricamente [0, 1]. Los datos codificados en caliente se guardarán en el archivo [xlsx] original en una hoja nueva.

Razones por las que la precisión de un modelo matemático que utiliza el método del árbol de decisión (regresión) puede dar lugar a una precisión baja

Datos limitados: si los datos de entrada a un modelo son limitados o contienen información insuficiente, el modelo puede experimentar datos insuficientes para producir un modelo predictivo preciso.
Selección de características incorrecta: si se incluyen características inapropiadas o irrelevantes en el modelo, puede afectar la precisión del modelo. Seleccionar las características correctas y limpiar los datos de valores atípicos y ruido es muy importante para lograr una alta precisión del modelo de regresión.
Entrenamiento insuficiente: si un modelo no se entrena durante el tiempo suficiente o no es lo suficientemente complejo como para aproximarse a relaciones complejas en los datos, puede producir una precisión de predicción deficiente. En tales casos, puede ser necesario aumentar la profundidad del árbol de decisión o utilizar otras técnicas de aprendizaje automático.
Sobreajuste: si un modelo tiene demasiados parámetros o un árbol de decisión demasiado profundo, puede sobreajustarse a los datos de entrenamiento y funcionar mal con los nuevos datos. Una forma de combatir el sobreajuste es utilizar la regularización, como oscilar o restringir los parámetros del modelo.
Datos desequilibrados: si el conjunto de datos de entrenamiento contiene un número impar de ejemplos de valores de variables objetivo, esto puede resultar en una precisión deficiente del modelo. En tales casos, es posible que sea necesario utilizar técnicas de ponderación de ejemplo.
Ruido en los datos: el ruido o los valores atípicos aleatorios en los datos pueden hacer que el modelo de regresión tenga poca precisión. Es necesario realizar un análisis preliminar de los datos y eliminar los valores atípicos, así como aplicar métodos para reducir la influencia del ruido, como suavizar o filtrar los datos.

Árboles de decisión por método de clasificación para cantidades continuas (mediciones) como entrada y datos categóricos (clases) como salida

Ejemplo 1. Con base en los resultados de las pruebas clínicas del paciente, es necesario tomar una decisión sobre su diagnóstico, por ejemplo, enfermo/no enfermo.

Ejemplo 2. Es necesario sacar una conclusión sobre la pertenencia de un objeto o evento a una clase (tipo) específica a partir de los resultados de las mediciones de muchas de sus características (propiedades).

Ventana de la función de control del algoritmo de aprendizaje automático mediante el método del árbol de decisión (clasificación)-1.

Figura 12. Ventana de la función de gestión de entrenamiento y evaluación del modelo matemático del árbol de decisión (clasificación). Se muestra una información sobre herramientas desplegable cuando pasa el mouse sobre el botón para ir al panel de control de los algoritmos del árbol de decisión que utilizan el método de clasificación.

Ventana de la función de control del algoritmo de aprendizaje automático mediante el método del árbol de decisión (clasificación)-2.

Figura 13. Ventana de la función de gestión de entrenamiento y evaluación del modelo matemático del árbol de decisión (clasificación). La casilla de verificación está marcada para eliminar el límite de profundidad del árbol de decisión. La casilla de verificación está marcada para guardar el modelo al cambiar los parámetros del modelo en la carpeta de la aplicación correspondiente (SCCPython\resources\Model_AI). Se muestra una lista desplegable con una selección de tipos de gráficos de evaluación para el modelo entrenado cuando se utilizan datos de prueba que no se incluyeron en el conjunto de datos de entrenamiento.

Ventana de la función para controlar el algoritmo de aprendizaje automático mediante el método del árbol de decisión (clasificación)-3.

Figura 14. Ventana de la función de gestión de entrenamiento y evaluación del modelo matemático del árbol de decisión (clasificación) con gráficos de la “matriz de confusión”. Se muestra una sugerencia cuando pasa el cursor del mouse sobre el botón para ir al panel de control y seleccionar un modelo entrenado para importar datos en el siguiente paso".

Ventana de la función para controlar el algoritmo de aprendizaje automático mediante el método del árbol de decisión (clasificación)-4.

Figura 15. Ventana de la función para seleccionar un modelo matemático entrenado del Árbol de Decisión (clasificación) para datos seleccionados por el usuario en el siguiente paso. Se muestra información sobre herramientas cuando pasa el mouse sobre el botón para ir al panel de control de selección de datos y aplicarle el modelo entrenado seleccionado.

Ventana de la función para controlar el algoritmo de aprendizaje automático mediante el método del árbol de decisión (clasificación)-5.

Figura 16. Ventana de la función de aplicar un modelo de árbol de decisión matemático entrenado (clasificación) a datos seleccionados por el usuario. Aparece una información sobre herramientas cuando pasa el mouse sobre el botón "Predecir resultados".

Ventana de la función para controlar el algoritmo de aprendizaje automático mediante el método del árbol de decisión (clasificación)-6.

Figura 17. Ventana de la función de aplicar un modelo de árbol de decisión matemático entrenado (clasificación) a datos seleccionados por el usuario. Al hacer clic en el botón "Predecir resultados", el modelo se aplica a los datos importados y al finalizar la operación, se abre una ventana de notificación para guardar los valores pronosticados en un archivo de Excel.

Ventana de la función para controlar el algoritmo de aprendizaje automático mediante el método del árbol de decisión (clasificación)-7.

Figura 18. Ventana de la función de gestión de entrenamiento y evaluación del modelo matemático del árbol de decisión (clasificación). En el área de gráficos, las matrices de confusión se muestran en tamaño grande: el segundo tipo de gráficos para el árbol de decisión (clasificación).

Razones por las que la precisión de un modelo matemático que utiliza el método del árbol de decisión (clasificación) puede dar lugar a una precisión baja

Cantidad insuficiente de datos: si el modelo se entrena con una pequeña cantidad de datos, puede resultar en una precisión baja. Cuantos más datos estén disponibles para el entrenamiento, más preciso podrá ser el modelo.
Selección de características inadecuada: si se incluyen características inapropiadas o irrelevantes en el modelo, puede reducir su precisión. Es importante seleccionar aquellas características que estén más correlacionadas con la variable objetivo para lograr una alta precisión de clasificación.
Preprocesamiento de datos insuficiente: el procesamiento de datos incorrecto, como el escalado o la normalización inadecuados, puede provocar una precisión deficiente del modelo. Es importante llevar a cabo los pasos necesarios de preprocesamiento de datos, como limpiar datos de valores atípicos o completar valores faltantes.
Sobreentrenamiento del modelo: si un modelo es demasiado complejo o tiene demasiados parámetros, puede sobreentrenarse con los datos de entrenamiento y funcionar mal con los nuevos datos. El sobreajuste se puede reducir, por ejemplo, limitando la profundidad del árbol o utilizando la regularización.
Desequilibrio de clases: si las clases en los datos están desequilibradas, es decir, una clase domina a las demás, el modelo puede tender a predecir la clase dominante y mostrar baja precisión en las clases menos representadas. En tales casos, el uso de técnicas de equilibrio de clases, como el muestreo ascendente o descendente, puede mejorar la precisión del modelo.
Selección incorrecta de reglas de decisión: si las reglas de decisión que determinan la distribución de clases en los nodos del árbol se seleccionan incorrectamente, esto puede provocar una baja precisión del modelo. Es importante seleccionar reglas de decisión apropiadas que separen las clases con mayor precisión.

Gráficos de control de Shewhart Analista PRO +IA para Windows, Mac, Linux Registro de software ruso (entrada No. 18857 del 05/09/2023)