El análisis predictivo es una forma de análisis empresarial que aplica el aprendizaje automático para generar un modelo predictivo para determinadas aplicaciones empresariales. Como tal, abarca una variedad de técnicas estadísticas de modelado predictivo y aprendizaje automático que analizan hechos actuales e históricos para hacer predicciones sobre eventos futuros o desconocidos. [1] Representa un subconjunto importante de aplicaciones de aprendizaje automático; en algunos contextos, es sinónimo de aprendizaje automático. [2]
En el ámbito empresarial, los modelos predictivos aprovechan los patrones que se encuentran en los datos históricos y transaccionales para identificar riesgos y oportunidades. Los modelos capturan las relaciones entre muchos factores para permitir la evaluación del riesgo o el potencial asociado con un conjunto particular de condiciones, orientando la toma de decisiones para las transacciones candidatas. [3]
El efecto funcional definitorio de estos enfoques técnicos es que el análisis predictivo proporciona una puntuación predictiva (probabilidad) para cada individuo (cliente, empleado, paciente de atención médica, SKU de producto, vehículo, componente, máquina u otra unidad organizacional) con el fin de determinar, informar o influir en los procesos organizacionales que afectan a un gran número de individuos, como en marketing, evaluación de riesgo crediticio, detección de fraude, fabricación, atención médica y operaciones gubernamentales, incluida la aplicación de la ley.
El análisis predictivo es un conjunto de tecnologías de inteligencia empresarial (BI) que descubre relaciones y patrones dentro de grandes volúmenes de datos que se pueden utilizar para predecir comportamientos y eventos. A diferencia de otras tecnologías de BI, el análisis predictivo mira hacia el futuro y utiliza eventos pasados para anticipar el futuro. [4] Las técnicas estadísticas de análisis predictivo incluyen modelado de datos , aprendizaje automático , IA , algoritmos de aprendizaje profundo y minería de datos . A menudo, el evento desconocido de interés está en el futuro, pero el análisis predictivo se puede aplicar a cualquier tipo de incógnita, ya sea en el pasado, el presente o el futuro. Por ejemplo, identificar sospechosos después de que se haya cometido un delito o un fraude con tarjetas de crédito cuando ocurre. [5] El núcleo del análisis predictivo se basa en capturar relaciones entre las variables explicativas y las variables predichas a partir de sucesos pasados, y explotarlas para predecir el resultado desconocido. Sin embargo, es importante señalar que la precisión y la facilidad de uso de los resultados dependerán en gran medida del nivel de análisis de datos y la calidad de las suposiciones. [1]
El análisis predictivo se define a menudo como la predicción a un nivel de granularidad más detallado, es decir, la generación de puntuaciones predictivas (probabilidades) para cada elemento individual de la organización. Esto lo distingue de la previsión . Por ejemplo, "Análisis predictivo: tecnología que aprende de la experiencia (datos) para predecir el comportamiento futuro de las personas con el fin de impulsar mejores decisiones". [2] En los sistemas industriales futuros, el valor del análisis predictivo será predecir y prevenir problemas potenciales para lograr una avería casi nula y, además, integrarse en el análisis prescriptivo para la optimización de las decisiones. [6]
Los enfoques y técnicas utilizados para realizar análisis predictivos pueden agruparse en términos generales en técnicas de regresión y técnicas de aprendizaje automático.
El aprendizaje automático se puede definir como la capacidad de una máquina de aprender y luego imitar el comportamiento humano que requiere inteligencia. Esto se logra mediante inteligencia artificial, algoritmos y modelos. [7]
Los modelos ARIMA son un ejemplo común de modelos de series temporales. Estos modelos utilizan autorregresión, lo que significa que el modelo puede adaptarse a un software de regresión que utilizará el aprendizaje automático para realizar la mayor parte del análisis de regresión y suavizado. Se sabe que los modelos ARIMA no tienen una tendencia general, sino que tienen una variación alrededor del promedio que tiene una amplitud constante, lo que da como resultado patrones temporales estadísticamente similares. A través de esto, se analizan las variables y se filtran los datos para comprender y predecir mejor los valores futuros. [8] [9]
Un ejemplo de un método ARIMA son los modelos de suavizado exponencial. El suavizado exponencial tiene en cuenta la diferencia de importancia entre los conjuntos de datos más antiguos y los más nuevos, ya que los datos más recientes son más precisos y valiosos para predecir valores futuros. Para lograr esto, se utilizan exponentes para dar a los conjuntos de datos más nuevos un mayor peso en los cálculos que a los conjuntos más antiguos. [10]
Los modelos de series temporales son un subconjunto del aprendizaje automático que utiliza series temporales para comprender y pronosticar datos utilizando valores pasados. Una serie temporal es la secuencia del valor de una variable a lo largo de períodos igualmente espaciados, como años o trimestres en aplicaciones comerciales. [11] Para lograr esto, los datos deben suavizarse o debe eliminarse la varianza aleatoria de los datos para revelar tendencias en los datos. Hay varias formas de lograr esto.
Los métodos de promedio móvil único utilizan conjuntos de datos pasados cada vez más pequeños para disminuir el error asociado con la toma de un promedio único, lo que lo convierte en un promedio más preciso de lo que sería tomar el promedio de todo el conjunto de datos. [12]
Los métodos de promedio móvil centrado utilizan los datos encontrados en los métodos de promedio móvil simple tomando un promedio del conjunto de datos con números medianos. Sin embargo, como el conjunto de datos con números medianos es difícil de calcular con conjuntos de datos pares, este método funciona mejor con conjuntos de datos impares que con pares. [13]
El modelado predictivo es una técnica estadística que se utiliza para predecir el comportamiento futuro. Utiliza modelos predictivos para analizar una relación entre una unidad específica en una muestra dada y una o más características de la unidad. El objetivo de estos modelos es evaluar la posibilidad de que una unidad en otra muestra muestre el mismo patrón. Las soluciones de modelos predictivos pueden considerarse un tipo de tecnología de minería de datos. Los modelos pueden analizar datos históricos y actuales y generar un modelo para predecir posibles resultados futuros. [14]
Independientemente de la metodología utilizada, en general, el proceso de creación de modelos predictivos implica los mismos pasos. En primer lugar, es necesario determinar los objetivos del proyecto y los resultados deseados y traducirlos en objetivos y tareas de análisis predictivo. A continuación, analizar los datos de origen para determinar los datos y el enfoque de construcción de modelos más adecuados (los modelos son tan útiles como los datos aplicables utilizados para construirlos). Seleccionar y transformar los datos para crear modelos. Crear y probar modelos para evaluar si son válidos y podrán cumplir con los objetivos y las métricas del proyecto. Aplicar los resultados del modelo a los procesos de negocio adecuados (identificar patrones en los datos no significa necesariamente que una empresa sepa cómo aprovecharlos o capitalizarlos). Después, gestionar y mantener los modelos para estandarizar y mejorar el rendimiento (la demanda de gestión de modelos aumentará para cumplir con las nuevas regulaciones de cumplimiento). [4]
Generalmente, el análisis de regresión utiliza datos estructurales junto con los valores pasados de las variables independientes y la relación entre ellas y la variable dependiente para formar predicciones. [8]
En la regresión lineal, se construye un gráfico con los valores anteriores de la variable dependiente en el eje Y y la variable independiente que se está analizando en el eje X. Luego, un programa estadístico construye una línea de regresión que representa la relación entre las variables independientes y dependientes, que se puede utilizar para predecir los valores de la variable dependiente basándose únicamente en la variable independiente. Con la línea de regresión, el programa también muestra una ecuación de pendiente-intersección para la línea que incluye una adición para el término de error de la regresión, donde cuanto mayor sea el valor del término de error, menos preciso será el modelo de regresión. Para disminuir el valor del término de error, se introducen otras variables independientes en el modelo y se realizan análisis similares sobre estas variables independientes. [8] [15] Además, se puede emplear la regresión lineal múltiple (MLP) para abordar relaciones que involucran múltiples variables independientes, lo que ofrece un enfoque de modelado más integral. [16]
Un aspecto importante de la auditoría incluye la revisión analítica. En la revisión analítica, se determina la razonabilidad de los saldos de las cuentas que se investigan. Los auditores llevan a cabo este proceso a través de modelos predictivos para formar predicciones llamadas expectativas condicionales de los saldos que se auditan utilizando métodos de promedio móvil integrado autorregresivo (ARIMA) y métodos de análisis de regresión general [8] , específicamente a través de los métodos de Técnica estadística para revisión analítica (STAR). [17]
El método ARIMA para la revisión analítica utiliza el análisis de series temporales de saldos auditados anteriores para crear las expectativas condicionales. Estas expectativas condicionales se comparan luego con los saldos reales informados en la cuenta auditada para determinar qué tan cerca están los saldos informados de las expectativas. Si los saldos informados están cerca de las expectativas, las cuentas no se auditan más. Si los saldos informados son muy diferentes de las expectativas, existe una mayor posibilidad de que haya un error contable material y se realiza una auditoría adicional. [17]
Los métodos de análisis de regresión se utilizan de manera similar, excepto que el modelo de regresión utilizado supone la disponibilidad de una sola variable independiente. La materialidad de la variable independiente que contribuye a los saldos de las cuentas auditadas se determina utilizando saldos de cuentas anteriores junto con datos estructurales actuales. [8] La materialidad es la importancia de una variable independiente en su relación con la variable dependiente. [18] En este caso, la variable dependiente es el saldo de la cuenta. A través de esto, la variable independiente más importante se utiliza para crear la expectativa condicional y, de manera similar al método ARIMA, la expectativa condicional se compara luego con el saldo de la cuenta informado y se toma una decisión basada en la proximidad de los dos saldos. [8]
Los métodos STAR funcionan mediante análisis de regresión y se dividen en dos métodos. El primero es el enfoque de saldo mensual STAR, y las expectativas condicionales realizadas y el análisis de regresión utilizado están vinculados a un mes que se audita. El otro método es el enfoque de saldo anual STAR, que se realiza a mayor escala al basar las expectativas condicionales y el análisis de regresión en un año que se audita. Aparte de la diferencia en el tiempo que se audita, ambos métodos funcionan de la misma manera, al comparar los saldos esperados y reportados para determinar qué cuentas se deben investigar más a fondo. [17]
Además, la incorporación de procedimientos analíticos en las normas de auditoría subraya la creciente necesidad de que los auditores modifiquen estas metodologías para adaptarlas a conjuntos de datos específicos, lo que refleja la naturaleza siempre cambiante del examen financiero. [19]
A medida que avanzamos hacia un mundo de avances tecnológicos en el que se crean y almacenan cada vez más datos de forma digital, las empresas buscan formas de aprovechar esta oportunidad y utilizar esta información para generar ganancias. El análisis predictivo se puede utilizar y es capaz de proporcionar muchos beneficios a una amplia gama de empresas, incluidas las empresas de gestión de activos, las compañías de seguros, las empresas de comunicación y muchas otras empresas. Toda empresa que utiliza la gestión de proyectos para lograr sus objetivos se beneficia enormemente de las capacidades de inteligencia predictiva. En un estudio realizado por IDC Analyze the Future, Dan Vasset y Henry D. Morris explican cómo una empresa de gestión de activos utilizó el análisis predictivo para desarrollar una mejor campaña de marketing. Pasaron de un enfoque de marketing masivo a un enfoque centrado en el cliente, donde en lugar de enviar la misma oferta a cada cliente, personalizarían cada oferta en función de su cliente. Se utilizó el análisis predictivo para predecir la probabilidad de que un posible cliente aceptara una oferta personalizada. Debido a la campaña de marketing y al análisis predictivo, la tasa de aceptación de la empresa se disparó, con tres veces el número de personas que aceptaron sus ofertas personalizadas. [20]
Los avances tecnológicos en el análisis predictivo [21] han aumentado su valor para las empresas. Uno de ellos es la mayor potencia de los ordenadores, y con ello el análisis predictivo ha podido crear previsiones sobre grandes conjuntos de datos con mucha más rapidez. Con el aumento de la potencia informática también se consiguen más datos y aplicaciones, lo que supone una gama más amplia de datos que se pueden utilizar con el análisis predictivo. Otro avance tecnológico incluye una interfaz más sencilla de usar, que permite una menor barrera de entrada y una formación menos extensa necesaria para que los empleados utilicen el software y las aplicaciones de forma eficaz. Debido a estos avances, muchas más empresas están adoptando el análisis predictivo y viendo los beneficios en la eficiencia y la eficacia de los empleados, así como en las ganancias. [22] El porcentaje de proyectos que fracasan es bastante alto: un enorme 70% de todos los proyectos no cumplen lo prometido a los clientes. Sin embargo, se ha demostrado que la aplicación de un proceso de gestión reduce la tasa de fracaso al 20% o menos. [23]
Los modelos ARIMA univariados y multivariados se pueden utilizar para pronosticar los flujos de efectivo futuros de una empresa , con sus ecuaciones y cálculos basados en los valores pasados de ciertos factores que contribuyen a los flujos de efectivo. Utilizando el análisis de series de tiempo, los valores de estos factores se pueden analizar y extrapolar para predecir los flujos de efectivo futuros de una empresa. Para los modelos univariados, los valores pasados de los flujos de efectivo son el único factor utilizado en la predicción. Mientras tanto, los modelos multivariados utilizan múltiples factores relacionados con los datos de acumulación, como el ingreso operativo antes de la depreciación. [24]
Otro modelo utilizado para predecir los flujos de efectivo fue desarrollado en 1998 y se conoce como el modelo Dechow, Kothari y Watts, o DKW (1998). DKW (1998) utiliza el análisis de regresión para determinar la relación entre múltiples variables y los flujos de efectivo. A través de este método, el modelo descubrió que los cambios en el flujo de efectivo y las acumulaciones están negativamente relacionadas, específicamente a través de las ganancias actuales, y el uso de esta relación predice los flujos de efectivo para el próximo período. El modelo DKW (1998) deriva esta relación a través de las relaciones de las acumulaciones y los flujos de efectivo con las cuentas por pagar y por cobrar, junto con el inventario. [25]
Algunas agencias de bienestar infantil han comenzado a utilizar análisis predictivos para señalar casos de alto riesgo. [26] Por ejemplo, en el condado de Hillsborough, Florida , el uso de una herramienta de modelado predictivo por parte de la agencia de bienestar infantil ha evitado muertes infantiles relacionadas con el abuso en la población objetivo. [27]
La predicción del resultado de las decisiones jurídicas se puede realizar mediante programas de IA. Estos programas pueden utilizarse como herramientas de asistencia para los profesionales de este sector. [28] [29]
A menudo, el foco del análisis no es el consumidor, sino el producto, la cartera, la empresa, la industria o incluso la economía. Por ejemplo, un minorista podría estar interesado en predecir la demanda a nivel de tienda para fines de gestión de inventario. O la Junta de la Reserva Federal podría estar interesada en predecir la tasa de desempleo para el próximo año. Este tipo de problemas se pueden abordar mediante análisis predictivos utilizando técnicas de series temporales (ver más abajo). También se pueden abordar mediante enfoques de aprendizaje automático que transforman la serie temporal original en un espacio vectorial de características, donde el algoritmo de aprendizaje encuentra patrones que tienen poder predictivo. [30] [31]
Muchas empresas tienen que tener en cuenta la exposición al riesgo debido a sus diferentes servicios y determinar los costos necesarios para cubrir el riesgo. El análisis predictivo puede ayudar a suscribir estas cantidades al predecir las posibilidades de enfermedad, incumplimiento , quiebra , etc. El análisis predictivo puede agilizar el proceso de adquisición de clientes al predecir el comportamiento de riesgo futuro de un cliente utilizando datos a nivel de aplicación. El análisis predictivo en forma de puntajes crediticios ha reducido la cantidad de tiempo que lleva la aprobación de préstamos, especialmente en el mercado hipotecario. El análisis predictivo adecuado puede conducir a decisiones de precios adecuadas, lo que puede ayudar a mitigar el riesgo futuro de incumplimiento. El análisis predictivo se puede utilizar para mitigar el riesgo moral y evitar que ocurran accidentes. [32]
Las agencias policiales están utilizando ahora estrategias proactivas para la prevención del delito. El análisis predictivo, que utiliza herramientas estadísticas para pronosticar patrones delictivos, ofrece nuevas formas para que las agencias policiales movilicen recursos y reduzcan los niveles de delincuencia. [33] Con este análisis predictivo de los datos sobre delincuencia, la policía puede asignar mejor los recursos y la mano de obra limitados para evitar que se produzcan más delitos. Se pueden emplear patrullas dirigidas o la resolución de problemas para proteger los puntos críticos de delincuencia, que presentan densidades delictivas mucho más altas que el promedio de una ciudad. [34]
Han surgido varias empresas especializadas en análisis predictivos en el campo de los deportes profesionales, tanto para equipos como para individuos. [35] Si bien la predicción del comportamiento humano crea una amplia variación debido a muchos factores que pueden cambiar después de que se hacen las predicciones, incluidas las lesiones, el arbitraje, las decisiones de los entrenadores, el clima y más, el uso de análisis predictivos para proyectar tendencias y rendimiento a largo plazo es útil. Gran parte de este campo comenzó con el concepto Moneyball de Billy Beane a principios de siglo, y ahora la mayoría de los equipos deportivos profesionales emplean sus propios departamentos de análisis.
{{cite web}}
: CS1 maint: varios nombres: lista de autores ( enlace )