stringtranslate.com

Modelo basado en datos

Los modelos basados ​​en datos son una clase de modelos computacionales que se basan principalmente en datos históricos recopilados a lo largo de la vida útil de un sistema o proceso para establecer relaciones entre las variables de entrada, internas y de salida. Los modelos basados ​​en datos, que se encuentran comúnmente en numerosos artículos y publicaciones, han evolucionado a partir de modelos estadísticos anteriores , superando las limitaciones planteadas por supuestos estrictos sobre distribuciones de probabilidad. Estos modelos han ganado prominencia en varios campos, particularmente en la era del big data , la inteligencia artificial y el aprendizaje automático , donde ofrecen información y predicciones valiosas basadas en los datos disponibles.

Fondo

Estos modelos han evolucionado a partir de modelos estadísticos anteriores , que se basaban en ciertos supuestos sobre distribuciones de probabilidad que a menudo resultaban ser demasiado restrictivos. [1] La aparición de modelos basados ​​en datos en las décadas de 1950 y 1960 coincidió con el desarrollo de las computadoras digitales , los avances en la investigación de inteligencia artificial y la introducción de nuevos enfoques en el modelado no conductual, como el reconocimiento de patrones y la clasificación automática. [2]

Conceptos clave

Los modelos basados ​​en datos abarcan una amplia gama de técnicas y metodologías que tienen como objetivo procesar y analizar de forma inteligente grandes conjuntos de datos. Algunos ejemplos son la lógica difusa , los conjuntos difusos y aproximados para el manejo de la incertidumbre, [3] las redes neuronales para aproximar funciones, [4] la optimización global y la computación evolutiva , [5] la teoría del aprendizaje estadístico , [6] y los métodos bayesianos . [7] Estos modelos han encontrado aplicaciones en diversos campos, como la economía, la gestión de las relaciones con los clientes, los servicios financieros, la medicina y el ejército, entre otros. [8]

El aprendizaje automático , un subcampo de la inteligencia artificial , está estrechamente relacionado con el modelado basado en datos, ya que también se centra en el uso de datos históricos para crear modelos que puedan hacer predicciones e identificar patrones. [9] De hecho, muchos modelos basados ​​en datos incorporan técnicas de aprendizaje automático, como algoritmos de regresión , clasificación y agrupamiento , para procesar y analizar datos. [10]

En los últimos años, el concepto de modelos basados ​​en datos ha ganado una considerable atención en el campo de los recursos hídricos, con numerosas aplicaciones, cursos académicos y publicaciones científicas que utilizan el término como una generalización para los modelos que se basan en datos en lugar de en la física. [11] Esta clasificación ha aparecido en varias publicaciones e incluso ha estimulado el desarrollo de modelos híbridos en la última década. Los modelos híbridos intentan cuantificar el grado de información basada en la física que se utiliza en los modelos hidrológicos y determinar si el proceso de construcción del modelo está impulsado principalmente por la física o se basa puramente en datos. Como resultado, los modelos basados ​​en datos se han convertido en un tema esencial de discusión y exploración en la gestión y la investigación de los recursos hídricos. [12]

El término "modelado basado en datos" (DDM) se refiere al paradigma general de utilizar datos históricos junto con técnicas computacionales avanzadas, incluido el aprendizaje automático y la inteligencia artificial, para crear modelos que puedan revelar tendencias y patrones subyacentes y, en algunos casos, hacer predicciones [13]. Los modelos basados ​​en datos se pueden construir con o sin conocimiento detallado de los procesos subyacentes que rigen el comportamiento del sistema, lo que los hace particularmente útiles cuando dicho conocimiento falta o está fragmentado. [14]

Referencias

  1. ^ David, A., Freedman. (2006). Sobre el llamado “estimador sándwich de Huber” y los “errores estándar robustos”. The American Statistician, 60(4):299-302. doi :10.1198/000313006X152207
  2. ^ Richard, O., Duda., Peter, E., Hart. (1973). Clasificación de patrones y análisis de escenas.
  3. ^ J., A., Goguen. (1973). Zadeh LA. Conjuntos difusos. Información y control, vol. 8 (1965), págs. 338-353. Zadeh LA. Relaciones de similitud y ordenamientos difusos. Ciencias de la información, vol. 3 (1971), págs. 177-200.. Journal of Symbolic Logic, 38(4):656-657. doi :10.2307/2272014
  4. ^ Simon, Haykin. (2009). Redes neuronales y máquinas de aprendizaje 3.ª edición: Simon Haykin.   
  5. ^ David, E., Goldberg. (1988). Algoritmos genéticos en búsqueda, optimización y aprendizaje automático. Universidad de Alabama.
  6. ^ Vapnik, V. (1995). La naturaleza de la teoría del aprendizaje estadístico. Springer.
  7. ^ Paul, Hewson. (2015). Análisis de datos bayesianos 3.ª ed. A. Gelman, JB Carlin, HS Stern, DB Dunson, A. Vehtari y DB Rubin, 2013 Boca Raton, Chapman y Hall–CRC 676 pp., ISBN 1-4398-4095-4 . Revista de la Royal Statistical Society Serie A-statistics in Society, 178(1):301-301. doi :10.1111/J.1467-985X.2014.12096_1.X 
  8. ^ Usama, M., Fayyad., Gregory, Piatetsky-Shapiro., Padhraic, Smyth. (1996). De la minería de datos al descubrimiento de conocimiento en bases de datos. Ai Magazine, 17(3):37-54. doi :10.1609/AIMAG.V17I3.1230
  9. ^ Mitchell, TM (1997). Aprendizaje automático. Serie McGraw Hill en Ciencias de la Computación.
  10. ^ Alpaydin, E. (2020). Introducción al aprendizaje automático. MIT Press. ISBN 978-0-262-01243-0 
  11. ^ Robert, J., Abrahart., Linda, M., See., Dimitri, Solomatine. (2008). Hidroinformática práctica: inteligencia computacional y desarrollos tecnológicos en aplicaciones hídricas.
  12. ^ GA, Corzo, Pérez. (2009). Modelos híbridos para la predicción hidrológica: integración de técnicas de modelado conceptual y basado en datos.
  13. ^ Foster, Provost., Tom, Fawcett. (2013). Ciencia de datos para empresas: lo que necesita saber sobre minería de datos y pensamiento analítico de datos.
  14. ^ M., Cheng., Fangxin, Fang., Christopher, C., Pain., Ionel, Michael, Navon. (2020). Modelado basado en datos de flujos de fluidos espaciotemporales no lineales utilizando una red generativa antagónica convolucional profunda. Métodos informáticos en mecánica aplicada e ingeniería, 365:113000-. doi :10.1016/J.CMA.2020.113000