Un modelo matemático es una descripción abstracta de un sistema concreto utilizando conceptos y lenguaje matemáticos . El proceso de desarrollo de un modelo matemático se denomina modelado matemático . Los modelos matemáticos se utilizan en matemáticas aplicadas y en las ciencias naturales (como la física , la biología , las ciencias de la tierra , la química ) y en disciplinas de ingeniería (como la informática , la ingeniería eléctrica ), así como en sistemas no físicos como las ciencias sociales [1] (como la economía , la psicología , la sociología , la ciencia política ). También se puede enseñar como una asignatura por derecho propio. [2]
El uso de modelos matemáticos para resolver problemas en operaciones comerciales o militares es una gran parte del campo de la investigación de operaciones . Los modelos matemáticos también se utilizan en música , [3] lingüística , [4] y filosofía (por ejemplo, de forma intensiva en filosofía analítica ). Un modelo puede ayudar a explicar un sistema y a estudiar los efectos de diferentes componentes, y a hacer predicciones sobre el comportamiento.
Los modelos matemáticos pueden adoptar muchas formas, incluidos los sistemas dinámicos , los modelos estadísticos , las ecuaciones diferenciales o los modelos de teoría de juegos . Estos y otros tipos de modelos pueden superponerse, y un modelo determinado puede incluir una variedad de estructuras abstractas. En general, los modelos matemáticos pueden incluir modelos lógicos . En muchos casos, la calidad de un campo científico depende de lo bien que los modelos matemáticos desarrollados en el aspecto teórico concuerden con los resultados de experimentos repetibles. La falta de concordancia entre los modelos matemáticos teóricos y las mediciones experimentales a menudo conduce a avances importantes a medida que se desarrollan mejores teorías. En las ciencias físicas , un modelo matemático tradicional contiene la mayoría de los siguientes elementos:
Los modelos matemáticos son de diferentes tipos:
En los negocios y la ingeniería , los modelos matemáticos pueden utilizarse para maximizar un determinado resultado. El sistema en consideración requerirá ciertas entradas. El sistema que relaciona las entradas con las salidas también depende de otras variables: variables de decisión , variables de estado , variables exógenas y variables aleatorias . Las variables de decisión a veces se conocen como variables independientes. Las variables exógenas a veces se conocen como parámetros o constantes . Las variables no son independientes entre sí, ya que las variables de estado dependen de las variables de decisión, de entrada, aleatorias y exógenas. Además, las variables de salida dependen del estado del sistema (representado por las variables de estado).
Los objetivos y las restricciones del sistema y sus usuarios pueden representarse como funciones de las variables de salida o de estado. Las funciones objetivo dependerán de la perspectiva del usuario del modelo. Dependiendo del contexto, una función objetivo también se conoce como un índice de rendimiento , ya que es una medida de interés para el usuario. Aunque no hay límite para la cantidad de funciones objetivo y restricciones que puede tener un modelo, el uso u optimización del modelo se vuelve más complejo (computacionalmente) a medida que aumenta la cantidad. Por ejemplo, los economistas a menudo aplican álgebra lineal cuando utilizan modelos de entrada-salida . Los modelos matemáticos complicados que tienen muchas variables pueden consolidarse mediante el uso de vectores donde un símbolo representa varias variables.
Los problemas de modelado matemático suelen clasificarse en modelos de caja negra o de caja blanca , según la cantidad de información a priori disponible sobre el sistema. Un modelo de caja negra es un sistema del que no hay información a priori disponible. Un modelo de caja blanca (también llamado caja de cristal o caja transparente) es un sistema en el que está disponible toda la información necesaria. Prácticamente todos los sistemas se encuentran en algún punto intermedio entre los modelos de caja negra y caja blanca, por lo que este concepto es útil solo como una guía intuitiva para decidir qué enfoque adoptar.
Por lo general, es preferible utilizar la mayor cantidad posible de información a priori para que el modelo sea más preciso. Por lo tanto, los modelos de caja blanca suelen considerarse más fáciles, porque si se ha utilizado la información correctamente, el modelo se comportará correctamente. A menudo, la información a priori se presenta en forma de conocimiento del tipo de funciones que relacionan diferentes variables. Por ejemplo, si hacemos un modelo de cómo funciona un medicamento en un sistema humano, sabemos que, por lo general, la cantidad de medicamento en la sangre es una función que decae exponencialmente , pero aún nos quedan varios parámetros desconocidos: ¿con qué rapidez decae la cantidad de medicamento y cuál es la cantidad inicial de medicamento en la sangre? Por lo tanto, este ejemplo no es un modelo completamente de caja blanca. Estos parámetros deben estimarse por algún medio antes de poder utilizar el modelo.
En los modelos de caja negra, se intenta estimar tanto la forma funcional de las relaciones entre las variables como los parámetros numéricos en esas funciones. Usando información a priori podríamos terminar, por ejemplo, con un conjunto de funciones que probablemente podrían describir el sistema adecuadamente. Si no hay información a priori, intentaríamos usar funciones lo más generales posible para cubrir todos los modelos diferentes. Un enfoque que se usa a menudo para los modelos de caja negra son las redes neuronales que normalmente no hacen suposiciones sobre los datos entrantes. Alternativamente, los algoritmos NARMAX (modelo de media móvil autorregresiva no lineal con entradas exógenas) que se desarrollaron como parte de la identificación de sistemas no lineales [8] se pueden usar para seleccionar los términos del modelo, determinar la estructura del modelo y estimar los parámetros desconocidos en presencia de ruido correlacionado y no lineal. La ventaja de los modelos NARMAX en comparación con las redes neuronales es que NARMAX produce modelos que se pueden escribir y relacionar con el proceso subyacente, mientras que las redes neuronales producen una aproximación que es opaca.
A veces resulta útil incorporar información subjetiva a un modelo matemático. Esto se puede hacer con base en la intuición , la experiencia o la opinión de expertos , o en la conveniencia de la forma matemática. Las estadísticas bayesianas proporcionan un marco teórico para incorporar dicha subjetividad a un análisis riguroso: especificamos una distribución de probabilidad previa (que puede ser subjetiva) y luego actualizamos esta distribución con base en datos empíricos.
Un ejemplo de cuándo sería necesario este enfoque es una situación en la que un experimentador dobla ligeramente una moneda y la lanza una vez, registrando si sale cara, y luego se le da la tarea de predecir la probabilidad de que el siguiente lanzamiento salga cara. Después de doblar la moneda, la probabilidad real de que salga cara es desconocida; por lo tanto, el experimentador tendría que tomar una decisión (quizás observando la forma de la moneda) sobre qué distribución previa utilizar. La incorporación de esa información subjetiva podría ser importante para obtener una estimación precisa de la probabilidad.
En general, la complejidad de un modelo implica un equilibrio entre la simplicidad y la precisión del modelo. La navaja de Occam es un principio particularmente relevante para la modelización, cuya idea esencial es que entre los modelos con un poder predictivo aproximadamente igual, el más simple es el más deseable. Si bien la complejidad añadida suele mejorar el realismo de un modelo, puede dificultar su comprensión y análisis, y también puede plantear problemas computacionales, incluida la inestabilidad numérica . Thomas Kuhn sostiene que a medida que avanza la ciencia, las explicaciones tienden a volverse más complejas antes de que un cambio de paradigma ofrezca una simplificación radical. [9]
Por ejemplo, al modelar el vuelo de un avión, podríamos incorporar cada parte mecánica del avión en nuestro modelo y así obtener un modelo casi de caja blanca del sistema. Sin embargo, el costo computacional de agregar una cantidad tan grande de detalles inhibiría efectivamente el uso de dicho modelo. Además, la incertidumbre aumentaría debido a un sistema demasiado complejo, porque cada parte separada induce cierta cantidad de variación en el modelo. Por lo tanto, suele ser apropiado hacer algunas aproximaciones para reducir el modelo a un tamaño razonable. Los ingenieros a menudo pueden aceptar algunas aproximaciones para obtener un modelo más sólido y simple. Por ejemplo, la mecánica clásica de Newton es un modelo aproximado del mundo real. Aun así, el modelo de Newton es bastante suficiente para la mayoría de las situaciones de la vida cotidiana, es decir, siempre que las velocidades de las partículas sean muy inferiores a la velocidad de la luz y estudiemos solo macropartículas. Tenga en cuenta que una mayor precisión no significa necesariamente un mejor modelo. Los modelos estadísticos son propensos al sobreajuste , lo que significa que un modelo se ajusta demasiado a los datos y ha perdido su capacidad de generalizarse a nuevos eventos que no se habían observado antes.
Cualquier modelo que no sea de caja blanca pura contiene algunos parámetros que se pueden utilizar para ajustar el modelo al sistema que se pretende describir. Si el modelado se realiza mediante una red neuronal artificial u otro aprendizaje automático , la optimización de los parámetros se denomina entrenamiento , mientras que la optimización de los hiperparámetros del modelo se denomina ajuste y, a menudo, utiliza validación cruzada . [10] En el modelado más convencional a través de funciones matemáticas dadas explícitamente, los parámetros a menudo se determinan mediante el ajuste de curvas . [ cita requerida ]
Una parte crucial del proceso de modelado es la evaluación de si un modelo matemático determinado describe un sistema con precisión. Esta pregunta puede ser difícil de responder, ya que implica varios tipos de evaluación diferentes.
Por lo general, la parte más sencilla de la evaluación de un modelo es comprobar si un modelo predice mediciones experimentales u otros datos empíricos no utilizados en el desarrollo del modelo. En los modelos con parámetros, un enfoque común es dividir los datos en dos subconjuntos disjuntos: datos de entrenamiento y datos de verificación. Los datos de entrenamiento se utilizan para estimar los parámetros del modelo. Un modelo preciso coincidirá estrechamente con los datos de verificación, incluso aunque estos datos no se hayan utilizado para establecer los parámetros del modelo. Esta práctica se conoce como validación cruzada en estadística.
Definir una métrica para medir las distancias entre los datos observados y los previstos es una herramienta útil para evaluar el ajuste del modelo. En estadística, teoría de decisiones y algunos modelos económicos , una función de pérdida desempeña un papel similar. Si bien es bastante sencillo probar la idoneidad de los parámetros, puede ser más difícil probar la validez de la forma matemática general de un modelo. En general, se han desarrollado más herramientas matemáticas para probar el ajuste de los modelos estadísticos que de los modelos que involucran ecuaciones diferenciales . Las herramientas de las estadísticas no paramétricas a veces se pueden utilizar para evaluar qué tan bien se ajustan los datos a una distribución conocida o para elaborar un modelo general que solo haga suposiciones mínimas sobre la forma matemática del modelo.
Evaluar el alcance de un modelo, es decir, determinar a qué situaciones es aplicable el modelo, puede ser menos sencillo. Si el modelo se construyó a partir de un conjunto de datos, se debe determinar para qué sistemas o situaciones los datos conocidos son un conjunto de datos "típico". La cuestión de si el modelo describe bien las propiedades del sistema entre puntos de datos se denomina interpolación , y la misma cuestión para eventos o puntos de datos fuera de los datos observados se denomina extrapolación .
Como ejemplo de las limitaciones típicas del alcance de un modelo, al evaluar la mecánica clásica newtoniana , podemos señalar que Newton realizó sus mediciones sin equipo avanzado, por lo que no pudo medir propiedades de partículas que viajaban a velocidades cercanas a la de la luz. Asimismo, no midió los movimientos de moléculas y otras partículas pequeñas, sino solo de macropartículas. No es sorprendente entonces que su modelo no se extrapole bien a estos dominios, a pesar de que su modelo es bastante suficiente para la física de la vida ordinaria.
Muchos tipos de modelado implican implícitamente afirmaciones sobre causalidad . Esto suele ser cierto (pero no siempre) en el caso de los modelos que implican ecuaciones diferenciales. Como el propósito del modelado es aumentar nuestra comprensión del mundo, la validez de un modelo no solo se basa en su ajuste a las observaciones empíricas, sino también en su capacidad de extrapolarse a situaciones o datos más allá de los descritos originalmente en el modelo. Se puede pensar en esto como la diferenciación entre predicciones cualitativas y cuantitativas. También se puede argumentar que un modelo es inútil a menos que proporcione alguna información que vaya más allá de lo que ya se sabe a partir de la investigación directa del fenómeno que se está estudiando.
Un ejemplo de tales críticas es el argumento de que los modelos matemáticos de la teoría de la búsqueda óptima de alimento no ofrecen una perspectiva que vaya más allá de las conclusiones de sentido común de la evolución y otros principios básicos de la ecología. [11] También debe notarse que si bien el modelado matemático utiliza conceptos y lenguaje matemáticos, no es en sí una rama de las matemáticas y no necesariamente se ajusta a ninguna lógica matemática , sino que es típicamente una rama de alguna ciencia u otra materia técnica, con conceptos y estándares de argumentación correspondientes. [2]
Los modelos matemáticos son de gran importancia en las ciencias naturales, particularmente en la física . Las teorías físicas se expresan casi invariablemente mediante modelos matemáticos. A lo largo de la historia, se han desarrollado modelos matemáticos cada vez más precisos. Las leyes de Newton describen con precisión muchos fenómenos cotidianos, pero en ciertos límites se deben utilizar la teoría de la relatividad y la mecánica cuántica .
Es común utilizar modelos idealizados en física para simplificar las cosas. Cuerdas sin masa, partículas puntuales, gases ideales y la partícula en una caja se encuentran entre los muchos modelos simplificados utilizados en física. Las leyes de la física se representan con ecuaciones simples como las leyes de Newton, las ecuaciones de Maxwell y la ecuación de Schrödinger . Estas leyes son una base para hacer modelos matemáticos de situaciones reales. Muchas situaciones reales son muy complejas y por lo tanto modeladas de manera aproximada en una computadora, se hace un modelo que es computacionalmente factible de calcular a partir de las leyes básicas o a partir de modelos aproximados hechos a partir de las leyes básicas. Por ejemplo, las moléculas se pueden modelar mediante modelos de orbitales moleculares que son soluciones aproximadas a la ecuación de Schrödinger. En ingeniería , los modelos de física a menudo se hacen mediante métodos matemáticos como el análisis de elementos finitos .
Los distintos modelos matemáticos utilizan distintas geometrías que no son necesariamente descripciones precisas de la geometría del universo. La geometría euclidiana se utiliza mucho en la física clásica, mientras que la relatividad especial y la relatividad general son ejemplos de teorías que utilizan geometrías que no son euclidianas.
A menudo, cuando los ingenieros analizan un sistema para controlarlo u optimizarlo, utilizan un modelo matemático. En el análisis, los ingenieros pueden construir un modelo descriptivo del sistema como hipótesis de cómo podría funcionar el sistema o intentar estimar cómo un evento imprevisible podría afectarlo. De manera similar, en el control de un sistema, los ingenieros pueden probar diferentes enfoques de control en simulaciones .
Un modelo matemático suele describir un sistema mediante un conjunto de variables y un conjunto de ecuaciones que establecen relaciones entre las variables. Las variables pueden ser de muchos tipos: números reales o enteros , valores booleanos o cadenas , por ejemplo. Las variables representan algunas propiedades del sistema, por ejemplo, las salidas medidas del sistema, a menudo en forma de señales , datos de temporización , contadores y ocurrencia de eventos. El modelo real es el conjunto de funciones que describen las relaciones entre las diferentes variables.
Referencia general
Filosófico