stringtranslate.com

Quimiometría

La quimiometría es la ciencia que extrae información de los sistemas químicos por medios basados ​​en datos. La quimiometría es inherentemente interdisciplinaria y utiliza métodos que se emplean con frecuencia en disciplinas fundamentales de análisis de datos, como la estadística multivariante , las matemáticas aplicadas y la informática , para abordar problemas de química , bioquímica , medicina , biología e ingeniería química . De esta manera, refleja otros campos interdisciplinarios, como la psicometría y la econometría .

Fondo

La quimiometría se aplica para resolver problemas descriptivos y predictivos en las ciencias naturales experimentales, especialmente en la química. En las aplicaciones descriptivas, las propiedades de los sistemas químicos se modelan con la intención de aprender las relaciones y la estructura subyacentes del sistema (es decir, la comprensión e identificación del modelo). En las aplicaciones predictivas, las propiedades de los sistemas químicos se modelan con la intención de predecir nuevas propiedades o comportamientos de interés. En ambos casos, los conjuntos de datos pueden ser pequeños, pero a menudo son grandes y complejos, e involucran de cientos a miles de variables y de cientos a miles de casos u observaciones.

Las técnicas quimiométricas se utilizan con especial intensidad en la química analítica y la metabolómica , y el desarrollo de métodos de análisis quimiométricos mejorados también continúa impulsando el estado del arte en la instrumentación y metodología analíticas. Es una disciplina impulsada por la aplicación y, por lo tanto, si bien las metodologías quimiométricas estándar se utilizan ampliamente en la industria, los grupos académicos se dedican al desarrollo continuo de la teoría, el método y el desarrollo de aplicaciones quimiométricas.

Orígenes

Aunque se podría argumentar que incluso los primeros experimentos analíticos en química implicaban una forma de quimiometría, se reconoce generalmente que el campo surgió en la década de 1970, cuando las computadoras se explotaron cada vez más para la investigación científica. El término "quimiometría" fue acuñado por Svante Wold en una solicitud de subvención de 1971, [1] y la Sociedad Internacional de Quimiometría fue formada poco después por Svante Wold y Bruce Kowalski , dos pioneros en el campo. Wold era profesor de química orgánica en la Universidad de Umeå , Suecia, y Kowalski era profesor de química analítica en la Universidad de Washington, Seattle. [2]

Muchas de las primeras aplicaciones involucraban una clasificación multivariable, a las que siguieron numerosas aplicaciones predictivas cuantitativas y hacia fines de la década de 1970 y principios de la de 1980 se estaban realizando una amplia variedad de análisis químicos basados ​​en datos y computadoras.

El análisis multivariado fue una faceta crítica incluso en las primeras aplicaciones de la quimiometría. Los datos de espectroscopia infrarroja y UV/visible a menudo se cuentan en miles de mediciones por muestra. Los experimentos de espectrometría de masas, resonancia magnética nuclear, emisión/absorción atómica y cromatografía también son, por naturaleza, altamente multivariados. Se encontró que la estructura de estos datos era propicia para el uso de técnicas como el análisis de componentes principales (PCA), mínimos cuadrados parciales (PLS), mínimos cuadrados parciales ortogonales (OPLS) y mínimos cuadrados parciales ortogonales bidireccionales (O2PLS). [3] Esto se debe principalmente a que, si bien los conjuntos de datos pueden ser altamente multivariados, existe una estructura de bajo rango fuerte y a menudo lineal. Con el tiempo, se ha demostrado que el PCA y el PLS son muy eficaces para modelar empíricamente la estructura de bajo rango más interesante desde el punto de vista químico, explotando las interrelaciones o "variables latentes" en los datos y proporcionando sistemas de coordenadas compactos alternativos para un análisis numérico adicional, como la regresión , la agrupación y el reconocimiento de patrones . Los mínimos cuadrados parciales, en particular, se utilizaron ampliamente en aplicaciones quimiométricas durante muchos años antes de que comenzaran a utilizarse regularmente en otros campos.

Durante la década de 1980 aparecieron tres revistas especializadas en este campo: Journal of Chemometrics , Chemometrics and Intelligent Laboratory Systems y Journal of Chemical Information and Modeling . Estas revistas siguen cubriendo tanto la investigación fundamental como la metodológica en quimiometría. En la actualidad, la mayoría de las aplicaciones rutinarias de los métodos quimiométricos existentes se publican comúnmente en revistas orientadas a aplicaciones (por ejemplo, Applied Spectroscopy , Analytical Chemistry , Analytica Chimica Acta , Talanta ). Varios libros/monografías importantes sobre quimiometría también se publicaron por primera vez en la década de 1980, incluida la primera edición de Factor Analysis in Chemistry de Malinowski , [4] Chemometrics de Sharaf, Illman y Kowalski , [5] Chemometrics: a textbook de Massart et al. , [6] y Multivariate Calibration de Martens y Naes . [7]

Algunas grandes áreas de aplicación quimiométrica han pasado a representar nuevos dominios, como el modelado molecular y QSAR , la quimioinformática , los campos "ómicos" de la genómica , la proteómica , la metabonómica y la metabolómica , el modelado de procesos y la tecnología analítica de procesos .

Geladi y Esbensen publicaron un relato de la historia temprana de la quimiometría en forma de una serie de entrevistas. [8] [9]

Técnicas

Calibración multivariante

Muchos problemas químicos y aplicaciones de la quimiometría implican calibración . El objetivo es desarrollar modelos que puedan usarse para predecir propiedades de interés basadas en propiedades medidas del sistema químico, como presión, flujo, temperatura, infrarrojo , Raman , [10] espectros de RMN y espectros de masas . Los ejemplos incluyen el desarrollo de modelos multivariados que relacionan 1) la respuesta espectral de múltiples longitudes de onda con la concentración de analito, 2) descriptores moleculares con la actividad biológica, 3) condiciones/estados de proceso multivariados con los atributos del producto final. El proceso requiere un conjunto de datos de calibración o entrenamiento, que incluye valores de referencia para las propiedades de interés para la predicción y los atributos medidos que se cree que corresponden a estas propiedades. Para el caso 1), por ejemplo, se pueden ensamblar datos de varias muestras, incluidas las concentraciones de un analito de interés para cada muestra (la referencia) y el espectro infrarrojo correspondiente de esa muestra. Luego se utilizan técnicas de calibración multivariada, como la regresión de mínimos cuadrados parciales o la regresión de componentes principales (y casi innumerables otros métodos), para construir un modelo matemático que relaciona la respuesta multivariada (espectro) con la concentración del analito de interés, y dicho modelo se puede utilizar para predecir de manera eficiente las concentraciones de nuevas muestras.

Las técnicas de calibración multivariante suelen clasificarse ampliamente como métodos clásicos o inversos. [7] [11] La principal diferencia entre estos enfoques es que en la calibración clásica los modelos se resuelven de manera que sean óptimos para describir las respuestas analíticas medidas (por ejemplo, espectros) y, por lo tanto, pueden considerarse descriptores óptimos, mientras que en los métodos inversos los modelos se resuelven para que sean óptimos para predecir las propiedades de interés (por ejemplo, concentraciones, predictores óptimos). [12] Los métodos inversos generalmente requieren menos conocimiento físico del sistema químico y, al menos en teoría, proporcionan predicciones superiores en el sentido del error cuadrático medio, [13] [14] [15] y, por lo tanto, los enfoques inversos tienden a aplicarse con mayor frecuencia en la calibración multivariante contemporánea.

Las principales ventajas del uso de técnicas de calibración multivariante es que se pueden utilizar mediciones analíticas rápidas, económicas o no destructivas (como la espectroscopia óptica) para estimar propiedades de la muestra que de otro modo requerirían pruebas que consumen mucho tiempo, son costosas o destructivas (como la LC-MS ). Igualmente importante es que la calibración multivariante permite un análisis cuantitativo preciso en presencia de una fuerte interferencia de otros analitos. La selectividad del método analítico se proporciona tanto por la calibración matemática como por las modalidades de medición analítica. Por ejemplo, los espectros de infrarrojo cercano, que son extremadamente amplios y no selectivos en comparación con otras técnicas analíticas (como los espectros infrarrojos o Raman), a menudo se pueden utilizar con éxito junto con métodos de calibración multivariante cuidadosamente desarrollados para predecir concentraciones de analitos en matrices muy complejas.

Clasificación, reconocimiento de patrones, agrupamiento

Las técnicas de clasificación multivariante supervisada están estrechamente relacionadas con las técnicas de calibración multivariante, ya que se utiliza un conjunto de calibración o entrenamiento para desarrollar un modelo matemático capaz de clasificar muestras futuras. Las técnicas empleadas en quimiometría son similares a las que se emplean en otros campos: análisis discriminante multivariante, regresión logística, redes neuronales, árboles de regresión/clasificación. El uso de técnicas de reducción de rangos junto con estos métodos de clasificación convencionales es rutinario en quimiometría, por ejemplo, el análisis discriminante de componentes principales o puntuaciones de mínimos cuadrados parciales .

Una familia de técnicas, denominadas clasificadores de una clase o de modelado de clases , pueden construir modelos para una clase individual de interés. [16] Dichos métodos son particularmente útiles en el caso del control de calidad y la verificación de autenticidad de los productos.

La clasificación no supervisada (también denominada análisis de conglomerados ) también se utiliza comúnmente para descubrir patrones en conjuntos de datos complejos y, nuevamente, muchas de las técnicas centrales utilizadas en quimiometría son comunes a otros campos, como el aprendizaje automático y el aprendizaje estadístico.

Resolución de curvas multivariadas

En el lenguaje quimiométrico, la resolución de curvas multivariadas busca deconstruir conjuntos de datos con información de referencia y conocimiento del sistema limitados o ausentes. Algunos de los primeros trabajos sobre estas técnicas fueron realizados por Lawton y Sylvestre a principios de la década de 1970. [17] [18] Estos enfoques también se denominan análisis de mezcla de automodelado, separación ciega de fuente/señal y desmezcla espectral. Por ejemplo, a partir de un conjunto de datos que comprende espectros de fluorescencia de una serie de muestras que contienen múltiples fluoróforos, se pueden utilizar métodos de resolución de curvas multivariadas para extraer los espectros de fluorescencia de los fluoróforos individuales, junto con sus concentraciones relativas en cada una de las muestras, esencialmente desmezclando el espectro de fluorescencia total en las contribuciones de los componentes individuales. El problema suele estar mal determinado debido a la ambigüedad rotacional (muchas soluciones posibles pueden representar de manera equivalente los datos medidos), por lo que es común la aplicación de restricciones adicionales, como la no negatividad, la unimodalidad o las interrelaciones conocidas entre los componentes individuales (por ejemplo, restricciones cinéticas o de balance de masa). [19] [20]

Otras técnicas

El diseño experimental sigue siendo un área central de estudio en quimiometría y varias monografías están dedicadas específicamente al diseño experimental en aplicaciones químicas. [21] [22] Los principios sólidos del diseño experimental han sido ampliamente adoptados dentro de la comunidad de quimiometría, aunque muchos experimentos complejos son puramente observacionales y puede haber poco control sobre las propiedades e interrelaciones de las muestras y las propiedades de las muestras.

El procesamiento de señales también es un componente crítico de casi todas las aplicaciones quimiométricas, en particular el uso de pretratamientos de señales para acondicionar los datos antes de la calibración o clasificación. Las técnicas empleadas comúnmente en quimiometría suelen estar estrechamente relacionadas con las que se utilizan en campos relacionados. [23] El preprocesamiento de señales puede afectar la forma en que se pueden interpretar los resultados del procesamiento final de los datos. [24]

Caracterización del desempeño y cifras de mérito Como la mayoría de las áreas de las ciencias físicas, la quimiometría está orientada cuantitativamente, por lo que se pone un énfasis considerable en la caracterización del desempeño, la selección de modelos, la verificación y validación, y las cifras de mérito . El desempeño de los modelos cuantitativos generalmente se especifica por el error cuadrático medio en la predicción del atributo de interés, y el desempeño de los clasificadores como pares de tasa de verdaderos positivos/tasa de falsos positivos (o una curva ROC completa). Un informe reciente de Olivieri et al. proporciona una descripción general completa de las cifras de mérito y la estimación de la incertidumbre en la calibración multivariada, incluidas las definiciones multivariadas de selectividad, sensibilidad, SNR y estimación del intervalo de predicción. [25] La selección del modelo quimiométrico generalmente implica el uso de herramientas como el remuestreo (incluido el bootstrap, la permutación y la validación cruzada).

El control estadístico de procesos multivariados (MSPC) , el modelado y la optimización representan una cantidad sustancial del desarrollo histórico de la quimiometría. [26] [27] [28] La espectroscopia se ha utilizado con éxito para el monitoreo en línea de procesos de fabricación durante 30 a 40 años, y estos datos de proceso son altamente susceptibles al modelado quimiométrico. Específicamente en términos de MSPC, el modelado multidireccional de procesos por lotes y continuos es cada vez más común en la industria y sigue siendo un área activa de investigación en quimiometría e ingeniería química. La química analítica de procesos como se denominó originalmente, [29] o el término más nuevo tecnología analítica de procesos continúa basándose en gran medida en métodos quimiométricos y MSPC.

Los métodos multidireccionales se utilizan ampliamente en aplicaciones quimiométricas. [30] [31] Se trata de extensiones de orden superior de métodos más utilizados. Por ejemplo, mientras que el análisis de una tabla (matriz o matriz de segundo orden) de datos es rutinario en varios campos, los métodos multidireccionales se aplican a conjuntos de datos que involucran órdenes 3, 4 o superiores. Los datos de este tipo son muy comunes en química, por ejemplo, un sistema de cromatografía líquida/espectrometría de masas (LC-MS) genera una gran matriz de datos (tiempo de elución versus m/z) para cada muestra analizada. Los datos de múltiples muestras comprenden así un cubo de datos . El modelado de procesos por lotes implica conjuntos de datos que tienen tiempo vs. variables de proceso vs. número de lote. Los métodos matemáticos multidireccionales aplicados a este tipo de problemas incluyen PARAFAC , descomposición trilineal y PLS y PCA multidireccionales.

Referencias

  1. ^ Como se relata en Wold, S. (1995). "Quimiometría: ¿qué queremos decir con ella y qué queremos de ella?". Quimiometría y sistemas de laboratorio inteligentes . 30 (1): 109–115. doi :10.1016/0169-7439(95)00042-9.
  2. ^ Kowalski, Bruce R. (1975). "Quimiometría: puntos de vista y proposiciones". J. Chem. Inf. Comput. Sci . 15 (4): 201–203. doi :10.1021/ci60004a002.
  3. ^ Trygg, J.; Wold, S. (2003). "O2-PLS, un método de regresión de variable latente (LVR) de dos bloques (X–Y) con un filtro OSC integral". Journal of Chemometrics . 17 : 53–64. doi :10.1002/cem.775. S2CID  123071521.
  4. ^ Malinowski, ER; Howery, DG (1980). Análisis factorial en química . Nueva York: Wiley. ISBN 978-0471058816.(Otras ediciones siguieron en 1989, 1991 y 2002).
  5. ^ Sharaf, MA; Ilman, DL; Kowalski, BR, eds. (1986). Quimiometría . Nueva York: Wiley. ISBN 978-0471831068.
  6. ^ Massart, DL; Vandeginste, BGM; Deming, SM; Michotte, Y.; Kaufman, L. (1988). Quimiometría: un libro de texto . Ámsterdam: Elsevier. ISBN 978-0444426604.
  7. ^ ab Martens, H.; Naes, T. (1989). Calibración multivariante . Nueva York: Wiley. ISBN 978-0471909798.
  8. ^ Geladi, P.; Esbensen, K. (2005). "El comienzo y la historia temprana de la quimiometría: entrevistas seleccionadas. Parte 1". J. Chemometrics . 4 (5): 337–354. doi :10.1002/cem.1180040503. S2CID  120490459.
  9. ^ Esbensen, K.; Geladi, P. (2005). "El comienzo y la historia temprana de la quimiometría: entrevistas seleccionadas. Parte 2". J. Chemometrics . 4 (6): 389–412. doi :10.1002/cem.1180040604. S2CID  221546473.
  10. ^ Barton, Bastian; Thomson, James; Lozano Diz, Enrique; Portela, Raquel (septiembre de 2022). "Quimiometría para la armonización de la espectroscopia Raman". Applied Spectroscopy . 76 (9): 1021–1041. Bibcode :2022ApSpe..76.1021B. doi :10.1177/00037028221094070. ISSN  0003-7028. PMID  35622984. S2CID  249129065.
  11. ^ Franke, J. (2002). "Métodos de mínimos cuadrados inversos y de mínimos cuadrados clásicos para espectroscopia vibracional cuantitativa". En Chalmers, John M (ed.). Manual de espectroscopia vibracional . Nueva York: Wiley. doi :10.1002/0470027320.s4603. ISBN . 978-0471988472.
  12. ^ Brown, CD (2004). "Discordancia entre la teoría de la señal neta del analito y la calibración multivariante práctica". Química analítica . 76 (15): 4364–4373. doi :10.1021/ac049953w. PMID  15283574.
  13. ^ Krutchkoff, RG (1969). "Métodos de calibración de regresión clásica e inversa en extrapolación". Technometrics . 11 (3): 11–15. doi :10.1080/00401706.1969.10490714.
  14. ^ Hunter, WG (1984). "Estadística y química, y el problema de calibración lineal". En Kowalski, BR (ed.). Quimiometría: matemáticas y estadística en química . Boston: Riedel. ISBN 978-9027718464.
  15. ^ Tellinghuisen, J. (2000). "Calibración inversa frente a calibración clásica para conjuntos de datos pequeños". Fresenius' J. Anal. Chem . 368 (6): 585–588. doi :10.1007/s002160000556. PMID  11228707. S2CID  21166415.
  16. ^ Oliveri, Paolo (2017). "Modelado de clases en química analítica de alimentos: cuestiones de desarrollo, muestreo, optimización y validación: un tutorial". Analytica Chimica Acta . 982 : 9–19. Bibcode :2017AcAC..982....9O. doi :10.1016/j.aca.2017.05.013. hdl : 11567/881059 . PMID  28734370. S2CID  10119515.
  17. ^ Lawton, WH; Sylvestre, EA (1971). "Resolución de curvas de automodelado". Technometrics . 13 (3): 617–633. doi :10.1080/00401706.1971.10488823.
  18. ^ Sylvestre, EA; Lawton, WH; Maggio, MS (1974). "Resolución de curvas utilizando una reacción química postulada". Technometrics . 16 (3): 353–368. doi :10.1080/00401706.1974.10489204.
  19. ^ de Juan, A.; Tauler, R. (2003). "Quimiometría aplicada para desentrañar procesos y mezclas multicomponentes. Revisando las últimas tendencias en resolución multivariante". Analytica Chimica Acta . 500 (1–2): 195–210. Bibcode :2003AcAC..500..195D. doi :10.1016/S0003-2670(03)00724-4.
  20. ^ de Juan, A.; Tauler, R. (2006). "Resolución de curvas multivariadas (MCR) desde 2000: avances en conceptos y aplicaciones". Critical Reviews in Analytical Chemistry . 36 (3–4): 163–176. doi :10.1080/10408340600970005. S2CID  95309963.
  21. ^ Deming, SN; Morgan, SL (1987). Diseño experimental: un enfoque quimiométrico . Elsevier. ISBN 978-0444427342.
  22. ^ Bruns, RE; Scarminio, IS; de Barros Neto, B. (2006). Diseño estadístico – quimiometría . Ámsterdam: Elsevier. ISBN 978-0444521811.
  23. ^ Wentzell, PD; Brown, CD (2000). "Procesamiento de señales en química analítica". En Meyers, RA (ed.). Enciclopedia de química analítica . Wiley. págs. 9764–9800.
  24. ^ Oliveri, Paolo; Malegori, Cristina; Simonetti, Remo; Casale, Monica (2019). "El impacto del preprocesamiento de señales en la interpretación final de los resultados analíticos: un tutorial". Analytica Chimica Acta . 1058 : 9–17. Bibcode :2019AcAC.1058....9O. doi :10.1016/j.aca.2018.10.055. PMID  30851858. S2CID  73727614.
  25. ^ Olivieri, AC; Faber, NM; Ferre, J.; Boque, R.; Kalivas, JH; Mark, H. (2006). "Directrices para la calibración en química analítica Parte 3. Estimación de incertidumbre y cifras de mérito para la calibración multivariante". Química pura y aplicada . 78 (3): 633–650. doi : 10.1351/pac200678030633 . S2CID  50546210.
  26. ^ Illman, DL; Callis, JB; Kowalski, BR (1986). "Química analítica de procesos: un nuevo paradigma para los químicos analíticos". American Laboratory . 18 : 8–10.
  27. ^ MacGregor, JF; Kourti, T. (1995). "Control estadístico de procesos multivariados". Práctica de ingeniería de control . 3 (3): 403–414. doi :10.1016/0967-0661(95)00014-L.
  28. ^ Martin, EB; Morris, AJ (1996). "Una visión general del control estadístico de procesos multivariante en la monitorización del rendimiento de procesos continuos y por lotes". Transactions of the Institute of Measurement & Control . 18 (1): 51–60. Bibcode :1996TIMC...18...51M. doi :10.1177/014233129601800107. S2CID  120516715.
  29. ^ Hirschfeld, T.; Callis, JB; Kowalski, BR (1984). "Detección química en el análisis de procesos". Science . 226 (4672): 312–318. Bibcode :1984Sci...226..312H. doi :10.1126/science.226.4672.312. PMID  17749872. S2CID  38093353.
  30. ^ Smilde, AK; Bro, R.; Geladi, P. (2004). Análisis multidireccional con aplicaciones en las ciencias químicas . Wiley.
  31. ^ Bro, R.; Workman, JJ; Mobley, PR; Kowalski, BR (1997). "Descripción general de la quimiometría aplicada a la espectroscopia: 1985-95, Parte 3: Análisis multidireccional". Applied Spectroscopy Reviews . 32 (3): 237-261. Bibcode :1997ApSRv..32..237B. doi :10.1080/05704929708003315.

Lectura adicional

Enlaces externos