En matemáticas , la resultante de dos polinomios es una expresión polinómica de sus coeficientes que es igual a cero si y solo si los polinomios tienen una raíz común (posiblemente en una extensión de campo ), o, equivalentemente, un factor común (sobre su campo de coeficientes). En algunos textos más antiguos, la resultante también se denomina eliminante . [1]
La resultante se utiliza ampliamente en teoría de números , ya sea directamente o a través del discriminante , que es esencialmente la resultante de un polinomio y su derivada . La resultante de dos polinomios con coeficientes racionales o polinómicos se puede calcular de manera eficiente en una computadora. Es una herramienta básica del álgebra computacional y es una función incorporada en la mayoría de los sistemas de álgebra computacional . Se utiliza, entre otros, para la descomposición algebraica cilíndrica , la integración de funciones racionales y el dibujo de curvas definidas por una ecuación polinómica bivariada .
La resultante de n polinomios homogéneos en n variables (también llamada resultante multivariante , o resultante de Macaulay para distinguirla de la resultante usual) es una generalización, introducida por Macaulay , de la resultante usual. [2] Es, con bases de Gröbner , una de las principales herramientas de la teoría de la eliminación .
La resultante de dos polinomios univariados A y B se denota comúnmente como
En muchas aplicaciones de la resultante, los polinomios dependen de varias indeterminaciones y pueden considerarse como polinomios univariados en una de sus indeterminaciones, con polinomios en las otras indeterminaciones como coeficientes. En este caso, la indeterminación que se selecciona para definir y calcular la resultante se indica como un subíndice: o
Los grados de los polinomios se utilizan en la definición de la resultante. Sin embargo, un polinomio de grado d también puede considerarse como un polinomio de grado superior en el que los coeficientes principales son cero. Si se utiliza un grado superior para la resultante, normalmente se indica como un subíndice o un superíndice, como o
La resultante de dos polinomios univariados sobre un cuerpo o sobre un anillo conmutativo se define comúnmente como el determinante de su matriz de Sylvester . Más precisamente, sean y polinomios no nulos de grados d y e respectivamente. Denotemos por el espacio vectorial (o módulo libre si los coeficientes pertenecen a un anillo conmutativo) de dimensión i cuyos elementos son los polinomios de grado estrictamente menor que i . La función tal que es una función lineal entre dos espacios de la misma dimensión. Sobre la base de las potencias de x (enumeradas en orden descendente), esta función se representa por una matriz cuadrada de dimensión d + e , que se llama matriz de Sylvester de A y B (para muchos autores y en el artículo Matriz de Sylvester , la matriz de Sylvester se define como la transpuesta de esta matriz; esta convención no se utiliza aquí, ya que rompe la convención habitual para escribir la matriz de una función lineal).
La resultante de A y B es entonces el determinante que tiene e columnas de a i y d columnas de b j (el hecho de que la primera columna de a y la primera columna de b tengan la misma longitud, es decir d = e , se incluye aquí sólo para simplificar la representación del determinante). Por ejemplo, tomando d = 3 y e = 2 obtenemos
Si los coeficientes de los polinomios pertenecen a un dominio integral , entonces donde y son respectivamente las raíces, contadas con sus multiplicidades, de A y B en cualquier cuerpo algebraicamente cerrado que contenga el dominio integral. Esta es una consecuencia directa de las propiedades caracterizantes de la resultante que aparecen a continuación. En el caso común de coeficientes enteros, el cuerpo algebraicamente cerrado se elige generalmente como el cuerpo de números complejos .
En esta sección y sus subsecciones, A y B son dos polinomios en x de grados respectivos d y e , y su resultante se denota
Las siguientes propiedades se cumplen para la resultante de dos polinomios con coeficientes en un anillo conmutativo R . Si R es un cuerpo o, más generalmente, un dominio integral , la resultante es la única función de los coeficientes de dos polinomios que satisface estas propiedades.
Sean A y B dos polinomios de grados respectivos d y e con coeficientes en un anillo conmutativo R , y un homomorfismo de anillo de R en otro anillo conmutativo S . Aplicando a los coeficientes de un polinomio se extiende a un homomorfismo de anillos de polinomios , que también se denota con esta notación, tenemos:
Estas propiedades se deducen fácilmente de la definición de la resultante como determinante. Se utilizan principalmente en dos situaciones. Para calcular una resultante de polinomios con coeficientes enteros, generalmente es más rápido calcularla módulo varios primos y recuperar la resultante deseada con el teorema del resto chino . Cuando R es un anillo de polinomios en otros indeterminados, y S es el anillo obtenido al especializar en valores numéricos algunos o todos los indeterminados de R , estas propiedades pueden reformularse como si los grados se conservaran por la especialización, la resultante de la especialización de dos polinomios es la especialización de la resultante . Esta propiedad es fundamental, por ejemplo, para la descomposición algebraica cilíndrica .
Esto significa que la propiedad de la resultante de ser cero es invariante bajo cambios lineales y proyectivos de la variable.
Estas propiedades implican que en el algoritmo de Euclides para polinomios , y todas sus variantes ( secuencias de pseudorestos ), la resultante de dos residuos sucesivos (o pseudorestos) difiere de la resultante de los polinomios iniciales en un factor que es fácil de calcular. A la inversa, esto permite deducir la resultante de los polinomios iniciales a partir del valor del último residuo o pseudoresto. Esta es la idea de partida del algoritmo de la secuencia de pseudorestos subresultantes , que utiliza las fórmulas anteriores para obtener los polinomios subresultantes como pseudorestos, y la resultante como el último pseudoresto distinto de cero (siempre que la resultante no sea cero). Este algoritmo funciona para polinomios sobre los números enteros o, más generalmente, sobre un dominio integral, sin ninguna división que no sean divisiones exactas (es decir, sin involucrar fracciones). Implica operaciones aritméticas, mientras que el cálculo del determinante de la matriz de Sylvester con algoritmos estándar requiere operaciones aritméticas.
En esta sección, consideramos dos polinomios y cuyos coeficientes d + e + 2 son indeterminados distintos . Sea el anillo polinomial sobre los enteros definidos por estos indeterminados. La resultante se suele denominar resultante genérica para los grados d y e . Tiene las siguientes propiedades.
La resultante genérica para los grados d y e es homogénea en varios aspectos. Más precisamente:
Sea el ideal generado por dos polinomios A y B en un anillo polinomial donde es a su vez un anillo polinomial sobre un cuerpo. Si al menos uno de A y B es mónico en x , entonces:
La primera afirmación es una propiedad básica de la resultante. Las demás afirmaciones son corolarios inmediatos de la segunda, que se puede demostrar de la siguiente manera.
Como al menos uno de A y B es mónico, una tupla es un cero de si y solo si existe tal que es un cero común de A y B . Tal cero común es también un cero de todos los elementos de A la inversa, si es un cero común de los elementos de es un cero de la resultante, y existe tal que es un cero común de A y B . Entonces y tienen exactamente los mismos ceros.
En teoría, la resultante podría calcularse utilizando la fórmula que la expresa como un producto de diferencias de raíces. Sin embargo, como las raíces generalmente no pueden calcularse con exactitud, dicho algoritmo sería ineficiente y numéricamente inestable . Como la resultante es una función simétrica de las raíces de cada polinomio, también podría calcularse utilizando el teorema fundamental de polinomios simétricos , pero esto sería altamente ineficiente.
Como la resultante es el determinante de la matriz de Sylvester (y de la matriz de Bézout ), se puede calcular utilizando cualquier algoritmo para calcular determinantes. Esto requiere operaciones aritméticas. Como se conocen algoritmos con una mayor complejidad (ver más abajo), este método no se utiliza en la práctica.
Del § Invariancia bajo cambio de polinomios se desprende que el cálculo de una resultante está estrechamente relacionado con el algoritmo euclidiano para polinomios . Esto demuestra que el cálculo de la resultante de dos polinomios de grados d y e puede realizarse en operaciones aritméticas en el campo de los coeficientes.
Sin embargo, cuando los coeficientes son números enteros, racionales o polinomios, estas operaciones aritméticas implican un número de cálculos MCD de coeficientes que es del mismo orden y hacen que el algoritmo sea ineficiente. Las secuencias de pseudoresiduos subresultantes se introdujeron para resolver este problema y evitar cualquier fracción y cualquier cálculo MCD de coeficientes. Se obtiene un algoritmo más eficiente utilizando el buen comportamiento de la resultante bajo un homomorfismo de anillo en los coeficientes: para calcular una resultante de dos polinomios con coeficientes enteros, se calculan sus resultantes módulo una cantidad suficiente de números primos y luego se reconstruye el resultado con el teorema chino del resto .
El uso de la multiplicación rápida de números enteros y polinomios permite algoritmos para resultantes y máximos comunes divisores que tienen una mejor complejidad temporal , que es del orden de la complejidad de la multiplicación, multiplicada por el logaritmo del tamaño de la entrada ( donde s es un límite superior del número de dígitos de los polinomios de entrada).
Las resultantes se introdujeron para resolver sistemas de ecuaciones polinómicas y constituyen la prueba más antigua de que existen algoritmos para resolver dichos sistemas. Están pensadas principalmente para sistemas de dos ecuaciones con dos incógnitas, pero también permiten resolver sistemas generales.
Considérese el sistema de dos ecuaciones polinómicas donde P y Q son polinomios de grados totales respectivos d y e . Entonces es un polinomio en x , que es genéricamente de grado de (por propiedades de § Homogeneidad). Un valor de x es una raíz de R si y solo si existen en un cuerpo algebraicamente cerrado que contiene los coeficientes, tales que , o y (en este caso, se dice que P y Q tienen una raíz común en el infinito para ).
Por lo tanto, las soluciones del sistema se obtienen calculando las raíces de R y, para cada raíz, calculando la(s) raíz(es) común(es) de y
El teorema de Bézout resulta del valor de , producto de los grados de P y Q . De hecho, después de un cambio lineal de variables, se puede suponer que, para cada raíz x de la resultante, hay exactamente un valor de y tal que ( x , y ) es un cero común de P y Q . Esto demuestra que el número de ceros comunes es como máximo el grado de la resultante, es decir, como máximo el producto de los grados de P y Q . Con algunos tecnicismos, esta demostración puede extenderse para mostrar que, contando multiplicidades y ceros en el infinito, el número de ceros es exactamente el producto de los grados.
A primera vista, parece que las resultantes pueden aplicarse a un sistema general de ecuaciones polinómicas calculando las resultantes de cada par con respecto a para eliminar una incógnita y repitiendo el proceso hasta obtener polinomios univariados. Desafortunadamente, esto introduce muchas soluciones espurias, que son difíciles de eliminar.
Un método, introducido a finales del siglo XIX, funciona de la siguiente manera: se introducen k − 1 indeterminados nuevos y se calcula Este es un polinomio en cuyos coeficientes son polinomios en los que tienen la propiedad de que es un cero común de estos coeficientes polinómicos, si y solo si los polinomios univariados tienen un cero común, posiblemente en el infinito . Este proceso puede iterarse hasta encontrar polinomios univariados.
Para obtener un algoritmo correcto, se deben añadir al método dos complementos. En primer lugar, en cada paso, puede ser necesario un cambio lineal de variable para que los grados de los polinomios en la última variable sean iguales a su grado total. En segundo lugar, si en cualquier paso la resultante es cero, esto significa que los polinomios tienen un factor común y que las soluciones se dividen en dos componentes: uno donde el factor común es cero y el otro que se obtiene factorizando este factor común antes de continuar.
Este algoritmo es muy complicado y tiene una enorme complejidad temporal , por lo que su interés es principalmente histórico.
El discriminante de un polinomio, que es una herramienta fundamental en la teoría de números , es , donde es el coeficiente principal de y su grado.
Si y son números algebraicos tales que , entonces es una raíz de la resultante y es una raíz de , donde es el grado de . Combinado con el hecho de que es una raíz de , esto demuestra que el conjunto de números algebraicos es un cuerpo .
Sea una extensión de campo algebraico generada por un elemento que tiene como polinomio mínimo . Todo elemento de puede escribirse como donde es un polinomio. Entonces es una raíz de y esta resultante es una potencia del polinomio mínimo de
Dadas dos curvas algebraicas planas definidas como los ceros de los polinomios P ( x , y ) y Q ( x , y ) , la resultante permite calcular su intersección. Más precisamente, las raíces de son las coordenadas x de los puntos de intersección y de las asíntotas verticales comunes, y las raíces de son las coordenadas y de los puntos de intersección y de las asíntotas horizontales comunes.
Una curva plana racional puede definirse mediante una ecuación paramétrica donde P , Q y R son polinomios. Una ecuación implícita de la curva viene dada por El grado de esta curva es el grado más alto de P , Q y R , que es igual al grado total de la resultante.
En la integración simbólica , para calcular la antiderivada de una fracción racional , se utiliza la descomposición en fracciones parciales para descomponer la integral en una "parte racional", que es una suma de fracciones racionales cuyas antiprimitivas son fracciones racionales, y una "parte logarítmica" que es una suma de fracciones racionales de la forma donde Q es un polinomio libre de cuadrados y P es un polinomio de grado inferior a Q. La antiderivada de una función de este tipo implica necesariamente logaritmos y, en general, números algebraicos (las raíces de Q ). De hecho, la antiderivada es donde la suma se extiende sobre todas las raíces complejas de Q.
El número de números algebraicos involucrados en esta expresión es generalmente igual al grado de Q , pero ocurre con frecuencia que se puede calcular una expresión con menos números algebraicos. El método Lazard -Rioboo-Trager produce una expresión, donde el número de números algebraicos es mínimo, sin ningún cálculo con números algebraicos.
Sea la factorización libre de cuadrados de la resultante que aparece a la derecha. Trager demostró que la antiderivada es donde las sumas internas recorren las raíces de (si la suma es cero, como siendo la suma vacía ), y es un polinomio de grado i en x . La contribución de Lazard-Rioboo es la prueba de que es la subresultante de grado i de y Por lo tanto, se obtiene de forma gratuita si la resultante se calcula mediante la secuencia de pseudoresiduo subresultante .
Todas las aplicaciones anteriores, y muchas otras, muestran que la resultante es una herramienta fundamental en el álgebra computacional . De hecho, la mayoría de los sistemas de álgebra computacional incluyen una implementación eficiente del cálculo de resultantes.
La resultante también se define para dos polinomios homogéneos en dos indeterminados. Dados dos polinomios homogéneos P ( x , y ) y Q ( x , y ) de grados totales respectivos p y q , su resultante homogénea es el determinante de la matriz sobre la base monomial de la función lineal donde A se extiende sobre los polinomios homogéneos bivariados de grado q − 1 , y B se extiende sobre los polinomios homogéneos de grado p − 1 . En otras palabras, la resultante homogénea de P y Q es la resultante de P ( x , 1) y Q ( x , 1) cuando se consideran como polinomios de grado p y q (su grado en x puede ser menor que su grado total): (Aquí se utiliza la mayúscula de "Res" para distinguir las dos resultantes, aunque no hay una regla estándar para la mayúscula de la abreviatura).
La resultante homogénea tiene esencialmente las mismas propiedades que la resultante habitual, con esencialmente dos diferencias: en lugar de raíces polinómicas, se consideran ceros en la línea proyectiva y el grado de un polinomio no puede cambiar bajo un homomorfismo de anillo . Es decir:
Cualquier propiedad de la resultante usual puede extenderse de manera similar a la resultante homogénea, y la propiedad resultante es muy similar o más simple que la propiedad correspondiente de la resultante usual.
La resultante de Macaulay , llamada así por Francis Sowerby Macaulay , también llamada resultante multivariante o resultante multipolinomial , [3] es una generalización de la resultante homogénea a n polinomios homogéneos en n indeterminados . La resultante de Macaulay es un polinomio en los coeficientes de estos n polinomios homogéneos que se anula si y solo si los polinomios tienen una solución común distinta de cero en un cuerpo algebraicamente cerrado que contiene los coeficientes o, equivalentemente, si las n hipersuperficies definidas por los polinomios tienen un cero común en el espacio proyectivo de dimensión n –1 . La resultante multivariante es, con bases de Gröbner , una de las principales herramientas de la teoría de eliminación efectiva (teoría de eliminación en computadoras).
Al igual que la resultante homogénea, la de Macaulay puede definirse con determinantes y, por lo tanto, se comporta bien bajo homomorfismos de anillo . Sin embargo, no puede definirse con un único determinante. De ello se deduce que es más fácil definirla primero con polinomios genéricos .
Un polinomio homogéneo de grado d en n variables puede tener hasta coeficientes; se dice que es genérico , si estos coeficientes son indeterminados distintos.
Sean n polinomios homogéneos genéricos en n indeterminados, de grados respectivos. En conjunto, implican coeficientes indeterminados. Sea C el anillo polinomial sobre los enteros, en todos estos coeficientes indeterminados. Los polinomios pertenecen, por tanto, a y su resultante (aún por definir) pertenece a C .
El grado de Macaulay es el entero fundamental en la teoría de Macaulay. Para definir la resultante se considera la matriz de Macaulay , que es la matriz sobre la base monomial de la función C - lineal en la que cada una recorre los polinomios homogéneos de grado y el codominio es el C -módulo de los polinomios homogéneos de grado D.
Si n = 2 , la matriz de Macaulay es la matriz de Sylvester, y es una matriz cuadrada , pero esto ya no es cierto para n > 2 . Por lo tanto, en lugar de considerar el determinante, se consideran todos los menores máximos , es decir, los determinantes de las submatrices cuadradas que tienen tantas filas como la matriz de Macaulay. Macaulay demostró que el C -ideal generado por estos menores principales es un ideal principal , que es generado por el máximo común divisor de estos menores. Como se trabaja con polinomios con coeficientes enteros, este máximo común divisor se define hasta su signo. La resultante genérica de Macaulay es el máximo común divisor que se convierte en 1 , cuando, para cada i , se sustituye cero por todos los coeficientes de excepto el coeficiente de por el que se sustituye uno.
A partir de ahora, consideramos que los polinomios homogéneos de grados tienen sus coeficientes en un cuerpo k , es decir que pertenecen a Su resultante se define como el elemento de k obtenido al sustituir en la resultante genérica los coeficientes indeterminados por los coeficientes reales de la
La propiedad principal de la resultante es que es cero si y sólo si tienen un cero común distinto de cero en una extensión algebraicamente cerrada de k .
La parte "sólo si" de este teorema resulta de la última propiedad del párrafo anterior, y es una versión efectiva de Proyectivo Nullstellensatz : Si la resultante es distinta de cero, entonces donde es el grado de Macaulay, y es el ideal homogéneo máximo. Esto implica que no tienen otro cero común que el único cero común, (0, ..., 0) , de
Como el cálculo de una resultante puede reducirse al cálculo de determinantes y máximos comunes divisores de polinomios , existen algoritmos para calcular resultantes en un número finito de pasos.
Sin embargo, la resultante genérica es un polinomio de grado muy alto (exponencial en n ) que depende de un gran número de indeterminados. De ello se deduce que, salvo para n muy pequeños y grados muy pequeños de polinomios de entrada, la resultante genérica es, en la práctica, imposible de calcular, incluso con ordenadores modernos. Además, el número de monomios de la resultante genérica es tan alto que, si fuera computable, el resultado no podría almacenarse en los dispositivos de memoria disponibles, incluso para valores bastante pequeños de n y de los grados de los polinomios de entrada.
Por lo tanto, calcular la resultante sólo tiene sentido para polinomios cuyos coeficientes pertenecen a un campo o son polinomios en pocas indeterminadas sobre un campo.
En el caso de polinomios de entrada con coeficientes en un cuerpo, el valor exacto de la resultante rara vez es importante, solo importa su igualdad (o no) a cero. Como la resultante es cero si y solo si el rango de la matriz de Macaulay es menor que el número de sus filas, esta igualdad a cero se puede probar aplicando la eliminación gaussiana a la matriz de Macaulay. Esto proporciona una complejidad computacional donde d es el grado máximo de los polinomios de entrada.
Otro caso en el que el cálculo de la resultante puede proporcionar información útil es cuando los coeficientes de los polinomios de entrada son polinomios en un pequeño número de indeterminados, a menudo llamados parámetros. En este caso, la resultante, si no es cero, define una hipersuperficie en el espacio de parámetros. Un punto pertenece a esta hipersuperficie, si y sólo si hay valores de los cuales, junto con las coordenadas del punto, son un cero de los polinomios de entrada. En otras palabras, la resultante es el resultado de la " eliminación " de de los polinomios de entrada.
La resultante de Macaulay proporciona un método, llamado " U -resultante" por Macaulay, para resolver sistemas de ecuaciones polinómicas .
Dados n − 1 polinomios homogéneos de grados en n indeterminados sobre un cuerpo k , su U -resultante es la resultante de los n polinomios donde es la forma lineal genérica cuyos coeficientes son nuevos indeterminados La notación o para estos coeficientes genéricos es tradicional, y es el origen del término U -resultante.
La U -resultante es un polinomio homogéneo en Es cero si y solo si los ceros comunes de forman un conjunto algebraico proyectivo de dimensión positiva (es decir, hay infinitos ceros proyectivos sobre una extensión algebraicamente cerrada de k ). Si la U -resultante no es cero, su grado es la cota de Bézout La U -resultante factoriza sobre una extensión algebraicamente cerrada de k en un producto de formas lineales. Si es un factor lineal de este tipo, entonces son las coordenadas homogéneas de un cero común de Además, todo cero común puede obtenerse a partir de uno de estos factores lineales, y la multiplicidad como factor es igual a la multiplicidad de intersección de en este cero. En otras palabras, la U -resultante proporciona una versión completamente explícita del teorema de Bézout .
La resultante U definida por Macaulay requiere que el número de polinomios homogéneos en el sistema de ecuaciones sea , donde es el número de indeterminados. En 1981, Daniel Lazard extendió la noción al caso en el que el número de polinomios puede diferir de , y el cálculo resultante se puede realizar mediante un procedimiento especializado de eliminación gaussiana seguido de un cálculo de determinante simbólico .
Sean polinomios homogéneos de grados sobre un cuerpo k . Sin pérdida de generalidad, se puede suponer que Si se establece para i > k , la cota de Macaulay es
Sean nuevas indeterminadas y definamos En este caso, la matriz de Macaulay se define como la matriz, sobre la base de los monomios en de la función lineal donde, para cada i , recorre el espacio lineal constituido por cero y los polinomios homogéneos de grado .
Reduciendo la matriz de Macaulay por una variante de eliminación gaussiana , se obtiene una matriz cuadrada de formas lineales en El determinante de esta matriz es la U -resultante. Al igual que con la U -resultante original, es cero si y solo si tienen infinitos ceros proyectivos comunes (es decir, si el conjunto algebraico proyectivo definido por tiene infinitos puntos sobre una clausura algebraica de k ). De nuevo, como con la U -resultante original, cuando esta U -resultante no es cero, se factoriza en factores lineales sobre cualquier extensión algebraicamente cerrada de k . Los coeficientes de estos factores lineales son las coordenadas homogéneas de los ceros comunes de y la multiplicidad de un cero común es igual a la multiplicidad del factor lineal correspondiente.
El número de filas de la matriz de Macaulay es menor que donde e ~ 2,7182 es la constante matemática habitual y d es la media aritmética de los grados de la De ello se deduce que todas las soluciones de un sistema de ecuaciones polinómicas con un número finito de ceros proyectivos se pueden determinar en el tiempo Aunque este límite es grande, es casi óptimo en el siguiente sentido: si todos los grados de entrada son iguales, entonces la complejidad temporal del procedimiento es polinómica en el número esperado de soluciones ( teorema de Bézout ). Este cálculo puede ser prácticamente viable cuando n , k y d no son grandes.