En matemáticas , el teorema de los números primos ( PNT ) describe la distribución asintótica de los números primos entre los enteros positivos. Formaliza la idea intuitiva de que los números primos se vuelven menos comunes a medida que crecen, cuantificando con precisión la velocidad a la que esto ocurre. El teorema fue demostrado de forma independiente por Jacques Hadamard [1] y Charles Jean de la Vallée Poussin [2] en 1896 utilizando ideas introducidas por Bernhard Riemann (en particular, la función zeta de Riemann ).
La primera distribución de este tipo encontrada es π ( N ) ~norte/iniciar sesión ( norte ), donde π ( N ) es la función de conteo de primos (el número de primos menores o iguales que N ) y log( N ) es el logaritmo natural de N . Esto significa que para N lo suficientemente grande , la probabilidad de que un entero aleatorio no mayor que N sea primo es muy cercana a 1/log( N ) . En consecuencia, un entero aleatorio con como máximo 2 n dígitos (para n lo suficientemente grande ) tiene aproximadamente la mitad de probabilidades de ser primo que un entero aleatorio con como máximo n dígitos. Por ejemplo, entre los enteros positivos de como máximo 1000 dígitos, aproximadamente uno entre 2300 es primo ( log(10 1000 ) ≈ 2302,6 ), mientras que entre los enteros positivos de como máximo 2000 dígitos, aproximadamente uno entre 4600 es primo ( log(10 2000 ) ≈ 4605,2 ). En otras palabras, la brecha promedio entre números primos consecutivos entre los primeros N enteros es aproximadamente log( N ) . [3]
Sea π ( x ) la función de conteo de primos definida como el número de primos menores o iguales a x , para cualquier número real x . Por ejemplo, π (10) = 4 porque hay cuatro números primos (2, 3, 5 y 7) menores o iguales a 10. El teorema de los números primos establece entonces que x / log x es una buena aproximación a π ( x ) (donde log aquí significa el logaritmo natural), en el sentido de que el límite del cociente de las dos funciones π ( x ) y x / log x cuando x aumenta sin límite es 1:
conocida como ley asintótica de distribución de números primos . Usando notación asintótica, este resultado se puede reformular como
Esta notación (y el teorema) no dice nada sobre el límite de la diferencia de las dos funciones cuando x aumenta sin límite. En cambio, el teorema establece que x /log x se aproxima a π ( x ) en el sentido de que el error relativo de esta aproximación se aproxima a 0 a medida que x aumenta sin límite.
El teorema de los números primos es equivalente a la afirmación de que el n -ésimo número primo p n satisface
la notación asintótica significa, nuevamente, que el error relativo de esta aproximación se acerca a 0 cuando n aumenta sin límite. Por ejemplo, el2 × 10 El decimoséptimo número primo es8 512 677 386 048 191 063 , [4] y (2 × 10 17 )log(2 × 10 17 ) redondea a7 967 418 752 291 744 388 , un error relativo de aproximadamente el 6,4%.
Por otro lado, las siguientes relaciones asintóticas son lógicamente equivalentes: [5]
Como se describe a continuación, el teorema de los números primos también es equivalente a
donde ϑ y ψ son la primera y segunda funciones de Chebyshev respectivamente, y a
¿Dónde está la función de Mertens ?
Basándose en las tablas de Anton Felkel y Jurij Vega , Adrien-Marie Legendre conjeturó en 1797 o 1798 que π ( a ) se aproxima mediante la función a /( A log a + B ) , donde A y B son constantes no especificadas. En la segunda edición de su libro sobre teoría de números (1808) hizo entonces una conjetura más precisa , con A = 1 y B = −1,08366 . Carl Friedrich Gauss consideró la misma pregunta a los 15 o 16 años "en el año 1792 o 1793", según su propio recuerdo en 1849. [7] En 1838, Peter Gustav Lejeune Dirichlet ideó su propia función de aproximación, la integral logarítmica li ( x ) (bajo la forma ligeramente diferente de una serie, que comunicó a Gauss). Tanto la fórmula de Legendre como la de Dirichlet implican la misma equivalencia asintótica conjeturada de π ( x ) y x /log( x ) mencionada anteriormente, aunque resultó que la aproximación de Dirichlet es considerablemente mejor si se consideran las diferencias en lugar de los cocientes.
En dos artículos de 1848 y 1850, el matemático ruso Pafnuty Chebyshev intentó demostrar la ley asintótica de distribución de los números primos. Su trabajo se destaca por el uso de la función zeta ζ ( s ) , para valores reales del argumento " s ", como en las obras de Leonhard Euler , ya en 1737. Los artículos de Chebyshev son anteriores a las célebres memorias de Riemann de 1859, y logró al demostrar una forma ligeramente más débil de la ley asintótica, a saber, que si el límite cuando x llega al infinito de π ( x ) / ( x / log ( x )) existe, entonces es necesariamente igual a uno. [8] Pudo demostrar incondicionalmente que esta relación está limitada por arriba y por abajo por dos constantes dadas explícitamente cerca de 1, para todo x suficientemente grande . [9] Aunque el artículo de Chebyshev no demostró el teorema de los números primos, sus estimaciones para π ( x ) fueron lo suficientemente sólidas como para demostrar el postulado de Bertrand de que existe un número primo entre n y 2 n para cualquier número entero n ≥ 2 .
Un artículo importante sobre la distribución de números primos fueron las memorias de Riemann de 1859 " Sobre el número de primos menores que una magnitud dada ", el único artículo que escribió sobre el tema. Riemann introdujo nuevas ideas en el tema, principalmente que la distribución de números primos está íntimamente relacionada con los ceros de la función zeta de Riemann analíticamente extendida de una variable compleja. En particular, es en este artículo donde se origina la idea de aplicar métodos de análisis complejo al estudio de la función real π ( x ) . Ampliando las ideas de Riemann, Jacques Hadamard [1] y Charles Jean de la Vallée Poussin [2] encontraron de forma independiente dos pruebas de la ley asintótica de la distribución de números primos , que aparecieron el mismo año (1896). Ambas pruebas utilizaron métodos provenientes del análisis complejo, estableciendo como paso principal de la prueba que la función zeta de Riemann ζ ( s ) es distinta de cero para todos los valores complejos de la variable s que tienen la forma s = 1 + it con t > 0 . [10]
Durante el siglo XX, el teorema de Hadamard y de la Vallée Poussin también pasó a ser conocido como teorema de los números primos. Se encontraron varias pruebas diferentes de ello, incluidas las pruebas "elementales" de Atle Selberg [11] y Paul Erdős [12] (1949). Las pruebas originales de Hadamard y de la Vallée Poussin son largas y elaboradas; Las demostraciones posteriores introdujeron varias simplificaciones mediante el uso de teoremas de Tauber , pero siguieron siendo difíciles de digerir. En 1980, el matemático estadounidense Donald J. Newman descubrió una breve demostración . [13] [14] La prueba de Newman es posiblemente la prueba más simple conocida del teorema, aunque no es elemental en el sentido de que utiliza el teorema integral de Cauchy a partir de un análisis complejo.
He aquí un esbozo de la prueba a la que se hace referencia en una de las conferencias de Terence Tao . [15] Como la mayoría de las pruebas del PNT, comienza reformulando el problema en términos de una función de conteo de primos menos intuitiva, pero de mejor comportamiento. La idea es contar los números primos (o un conjunto relacionado, como el conjunto de potencias primas) con pesos para llegar a una función con un comportamiento asintótico más suave. La función de conteo generalizada más común es la función de Chebyshev ψ ( x ) , definida por
Esto a veces se escribe como
donde Λ ( n ) es la función de von Mangoldt , es decir
Ahora es relativamente fácil comprobar que el PNT es equivalente a la afirmación de que
De hecho, esto se desprende de las estimaciones sencillas
y (usando notación O grande ) para cualquier ε > 0 ,
El siguiente paso es encontrar una representación útil para ψ ( x ) . Sea ζ ( s ) la función zeta de Riemann. Se puede demostrar que ζ ( s ) está relacionada con la función de von Mangoldt Λ ( n ) , y por tanto con ψ ( x ) , mediante la relación
Un análisis delicado de esta ecuación y las propiedades relacionadas de la función zeta, utilizando la transformada de Mellin y la fórmula de Perron , muestra que para x no entero la ecuación
se mantiene, donde la suma es sobre todos los ceros (triviales y no triviales) de la función zeta. Esta sorprendente fórmula es una de las llamadas fórmulas explícitas de la teoría de números , y ya sugiere el resultado que deseamos probar, ya que el término x (que se afirma es el orden asintótico correcto de ψ ( x ) ) aparece a la derecha. -lado derecho, seguido de (presumiblemente) términos asintóticos de orden inferior.
El siguiente paso en la demostración implica un estudio de los ceros de la función zeta. Los ceros triviales −2, −4, −6, −8, ... se pueden manejar por separado:
que desaparece para x grande . Los ceros no triviales, es decir, los de la franja crítica 0 ≤ Re( s ) ≤ 1 , pueden ser potencialmente de un orden asintótico comparable al término principal x si Re( ρ ) = 1 , por lo que debemos demostrar que todos los ceros tienen valores reales. parte estrictamente menor que 1.
Para hacer esto, damos por sentado que ζ ( s ) es meromórfico en el semiplano Re( s ) > 0 , y es analítico allí excepto por un polo simple en s = 1 , y que existe una fórmula producto
para Re( s ) > 1 . Esta fórmula del producto se deriva de la existencia de una factorización prima única de números enteros y muestra que ζ ( s ) nunca es cero en esta región, de modo que su logaritmo se define allí y
Escribe s = x + iy ; entonces
Ahora observa la identidad.
de modo que
para todo x > 1 . Supongamos ahora que ζ (1 + iy ) = 0 . Ciertamente y no es cero, ya que ζ ( s ) tiene un polo simple en s = 1 . Supongamos que x > 1 y dejemos que x tienda a 1 desde arriba. Dado que tiene un polo simple en s = 1 y ζ ( x + 2 iy ) permanece analítico, el lado izquierdo en la desigualdad anterior tiende a 0, una contradicción.
Finalmente, podemos concluir que el PNT es heurísticamente cierto. Para completar rigurosamente la prueba todavía hay serios tecnicismos que superar, debido al hecho de que la suma sobre ceros zeta en la fórmula explícita para ψ ( x ) no converge absolutamente sino sólo condicionalmente y en un sentido de "valor principal". Hay varias formas de solucionar este problema, pero muchas de ellas requieren estimaciones analíticas complejas bastante delicadas. El libro de Edwards [16] proporciona los detalles. Otro método es utilizar el teorema Tauberiano de Ikehara , aunque este teorema es bastante difícil de demostrar. DJ Newman observó que no se necesita toda la fuerza del teorema de Ikehara para el teorema de los números primos, y uno puede salirse con la suya en un caso especial que es mucho más fácil de demostrar.
DJ Newman ofrece una demostración rápida del teorema de los números primos (PNT). La prueba es "no elemental" en virtud de que se basa en análisis complejos, pero utiliza sólo técnicas elementales de un primer curso en la materia: fórmula integral de Cauchy , teorema integral de Cauchy y estimaciones de integrales complejas. He aquí un breve esbozo de esta prueba. Consulte [14] para obtener detalles completos.
La prueba utiliza los mismos preliminares que en la sección anterior excepto que en lugar de la función , se usa la función de Chebyshev , que se obtiene eliminando algunos de los términos de la serie para . Es fácil demostrar que el PNT equivale a . Asimismo, en lugar de se utiliza la función , que se obtiene eliminando algunos términos de la serie para . Las funciones y se diferencian por una función holomorfa . Dado que, como se mostró en la sección anterior, no tiene ceros en la recta , no tiene singularidades en .
Otra información necesaria en la demostración de Newman, y que es la clave para las estimaciones en su método simple, es que es acotada. Esto se demuestra mediante un método ingenioso y sencillo gracias a Chebyshev.
La integración por partes muestra cómo y se relacionan. Para ,
El método de Newman prueba el PNT mostrando la integral
converge, y por lo tanto el integrando va a cero como , que es el PNT. En general, la convergencia de la integral impropia no implica que el integrando vaya a cero en el infinito, ya que puede oscilar, pero como es creciente, es fácil de demostrar en este caso.
Para mostrar la convergencia de , por let
entonces
que es igual a una función holomorfa sobre la recta .
La convergencia de la integral , y por tanto del PNT, se demuestra demostrando que . Esto implica un cambio de orden de los límites ya que puede escribirse y por tanto clasificarse como un teorema de Tauber.
La diferencia se expresa utilizando la fórmula integral de Cauchy y luego se muestra que es pequeña para grande estimando el integrando. Fix y tal que sea holomorfo en la región donde , y sea el límite de esta región. Dado que 0 está en el interior de la región, la fórmula integral de Cauchy da
donde está el factor introducido por Newman, que no cambia la integral ya que es entera y .
Para estimar la integral, divida el contorno en dos partes, donde y . Entonces dónde . Dado que , y por tanto , están acotados, sea un límite superior para el valor absoluto de . Esto unido a la estimación de da que la primera integral en valor absoluto es . El integrando en la segunda integral es entero , por lo que según el teorema integral de Cauchy , el contorno se puede modificar a un semicírculo de radio en el semiplano izquierdo sin cambiar la integral, y el mismo argumento que para la primera integral da el valor absoluto. de la segunda integral es . Finalmente, dejando , la tercera integral va a cero desde y por tanto va a cero en el contorno. Combinando las dos estimaciones y el límite se obtiene
Esto es válido para todos , y el PNT sigue.
En una nota manuscrita sobre una reimpresión de su artículo de 1838 " Sur l'usage des séries infinies dans la théorie des nombres ", que envió por correo a Gauss, Dirichlet conjeturó (bajo una forma ligeramente diferente apelando a una serie en lugar de una integral) que una aproximación aún mejor a π ( x ) viene dada por la función integral logarítmica compensada Li( x ) , definida por
De hecho, esta integral sugiere fuertemente la noción de que la "densidad" de los números primos alrededor de t debería ser 1/log t . Esta función está relacionada con el logaritmo por la expansión asintótica
Entonces, el teorema de los números primos también se puede escribir como π ( x ) ~ Li( x ) . De hecho, en otro artículo [17] de 1899, de la Vallée Poussin demostró que
para alguna constante positiva a , donde O (...) es la notación O grande . Esto se ha mejorado a
En 2016, Trudgian demostró un límite superior explícito para la diferencia entre y :
para . [19]
La conexión entre la función zeta de Riemann y π ( x ) es una de las razones por las que la hipótesis de Riemann tiene una importancia considerable en la teoría de números: si se establece, produciría una estimación del error involucrado en el teorema de los números primos mucho mejor que la que está disponible en la actualidad. Más específicamente, Helge von Koch demostró en 1901 [20] que si la hipótesis de Riemann es cierta, el término de error en la relación anterior puede mejorarse a
(Esta última estimación es de hecho equivalente a la hipótesis de Riemann). La constante involucrada en la notación O grande fue estimada en 1976 por Lowell Schoenfeld : [21] asumiendo la hipótesis de Riemann,
para todo x ≥ 2657 . También derivó un límite similar para la función de conteo de primos de Chebyshev ψ :
para todo x ≥ 73,2 . Se ha demostrado que este último límite expresa una varianza de la ley de potencia media (cuando se considera una función aleatoria sobre los números enteros) y1/ F ruido y corresponder también a la distribución de Poisson compuesta de Tweedie . (Las distribuciones de Tweedie representan una familia de distribuciones invariantes de escala que sirven como focos de convergencia para una generalización del teorema del límite central . [22] )
La integral logarítmica li( x ) es mayor que π ( x ) para valores "pequeños" de x . Esto se debe a que (en cierto sentido) no se cuentan primos, sino potencias primarias, donde una potencia p n de un primo p se cuenta como1/ norte de un primo. Esto sugiere que li( x ) normalmente debería ser mayor que π ( x ) aproximadamente y, en particular, siempre debería ser mayor que π ( x ) . Sin embargo, en 1914, JE Littlewood demostró que los cambios de signo son infinitamente frecuentes. [23] El primer valor de x donde π ( x ) excede li ( x ) probablemente esté alrededor de x ~ 10316 ; consulte el artículo sobreel número de Skewespara obtener más detalles. (Por otro lado, laintegral logarítmica compensada Li( x )es menor que π ( x )para x = 2; de hecho,Li(2) = 0, mientras que π (2) = 1.)
En la primera mitad del siglo XX, algunos matemáticos (notablemente GH Hardy ) creían que existía una jerarquía de métodos de demostración en matemáticas dependiendo de qué tipos de números ( enteros , reales , complejos ) requiere una demostración, y que el teorema de los números primos (PNT) es un teorema "profundo" en virtud de que requiere un análisis complejo . [24] Esta creencia se vio algo sacudida por una demostración del PNT basada en el teorema tauberiano de Wiener , aunque esto podría dejarse de lado si se considerara que el teorema de Wiener tiene una "profundidad" equivalente a la de los métodos de variables complejas.
En marzo de 1948, Atle Selberg estableció, por medios "elementales", la fórmula asintótica
dónde
para primos p . [11] En julio de ese año, Selberg y Paul Erdős [12] habían obtenido pruebas elementales del PNT, ambos utilizando la fórmula asintótica de Selberg como punto de partida. [24] [25] Estas pruebas efectivamente echaron a un lado la noción de que el PNT era "profundo" en ese sentido, y demostraron que los métodos técnicamente "elementales" eran más poderosos de lo que se había creído. Sobre la historia de las pruebas elementales del PNT, incluida la disputa de prioridad Erdős-Selberg , véase un artículo de Dorian Goldfeld . [24]
Existe cierto debate sobre la importancia del resultado de Erdős y Selberg. No existe una definición rigurosa y ampliamente aceptada de la noción de prueba elemental en la teoría de números, por lo que no está claro exactamente en qué sentido su prueba es "elemental". Aunque no utiliza un análisis complejo, de hecho es mucho más técnico que la prueba estándar de PNT. Una posible definición de prueba "elemental" es "aquella que puede realizarse en aritmética de Peano de primer orden ". Hay enunciados de teoría de números (por ejemplo, el teorema de Paris-Harrington ) que se pueden demostrar utilizando métodos de segundo orden pero no de primer orden , pero tales teoremas son raros hasta la fecha. La prueba de Erdős y Selberg ciertamente puede formalizarse en aritmética de Peano, y en 1994, Charalambos Cornaros y Costas Dimitracopoulos demostraron que su prueba puede formalizarse en un fragmento muy débil de PA, a saber, I Δ 0 + exp . [26] Sin embargo, esto no aborda la cuestión de si la prueba estándar de PNT puede formalizarse o no en PA.
En 2005, Avigad et al. empleó el demostrador del teorema de Isabelle para idear una variante verificada por computadora de la prueba de Erdős-Selberg del PNT. [27] Esta fue la primera prueba verificada por máquina del PNT. Avigad optó por formalizar la prueba de Erdős-Selberg en lugar de una analítica porque, si bien la biblioteca de Isabelle en ese momento podía implementar las nociones de límite, derivada y función trascendental , casi no tenía una teoría de integración de la que hablar. [27] : 19
En 2009, John Harrison empleó HOL Light para formalizar una prueba empleando un análisis complejo . [28] Al desarrollar la maquinaria analítica necesaria, incluida la fórmula integral de Cauchy , Harrison pudo formalizar "una prueba directa, moderna y elegante en lugar del argumento 'elemental' más complicado de Erdős-Selberg".
Sea π d , a ( x ) el número de números primos en la progresión aritmética a , a + d , a + 2 d , a + 3 d , ... que son menores que x . Dirichlet y Legendre conjeturaron, y De la Vallée Poussin demostró, que si a y d son coprimos , entonces
donde φ es la función totiente de Euler . En otras palabras, los números primos se distribuyen uniformemente entre las clases de residuos [ a ] módulo d con mcd( a , d ) = 1 . Esto es más fuerte que el teorema de Dirichlet sobre progresiones aritméticas (que sólo establece que hay una infinidad de números primos en cada clase) y se puede demostrar utilizando métodos similares utilizados por Newman para su prueba del teorema de los números primos. [29]
El teorema de Siegel-Walfisz da una buena estimación de la distribución de números primos en clases de residuos.
Bennett y cols. [30] demostró la siguiente estimación que tiene constantes explícitas A y B (Teorema 1.3): Sea d un número entero y sea a un número entero coprimo de d . Entonces existen constantes positivas A y B tales que
dónde
y
Aunque tenemos en particular
empíricamente los primos congruentes con 3 son más numerosos y casi siempre van por delante en esta "carrera de números primos"; la primera inversión ocurre en x = 26861 . [31] : 1–2 Sin embargo, Littlewood demostró en 1914 [31] : 2 que hay infinitos cambios de signo para la función
Así, el liderato de la carrera cambia infinitas veces. El fenómeno de que π 4,3 ( x ) esté adelantado la mayor parte del tiempo se llama sesgo de Chebyshev . La carrera de los números primos se generaliza a otros módulos y es objeto de mucha investigación; Pál Turán preguntó si siempre se da el caso de que π ( x ; a , c ) y π ( x ; b , c ) cambian de lugar cuando a y b son coprimos de c . [32] Granville y Martin ofrecen una exposición y un estudio exhaustivos. [31]
El teorema de los números primos es un resultado asintótico . Da un límite ineficaz en π ( x ) como consecuencia directa de la definición del límite: para todo ε > 0 , existe un S tal que para todo x > S ,
Sin embargo, se conocen mejores límites para π ( x ) , por ejemplo el de Pierre Dusart.
La primera desigualdad se cumple para todo x ≥ 599 y la segunda para x ≥ 355991 . [33]
Un límite más débil pero a veces útil para x ≥ 55 es [34]
En la tesis de Pierre Dusart hay versiones más fuertes de este tipo de desigualdad que son válidas para x más grande . Más tarde, en 2010, Dusart demostró: [35]
La prueba de de la Vallée Poussin implica lo siguiente: Para cada ε > 0 , existe un S tal que para todo x > S ,
Como consecuencia del teorema de los números primos, se obtiene una expresión asintótica para el n -ésimo número primo, denotada por p n :
Una mejor aproximación es [36]
Nuevamente considerando el2 × 10 17º número primo8 512 677 386 048 191 063 , esto da una estimación de8 512 681 315 554 715 386 ; los primeros 5 dígitos coinciden y el error relativo es de aproximadamente 0,00005%.
El teorema de Rosser establece que
Esto se puede mejorar mediante el siguiente par de límites: [34] [37]
La tabla compara los valores exactos de π ( x ) con las dos aproximaciones x /log x y li( x ) . La última columna, x / π ( x ) , es la brecha prima promedio debajo de x .
El valor de π (10 24 ) se calculó originalmente asumiendo la hipótesis de Riemann ; [38] Desde entonces ha sido verificado incondicionalmente. [39]
Existe un análogo del teorema de los números primos que describe la "distribución" de polinomios irreducibles en un campo finito ; la forma que adopta es sorprendentemente similar al caso del teorema clásico de los números primos.
Para expresarlo con precisión, sea F = GF( q ) el cuerpo finito con q elementos, para algunos q fijos , y sea N n el número de polinomios mónicos irreducibles sobre F cuyo grado es igual a n . Es decir, estamos ante polinomios con coeficientes elegidos de F , que no pueden escribirse como productos de polinomios de menor grado. En este contexto, estos polinomios desempeñan el papel de los números primos, ya que todos los demás polinomios mónicos están formados por productos de ellos. Entonces se puede probar que
Si hacemos la sustitución x = q n , entonces el lado derecho es simplemente
lo que aclara la analogía. Dado que hay precisamente q n polinomios mónicos de grado n (incluidos los reducibles), esto se puede reformular de la siguiente manera: si se selecciona aleatoriamente un polinomio mónico de grado n , entonces la probabilidad de que sea irreducible es aproximadamente 1/norte.
Incluso se puede demostrar una analogía con la hipótesis de Riemann, es decir, que
Las pruebas de estas afirmaciones son mucho más simples que en el caso clásico. Implica un argumento combinatorio breve, [40] resumido como sigue: cada elemento de la extensión de grado n de F es una raíz de algún polinomio irreducible cuyo grado d divide a n ; contando estas raíces de dos maneras diferentes se establece que
donde la suma es sobre todos los divisores d de n . La inversión de Möbius entonces produce
donde μ ( k ) es la función de Möbius . (Esta fórmula era conocida por Gauss.) El término principal aparece para d = n , y no es difícil acotar los términos restantes. La afirmación de la "hipótesis de Riemann" depende del hecho de que el mayor divisor propio de n no puede ser mayor quenorte/2.