Se dice que una secuencia numérica es estadísticamente aleatoria cuando no contiene patrones o regularidades reconocibles; secuencias como los resultados de una tirada de dados ideal o los dígitos de π exhiben aleatoriedad estadística. [1]
La aleatoriedad estadística no implica necesariamente una aleatoriedad "real" , es decir, una imprevisibilidad objetiva . La pseudoaleatoriedad es suficiente para muchos usos, como la estadística, de ahí el nombre de aleatoriedad estadística .
La aleatoriedad global y la aleatoriedad local son diferentes. La mayoría de las concepciones filosóficas de la aleatoriedad son globales, porque se basan en la idea de que "a largo plazo" una secuencia parece verdaderamente aleatoria, incluso si ciertas subsecuencias no lo parecen. En una secuencia "verdaderamente" aleatoria de números de longitud suficiente, por ejemplo, es probable que haya largas secuencias de nada más que números repetidos, aunque en general la secuencia podría ser aleatoria. La aleatoriedad local se refiere a la idea de que puede haber longitudes mínimas de secuencia en las que se aproximan distribuciones aleatorias. Largos tramos de los mismos números, incluso aquellos generados por procesos "verdaderamente" aleatorios, disminuirían la "aleatoriedad local" de una muestra (podría ser solo localmente aleatoria para secuencias de 10.000 números; tomar secuencias de menos de 1.000 podría no parecer aleatoria en absoluto, por ejemplo).
No se demuestra por ello que una secuencia que presente un patrón no sea estadísticamente aleatoria. Según los principios de la teoría de Ramsey , los objetos suficientemente grandes deben contener necesariamente una subestructura dada (" el desorden completo es imposible ").
La legislación relativa al juego impone ciertos estándares de aleatoriedad estadística a las máquinas tragamonedas .
Las primeras pruebas para números aleatorios fueron publicadas por MG Kendall y Bernard Babington Smith en el Journal of the Royal Statistical Society en 1938. [2] Se basaron en herramientas estadísticas como la prueba de chi-cuadrado de Pearson , que se desarrolló para distinguir si los fenómenos experimentales coincidían con sus probabilidades teóricas. Pearson desarrolló su prueba originalmente al demostrar que una serie de experimentos con dados de WFR Weldon no mostraban un comportamiento "aleatorio".
Las cuatro pruebas originales de Kendall y Smith eran pruebas de hipótesis que tomaban como hipótesis nula la idea de que cada número en una secuencia aleatoria dada tenía la misma probabilidad de ocurrir, y que varios otros patrones en los datos también deberían distribuirse de manera equiprobable.
Si una secuencia dada era capaz de pasar todas estas pruebas dentro de un grado dado de significancia (generalmente 5%), entonces se juzgaba que era, en sus palabras, "localmente aleatoria". Kendall y Smith diferenciaron la "aleatoriedad local" de la "aleatoriedad verdadera" en que muchas secuencias generadas con métodos verdaderamente aleatorios podrían no mostrar "aleatoriedad local" en un grado dado - secuencias muy grandes podrían contener muchas filas de un solo dígito. Esto podría ser "aleatorio" en la escala de toda la secuencia, pero en un bloque más pequeño no sería "aleatorio" (no pasaría sus pruebas), y sería inútil para una serie de aplicaciones estadísticas.
A medida que los conjuntos de números aleatorios se hicieron cada vez más comunes, se utilizaron más pruebas, cada vez más sofisticadas. Algunas pruebas modernas trazan dígitos aleatorios como puntos en un plano tridimensional, que luego se pueden rotar para buscar patrones ocultos. En 1995, el estadístico George Marsaglia creó un conjunto de pruebas conocidas como pruebas diehard , que distribuye con un CD-ROM de 5 mil millones de números pseudoaleatorios . En 2015, Yongge Wang distribuyó un paquete de software Java [3] para pruebas de aleatoriedad basadas en la distancia estadística.
Los generadores de números pseudoaleatorios requieren pruebas como verificación exclusiva de su "aleatoriedad", ya que decididamente no son producidos por procesos "verdaderamente aleatorios", sino por algoritmos deterministas. A lo largo de la historia de la generación de números aleatorios, muchas fuentes de números que se pensaba que parecían "aleatorios" al realizar pruebas se han descubierto posteriormente que eran muy poco aleatorios al someterse a ciertos tipos de pruebas. La noción de números cuasialeatorios se desarrolló para sortear algunos de estos problemas, aunque los generadores de números pseudoaleatorios todavía se utilizan ampliamente en muchas aplicaciones (incluso en aquellas que se sabe que son extremadamente "poco aleatorias"), ya que son "suficientemente buenos" para la mayoría de las aplicaciones.
Otras pruebas: