stringtranslate.com

Aleatoriedad estadística

Se dice que una secuencia numérica es estadísticamente aleatoria cuando no contiene patrones o regularidades reconocibles; secuencias como los resultados de una tirada de dados ideal o los dígitos de π exhiben aleatoriedad estadística. [1]

La aleatoriedad estadística no implica necesariamente una aleatoriedad "verdadera" , es decir, imprevisibilidad objetiva . La pseudoaleatoriedad es suficiente para muchos usos, como la estadística, de ahí el nombre de aleatoriedad estadística .

La aleatoriedad global y la aleatoriedad local son diferentes. La mayoría de las concepciones filosóficas de la aleatoriedad son globales, porque se basan en la idea de que "a largo plazo" una secuencia parece verdaderamente aleatoria, incluso si ciertas subsecuencias no lo parecen . En una secuencia "verdaderamente" aleatoria de números de longitud suficiente, por ejemplo, es probable que haya largas secuencias de nada más que números repetidos, aunque en general la secuencia podría ser aleatoria. La aleatoriedad local se refiere a la idea de que puede haber longitudes mínimas de secuencia en las que se aproximan las distribuciones aleatorias. Largos tramos de los mismos números, incluso aquellos generados por procesos "verdaderamente" aleatorios, disminuirían la "aleatoriedad local" de una muestra (podría ser sólo localmente aleatoria para secuencias de 10.000 números; tomar secuencias de menos de 1.000 podría no parecer aleatoria). en absoluto, por ejemplo).

Por ello no se demuestra que una secuencia que muestra un patrón no sea estadísticamente aleatoria. Según los principios de la teoría de Ramsey , los objetos suficientemente grandes deben contener necesariamente una subestructura determinada (" el desorden completo es imposible ").

La legislación relativa a los juegos de azar impone ciertos estándares de aleatoriedad estadística a las máquinas tragamonedas .

Pruebas

Las primeras pruebas para números aleatorios fueron publicadas por MG Kendall y Bernard Babington Smith en el Journal of the Royal Statistical Society en 1938. [2] Se basaron en herramientas estadísticas como la prueba chi-cuadrado de Pearson , que se desarrollaron para distinguir si los fenómenos experimentales coincidieron con sus probabilidades teóricas. Pearson desarrolló su prueba originalmente mostrando que varios experimentos con dados realizados por WFR Weldon no mostraban un comportamiento "aleatorio".

Las cuatro pruebas originales de Kendall y Smith eran pruebas de hipótesis , que tomaban como hipótesis nula la idea de que cada número en una secuencia aleatoria dada tenía la misma probabilidad de ocurrir, y que varios otros patrones en los datos también deberían distribuirse de manera equiprobable.

Si una secuencia determinada podía pasar todas estas pruebas dentro de un determinado grado de significancia (generalmente 5%), entonces se consideraba, en sus palabras, "localmente aleatoria". Kendall y Smith diferenciaron la "aleatoriedad local" de la "aleatoriedad verdadera" en que muchas secuencias generadas con métodos verdaderamente aleatorios podrían no mostrar "aleatoriedad local" en un grado determinado; las secuencias muy grandes pueden contener muchas filas de un solo dígito. Esto podría ser "aleatorio" en la escala de toda la secuencia, pero en un bloque más pequeño no sería "aleatorio" (no pasaría sus pruebas) y sería inútil para una serie de aplicaciones estadísticas.

A medida que los conjuntos de números aleatorios se volvieron cada vez más comunes, se utilizaron más pruebas cada vez más sofisticadas. Algunas pruebas modernas trazan dígitos aleatorios como puntos en un plano tridimensional, que luego se puede girar para buscar patrones ocultos. En 1995, el estadístico George Marsaglia creó un conjunto de pruebas conocidas como pruebas intransigentes , que distribuye en un CD-ROM con 5 mil millones de números pseudoaleatorios . En 2015, Yongge Wang distribuyó un paquete de software Java [3] para pruebas de aleatoriedad basadas en distancias estadísticas.

Los generadores de números pseudoaleatorios requieren pruebas como verificaciones exclusivas de su "aleatoriedad", ya que decididamente no se producen mediante procesos "verdaderamente aleatorios", sino mediante algoritmos deterministas. A lo largo de la historia de la generación de números aleatorios, se ha descubierto que muchas fuentes de números que se pensaba que parecían "aleatorias" durante las pruebas eran muy no aleatorias cuando se sometían a ciertos tipos de pruebas. La noción de números cuasi aleatorios se desarrolló para evitar algunos de estos problemas, aunque los generadores de números pseudoaleatorios todavía se utilizan ampliamente en muchas aplicaciones (incluso en aquellas que se sabe que son extremadamente "no aleatorias"), ya que son "suficientemente buenos" para la mayoría. aplicaciones.

Otras pruebas:

Ver también

Referencias

  1. ^ Pi parece un buen generador de números aleatorios, pero no siempre el mejor, Chad Boutin, Universidad Purdue
  2. ^ Kendall, MG ; Smith, B. Babington (1938). "Aleatoriedad y números de muestreo aleatorio". Revista de la Real Sociedad de Estadística . 101 (1): 147-166. doi :10.2307/2980655. JSTOR  2980655.
  3. ^ Yongge Wang. Técnicas de prueba estadística para generación pseudoaleatoria. http://webpages.uncc.edu/yonwang/liltest/
  4. ^ Yongge Wang: Sobre el diseño de pruebas LIL para generadores (pseudo) aleatorios y algunos resultados experimentales. PDF
  5. ^ Wang, Yongge; Nicol, Tony (2015). "Propiedades estadísticas de secuencias pseudoaleatorias y experimentos con PHP y Debian OpenSSL". Computadoras y Seguridad . 53 : 44–64. doi :10.1016/j.cose.2015.05.005.
  6. ^ Knuth, Donald (1998). El arte de la programación informática vol. 2: Algoritmos Seminuméricos . Addison Wesley. págs. 93-118. ISBN 978-0-201-89684-8.

enlaces externos