Estos días se ha paseado por mi TL la idea de "aleatoriedad".

En general, podemos asumir que el azar se encuentra en la naturaleza. Ahora bien… ¿es posible "generar" el azar por nuestros medios?

🧵 Tira del hilo para saber la respuesta 👇

(En blog: https://picanumeros.wordpress.com/2020/12/30/dados-monedas-ordenadores-y-formulas-como-generar-la-aleatoriedad/)
El azar es un fenómeno que ha llamado nuestra atención desde siempre, así como nuestro afán por reproducirlo.

Ya hace miles de años se utilizaban dispositivos, como dados o monedas, para generar procesos aleatorios para todo aquello que se necesitase (juegos, selecciones...)
¡Más despacio! "Aleatorio" exactamente, ¿qué significa?

Un experimento aleatorio es todo aquel en el que:
- Se conocen los resultados posibles…
- …pero no se sabe, ANTES de hacerlo, cuál de ellos saldrá
- Y repetido bajo mismas condiciones puede dar diferentes resultados
Cosas que NO son necesarias para la aleatoriedad:
- Desconocer las probabilidades de cada resultado (no por saber que la prob. de cara es 50% sabré de qué lado cae la moneda).
- Que las probabilidades de todos los resultados sean iguales (spoiler: pocas veces lo son).
Y diréis… ¿Y si yo me pongo a analizar la física de un dado para determinar el resultado?

Pues esto fue lo que descubrieron Persi Diaconis y colegas, pero para monedas: tirándolas de cierta forma puedes hacer que siempre (prob. = 1) salga lo que quieras: https://statweb.stanford.edu/~susan/papers/headswithJ.pdf
Esto lleva a LA CUESTIÓN:

¿aleatorio es lo que no se sabe porque no puede saberse…

…o porque aún no lo conocemos?

La respuesta no es sencilla, pero me gusta la definición informal de Batanero (2001): el azar es el patrón que explica los fenómenos sin causa o no predecibles.
Esta definición de azar nos puede servir para esos dispositivos (tirar una moneda sí será *normalmente* un experimento aleatorio, basándonos en el propio paper de Diaconis), pero no es la opción más rápida para aplicaciones "serias" de la aleatoriedad en la estadística.
Para solucionar estos problemas, surgieron a principios del S·XX lo que conocemos como

✨TABLAS DE NÚMEROS ALEATORIOS✨

Y son… pues eso. Tablas con un montón de dígitos (reunidos mediante procedimientos aleatorios) que podemos ir utilizando secuencialmente según necesidades.
Desde la primera tabla (Tippett, 1927) surgieron varias con longitudes de hasta 100.000 dígitos, pero seguía sin ser suficiente. Los ordenadores, en su tierna infancia, permitían hacer muestreos aleatorios para los que las tablas se quedaban *cortas*.
En estas surgió el proyecto RAND, que a partir de datos de pulsos electrónicos permitió la obtención masiva de dígitos aleatorios. El fruto fue el libro del MILLÓN de dígitos, publicado en 1955.

En él, cada dígito era como una caja de bombones: ¡nunca sabías cuál te iba a tocar!
Pero adivinad qué: tampoco era suficiente. Por buenas que fueran estas tablas de números aleatorios, su uso en computadoras resultaba ineficiente y se optó por buscar métodos que pudieran *generar* de cero esta aleatoriedad.

Y así llegamos a

🥁 LOS NÚMEROS PSEUDOALEATORIOS 🥁
Los números pseudoaleatorios son aquellos generados por fórmulas como las de abajo, de tal manera que tú le das un número cualquiera (llamado semilla) y a partir de ahí te genera una secuencia de números hasta el infinito.

¿Son aleatorios estos números? No estrictamente, pero...
…los números generados en la práctica se asemejan a secuencias aleatorias. Son infinitos números, con distribución uniforme entre 0 y 1, que siempre serán los mismos para una semilla, pero que no conoces con exactitud antes de decidirte por una. Presentan múltiples ventajas.
Permiten reproducir un experimento en diferentes momentos y/o circunstancias (ya que al usar una misma semilla, saldrán los mismos números). No hace falta almacenarlos, y puedes generar a gran velocidad todos los que quieras.
¿Y de qué sirve tener números aleatorios? ¡Yo lo que quiero es simular una cara o una cruz!

Bien: podemos transformar estos números entre 0 y 1 para lo que queramos, utilizando métodos como el de Monte Carlo.

Por ejemplo: si sale menor que 0.5, decimos "cara". Si no, "cruz".
¿Puede comprobarse si un generador de núm. pseudoaleatorios es bueno o no? Por supuesto.
Podemos mirar si tiene "ciclos", es decir, si tras una serie de pasadas, se está generando una sucesión que ya hemos visto antes. Lo suyo es que aparezcan tan tarde que ni nos enteremos.
También podemos pasarlos por los tests de hipótesis sobre uniformidad o autocorrelación, que normalmente usamos para datos reales, para ver si cuadran con esa hipótesis o no. Pero son palabras mayores… así que lo podemos dejar aquí.
Como de costumbre, he tenido que hacer unos cuantos sacrificios "técnicos" en favor de hacer el hilo un poco más divulgativo (no he tocado p. ej. cómo pasar los números entre 0 y 1 a distribuciones de probabilidad). Tened esto en cuenta a la hora de hacer enmiendas 😁
Agradecimientos:
- A @walyt por proponer el hilo en primer lugar.
- A @ljrguezmuniz por su divulgación que me permitió llegar a obras clave.
- A @AliciaFranco17 por su hilo sobre la falacia del jugador, que fue la semilla de este.
- Y a ti, que vas a dar RT y difusión al hilo (?)
Referencias:
- Batanero, C. (2001) Didáctica de la estadística. Universidad de Granada.
- L'Écuyer, P. (2017) History of uniform random number generation. WSC 2017. Las Vegas, EEUU ( https://hal.inria.fr/hal-01561551/document)
- Bennett, D. J. (1999) Randomness. Harvard University Press.
You can follow @Picanumeros.
Tip: mention @twtextapp on a Twitter thread with the keyword “unroll” to get a link to it.

Latest Threads Unrolled:

By continuing to use the site, you are consenting to the use of cookies as explained in our Cookie Policy to improve your experience.