¿Es pi normal?

círculo y pi

Un número simplemente normal tiene todos sus dígitos distribuidos como si cada uno se eligiera lanzando un dado.

dado de diez lados
Un dado puede tener 10 caras.

Y obtenemos algo como esto:

dígitos normales

Sobre la secuencia infinita de dígitos decimales:

  • 110 son 0, 110 son 1, 110 son 2, etc. (Esto lo hace " simplemente normal")

Pero para ser "normal" (sin el "simplemente" delante) también necesitamos:

  • 1100 sean 00, 1100 sean 01, 1100 sean 02, etc.
  • 11000 sean 000, 11000 sean 001, 11000 sean 002, etc.
  • y así sucesivamente, para cada grupo de dígitos.


¿Es este el caso de Pi ?

Para investigar, contemos cuántos de cada dígito hay y veamos si aparecen con más o menos frecuencia de lo esperado.

También necesitamos hacer esto para pares de 2 dígitos, grupos de 3 dígitos, etc.

¡Vamos a intentarlo!

Cien dígitos

Aquí están los primeros 100 dígitos de Pi:

314159265358979323846264338327950288
4197169399375105820974944592307816
406286208998628034825342117067

Con 100 dígitos y diez posibilidades (0,1,2,3,4,5,6,7,8,9) deberíamos obtener 10 de cada dígito, ¿verdad?

Bueno, cuento 8 "0"s, ¿te parece correcto?

Por supuesto, esperar un 10 perfecto de cada dígito no es realista, por lo que tal vez solo 8 esté bien.

Aquí está el recuento de cada dígito:

Dígito Conteo
0: 8
1: 8
2: 12
3: 12
4: 10
5: 8
6: 9
7: 8
8: 12
9: 13

En su mayoría son alrededor de 10, pero ¡guau! ¡El "9" apareció 13 veces!

¿Debería esperarse eso? Analicemos las cuentas:

Como gráfica:

pi normal

Son cerca de 10, pero también un poco dispersos... ¿es esto "normal"?

Probemos con pares de dos dígitos:

Dígitos Conteo
00: 0
01: 0
02: 1
03: 1
04: 0
05: 1
06: 2
... ...
98: 1
99: 2

Principalmente 0 y 1. ¡Necesitamos más datos sin procesar!

Mil Dígitos

Usando los primeros mil dígitos de Pi obtenemos esto:

Dígito Conteo
0: 93
1: 116
2: 103
3: 103
4: 93
5: 97
6: 94
7: 95
8: 101
9: 105

Analizando las cuentas:

pi normal

Alejando la gráfica:

pi normal

Ahora parece más agrupado alrededor de 100, nuestro primer indicio de que Pi podría ser "normal".

Veamos pares de dos dígitos:

Dígitos Conteo
00: 7
01: 10
02: 10
03: 9
04: 4
05: 14
06: 8
07: 6
... ...
93: 14
94: 11
95: 16
96: 9
97: 7
98: 8
99: 11

Bien, estamos obteniendo valores alrededor de 10, pero veamos el conteo de conteos:

pi normal

Vaya, se ve muy bien agrupado alrededor de 10, tal vez un poco sesgado.

¡Vamos por más datos!

Diez mil dígitos

Usando los primeros diez mil dígitos de Pi obtenemos esto:

Dígito Conteo
0: 968
1: 1026
2: 1021
3: 975
4: 1012
5: 1046
6: 1021
7: 970
8: 947
9: 1014

Y el análisis de los conteos:

pi normal



Y para pares de dos dígitos:
Dígitos Conteo
00: 85
01: 103
02: 98
03: 103
04: 98
05: 89
06: 101
07: 93
... ...
94: 98
95: 107
96: 106
97: 88
98: 100
99: 91

Y el análisis de los conteos:

pi normal

Está empezando a parecerse a una distribución normal, ¿no crees?

curva de campana

Cien Mil Dígitos

Usando los primeros cien mil dígitos de Pi obtenemos esto:

Dígito Conteo
0: 9999
1: 10137
2: 9908
3: 10026
4: 9971
5: 10026
6: 10028
7: 10025
8: 9978
9: 9902

Y el análisis de los conteos:

pi normal



Y para pares de dos dígitos:
Dígitos Conteo
00: 998
01: 1027
02: 962
03: 993
04: 968
05: 1007
06: 1009
07: 1017
08: 1001
... ...
94: 1033
95: 1014
96: 952
97: 934
98: 997
99: 968

Y el análisis de los conteos:

pi normal

Todos los números rondan el 1000 y, usando la calculadora de desviación estándar obtiene una desviación estándar de sólo 32.3, que es una agrupación razonablemente ajustada, ¿no crees?

Resumen

Solo mirando un solo dígito:

Dígito 100 1000 10,000 100,000
esperado: 10 100 1000 10000
0: 8 93 968 9999
1: 8 116 1026 10137
2: 12 103 1021 9908
3: 12 103 975 10026
4: 10 93 1012 9971
5: 8 97 1046 10026
6: 9 94 1021 10028
7: 8 95 970 10025
8: 12 101 947 9978
9: 13 105 1014 9902

A simple vista podemos ver que cuantos más dígitos usamos, más tienden a agruparse los recuentos alrededor del valor esperado.

Esto se llama la "Ley de los Grandes Números": a largo plazo, los eventos aleatorios tienden a promediar el valor esperado.

Vemos lo mismo con pares de dos dígitos.

Entonces esto aumenta nuestra confianza en que Pi es un número normal.

Conclusión

Por lo tanto, parece que los pares de un solo dígito y de dos dígitos no ocurren con más frecuencia que el azar. Al menos dentro de los primeros 100,000 dígitos.

Pero necesitamos verificar más dígitos y también grupos de 3 dígitos, 4 dígitos, etc. Un trabajo muy grande.

Investigación

Las personas con acceso a computadoras poderosas han verificado billones de dígitos de Pi:

(Enlace externo en inglés) Estadísticas de los primeros 22.4 billones de decimales de Pi


Y tampoco han encontrado motivos para dudar de que Pi sea un número normal. No es una prueba, sólo una sospecha muy fuerte de que Pi es normal.

¿Por qué es esto importante?

En primer lugar, ¿no es curioso que los dígitos de Pi (que forman una secuencia exacta) parezcan estar distribuidos aleatoriamente?

Pero la otra implicación alucinante es que un número infinito de dígitos que ocurren aleatoriamente contendrá cada secuencia finita de dígitos, incluyendo:

Y simplemente convirtiendo texto a dígitos (como hola = 8 5 12 12 15), los dígitos de Pi también incluirán:

Ahora bien, si también pudiéramos obtener un índice de dónde están esas cosas...