03a. generadores de números aleatorios

Anuncio
Generadores de Números
Aleatorios
Jorge Eduardo Ortiz Triviño
jeortizt@unal.edu.co
http://www.docentes.unal.edu.co/jeortizt/
Contenido:
• ¿Qué entendemos por secuencia de números
aleatorios?
• Cómo se generan n. aleatorios
• Generadores congruenciales lineales
• Propiedades de los GCL
• Otros tipos de generadores
– De Tausworthe (“feedback shift register”)
– “Barajados” (??) (“shuffled”)
Números Aleatorios
• Elemento Central en la Simulación digital.
• Definición formal controvertida.
• Elemento esencial en muchas áreas del conocimiento
Ingeniería, Economía, Física, Estadística, etc.
• Definición intuitiva: Una sucesión de números aleatorios
puros, se caracteriza por que no existe ninguna regla o plan
que nos permita conocer sus valores.
• Los números aleatorios obtenidos a través de algoritmos
recursivos se llaman pseudoaleatorios.
Números Aleatorios
Disponer de un buen generador de números
aleatorios es clave en:
•
•
•
•
•
•
•
Computación Aleatorizada
Computación Evolutiva
Algoritmos Aleatorizados
Verificación de Algoritmos
Validación de Algoritmos
Criptografía
etc.
Números Aleatorios
• La gran disponibilidad de generadores de números
aleatorios en muchos entornos y compiladores puede
llevarnos a pensar que para un usuario de la simulación
no sería necesario estudiar estas cuestiones.
• Una lección del pasado reciente nos obliga a sacar
lecciones y actuar con mucho cuidado con dichos
generadores (RANDU - IBM).
• El Uso progresivo de modelos de simulación cada vez
más detallados exige una mayor calidad de los
generadores de números aleatorios.
NÚMEROS ALEATORIOS
f(x)
1, 0  x  1
f(x)
1
0, en otro caso
1
F(x)
0, x < 0
F(x)
x, 0  x  1
1
1, x<1
1
¿Qué entendemos por secuencia de
números aleatorios?
• En teoría, realización de secuencia de v.a.u
U1, U2, ..., Un, ... iid, Ri  U(0,1)
• En la práctica criterios menos estrictos:
– n-distributividad: todas las n-tuplas {(Ui, Ui+1 ...,
Ui+n-1)} uniformes sobre (0,1)n
– (k,n)-distributividad: cada k-ésima subsecuencia
de longitud n uniforme (0,1)n
• p.e. (5,2) seria {(U5i,U5i+1)}, {(U5i+1,U5i+2)},
{(U5i+2,U5i+3)}, {(U5i+3,U5i+4)}, {(U5i+4,U5i+5)} uniformes
sobre (0,1)x(0,1)
ALGORITMO GENERADOR DE BITS
PSEUDOALEATORIOS
Entrada:
Dos primos p,q , elegir e, tal que mcd (e,  )=1, donde
=(p-1)(q-1) .
Una semilla x0 [1,n-1]
Algoritmo:
a) Para j=1 hasta k:
a1) xj=(xj-1)e mod n
a2) zj=el menor bit significativo de xj
Salida:
La sucesión z1, z2, …, zk.
Generadores de números.
• Características deseables:
– Los números generados no se deben repetir frecuentemente
(en ciclos).
– Las series generadas deben ser reproducibles.
– Rapidez en la obtención de los números.
– Almacenamiento mínimo.
– Los números generados han de estar uniformemente
distribuidos.
– Los valores deben ser independientes unos de otros.
Métodos De Generación
• Métodos manuales: Generación de números con artificio
manuales: bolillas, patentes de los autos, guía telefónica
– Ventajas: Son aleatorios y son Simples,
– Desventajas: No reproducibles y Lentos
• Tablas de biblioteca: La mas importante: “A millón randon
digist” editorial RAND, configurada con las radiaciones
termoiónicas de un tubo de rayos catódicos.
– Ventaja:
• Provienen de un fenómeno aleatorio
• son reproducibles.
• Se las puede estudiar y analizar rigurosamente antes de ser utilizada.
– Desventaja:
• No se obtiene en tiempo real.
• Necesidades de memoria.
Métodos De Generación
• Métodos De Computación Analógica: Generados con procesos
físicos aleatorios (Ej: una corriente eléctrica).
– Ventaja: Aleatorios.
– Desventaja: No reproducible.
• Métodos De Computación Digital: Con computadoras:
– Provisión Externa: Se graba en memoria las tablas Randa.
– Procesos Físicos Aleatorios: Usar algún dato interno de la computadora
(temperatura, segundos, ciclos, cantidad de memoria asignada, etc).
– Relación de recurrencia: Generar números pseudoaleatorios por medio
de ecuaciones de recurrencia en las que necesariamente se tiene que dar un
valor inicial o semilla para obtener los siguientes valores.
• Ventaja:
– Son reproducibles.
– No afectan en demasía al procesador ni sobrecargan la memoria.
– Existe la posibilidad de su absoluta reproducción
• Desventaja:
– Son pseudoaleatorios.
– Hay que probar la Calidad Aleatoria del método.
Propiedades de los Números aleatorios
• Uniformemente distribuido (sin recurrencia):
– Es recurrente cuando uno o varios elementos se
repiten con mayor frecuencia teórica, =>
disminución de frecuencia de los demás números.
– Estudiar la recurrencia de : 2, 6, 6, 8, 7, 6, 6, 6, 4,
7, 2, 6, 5, 6, 2,6,6,7, 6, 5, 4, 3, 3, 6, 6, 6, 2,
9,4,8,6,4,6, 9,6,3,7,6,9,6, 0.
– Hay 40 Números, por lo tanto la frecuencia teórica
de cada uno de los dígitos (del 0 al 9) deberá ser 4.
– De una tabla de frecuencias se obtiene que el digito
6->F(6)=18 veces.
Propiedades de los Números aleatorios
• Estadísticamente independientes (sin
periodicidad):
– Tiene periodicidad cuando varios elementos,
repetidos o no, formando una cadena, aparecen en
la misma secuencia.
– Estudiar periodicidad de:
• 1,0,2,2,6,8,2,3,3,0,1,0,2,2,6,8,4,1,7,0,2,2,6,8,
7,6,5,3,3,5,1,0,2,2,6,8.....
– Secuencia periódica 02268. . de Frecuencia 4
• 1,0,2,4,6,8,2,3,3,0,1,0,2,4,6,8,4,1,7,0,2,4,6,8,
7,6,5,3,3,5,1,0,2,4,6,8.....
– Secuencia periódica 02468. de Frecuencia 4
Propiedades de los Números Pseudoaleatorios
• Reproducibles: Cuando el Método comienza con la misma
Semilla, DEBE dar la misma secuencia de números
Pseudoaleatoreos.
• Rápidos, velocidad de generación acorde a las necesidades.
• Mínimos de memoria.
Conclusiones:
•Hay que verificar la calidad estadísticas de las series.
Comprobarlas en tiempo de Ejecución es una perdida de
tiempo, entonces se prueba la calidad estadística del Método.
•Por la cantidad de números que se necesitan y por la velocidad
de su ocurrencia, es imprescindible generarlos en la medida
que se lo necesiten.
Números Aleatorios
Algunas ideas o propiedades de los generadores
I. Lagarias (1993) publicó un trabajo titulado “Pseudo
Random Numbers” en Statistical Science. Donde estudia
algunas propiedades tales como:
Expansividad : Una aplicación d  [0,1] es expansiva si
2
| d ' ( x) |  1 x [0,1]
La idea es escoger “d” como una aplicación expansiva de
manera que la inestabilidad computacional proporcione
aleatoriedad.
Números Aleatorios
No Linealidad: La composición de aplicaciones no lineales
puede conducir a comportamientos crecientemente no
lineales Ej: d(x) = x2; d(n)(x) = x2n
Complejidad Computacional: La
aleatoriedad de
Kolmogorov, también denominada incomprensibilidad
computacional. Consiste en constatar si la aleatoriedad de
una sucesión de números es incomprensible (problema
decidible).
Impredecibilidad
Números Aleatorios
• DEF 1: Kolmogorov (1987) [Complejidad Algorítmica]
Una sucesión de números es aleatoria sino puede producirse
eficientemente de una manera más corta que la propia serie.
• DEF 2: L’Ecuyer (1990) [Impredicibilidad] Una sucesión de
números es aleatoria si nadie que utilice recursos
computacionales razonables puede distinguir entre la serie y
una sucesión de números verdaderamente aleatoria de una
forma mejor que tirando una moneda legal para decidir cuál
es cuál.
Obs: Esta definición conduce a los denominados
generadores PT-perfectos usados en Criptografía.
Números Aleatorios
• DEF 3: Un Número aleatorio es una realización de una
variable aleatoria que tiene asociada una ley de probabilidades
F, en un espacio o modelo de Probabilidades (, , P).
Obs: Una particular Ley de Probabilidad base para la
generación de números pseudo-aleatorios es:
u1, u2,..., un : es la uniforme (0 ; 1) ui ~ U(0,1).
• DEF 4: Una sucesión de números aleatorios {u1, u2,..., un} es
una sucesión de números U(0;1), si tiene las mismas
propiedades estadísticas relevantes que dicha sucesión de
números aleatorios.
Números Aleatorios
• DEF 5: Una sucesión de números aleatorios {ui} es
aleatorio si h-úplas de números sucesivos no
superpuestos se distribuyen aproximadamente. como
una [0,1]h, con h=1,2,..,n, para n suficientemente
grande.
• Obs: h=2 tenemos (ui,ui+1) , i=1,2,..n , se distribuye
como una ley uniforme en [0,1]2.
• Existe una gran de métodos para generar
{ui} U(0,1) : -Uniformente distribuidas
- Independientes
- E[U]= ½ ; V[U]= 1/12
- Período largo
Números Aleatorios
A las propiedades estadísticas anteriores se deben
agregar otras relativas a la eficiencia computacional:
• Velocidad de respuesta
• Consumo de memoria
• Portabilidad
• Parsimonia
• Reproducibilidad
• Mutabilidad
• Período
Números Aleatorios
Métodos de Generación de Números Aleatorios
1.- Método de los cuadrados medios
2.- Métodos Congruenciales
3.- Método de registros desfasados
[Semilla - Algoritmo - Validación]
P1 : Obtener semilla (valores iniciales)
P2 : Aplicación de Algoritmos recursivos
P3 : Validación del conjunto de datos
generados (Test de Aleatoriedad)
Métodos de los cuadrados Medios
Consiste en que cada número de una sucesión es producido
tomando los dígitos medios de un número obtenido
mediante la elevación al cuadrado.
P1 : Obtener semilla (valores iniciales 445)
P2 : Aplicación de Algoritmos recursivos (elevar
al cuadrado)
P3 : Validación del conjunto de datos
generados
Métodos de los Cuadrados Medios
Ejemplo: Consideremos la semilla 445
X
X2
N° Aleatorio
445
1| 9802 | 5
0,9802
9802
96| 0792 | 04
0,0792
792
6 | 2726 | 4
0,2726
2726
...............
...............
Descargar