Ver Mensaje Individual
  #24  
Antiguo 24-03-2018
tsk tsk is offline
Miembro
 
Registrado: dic 2017
Posts: 52
Reputación: 7
tsk Va por buen camino
Cita:
Empezado por danielmj Ver Mensaje
Hola casimiro, ahora mismo estoy liado con el programa.. estoy cargando archivos CVS descargados de todos los sorteos desde el 85 y claro, al no ser miles y miles de combinaciones como hacia antes, el programa acaba muy rapido. Lo que me mosquea es que 2 progressbar no avanzan según se lee del listview sino que de repente están llenos, pero claro tambien es verdad que estoy con muchas menos combinaciones que antes.
Quiero mirar como funciona la ley del primer número por una parte y como cargar todos los archivos CSV de la carpeta a la vez, porque se hace tedioso ir cargando 1 a 1.
En cuanto al uso o no del listview, estoy haciendo uso de un listview virtual, aunque si es cierto que sobre otro "dibujado" se cargan los archivos. Igual estoy haciendo algo mal.

Saludos.
La ley del primer dígito es eso, agarras el primer dígito de todos los números (sin contar los 0 a la izquierda) y obtienes su distribución, esta debe debe de ser algo así



En un mundo aletorio ideal, al generar una secuencia aleatoria, tu no serías capaz obtener información de la secuencia ya que idealmente esta presenta una distribución uniforme, por lo que la aparición de un número es equiprobable a la aparición de cualquier otro, entonces no puedes inferir absolutamente nada.

También existe el supuesto que cada evento es independiente.

Lo que esperarías ver en una lista de números generados de forma aleatoria es es una distribución uniforme.

Pero no todo es siempre así, por ejemplo el siguiente histograma lo obtuve de un generador de números aleatorios por hardware, que se encuentra dentro de un microcontrolador stm32f103c8t6.



A este hardware se le conoce como TRNG (True Random Number Generator) y genera enteros de 32 bits que pueden ir de 0 a 2**32. No es ideal pero es casi ideal, ya que como puedes observar hay rangos que tienen una ligera probabilidad mayor de aparecer, pero no es suficiente para poder predecir cual va a ser el siguiente número en aparecer.

La idea de usar la ley del primer dígito sobre resultados pasados, es sólo para obtener algo más de información del sistema, algo que te permita reducir el espacio de búsqueda.

Por ejemplo, voy a suponer que son los 6 dígitos, pero que cada dígito sólo puede tener el valor de 1 a 9. Entonces la probabilidad de que el primer dígito sea un 1 es igual a 1/9 o aproximadamente el 11.11%, pero si de los datos de sorteos anteriores muetran que sigue la ley del primer dígito, entonces la probabilidad de que tenga un 1 como primer dígito aumenta a un ~30%.

También lo que tienes que preguntarte es si realmente hay independencia en la generación de los dígitos, porque eso te puede dar algo más de información. Si son independientes, no puedes obtener información, ya que aunque tengas la información de que dígito obtuviste primero, no te incrementa la probabilidad de conocer el valor del segundo dígito y así sucesivamente.

p(d2=2|d1=1) = p(d1=2)*p(d1=1)

Si son independientes la igualdad de arriba se debe de cumplir, si no se cumple, entonces ya tienes información extra en la forma de probabilidad de obtener un 2 en dígito 2 dado que dígito 1 ya fue 1.

p(d2=2|d1=1) != p(d1=2)*p(d1=1)

Si detectas, por medio del estudio de datos anteriores, que tienes un proceso que no es del todo aleatorio, y que hay cierta tendencia, entonces a simular se ha dicho para tratar de ajustar un modelo para el sistema.

Un libro muy bueno con respecto a esto es el de Probabilistic Graphical Models: Principles and Techniques de Daphne Koller y Nir Friedman.

Por eso mi ejemplo de la generación de los dígitos por medio de esferas que se encuentra en un recipiente. La posición inicial de cada esfera va a determinar la probabilidad de que salga o no del contenedor, pero también le afecta el choque con otras esferas, al igual que el choque con el recipiente.

Otro aspecto, es que aunque en apariencia todavía puede ser algo aleatorio, es sabido que la suma de variables aleatorias independientes con distribución uniforme, te da una distribución conocida como Irwin-Hall,tu tienes 6 variables aleatorias, que tentativamente son independientes.

Última edición por tsk fecha: 24-03-2018 a las 17:54:59.
Responder Con Cita