DM Probabilites & Simulations : Vignettes Panini

Tout d’abord, on initialise notre DM en fixant le noyau

set.seed(16)

APPROCHE EXPERIMENTALE

QUESTION 1 : SIMULATEUR GENERANT T EN FONCTION DE M

Afin de simuler un album, nous avons décidé de le représenter sous forme d’un vecteur de taille 300 (chaque indice représentant une carte). Au début toutes les valeurs de chaque indice sont à 0. Nous allons ensuite générer un nombre entre 1 et 300 (une carte), et nous allons passer de 0->1 la valeur du vecteur à l’indice du nombre tiré. Nous incrémentons un compteur, tant que toutes les valeurs du vecteur ne sont pas à 1.

bookbook <- function(M){
book =rep(0,M)
    i<-0
    while (min(book)<1){
        book[sample(1:M,1)] <- 1
        
        i<-i+1
        }
    return (i)
  }
  r<-bookbook(M=300)

## [1] 1473

QUESTION 2 :

Nous avons choisi de faire 100 echantillons pour chaque valeurs de M(10–>300 par pas de 10)

nb<-1
c<-0
res<-0
resM<-0
while(c<300){
  c<-c+10
  nb<-0
  while (nb<=100){
    resM[nb]<-bookbook(M=c)
    nb=nb+1
  }
res[c]<-mean(resM)
}
plot (res)

plot of chunk unnamed-chunk-4

On peut voir graphiquement que les résultats évoluent de façons croissantes.

==> LOI LINEAIRE UNIFORME

MODELISATION

QUESTION 3:

D’après le cours et l’énoncé, les hypothèses statistiques sur la suite des variables Xn que l’énoncé nous sugère :

Variables aléatoires(l’album panini possède 300 vignettes DISTINCT),
Indépendantes (on ne connait pas les vignettes lors de l’achat),
Identiquement distribuées (les vignettes sont imprimer dans les memes proportions).
Une loi uniforme sur 0…M

QUESTION 4 :

On sait que P(Yi=k) correspond à la probabilité d’avoir une nouvelle vignette en k achat, sachant que l’on en a déjà i-1. M étant le nombre total de vignette.

Nous avons commencé par calculer :

P(Y1=1)=1 (probabilité d’obtenir une nouvelle vignette quand l’album est vide)

P(Y2=1)= 1-(1/M) = (M-1)/M (probabilité d’obtenir une nouvelle vignette sachant qu’on en a deja 1)

P(Y3=1)= (M-2)/M (probabilité d’obtenir une nouvelle vignette sachant qu’on en a deja 2)

P(Y4=1)= (M-3)/M etc…

==>On en conclut que la probabilité d’obtenir une nouvelle vignette sachant qu’on en possède i-1 est de : P(Yi=1) = (M - (i-1)) / M

Nous avons donc déja trouvé que la probabilité d’obtenir une nouvelle vignette sachant qu’on en a i-1 dans l’album.

Nous pouvons à présent calculer la probabilité d’un echec : 1 - P(Yi=1)

Nous devons acheter soit une vignette(succès) soit 2(échec, succès) soit 3(échec, échec, succès)… jusqu’à n (n-1echec, succès) toutes les vignettes étant achetées de façon indépendantes

On peut donc en conclure que Yi suit une LOI GEOMETRIQUE de parametre P(Yi=1) = (M - (i-1)) / M

Nous sommes dans un cas où nous achetons une vignette dont la probabilité de succès est de P et celle d’échec est de Q. (Loi de Bernoulli)

Dans notre cas nous allons renouveler (tant qu’il y a échec) Bernouilli de manière indépendante jusqu’à l’achat d’une nouvelle carte (suces)

Donc pour que P(Yi=k) arrive à un succès il faut qu’il y ait k-1 échec(d’où le (1-P(Yi=1))^(k-1)

On peut donc maintenant calculer

P(Yi=k) = (1-P(Yi=1))^(k-1) * P(Yi=1) = ((i-1)/M)^(k-1) * (M - (i-1)) / M

P_Yi_Eqls_K <- function(i,k,M){
  pi <- (M-(i-1))/M
  Proba <- ((1-pi)^(k-1))*pi
  Proba
}
print(P_Yi_Eqls_K(i=1,k=1,M=300))

## [1] 1

Par définition de la loi géometrique son Espérence et sa variance :

E(Yi)= 1/P(Yi=1) = M / (M - (i-1))
V(Yi) = (1-P(Yi=1)) / (P(Yi=1))^2 = ((i-1)/M) * (M / (M - (i-1)))^2

Les variables Yi sont par définitions, indépendantes, puisque nous avons à faire à une loi Geometrique.

Maintenant nous allons calculer E(T) et V(T), commencons par E(T) :

E(T)= E * ∑(i=1->300)[Yi]

Quand M devient très grand nous pouvons utilisé une linéarité de l’espérence ce qui nous donne :

E(T)=∑(i=1->300)[E(Yi)]

⟺E(T)= M * ∑(i=1->300)[1 / (M - (i-1))]

Avec l’aide de Wikipedia.fr nous en avons déduit que :

⟺ Quand M est tres grand alors nous obtenons : E(T)=M∗(log(M)+y)

Et la variance V(T): avec l’aide de Wikipedia.fr

V(T)=V(∑(i=1->M)[Yi]) = ∑(i=1->M) [V(Yi)] + 2 ∗ ∑1≤iM) [V(Yi)] ≤ ∑(i=1->M) [(M^{2)/(M−(i−1))}2] = M^2∗∑(i=1->M)[1/(M−(i−1))^2]

Quand M est très grand alors V(T) tend vers : (M^2) ∗ (π/6)

SYNTHÈSE

QUESTION 5 :

Ci dessous nous simulons E(T)

EdeT <- function(M){
  Ey=0
  resRes<-0
  for (i in 1:M){
    Ey<-0
    for (j in 1:i){
        Ey<-Ey+(i/(i-(j-1)))
        }
    resRes[i]<-Ey
  }
  plot(resRes)
  }

EdeT(M=300)

plot of chunk unnamed-chunk-7

Ci dessous nous simulons V(T)

VdeT <- function(M){
  Vy=0
  resRes<-0
  for (i in 1:M){
    Vy<-0
    for (j in 1:i){
        Vy<-Vy+(i*(j-1))/((i-j+1)^2)
        }
    resRes[i]<-Vy
  }
  plot(resRes)
  }

VdeT(M=300)

plot of chunk unnamed-chunk-9

Conclusion On peut donc voir graphiquement que l’on retombe sur les mêmes résultats que lors des précedents calculs, en effet, nous avons pour E(T) quasiment une droite, cependant on remarque, comme on a pu le montrer à la question 4 qu’un log apparait.

La variance au niveau graphique et algébrique sont en parfaite harmonies.

QUESTION 6:

On chercher donc le nombre moyen de vignettes à acheter afin de remplir l’ensemble du carnet se qui revient donc à calculer l’espérance :

E(T)= SOMME(i=1–>M, E(Yi)) soit 1884,799. Les vignettes ne se vendent que par paquet de 10 donc il faut 1890 vignette donc 189 paquets. Sachant qu’un paquet coute 2euros

Il devras débourser : 2 * 189 + Album = 378 + 4 = 382 EUROS

EXTENSION AU CAS NON UNIFORME

QUESTION 7.1:

Dans un premier temps nous allons calculer la probabilité Pi:

NewProb <- function(M,i){
  p<-0
  a<-0
  for(k in 1:M){
        a=a+(1/k)
        }
  
 p<-1/(a*i)
 return (p)
  }

Puis nous allons sur le meme principe que la question 1, générer non uniformément un nombre aléatoire, grâce à la fonction sample et au tableau de proba que nous avons généré prenant en compte Pi

Newbookbook <- function(M){
  proba<-0
  for(k in 1:M){
  proba[k]<-NewProb(M=300,i=k)
}
newbook =rep(0,M)
    i<-0
    while (min(newbook)<1){
        newbook[sample(seq(1, 300), 1, prob = proba)] <- 1
        
        i<-i+1
        }
    return (i)
  }
 r1<-0
for (j in 1:100){
  r1[j]<-Newbookbook(M=300)
}
plot(r1)

plot of chunk unnamed-chunk-11

print (mean(r1))

## [1] 8431

On peut voir graphiquement grâce à cette expérience qu’il y a un grand écart type. Pour trouver les 300 vignettes, il nous faut entre 2000 et plus de 15000 achat. On peut aussi voir que la moyenne est d’environ 8200 sur 100 test

QUESTION 7.2:

Nous avons fait de même pour cette question, à l’exeption de Pi que nous avons modifié.

NewProb2 <- function(M,i){
  p<-0
  a<-0
  for(k in 1:M){
        a<-a+(1/(k*k))
        }
  
 p<-1/(a*i*i)
 return (p)
  }

Newbookbook2 <- function(M){
  proba2<-0
  for(k in 1:M){
  proba2[k]<-NewProb2(M=300,i=k)
}
newbook2 =rep(0,M)
    i<-0
    while (min(newbook2)<1){
        newbook2[sample(seq(1, 300), 1, prob = proba2)] <- 1
        i<-i+1
        }
    return (i)
  }
 r2<-0
for (j in 1:60){
  r2[j]<-Newbookbook2(M=300)
}
plot(r2)

plot of chunk unnamed-chunk-13

print (mean(r2))

## [1] 546353

On voit que moyenne très nettement supérieur à précédemment.

CONCLUSION On remarque qu’il est beaucoup plus difficile de trouver l’ensemble des vignettes si celle ci ne sont pas fabriquer dans les mêmes proportions. Plus l’écart de probabilité est important entre celle qui a le moins de chance de sortir et celle qui en a le plus, plus il faudra acheter des vignettes

QUESTION 8 :

Pour cette simulation, nous trouverons un nombre très supérieur à 600 312 que nous avions trouvé précédemment. Il sera presque impossible d’avoir toute la collection de carte.

Cela est très intéressant pour le vendeur… bien moins pour le client,qui n’arrivera pas à finir son album.

DM Probabilites & Simulations : Vignettes Panini

Sébastien TOUSSAINT & Thibault SAUSSAC

19 octobre 2014

APPROCHE EXPERIMENTALE

MODELISATION

SYNTHÈSE

EXTENSION AU CAS NON UNIFORME