Le but de ce DM est de vérifier que vous avez compris les principales étapes à suivre lorsque l’on analyse un jeu de données.

Pour cela, vous appliquerez la démarche de statistiques descriptives vue en cours aux divers jeux de données proposés:

À chaque étape, vous justifierez que ce que vous calculez ou affichez a bien du sens. Le cas échéant, si le jeu de données ne satisfait pas les hypothèses attendues, vous essayerez de vous restreindre à un sous-ensemble du jeu de données en justifiant vos choix. Si vous avez l’impression qu’il y a plusieurs régimes (successifs ou supperposés), vous séparerez les deux régimes et les analyserez séparément.

On rappelle les différentes fonctions de base de R qui pourront vous êtres utiles: str, summary, mean, diff, sort, var, sd, plot, plot.ts, hist, boxplot.

Récupération des jeux de données

On distingue, ici, une courbe plutôt plausible du taux de réussite d’accès à un cache. En effet le processeur peut assez souvent faire des défauts de cache s’il cherche à accèder à une valeur qui n’est pas dans le cache. Ici le taux même s’il est plausible paraît quand même un peu bas (environ 50% à vue d’oeil). Essayons sans les 6 premières valeurs qui sont responsable du trou que l’on a en début de courbe.