Dans un premier temps, nous aborderons quelques définitions élémentaires de statistique, puis, nous verrons la différence entre les paramètres de position et de dispersion.
Dans un deuxième temps, nous expliquerons ce qu'est le test du CHI-2.
La statistique descriptive est une discipline qui étudie des ensembles de référence sur lesquels vont porter les observations. Ces ensembles de références s'appellent des populations.
Chaque élément constituant une population s'appelle un individu ou une unité statistique.
Lorsque la population à étudier est trop nombreuse ou impossible à observer dans sa totalité (la population française, par exemple), le statisticien choisit, selon certains critères, un sous-ensemble de la population appelé un échantillon
Pour recueillir des informations sur une population statistique, on dispose de deux méthodes:
Chaque individu de la population est étudié selon le ou les caractères étudiés.
Le statisticien conduit à n'examiner qu'une fraction de la population : un échantillon.
L'échantillonnage représente l'ensemble des opérations qui ont pour objet de prélever un certain nombre d'individus dans une population donnée.
Pour que les résultats observés lors d'une étude soient généralisables à la population statistique, l'échantillon doit être représentatif de cette dernière, c'est-à-dire qu'il doit refléter fidèlement sa composition et sa complexité. Seul un échantillonnage aléatoire assurera la représentativité de l'échantillon.
La méthode la plus connue en statistique descriptive est l'échantillonnage aléatoire simple. Cette méthode consiste à prélever au hasard et de façon indépendante, n individus ou unités statistiques d'échantillonnage d'une population composée de N individus.
Ainsi, chaque individu possède la même probabilité de faire partie d'un échantillon de n individus et chacun des échantillons possibles de taille N possède la même probabilité d'être constitué. L'échantillonnage aléatoire simple assure l'indépendance des erreurs, c'est-à-dire l'absence d'auto corrélations parmi les données relatives à un même caractère. Cette indépendance est indispensable à la validité de nombreux tests statistiques.