Au départ de l’analyse statistique, il y a en général une population composée d’unités statistiques. Pour chacune de ces unités, un travail de recueil de données sur les divers caractères que l’on souhaite étudier, a été effectué.
Ces informations sont désormais dans la plupart des cas disponibles sous forme informatisée dans ce que l’on appelle couramment une base de données. Cette base de données n’est finalement qu’un tableau exhaustif dans lequel chaque ligne indique la ou les valeurs, ainsi que, le cas échéant, la ou les modalités d’une unité statistique de la population.
Si l’on fait abstraction de la première ligne du tableau, qui contient le nom des unités statistiques (ou leur identificateur), ainsi que le nom des caractères pour lesquels des données ont été recueillies, le nombre de lignes est égal à la population statistique.
Par exemple, si l’on définit comme population les 27 pays de l’UE, chaque pays devient une « unité statistique » et est caractérisé par des modalités (ici : le nom du pays(Le nom du pays est l’identificateur de l’unité statistique mais rien n’empêche de le considérer également comme un caractère.) et la monnaie utilisée) et des valeurs (superficie, année d’adhésion à l’UE, etc.).
On est donc en présence d’une petite base de données. De fait, pour que les données relatives à une population statistique puissent être matériellement représentées sous forme d’un tableau exhaustif, il faut :
- Que le nombre d’unités statistiques soit relativement limité. Bien qu’il n’existe pas de règles en cette matière, il est clair que ce type de tableau devient difficile à lire quand le nombre de lignes ne tient pas sur une seul page.
- Que le nombre de caractères (ou « dimensions ») soit relativement limité. Bien qu’il n’existe pas de règles en cette matière, il est clair que ce type de tableau devient difficile à lire quand le nombre de colonnes (dimensions) ne tient pas sur une seul page.
Dans les deux tableaux suivants, chaque unité statistique est « décrite » par une ligne. Cette description comprend :
- Le cas échéant (mais pas nécessairement), un identificateur tel que le nom du pays, du client, du produit, de l’étudiant, etc. L’identificateur peut être absent du tableau lorsqu’il n’est pas nécessaire pour l’étude statistique. Le caractère confidentiel des informations n’empêche pas la présence d’un identificateur tel que code, etc.
- Les valeurs des caractères quantitatifs associés à cette unité (par exemple les notes).
- Les modalités des caractères qualitatifs associés à cette unité (par exemple le groupe de TD ou le sexe).
Tableau 1 : tableau exhaustif ou (mini) base de données
Ci-après, un autre exemple de tableau exhaustif.
Tableau 2 : les notes de chacun des 50 étudiants dans la matière x, la matière y, ainsi que le groupe de TD et le sexe