LES STATISTIQUES DANS EXCELConférence sur les fonctions statistiques dans Excel |
![]() |
La statistique est une méthode d'analyse numérique des ensembles comportant un grand nombre d'éléments.
La méthode d'analyse statistique se caractérise par un certain nombre d'opérations logiques :
Le mot Statistique semblerait provenir de l'Allemagne du XVIIè siècle, et serait construit sur la racine latine « status » dans le sens d'état des affaires publiques.
La statistique descriptive se propose de classer les données, de les organiser et de les présenter de façon claire. Elle est essentielle à la conduite de l'entreprise tant par la représentation qu'elle permet des activités de celle-ci que par la connaissance qu'elle donne de son environnement.
La statistique descriptive est à la base de l'organisation du Système d'Information interne à l'entreprise. Elle aboutit à la constitution d'un véritable « tableau de bord » et est indispensable à l'établissement du contrôle budgétaire dans l'entreprise.
Une population est un ensemble d'unités statistiques ou d'individus étudiés par le statisticien. Chaque observation faite par celui-ci porte sur une unité statistique.
La population étudié doit être définie avec précision de façon à ce que les enquêteurs ou les différents intermédiaires qui concourent à l'observation des faits, interprètent toujours les instructions de la même façon.
Pour décrire quantitativement une population, on s'efforce de classer cette population en sous-ensembles. Cette opération aboutit à la confection de tableaux statistiques. Le classement peut se faire relativement à un ou plusieurs caractères.
Exemple : dans un tableau décrivant la population française on pourra retenir les caractères : sexe, âge, lieu de résidence, emploi etc.
Une étude statistique cherche donc à caractériser une population.
Le choix du caractère détermine le critère qui servira à classer les individus de la population. Le nombre de sous-ensembles correspond aux différentes situations (occurrences) possibles ou modalités de ce caractère.
Afin que le classement d'une unité statistique soit toujours possible, les différentes modalités d'un caractère doivent être incompatibles et exhaustives.
Incompatibilité : un individu ne peut appartenir à la fois à deux ou plusieurs modalités.
Exhaustivité : implique que tous les cas ont été prévus.
Un individu appartient à un, et à un seulement, des sous-ensembles définis par ces modalités.
L'étude d'une population selon 1 seul caractère conduit à l'élaboration d'un tableau statistique à une seule dimension :
Population Active | ||
---|---|---|
Population | Hommes | Femmes |
1.254 | 691 | 563 |
100 % | 55 % | 45 % |
Une population peut être étudiée suivant plusieurs caractères. Le nombre de sous-ensembles incompatibles et exhaustifs est égal au produit du nombre de modalités de chaque caractère.
Exemple : Le croisement du caractère « sexe » avec le caractère « état matrimonial » en deux postes à chaque fois donne naissance à un tableau statistique à deux dimensions comportant quatre cases correspondant aux sous-ensembles :
État matrimonial par sexe | ||
---|---|---|
État matrimonial |
Sexe | |
Hommes | Femmes | |
Mariés | Hommes mariés | Femmes mariées |
Non mariés | Hommes non mariés | Femmes non mariées |
Il est possible en théorie de croiser trois, quatre caractères… On obtient des tableaux statistiques à n dimensions. Mais dans la pratique on ne peut croiser un trop grand nombre de caractères : le nombre de cases du tableau augmente très vite et son utilisation devriendrait difficile. L'étude statistique est une simplification de la réalité sur laquelle repose son efficacité. Retenir un nouveau caractère revient à rendre progressivement à la réalité sa complexité et remet en cause la description chiffrée qu'offre l'étude statistique.
Un caractère qualitatif est un caractère dont les modalités échappent à la mesure. Elles ne peuvent être que constatées.
Exemples : l'armée d'appartenance, le statut, le métier d'un employé du Ministère de la Défense.
Les diverses modalités d'un caractère qualitatif constituent les rubriques d'une nomenclature ou classification. Ces rubriques doivent être exhaustives et incompatibles.
![]() |
Définition de la NACE |
![]() |
Exemple : Nomenclature statistique des Activités économiques dans la Communauté Européenne. |
![]() |
Télécharger le fichier NACE 2003 au format pdf. |
La nomenclature statistique des activités économiques dans la Communauté européenne (NACE) a été adoptée en 1990 afin d'établir une nomenclature statistique commune des activités économiques dans la Communauté européenne garantissant la comparabilité entre nomenclatures nationales et nomenclatures communautaires et, partant, entre statistiques nationales et statistiques communautaires.
Une version révisée de la NACE est en vigueur depuis le 1er janvier 2003 (NACE rév. 1).
Un caractère est quantitatif lorsqu'il est mesurable (ou repérable). À chaque unité statistique correspond alors un nombre qui est la mesure (la valeur) du caractère. C'est la variable statistique.
Les modalités du caractère sont les valeurs possibles de la variable statistique ou des regroupements de ces valeurs.
La variable statistique peut être discrète ou continue : les modes de représentation graphiques seront différents suivant que l'on étudie une variable discrète ou une variable continue.
Une variable statistique est discrète lorsqu'elle ne peut prendre que certaines valeurs isolées dans son intervalle de variation. Il s'agit en général, de valeurs entières.
Exemple :
Dans ce cas, les modalités peuvent être :
Une variable est continue lorsqu'elle peut prendre toutes les valeurs à l'intérieur de son intervalle de variation. Le nombre de valeurs possibles est toujours infini. Il est donc obligatoire de définir les modalités du caractère en regroupant en classes les valeurs possibles de la variable statistique.
Exemples de variables continues :
A contrario, voici des exemples de variable qui sembleraient être continues mais qui en fait sont discrètes :
Dans la réalité des faits, la distinction entre variables discrètes ou continues n'est pas toujours aisée. En effet, la précision d'une mesure est limitée et les résultats de celle-ci seront donc donnés sous forme discrète (l'accroissement de la taille des hommes, par exemple).
À l'inverse, lorsqu'une variable discrète peut prendre un grand nombre de valeurs possibles, deux valeurs voisines apparaîtront très proches l'une de l'autre et la variable sera considérée et traitée comme une variable continue.
Exemple : les revenus des ménages.
Dans la pratique, la distinction entre variables statistiques repose sur le fait que les valeurs se présentent ou non, groupées en classes.
Les classes de valeurs possibles qui constituent les modalités du caractère étudié, peuvent avoir une amplitude constante ou variable.
Exemples :
– 1 – La variable « âge » selon l'étude faite peut être découpée en différentes classes – souvent quinquennales, mais pas obligatoirement ! Voici un autre exemple classique : moins de 20 ans, de 20 à 64 ans, 65 ans et plus. Il est clair que la variable étudiée est la population active dans cet exemple.
0, 20, et 64 ans sont les extrémités de classe.
![]() |
– 2 – La variable « durée du chômage » pourra donner lieu aux classes suivantes :
moins de 1 mois ; 1 mois à moins de 3 mois ; 3 mois à moins de 6 mois ; 6 mois à moins de 1 an ; de 1 an à moins de 2 ans ; 2 ans et plus.
Les amplitudes sont de 1 mois pour la 1ère classe, 2 mois, 3 mois, 6 mois et 1 an pour les suivantes. La dernière classe est indéterminée.
Le choix du nombre de classes et de leur amplitude se fait en fonction de l'effectif de la population étudiée. Le choix des extrémités de classe doit être fait de façon rigoureuse afin qu'il n'y ait pas d'ambiguité !
Choix des extrémités de classe – Exemple effectif d'entreprise | |
---|---|
Libellé incorrect | Libellé correct |
|
|
Un tableau croisé dynamique permet d'effectuer facilement une synthèse des informations contenues dans un tableau ou dans une base de données Excel. Un Tableau Croisé Dynamique peut être accompagné d'un graphique croisé dynamique.
Les tableaux croisés dynamiques permettent de procéder à des synthèses et à de nombreuses autres opérations – principalement statistiques – à des fins d'exploitation. Ils permettent de créer des feuilles par une combinaison quelconque de lignes et de colonnes à partir d'un tableau ou d'une base de données. Il suffit de définir les informations qui seront portés respectivement dans les lignes et dans les colonnes.
Un assistant permet de réaliser ce type d'analyse très facilement (3 étapes) :
Appel de l'assistant Tableau et graphique croisé dynamique |
|
![]() |
|
|
|
Définir une plage de données à analyser | |
![]() |
|
|
|
![]() |
Remarque : Cette étape (<Disposition…>) n'est absolument pas obligatoire puisque vous pouvez modifier en temps réel votre tableau croisé dynamique… justement ! |
|
|
Mise en page du tableau croisé dynamique | |
![]() |
Cette étape requiert toute votre attention, car vous allez définir la mise en page, la structure du tableau croisé dynamique. La partie droite de la boîte de dialogue regroupe les boutons correspondant à diverses cellules du tableau des données. Chaque cellule du tableau a son bouton. Vous allez créer la structure du tableau croisé dynamique en positionnant ces boutons sur les trois champs du tableau suivants : |
Colonne :
|
Placez dans cette zone le champ qui servira à créer les étiquettes de colonnes, par exemple « Civilité ». |
Ligne : |
Placez ici le champs qui formera les étiquettes des lignes, par exemple « Catégorie ». |
Données : |
Cette zone est destinée aux champs de calcul et d'affichage des résultats, par exemple « Numéro d'adhérent ». |
|
|
Définition de la zone dynamique | |
![]() |
Dans cette étape vous allez définir l'emplacement du Tableau croisé dynamique. Vous pouvez place un tableau croisé dynamique dans la feuille de votre choix mais il est préférable de créer un tableau croisé dynamique sur une nouvelle feuille.
|
|
|
![]() |
Dans la plage de données, les nombres d'adhérents à une association ont été décompté selon les sexes et les statuts au sein de l'association. Enfin, les totaux sont également indiqués grâce à la fonction NB (nombre de…) portant sur la rubrique « Numéro d'adhérent ». Cette fonction peut être modifiée par une autre, comme par exemple :
|
L'ensemble des rubriques disponibles sont dans une palette flottante qu'il faut veiller à ne pas fermer par inadvertance ! |
|
Modifier le style numérique | |
Mes sources pour ce cycle de conférence furent :
- Statistique Descriptive
Bernard Grais. Modules économiques • Dunod •- Dictionnaire Electronique pour la Finance et l'Informatique (DEFI)
Thierry Feltz.
![]() |
![]() |
![]() |