Définition

 

Le but principal de la statistique est de déterminer les caractéristiques d'une population donnée à partir de l'étude d'une partie de cette population, appelée "échantillon".

 

Statistique nom féminin (allemand Statistik ; du latin status, état)
1. Ensemble de méthodes mathématiques qui, à partir du recueil et de l'analyse de données réelles, permettent l'élaboration de modèles probabilistes autorisant les prévisions.
2. Tableau numérique d'un phénomène se prêtant à l'analyse statistique. Statistique de la natalité

Définition Larousse

 

Étapes de l'analyse statistique

 

Cinq étapes typiques de la pratique de la statistique:

 

1     Définition des unités statistiques, des variables, sur lesquelles on va opérer: caractères comme la température, la taille, la rémunération, les notes …

2     Recueil des données: mesures, enquêtes, sondages, échantillonnage …

3     Présentation des données sous forme de tableaux, de courbes, de graphiques …

4     Caractérisation de ces données par des paramètres. statistiques caractéristiques: moyenne, médiane, mode, écart-type …

5     Extraction des conclusions: bilan narratif, modélisation, expression de tendances, test des hypothèses, recherche de lien entre caractères, de corrélations …

 

 

Le traitement des données s'appelle la statistique descriptive (étapes 1 à 4); l'interprétation des données s'appelle l'inférence statistique ou statistique inférentielle (étape 5).

 

 

Termes principaux

 

 

 

Jargon!

Voir Suite

 

 

Anglais

 

*        Statistics: figures giving information about something; the study of such figures.

 

*        Statistic: a function of a sample; in other words, a quantity calculated from a set of observations. Often a statistic is an estimator for a population parameter.

 

For example, the sample mean, the sample median and the sample variance are each a statistic.

The sum of observations in a sample is also a statistic, but this is not an estimator.

 

En savoir plus

 

*  StatistiquesDébutant

*  Probabilités et statistiquesIndex

*  Probabilités

*  Dénombrement

 

Cette page

http://villemin.gerard.free.fr/Referenc/Vocabula/GlosS/Statisti.htm

 

 

La statistique est moins une science qu'un art. Elle est la poésie des nombres. Chacun y trouve ce qu'il y met.                  Albert Brie

Voir Pensées & humour

 

 

Bellydancing Bellydance Bellydancers

 

 

 

 

Vocabulaire de base du domaine de la statistique

 

 

Caractère Variable

 

*        Le caractère est la grandeur sur laquelle porte la statistique:

Âges dans une population, profondeurs dans une mer donnée, notes dans une classe, rémunération des grands patrons, prix d'achat d'un appartement dans une région …

 

Caractère quantitatif: le prix d'un objet, la hauteur des arbres ou tout autre critère d'étude en statistique auquel on peut donner une valeur; un caractère quantitatif peut être:

- soit discret (ex: pointure des chaussures);

- soit continu (ex: tension mesurée aux bornes d'une pile).


Caractère qualitatif: ce sont des noms et pas des nombres; ex: les produits d'un magasin, le sexe d'une population, la couleur d'objets, la nationalité …

 

*        Caractère est le mot général; un caractère quantitatif  est aussi baptisé variable statistique.

 

 

Population

Échantillon

Effectif

 

*        La population est l'ensemble des éléments soumis à une étude statistique.

 

*        L'échantillon est l'ensemble des éléments effectivement choisis pour contribuer à l'étude statistique.

 

*        L'effectif d'un caractère (ou d'une variable) est le nombre d'éléments pour lequel le caractère a une valeur donnée.

 

*        L'effectif total est le nombre d'éléments soumis à la statistique; c'est la somme des effectifs de toutes les valeurs du caractère.

 

*        L'effectif cumulé d'un caractère est le nombre d'éléments pour lequel le caractère a une valeur inférieure ou égale à une valeur donnée; c'est la somme des effectifs de toutes les valeurs du caractère inférieures ou égales à une valeur donnée.

 

Exemple: les chaussures de la famille

Pointure 37

1

 

Pointure 39

3

Effectif "pointure 39" = 3

Pointure 40

1

Effectif cumulé "pointure 40" = 5

Pointure 43

2

 

 

 

Effectif total = 7

 

*        L'effectif d'une classe, dans le cas d'un caractère continu, est l'effectif d'un caractère choisi dans un intervalle donné (une classe).

 

 

Série

Étendue

 

*        Une série statistique est la liste de toutes valeurs étudiées.

 

*        L'étendue de la série est la différence entre la plus grande valeur et la plus petite.

 

Fréquence

 

*        La fréquence donne le taux de présence d'un effectif par rapport à l'effectif total; c'est le quotient de l'effectif d'un caractère donné sur l'effectif total.

C'est une valeur comprise entre 0 et 1 qui peut aussi être exprimée sous la forme d'un pourcentage.

 

Exemple:

La fréquence de la pointure 40 est de 1 sur 7 soit 0,14 ou 14%.

 

*        Pour une modalité (valeur) d'un caractère, la fréquence est le rapport entre l'effectif  de la modalité et l'effectif total.

 

Moyenne

Médiane

Mode

 

*        La Moyenne représente le caractère moyen; c'est la moyenne arithmétique des caractères (longueur, salaire …).

 

Exemple:

Trois individus de 1,70m, 1,73m et 1,92 m, la moyenne est 1,78 m (somme des 3 valeurs divisée par 3).

 

*        La Médiane partage la population en deux parties de même effectif: 50% des individus ont une valeur du caractère (taille, âge …) inférieure ou égale à la médiane, et 50% une valeur supérieure ou égale à la médiane.

 

*        Mode: individu le plus fréquent; en statistique, le mode (ou la classe modale) est la valeur (ou la classe de valeurs) de X  pour laquelle l'effectif (ou la fréquence) est maximal(e). C'est la donnée la mieux représentée.

 

Voir Moyennes (statistiques) / Moyennes en général

 

Variance Écart-type

 

*        Variance: différence entre la moyenne des carrés E[X²] et carré de la moyenne E[X]²

*        Écart-type: racine carrée de la variance. Caractérise la dispersion autour de la moyenne. Nombre positif noté  (sigma).

 

Ces valeurs sont appelées paramètres de dispersion.

Ils permettent d'évaluer les écarts des valeurs des caractères par rapport à la moyenne

Plus l'écart-type est grand plus la dispersion est grande.

Note: l'étendue est aussi un paramètre de dispersion. Quant à la moyenne, la médiane, le mode et les quartiles, ce sont des paramètres de tendance.

 

 

Distribution

 

*        Distribution: Ensemble des valeurs, modalités ou classes d'une variable statistique, et des effectifs ou fréquences associées. La distribution de probabilité est la distribution des valeurs (xi)  de la variable aléatoire X et de leurs probabilités (pi).

*        Loi de probabilité: une loi de probabilité décrit le comportement aléatoire d'un phénomène dépendant du hasard. Ex: Loi de Poisson.

*        Processus: Une loi de probabilité est une distribution définie par trois paramètres:

*    un processus aléatoire d'épreuve (la manière de s'y prendre, d'opérer les tirages, de solliciter le hasard),

*    les résultats incompatibles deux à deux, et

*    les probabilités correspondantes: pi = Prob(xi).
 

 

Site

*      Glossaire multilingue des statistiques

Cette page

http://villemin.gerard.free.fr/Referenc/Vocabula/GlosS/Statisti.htm

 

Bellydancing Bellydance Bellydancers