|
LOI de BENFORD ou Loi du premier chiffre significatif ou ex loi des nombres anormaux
La loi s'applique à de nombreuses collections de
nombres relatives à des phénomènes naturels. Elle dit que, contrairement à
l'intuition, le 1er chiffre non nul le plus fréquent est 1, pour
près du tiers des observations. Le chiffre 2 est plus fréquent que le 3, et
ainsi de suite. |
Anglais: Benford's Law or First digit law or leading digit
phenomenon
|
|||
|
Curieusement
la probabilité de trouver un des chiffres de 1 à 9, à gauche d'un nombre,
n'est pas la même. Pour
chacun des neuf chiffres, la probabilité devrait être de 11,11% |
||
|
PC
est la probabilité que le premier chiffre significatif soit c) Log = logarithme en base 10 Ce qui
donne les valeurs illustrées sur ce graphique: |
||
En 1938, Frank Benford, un
physicien américain, redécouvre une loi du même type. |
Sur
des milliers de données, Benford constate que le chiffre 1, en tant que
premier chiffre significatif, est présent dans 30% des cas. |
||
Observations sur des
milliers de données. |
Quel
que soit le domaine observé, les fréquences de chaque chiffre restent très
voisines. En
multipliant les valeurs, les fréquences sont conservées. Même
en changeant la base de numération, cette
propriété revient. |
||
La loi s'applique à des
mesures (nombres suivis d'une unité de mesure). |
Elle ne s'applique pas aux
données purement aléatoires comme le tirage
du loto. Elle ne s'applique pas non
plus à des données contraintes comme le
poids des humains, le quotient intellectuel
ou le record du saut à la perche … Un cas spécial d'exception:
les prix affichés du type 99 euros pour des raisons marketing. |
||
|
||
En 1961, Roger Pinkham
propose une explication. |
Si la
loi est valable pour des prix exprimés en euros comme en dollars, pour des
longueurs exprimées en mètres comme en yards … c'est qu'elle présente une
invariance d'échelle. |
|
Invariance d'échelle Explication du principe avec
l'exemple de la multiplication par 2. Les nombres commençant par
5, 6, 7, 8 et 9 multipliés par 2 produisent un 1. Celui-ci hérite de la somme
des probabilités de ces chiffres soit 30,07% et retrouve une probabilité
globale de 30%. Les autres chiffres, après
multiplication par 2, retrouvent, eux aussi, une probabilité voisine. Si les nombres sont multipliés par une constante
quelconque, la distribution du premier chiffre est conservée. |
|
|
|
||
Il faut attendre 1998, pour
que Hill en fasse la démonstration complète et satisfaisante. |
Soit P
la loi de distribution de la probabilité de ces chiffres (si elle existe). |
|
Elle est invariante par
changement d'échelle: |
P(a.x) = f(a).P(x) |
|
En décimal un nombre peut
s'exprimer en notation scientifique |
|
|
Le premier chiffre
significatif |
C
étant le premier chiffre de x. |
|
Trouver un invariant
d'échelle pour C |
C'est
trouver un invariant d'échelle pour x. Et
aussi pour son logarithme. |
|
Avec les logarithmes,
l'invariance se traduit par la conservation de la valeur en ajoutant une
constante. |
y = log x log ax = log a + log x = log a + y |
|
La seule distribution de
probabilités qui reste inchangée lors de l'addition d'une constante et la
distribution uniforme (équirépartie). Sur cette figure, on voit
que y est uniformément réparti entre log(1) = 0 et log(10) = 1. Nous sommes toujours en logarithmes
décimaux (base 10) |
||
La probabilité que C vaille 1 est égale à: |
|
|
Il s'agit d'un calcul d'intégrale: |
|
|
Cas général |
|
|
Et son intégrale, où on
retrouve la formulation indiquée en début de page. |
|
|
Internet
donne de nombreux exemples d'expériences sur ce thème. La Loi de Benford
étant une loi statistique, plus il y a d'échantillons et plus on se rapproche
des valeurs théoriques. La
loi est présente à un point que certains l'utilisent pour détecter des fraudes.
Des déclarations avec trop de 5, 6 ou 7 déclenchent une alerte. D'autres
applications sont à l'étude. |
La probabilité des chiffres suivants se calcule sur le même
principe
|
|
Benford’s law: a quirky law based on the number of times a particular digit occurs
in a particular position in numbers. The law is based on a peculiar observation that certain digits appear more
frequently than others in data sets. For example, in certain data sets, it has been observed that more than
30% of numbers begin with the digit one. Using the Benford's formula, the probability that the first digit of a
number is one is about 30 percent while the probability the first digit is a
nine is only 4.6 percent. Table above shows the expected frequencies for all
digits 0 through 9 in each of the first four places in any number.
|
Suite |
|
Voir |
|
Livre |
|
Sites |
|
Cette page |