|
LOI de BENFORD ou Loi du premier chiffre significatif ou ex loi des nombres anormaux Curieux!
Ce sont toujours les mêmes chiffres qui sont privilégiés. La loi s'applique à de nombreuses collections de
nombres relatives à des phénomènes naturels. Elle dit que, contrairement à
l'intuition, le 1er chiffre non nul le plus fréquent est 1, pour
près du tiers des observations. Le chiffre 2 est plus fréquent que le 3, et
ainsi de suite. |
Anglais: Benford's Law or First digit law or leading digit
phenomenon
|
|||
Nous nous intéressons aux nombres de la vie courante: recensements démographiques, prix au supermarché,
cours de la bourse, taux de change,
facture de gaz, longueurs des fleuves, poids
atomiques, constantes
physiques, constantes
mathématiques, etc.
Nous observons le chiffre le plus à
gauche des nombres, celui de poids le plus fort dit chiffre le plus significatif. |
Curieusement
la probabilité de trouver un des chiffres de 1 à 9, à gauche d'un nombre,
n'est pas la même. Pour
chacun des neuf chiffres, la probabilité devrait être de 11,11% |
||
En 1881, Simon Newcomb
(1835-1909), un mathématicien et astronome, constate que les premières pages
des tables de logarithmes sont plus usées que les autres. Il formule une loi
qui tomba dans l'oubli.
Publication dans l'American Journal of Mathematics. |
PC
est la probabilité que le premier chiffre significatif soit c) Log = logarithme en base 10 Ce qui
donne les valeurs illustrées sur ce graphique: |
||
En 1938, Frank Benford, un
physicien américain, redécouvre une loi du même type. |
Sur
des milliers de données, Benford constate que le chiffre 1, en tant que
premier chiffre significatif, est présent dans 30% des cas. |
||
Observations sur des
milliers de données. |
Quel
que soit le domaine observé, les fréquences de chaque chiffre restent très
voisines. En
multipliant les valeurs, les fréquences sont conservées. Même
en changeant la base de numération, cette
propriété revient. |
||
La loi s'applique à des
mesures (nombres suivis d'une unité de mesure). |
Elle ne s'applique pas aux
données purement aléatoires comme le tirage
du loto. Elle ne s'applique pas non
plus à des données contraintes comme le
poids des humains, le quotient intellectuel
ou le record du saut à la perche … Un cas spécial d'exception:
les prix affichés du type 99 euros pour des raisons marketing. |
||
|
||
En 1961, Roger Pinkham
propose une explication. |
Si la
loi est valable pour des prix exprimés en euros comme en dollars, pour des
longueurs exprimées en mètres comme en yards … c'est qu'elle présente une
invariance d'échelle. |
|
Invariance d'échelle Explication du principe avec
l'exemple de la multiplication par 2. Les nombres commençant par
5, 6, 7, 8 et 9 multipliés par 2 produisent un 1. Celui-ci hérite de la somme
des probabilités de ces chiffres soit 30,07% et retrouve une probabilité
globale de 30%. Les autres chiffres, après
multiplication par 2, retrouvent, eux aussi, une probabilité voisine. Si les nombres sont multipliés par une constante
quelconque, la distribution du premier chiffre est conservée. |
|
|
|
||
Il faut attendre 1998, pour
que Hill en fasse la démonstration complète et satisfaisante. |
Soit P
la loi de distribution de la probabilité de ces chiffres (si elle existe). |
|
Elle est invariante par
changement d'échelle: |
P(a.x) = f(a).P(x) |
|
En décimal un nombre peut
s'exprimer en notation scientifique |
|
|
Le premier chiffre
significatif |
C
étant le premier chiffre de x. |
|
Trouver un invariant
d'échelle pour C |
C'est
trouver un invariant d'échelle pour x. Et
aussi pour son logarithme. |
|
Avec les logarithmes,
l'invariance se traduit par la conservation de la valeur en ajoutant une
constante. |
y = log x log ax = log a + log x = log a + y |
|
La seule distribution de
probabilités qui reste inchangée lors de l'addition d'une constante et la
distribution uniforme (équirépartie). Sur cette figure, on voit
que y est uniformément réparti entre log(1) = 0 et log(10) = 1. Nous sommes toujours en logarithmes
décimaux (base 10) |
||
La probabilité que C vaille 1 est égale à: |
|
|
Il s'agit d'un calcul d'intégrale: |
|
|
Cas général |
|
|
Et son intégrale, où on
retrouve la formulation indiquée en début de page. |
|
|
Internet
donne de nombreux exemples d'expériences sur ce thème. La Loi de Benford
étant une loi statistique, plus il y a d'échantillons et plus on se rapproche
des valeurs théoriques. La
loi est présente à un point que certains l'utilisent pour détecter des fraudes.
Des déclarations avec trop de 5, 6 ou 7 déclenchent une alerte. D'autres
applications sont à l'étude. |
La probabilité des chiffres suivants se calcule sur le même
principe
|
|
Benford’s law: a quirky law based on the number of times a particular digit occurs
in a particular position in numbers. The law is based on a peculiar observation that certain digits appear more
frequently than others in data sets. For example, in certain data sets, it has been observed that more than
30% of numbers begin with the digit one. Using the Benford's formula, the probability that the first digit of a
number is one is about 30 percent while the probability the first digit is a
nine is only 4.6 percent. Table above shows the expected frequencies for all
digits 0 through 9 in each of the first four places in any number.
|
Suite |
Loi de
l'étalement uniforme de la partie fractionnaire
Chiffres – Index |
Voir |
|
Livre |
Une
explication pour la loi de Benford – Jean-Paul Delahaye – Pour la
Science - n°489 – Juillet 2018 |
Sites |
Loi de Benford –
Wikipédia
Quel
est le début de ce nombre ? L'étrange loi de Benford – Images de Maths
CNRS – Élise Janvresse – 2009
Loi
de Benford – Science et Avenir – Avner Ber-Hen – 2016
Benford's Law –
Wolfram MathWorld
Benford's Law
– Adrien Jamain – Imperial College of London – 2001 – 69 pages |
Cette page |