Intuicyjnie wydaje się, że każda z cyfr od 1 do 9 ma równe szanse na wystąpienie na początku jakiejkolwiek wartości liczbowej. Jest jednak pewna reguła zwana rozkładem Benforda, która określa rozkład prawdopodobieństwa występowania określonej cyfry w wielu rzeczywistych wielkościach. Rozkład sprawdza się w przypadku zbiorów, które mogą przyjmować różne rzędy wielkości jak dane geograficzne (np. powierzchnie, liczba ludności, długości rzek), dane fizyczne (np. masy atomowe, wartości stałych fizycznych), ciągi geometryczne, ciąg Fibonacciego, rozkład głosów w wyborach, dane ekonomiczne, księgowe czy podatkowe.
Chociaż prawo nosi nazwę Benforda, prawidłowość ta została zaobserwowana niezależnie przez Simona Newcomba w 1881 roku oraz Franka Benforda w 1938 roku. Obaj dokonali tego samego odkrycia na podstawie stanu czystości tablic logarytmicznych, których strony były brudniejsze na pierwszych kartkach. Wywnioskowali, że korzystający z tablic logarytmicznych częściej szukają liczb rozpoczynających się od niższych cyfr – te znajdują się na początku tablic. Odkrycie Newcomba, pomimo publikacji na łamach “American Journal of Mathematics”, nie spotkało się z większym zainteresowaniem.
Frank Benford, inżynier General Electric nie zdając sobie sprawy z istnienia pracy Newcomba, dokonał tego samego odkrycia i zafascynowany tym zjawiskiem zaczął sprawdzać, czy jego teoria znajduje potwierdzenie również w innych zbiorach danych, m.in. w powierzchniach rzek, liczbach drukowanych w gazetach, czy nawet cenach. Wyniki swoich badań przedstawił w artykule wydrukowanym w “Proceedings of the American Philosophical Society”. Podobnie jak w artykule Newcomba, formalny dowód nie został przedstawiony.
Benford opisał w artykule zjawisko dotyczące częstotliwości występowania cyfr na pozycjach znaczących w liczbach pochodzenia naturalnego (zaobserwowanych w przyrodzie – nie generowanych sztucznie). Zjawisko to nazwał prawem pierwszej cyfry (ang. First Digit Law).
Według tej reguły, prawdopodobieństwo wystąpienia cyfry 1 wynosi 30,10%, podczas, gdy cyfry 9 – jedynie 4,58%.
Pierwsza cyfra | Częstość |
1 | 30,1% |
2 | 17,6% |
3 | 12,5% |
4 | 9,7% |
5 | 7,9% |
6 | 6,7% |
7 | 5,8% |
8 | 5,1% |
9 | 4,6% |
Rozkład Benforda znajduje coraz częściej zastosowanie do wykrywania defraudacji oraz nieprawidłowości w sprawozdaniach finansowych, deklaracjach podatkowych czy operacjach finansowych. Może być również ważnym narzędziem w pracy kontrolera NIK, a także audytora, prokuratora czy służb śledczych. Ludzie wpisując liczby tak, żeby wydawały się przypadkowe, nie są świadomi, że pewne cyfry występują częściej na pierwszej pozycji.
Oczywiście nie wszystkie odchylenia od rozkładu Benforda muszą od razu świadczyć o nieprawdziwości danych. Do weryfikacji używa się najczęściej cyfr 1 i 2 – liczb zaczynających się od nich powinno być najwięcej oraz cyfr 7, 8 i 9 – liczb zaczynających się od nich powinno być najmniej.
Prawo to jest w szczególności wykorzystywane do testowania dużych zestawów transakcji, dotyczących wielu aspektów danych u różnych klientów, a dotyczyło one najczęściej: transakcji gotówkowych, kont należności, zapasów i zobowiązań.
Jednym z pionierów i specjalistą w stosowaniu prawa Benforda do analizy śledczej (forensic analytics) danych księgowych i finansowych jest Amerykanin Mark Nigrini. W swoich pracach pokazał praktyczne zastosowanie prawa Benforda do wykrycia oszustw i nadużyć dokonywanych najczęściej przez tak zwane białe kołnierzyki, na przykład przez fałszowanie sprawozdań finansowych, fikcyjne wydatki i płace, wyłudzanie odszkodowań, oszustwa w funduszach inwestycyjnych, uchylanie się od płacenia podatków.
BenfordfałszerstwoNewcombprawdopodobieństwoprawo benfordarozkład Benforda