Для чего нужен закон Бенфорда? – 06.02.2021 – Марсело Виана

Читатель любезно прислал мне исследование 2011 года, в котором закон Бенфорда, примененный к экономическим данным из стран Европейского Союза, вызвал подозрения в манипулировании данными из Греции, что позже было официально подтверждено.

Закон, открытый С. Ньюкомбом в 1881 г. и Ф. Бенфордом в 1937 г., гласит, что в самых разных типах данных вероятность того, что начальная цифра (слева) равна d, определяется десятичным логарифмом (1 + 1 / д). Этот шанс уменьшается с увеличением числа: для d = 1 он составляет 30,1%, а для d = 9 – только 4,6%.

Мы не знаем, почему этот закон работает, но это полезный инструмент для выявления всех видов мошенничества, а не только бухгалтерского учета. Он используется, например, для аудита данных, представленных в научных статьях: в аутентичных статьях информация соответствует закону Бенфорда, но не в «сфабрикованных» работах.

Соответствие законодательству должно применяться независимо от используемой единицы измерения (например, дюйм, метр или световой год), хотя числа сильно различаются в зависимости от единицы измерения. Это означает, что даже если “качество изготовления” устройства, использованного в изделии, идеально, его все равно можно определить, просто заменив его.

Еще одно свойство, затрудняющее обмануть закон Бенфорда, заключается в том, что он выполняется в любой системе счисления: если мы заменим 10 на другое основание, b, вероятность того, что исходной “цифрой” будет d, определяется логарифмом (1 + 1 / d ) на этом основании b.

Кроме того, существуют обобщения, которые дают шансы первых двух цифр, первых трех цифр и т. Д. Они были применены к результатам выборов в Бразилии и других странах и дали интересные результаты. Но расхождения с законом также могут быть связаны с «полезным голосованием» и другими законными позициями электората, а не с мошенничеством.

Закон Бенфорда даже использовался для выявления поддельных пользователей в социальных сетях. Идея состоит в том, чтобы проанализировать количество фолловеров у фолловеров пользователя: тысячи «ботов» уже идентифицированы, потому что количество фолловеров их фолловеров не соответствовало положениям закона.

Еще одно интересное приложение – обнаружение «фальшивых» изображений в Интернете. Фотографии представлены в виде чисел (обычно b = 16), что соответствует закону Бенфорда. Но когда фото редактируют и снова сохраняют, закон нарушается. Таким образом, отклонение файла jpg или gif от закона Бенфорда сигнализирует о том, что в исходной фотографии могло быть изменение, хотя одно отклонение не может сказать, что это было за изменение.

НАСТОЯЩАЯ ССЫЛКА: Вам понравилась эта колонка? Подписчик может выпускать пять бесплатных просмотров по любой ссылке в день. Просто нажмите на синюю букву F.

Back to top button