数学中国

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 148|回复: 0

如果你还不知道这个数学定理,想用数据造假的话,你就死定了!

[复制链接]
发表于 2024-7-9 10:59 | 显示全部楼层 |阅读模式
如果你还不知道这个数学定理,想用数据造假的话,你就死定了!

原创 Masir123 科学羊 2024 年 06 月 07 日 07:21 广东

大家好,我是科学羊,这里是数学篇第五季第 04 篇,今天我们聊一个数学现象——本福特定律(Benford's Law)

本福特定律(Benford's Law),也称为第一位数字定律,是描述在现实生活中出现的数据集中第一位数字分布的一个数学定律。

根据本福特定律,较小的数字(如 1、2、3)作为数据的最高位出现的频率比较大的数字(如 8、9)出现的频率要高得多。

具体来说,数字 1 作为首位的概率大约是 30.1% ,而数字 9 作为首位的概率仅为 4.6% 。


首位数字 0~9 的概率分布

金融科学家们说:“数据就像是火山。海量的数据会导致危险的结果。

他们开发出一个模型,可以通过挖掘公司的海量数据来帮助投资者发现问题。

这个模型就是使用了 1938 年物理学家弗兰克·本福特发现的一个定律:“随机选择一些数字时,首位数为 1 的数字往往比首位数为 2 的数字更常见,首位数为 2 的数字比首位数为 3 的数字更常见(以 1 为首位数的数字,出现几率是抽取总数的三分之一)”。

也就是说,首位数越大,出现的机率越小。

所以,从财报中随机抽取一组数据,如果不符合本福特定律,那么这家公司可能从事了某种会计不合规行为。

本福特定律的发现

本福特定律最初是由天文学家西蒙·纽康在 1881 年发现的,纽康注意到在查阅对数表的书中,书的前几页比后几页磨损得更厉害,这启发他对数字的首位分布进行了统计,发现数字 1 作为首位出现的频率异常高。

这一现象后来由物理学家弗兰克·本福特在 1938 年重新发现并更为系统地研究。

本福特检验了多种不同来源的数据集,包括河流长度、国家人口、科学常数等,并发现这些数据集的首位数字分布符合相同的规律。

他提出了一个数学公式来描述这一现象:



其中,P(d) 是数字 d(从 1 到 9 )作为数据首位的概率。

生活中的应用

例如,审计员使用本福特定律来检测财务数据中可能的造假或错误,因为如果数据被人为修改,其分布很可能会偏离本福特定律预测的模式。此外,本福特定律也在选举数据分析和经济数据研究中有所应用。

本福特定律的普遍适用性在于它与数据的规模无关,而是与数字本身的数学性质相关。

本福特定律在多个领域中有着广泛的应用,尤其在审计、法医会计以及数据分析领域中。以下是一些具体的应用案例:

审计与财务分析

● 审计员使用本福法则来检查公司的会计记录。如果某公司的财务报表数据不符合本福特定律的预期分布,这可能是财务舞弊或错误记录的一个指示。例如,如果一组财务数据中较大数字的频率异常高,这可能表明有人为调整数据以满足特定的财务目标。

● 在税务审计中,税务机关可能利用本福特定律来筛选那些需要进一步调查的纳税申报表,特别是在大数据环境下,这种方法可以有效地识别出异常数据。

法医会计

● 法医会计师在调查潜在的经济犯罪(如洗钱或欺诈)时会参考本福特定律。通过分析交易数据的首位数字分布,可以发现那些可能经过人为操纵的数据集。

科学数据

● 在科学研究中,研究者使用本福特定律来验证数据的真实性。例如,分析地震数据、天文观测数据或生物学实验结果,查看其是否与本福特定律的预测相符,以确认数据集是否可能被篡改或误录。

社会科学与选举监督

● 在选举分析中,假如你收到的结果的数字分布显著偏离本福特定律预测的模式,这可能表明存在选票填报或计数过程中的不规则操作。

● 在人口普查数据或其他社会科学调查中,本福特定律同样可以用来检验数据集的一致性和可靠性。

计算机科学

● 在互联网流量分析中,网络安全专家使用本福特定律来识别异常的网络行为或潜在的安全威胁,例如分布式拒绝服务(DDoS)攻击可能会导致流量数据偏离正常分布。

这些案例展示了本福特定律作为一个工具,如何在多个领域提供对数据真实性和一致性的洞见,从而帮助专业人员进行更有效的决策和监督。

所以,我们以后要是专业性的回报工作,记一定要记得遵循本福特定律来办事。

好,今天就先这样啦。

科学羊 2024-06-07 于东莞

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|数学中国 ( 京ICP备05040119号 )

GMT+8, 2024-7-15 00:13 , Processed in 0.234375 second(s), 16 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表