欧科云链研究院:本福特定律能否考察块链上的数据。
美国选举多次逆转,终于尘埃落定,拜登现在以290票击败232票的扑克,成为下一位美国总统。但是,拜登选举欺诈的传闻也很傲慢,最初拜登选票的伪造疑问基于本福特定律,之后陆续传来了重复票据等新闻。本福特法则是宇宙中许多数据适用的法则,不能作为直接证据,但常用于检测数据的伪造。本文介绍了本福特定律,应用于块链行业,找出符合本福特定律的数据指标,从本福特定律的角度考察链上数据的合理性。
一、本福特法则:广泛存在的数据法则。
1.广泛存在的自然规律。
就像牛顿在苹果的落地中发现了万有重力法则一样,西蒙纽康和弗兰克本福特在对数表中发现了本福特法则。根据本福特定律,对于很多数据样本来说,第一位数是1的概率远大于其他数字,数字越大,出现的概率就越小。具体来说,最常用的10进制数字,首位数字出现的概率如下
香港股票交易:欧科云链上涨4.35%,火币科学技术下跌6.84%:今天香港股票交易,恒生指数交易报告26304.560点,下跌0.76%欧科集团旗下的欧科云链(0149.HK)报告0.144港元,上涨4.35%火币科学技术(0161.HK)报告3.540港元,下跌6.84%。[2020/12/814:35:03]
人口、GDP、面积等数据被验证符合本福特定律,斐波那剪刀数组、放射性要素半衰期等绝对自然的数据也符合本福特定律。但是,本福特定律是经验性的自然规律,没有严格的证明推导。一般来说,本福特定律的适用条件如下
样品数量和数量级跨度尽可能大。跨度小的身高数据不适用,但实践表明也适用于一些小样本数据
数据不能有人为操纵的痕迹。人为规定的数字,如电话号码、邮政编码等不符合本福特法则。数据被篡改后,不符合本福特定律的可能性很高,因此本福特定律可以用来检测数据的伪造
对于随着时间指数增长的数据,本福特定律一定符合。这一点可以从数学上严格证明,B进制中数字N出现的概率即。这种数据的特点是早期增长缓慢,后来增长越来越快。数据本身有自己的分布规则,很可能不符合本福特的规则。如果收益率不符合本福特定律。
香港股票交易:欧科云链上涨9.45%,火币技术下跌0.46%:今天香港股票交易,恒生指数交易报告23506.87点,上涨0.99%欧科集团旗下的欧科云链(01499.HK)报告0.22港元,上涨9.45%火币技术(01611.HK)报告4.30港元,下跌0.46%。[2020/9/30]
人口、GDP、营业收入、播放量、成交量等数据,由于规模效应或网络效应,早期从1到2很困难,但发展到一定规模后,从8到9相对容易增加,因此小数字停留时间长,大数字停留时间短,最终数字第一分布呈现本福特定律。
2.用于检测数据造假。
本福特法则常用于检测数据的伪造,特别是在财务数据中。2003年美国华盛顿州案,一开始是会计师Darrell,Dorrell在本福特定律中发现支票汇款数据的不合理性,通过进一步调查发现涉案金额高达1亿美元的。没有独特的偶然,安然公司2000-2001年的每股利润也远离本福特法则。实际上,自20世界70年代以来,本福特法则被广泛应用于挖掘会计欺诈行为。
香港股票交易:欧科云链上涨4.15%,火币技术下跌1.14%:今天香港股票交易,恒生指数交易报告23275.53点,下跌0.85%欧科集团旗下的欧科云链(01499.HK)报告0.20港元,上涨4.15%[2020/9/29]
除了金融财务领域,本福特定律也用于其他领域的数据,如2009年伊朗选举、希腊政府宏观经济数据、公共计划经济数据、比尔克林顿纳税申报数据……
但值得注意的是,本福特定律不能作为提供证据,只能作为数据伪造的推测,需要后续的科学调查。在华盛顿州案的成功应用案例中,会计师Darrell以本福特定律的检查开始,经过很多努力和3年的搜查,主犯凯文·劳伦斯被送进监狱,被判处20年徒刑。此外,本福特法则在某些领域的适用性存在争议。例如,哈佛大学的研究表明本福特法则不适用于选票数据。基于以上原因,网民对拜登选票进行了本福特定律检查,适用性和说服力存在问题,不能作为伪造选票的直接有力证据。
火币科学技术、欧科云链块链业务的比例分别为6.5%和4.3%:国内股市掀起块链热潮,大潮下真伪难辨,火币科学技术和欧科云链这样真正的块链企业和传统金融市场的融合也需要过程。火币科学技术的市场价格增加了5成,块链业务的比例只有6.5%。受疫情影响,2019年10月1日至2020年3月31日半年度报告期间,火币技术损失幅度进一步扩大到3020.9万港元,收入从24.5%下降到1.17亿港元。另一方面,欧科云链将于2015年9月登陆港交所。据年报报道,报告期间来自技术服务板块的收入达到2450万港元,仅占总收入5.7亿港元的4.3%。(新浪技术)[2020/8/24]
二、本福特定律在块链领域的应用。
以上介绍了本福特定律的一般应用,以下基于块链行业,挖掘哪些指标符合本福特定律,结合块链技术特性探讨链上数据的合理性。
1.区块链行业适用本福特定律的数据。
由此可见,人口、GDP、面积等宏观数据符合本福特的法则。在块链行业,块链专利数、企业数等宏观数据也符合本福特定律。下图显示了2020年至今各省市区块链专利数和Wind全球企业库区块链企业数,其首要分布符合本福特定律。
香港股票交易:欧科云链上升1.45%,火币科学技术上升1.85%:今天香港股票交易,恒生指数报告24253.29点,上升2.12%欧科集团旗下的欧科云链(01499.HK)报告0.210点,上升1.45%[2020/4/7]
此外,块链行业的财务数据也是本福特定律的典型应用场景,以下数据来自块链指数成分股。
2.从本福特定律的角度来看上数据的合理性。
块链技术本身具有分布式和数据透明的特点,有利于数据的多方监督,数据的不可篡改性也增加了数据伪造的成本,欺诈行为永远留下痕迹,块链技术能有效抑制数据伪造。目前,块链已在金融、公益等多个领域应用落地,有助于解决数据欺诈的痛点。
本文首先考察了成交额数据的一般特性,比较了基于相似体量的块链和不基于块链的平台数据。首先,考察样品量在100以上、1000以上、2000以上的交易平台数据后,发现成交额符合本福特定律,样品越大数据越接近本福特定律理论值。其次,从基于块链的交易平台获得成交额数据,整理114个有效样本,比较最初的数字分布和本福特定律理论值,观察链的成交额与本福特定律一致,除数字8外。为了比较,选择了不基于块链技术的类似体积的交易平台,有效样品数为195,但交易额为6和7。考虑到链条上数据样本量的缺点和整体情况的一致性,仅从本福特定律来看,根据块链的成交额数据是合理的。
公益项目水滴采购自称是基于大数据和块链的应用,以官方网站公布的122名不信任采购者黑名单为例,从本福特法则的角度探索块链技术链数据的真实性。根据以前的讨论,手机号码、身份证号码等人为规定的数据不符合本福特的法则,研究对象决定从2017年到现在每月失去信用的人数,结果如下。
受样品数量的限制,失信者数量的第一位分布不符合本福特的法则,但大体上数字越大概率越低。
三、说话。
虽然没有严格的证明,但是大量的实践检查显示,本福特法则是广泛存在的有趣数据法则,用于挖掘数据的伪造,特别是在财务数据中。本次美国大选中拜登选票不符合本福特定律的问题在数据适用性和说服力上存在问题,因此不能作为推翻选举结果的有力证据。正如本文多次强调的那样,本福特定律只是发现可疑性的方法,不是充分的证据,而是数据休假的起点,不是终点。
本福特定律也适用于块链行业的数据,如块链企业数、专利数、公司财务数据等。另外,块链技术本身的数据透明,不可篡改的特征有助于维持数据的真实性。并且,比较了一组实际的数据,从本福特定律的观点来看,链条上数据的最初分布是合理的。
1.1..1...
标签:
金色观察两个忽高忽低,现在是投资比特币的时候了吗? 金色财经块链1月31日,许多分析师认为,这次加密市场的牛市与2017年完全不同,这次比特币进入了新的历史高度,大大推进了机构投资者。而且,这次和2017年牛市的另一个最大区别是2020年发生了新的冠状病感染,美国政府印刷了数兆美元,引起了长期的通货膨胀和金融危机。
2/1/2021 7:28:30 PM金色观察|美国新政府领导人对加密货币的态度一览表。 金色相对论两张姨妈:加密货币在拉美更像危险回避资产:在今天举行的金色相对论中,ChainUP海外市场总监张姨妈发言说,加密货币在拉美更像危险回避资产,应对通货膨胀,在拉美市场,法币的变动性极高,本周可以买到面包的钱,下周可以买到因此,中国和拉美术语在很多地方都不同,但是热的两块热土。
2/1/2021 7:28:00 PM什么是哈希Hash? “知道块链的人多少都听说过这个概念,但是模糊不清,什么是Hash呢? Hash一般翻译为散列,音译为哈希,本文统称为哈希(哈希=散列),百度和谷歌没有直接找到Hash的定义,找到了相关概念、哈希算法、哈希函数、哈希表等概念。
2/1/2021 7:27:46 PM欧科云链研究院:本福特定律能否考察块链上的数据。 美国选举多次逆转,终于尘埃落定,拜登现在以290票击败232票的扑克,成为下一位美国总统。但是,拜登选举欺诈的传闻也很傲慢,最初拜登选票的伪造疑问基于本福特定律,之后陆续传来了重复票据等新闻。本福特法则是宇宙中许多数据适用的法则,不能作为直接证据,但常用于检测数据的伪造。
2/1/2021 7:27:15 PM科普:阅读ETCThanos硬分叉升级。 2020年11月29日03:48,ETC(以太网坊经典)经过几个月的黑暗时刻,终于迎来了巨大的变革——Thanos硬分叉升级。
2/1/2021 7:26:55 PM预言机:块链与现实世界交流的中间部件。 预言机的英语是Oracle,原意是神托,起源于14世纪末期,是大众讨论可靠知识的来源。 就像专家和技术知识一样,甲骨文根植于早期民主议会的审议和决策过程中。宗教占卜的想法在我们现代民主制度中完全失去了位置,但随着现代计算机科学和密码学的出现,神托这一概念在技术上卷土重来,出现在作为信赖机械的块链技术中。
2/1/2021 7:26:33 PM金色百科全书阅读合同交易和杠杆交易的区别。 从2019年开始,合同市场的热情持续上升,2020年继续这一趋势,越来越多的交易所开始配置合同产品,前312急剧下跌,比特币突破2万关口的激烈行情变动使加密市场疯狂,在现货市场的利益下,一些投资者开始关注杠杆交易。
2/1/2021 7:26:15 PM