福特定律简介:
在自然形成的很多数据中,首位数字为一的概率30%.首位数字为二的概率17%...首位数越大出现的概率越小,当首位为九时概率只有4%。用P(n)表示b进制数据中首位数字为n的概率,则本福特定律可表示为:
)11(log )(n
n p b +=,n=1,2,...b-1.特别的在10进制中:
)11lg()(n
n p +=,n=9.本福特定律可用于评估各种数据特别是财务数据的可信度,并且有很多成功案例。
本福特定律的理解和应用:
1.我们记录的数据不会是随机数据而是某个因素的函数
需要说明:本福特定律中数据的首位数字从1到9出现的概率即是频率。可以这样理解:从历史数据中随机取出一些,其中首位数字为1的约占取出全体的30%,首位数字为2的约占17%...首位数字为9的约占4%。
直觉上数据的首位数字有从1到9有9种情况,每种情况出现的概率应该一样,都是1/9,为什么和本福特定律差别如此大呢?其实直觉并没有错,从
一堆随机数据中任意取一些,把这些数字按首位数字从1到9分成9份,每一份确实应该占取出全体的1/9。但是随机数据和任何因素都不会有关联,我们不可能去记录这些没有意义的随机数据。只要是记录的数据至少是和某个因素有关联的,是这个因素的函数。例如记录第x年的GDP为y元,y当然是x 的函数。查数据y时是先到年份x,然后再查看相应的y。所以数据y各个阶段被查看到的概率是由相应的x决定的,为几何概型。
2.本福特定律怎么证明?哪些数据符合本福特定律?
下面的过程或许可以揭开以上迷惑。记数据为y=f(x),记y扩大到10倍为一个周期,即首位从1到2再到3依次变化直到重新回到1为一个周期。用1x 表示数据第一个周期x的增量,
2x 表示第二个周期x的增量,依次类推。
用11x 表示第1个周期中数据首位从1变为2时x的增量,车的标志大全
12x 表示第1个周期中首位从2变为3时x的增量,依次类推。
假设第一周期首位从1开始,并且最后一个周期为完整周期.那么由几何概型p(n)
......
......2121++++==x x x x x x n n n 的总增量
的总增量时各个周期首位数字为每一个周期中首位由1变为2时y的增长率(y
瑞福特y ∆==存量增量增长率)为1,
首位由2变为3时增长率为1/2,
首位由3变为4时增长率为1/3,依次类推。
由于函数y=f(x)在相应区间的增长率(记为k)已确定,所以希望到使对应的x ∆可求或∑∆x 可求的所有函数,继而计算p(n)。
满足条件的所有函数是困难的,但显然当y增长率正比于x增长量x ∆时,x ∆可求,y的表达式也可求。即x c y
y ∆=∆(c为常数)⇒⎰⎰=cdx
y dy ⇒),(ln 2121
为常数c c x c c y =+⇒),(211
2为常数c c e c y x c =可以把y写成更一般的指数函数x
ba 的形式(a,b为常数),并可列出以下方程1+=∆k a x (方程两端都表示了x增加x ∆后函数y是之前的几倍)解得)1(log +=∆k x a 。
上式说明对函数y =x
ba ,使函数值y增长k倍的x的增量为常数)1(log +k a 。在一个周期内y的首位数字从1变为2则y增长率为1,x的增量为2log a 。
y首位数字从2变为3增长率为1/2,x的增量为2
3log a ,......
一般的y首位数字从n变为n+1增长率为1/n,x的增量为11(log n
a +,可以得到对函数y=x ba ......
......
:::......:3
4log :23log :2log ......比亚迪客车
:::232221131211===x x x x x x a a a 继而p(n)
)11lg()34232(log )11(log 910log ...23log 2log )11(log ......
天津车牌摇号 (19)
121112121n
n n x x x x x x x x a a a a a a n n n +=⨯⨯⨯⨯⨯+=++++=+++=++++=特别说明当为b进制时,更换以上各式分母最后一项,可得
)11(log log )11(log )(n
b n n p b a a +=+=理解以上过程可总结如下:
1.指数函数或可拟合为指数函数的数据会满足本福特定律,但反过来不成立。
2.哪怕得不到数据的任何表达式,只要该数据之前绝大部分的统计都满足本福特定律或其他某种规律,那么之后也会满足这种规律。
3.可以使用一些高级的数学变换来确定更多的数据是否满足类似本福特这样的规律。
夏利a
4.应用上有一些小技巧,举例如下:某数据记录了工厂这些年的累计产值从8万到2亿,并且确定这些数据若真实则会满足本福特定律。那么应该把这些数据分成2份:
第一份:10万到1亿,这部分数据首位满足本福特定律。
第二份:1亿到2亿,这部分数据第二位满足本福特定律。
如2亿之后有零头采用类似方法处理。
>汽车报价大全2020最新汽车报价