"竹杖芒鞋轻胜马, 一蓑烟雨任平生"

Do not deify machine learning,it is not that cool

hadoop蒙特卡洛算法续集

06 Jan 2013
这个版本是参考自带samples实现。相比上个野生版本,增加修改如下特性:
【old/new
1:生成点数由输入文本文件决定/生成点数可由命令行参数指定,据此生成相应二进制文件
2:文件中存在冗余列/二进制输入输出文件中不再有冗余列,程序中通过NullWritable来对原本冗余列的位置占位
砍掉一堆import后的代码如下:
代码
另外关于蒙特卡洛算法,其实决定最终模拟结果精确性的还有一个重要因素,就是点的均匀程度(不是随机程度),原始的rand函数模拟的点存在重叠不够均匀的缺点,导致结果不够理想。samples中点的生成采用了Halton Sequence,保证点尽量均匀。但由于重点在分布式,所以忽略点生成的算法,这个版本依然采用野生随机生成法(samples中点生成算法代码太多实在懒得看我会乱说)

comments powered by Disqus