Page 24 - 范启勇-关于探索使用大数据的思考-市卫生局信息中心
P. 24
大数据怎么用 四、必须注意大数据“陷阱” 数据采集带有倾向性:采用严重有偏的数据几乎能够产 生任何人需要的任何结果。 大数据本身的“陷阱”:就是由于因为相关性存在于多 种可能性之中,只要有超大样本和很多变量,我们都可 能找到无厘头式的相关性。 统计学一样会欺骗你:因为无法自动剔除影响结果的“ 自相关性”因素,导致结果发生偏差。 无法确定“主观性数据”是否经过数据来源者的美化: 数据提供者的有意美化。