在我前面的系列文章里,奇趣网统计宝详细讲解过挖掘大量数据规律的思路,比如手上的数据有几千上万条的时候,它基本是符合大数定律的,每个数字出现的次数是接近它的平均值的,我们可以利用大数定律来预判大数据未来的数据。
但是手上只有少量数据的时候怎么办呢?比如手上只有几十或几百条数据,它就很难呈现出大数定律的规律了,这时候我们可以用“规律库”思路,预先设计好上千上万条规律,然后把数据套进去对比,把符合的规律显示出来,并按某种规则进行排序,这样就能对少量数据的未来可能性进行某种程度上的预判。
比如说,黑箱里有十个球,每次拿一个出来又放回去打乱重新拿,拿了20次之后,第21次将会拿出哪个乒乓球的可能性最大?这就是咱们要研究的问题。