失效链接处理 |
28道数据分析经典面试题 DOC 下载
相关截图:
主要内容: 1. 扑克牌54张,平均分成2份,求这2份都有2张A的概率。 M表示两个牌堆各有2个A的情况:M=4(25!25!) N表示两个牌堆完全随机的情况:N=27!27! 所以概率为:M/N = 926/53*17
因为男女的点击率可能有较大差异,同时低点击率群体的占比增大。 如原来男性20人,点击1人;女性100人,点击99人,总点击率100/120。 现在男性100人,点击6人;女性20人,点击20人,总点击率26/120。 即那个段子“A系中智商最低的人去读B,同时提高了A系和B系的平均智商。”
用样本统计量去估计总体的参数。 4. 假设检验参数估计和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,但推断的角度不同。 参数估计讨论的是用样本估计总体参数的方法,总体参数μ在估计前是未知的。 而在假设检验中,则是先对μ的值提出一个假设,然后利用样本信息去检验这个假设是否成立。
置信区间是我们所计算出的变量存在的范围,水平就是我们对于这个数值存在于我们计算出的这个范围的可信程度。 举例来讲,有95%的把握,真正的数值在我们所计算的范围里。 在这里,95%是置信水平,而计算出的范围,就是置信区间。 如果置信度为95%, 则抽取100个样本来估计总体的均值,由100个样本所构造的100个区间中,约有95个区间包含总体均值。
协方差:
相关系数:
|