失效链接处理 |
常用数据挖掘算法总结及Python实现 PDF 下载
本站整理下载:
相关截图:
主要内容:
1.1 概率论
1.概率论基本概念
样本空间
我们将随机实验 E 的一切可能基本结果组成的集合称为 E 的样本空间,记为 S。样本空间的元素,即
E 的每一个可能的结果,称为样本点。样本空间又叫基本事件空间。
例:拍拍贷用户的学历 S={‘研究生或以上’,‘本科’,‘大专’,‘高中’,‘中专’,‘初中及以下’},A={‘研
究生或以上’,‘本科’,‘大专’}
事件
事件 A 是样本空间的子集,可分为四种类型
空事件: 样本空间的空子集; 原子事件: 仅包含一个元素的样本空间; 混合事件: 包含多个元素的样本空间; 样本空间本身也是一个事件. 集合
概率论定义
概率用来描述一件事的不确定性。假设 A 是投硬币的一个结果(比如正面朝上),如果重复投硬币很
多次,直到 A 出现的机会逼近一个极限 p。那么可以说出现 A 的概率是 p
对于事件 A 和 B,联合概率 Pr(AB)表示事件 A 和 B 同时发生的概率。
概率定律
事件的概率: P(A) 满足: P(A) 0 ;P(S) = 1;对于一连串的互斥事件:
S A
( ) ( | )
( )
P B A P B A
P A
( ) ( ) ( ) P A B P A P B ( | ) ( ) ( | )
( )
P A B P B P B A
P A
b a
dx x p b X a P ) ( ) ( 条件概率
发生事件 A 的情况下,发生 B 的概率称作条件概率 P(B|A).
独立性
事件发生和其它事件无关。
如果 P(B|A)=P(B), 我们称 B 和 A 统计独立,当且仅当:
如果 A 和 B 统计独立,那么 B 与 A 也统计独立
总概率
P(A) = P(
|