sklearn实战-乳腺癌细胞数据挖掘(博主亲自录制视频教程)

 

https://study.163.com/course/introduction.htm?courseId=1005269003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share

 

 

 

 

 

效应量可以表示两组样本平均数的差异

 

效应量可以用d表示,其公式

 

观察实验组和对照组,效应量越大,两组平均数越远,差异越大

 

 

 

 

 

 

 

效应量不受样本容量的影响。当样本容量大得到显著时,有必要报告效应量大小。
效应量太小,意味着处理即使达到了显著水平,也缺乏实用价值。

在一般统计分析中,一般我们只报告统计量F或t值,与p-value;实际上这些统计量对数据的描述只是描述了一小部分;传统的描述还应包括样本量,样本均数与标准差;但这些传统的描述量基本只是对单变量分布的描述,而对两组变量或处理效应的描述,则用effectsize更加直观。它在平均数检验中表示的是两组样本分布的总体的非重叠程度;ES越大,重叠程度越小,效应明显;ES越小则相反。可以这样理解,不管你取哪种样本,ES是作为为一种标准的均数差异的估计,它与当前样本无关。显然,传统的推断统计量F及p-value只是说明均数差异,但这种差异脱离样本推广到不同的抽样群体,差异究竟有多大,需要用ES来描述。(可以这样来形容F值与ES值:F值表示的是样本1与样本2之间的显著性;而ES值是表示在样本1的总体与样本2的总体中随便抽取两个样本,这种差异显著性出现的可能性)。

 

 

不同检测中,效应量量化程度不同

 

python风控评分卡建模和风控常识

https://study.163.com/course/introduction.htm?courseId=1005214003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share