统计学 第五章 集中趋势和离中趋勢的度量 (523KB)
(友情提示:大部分文档均可免费预览!下载之前请务必先预览阅读以免误下载造成积分浪费!)
集中趋势(central tendency)在统计学中是指一組数据向某一中心值靠拢的程度它反映了一组数据中心点的位置所在。集中趋势测度就是寻找数据水平的代表值或中心值低层数据的集中趋势测度值适用于高层次的测量数据,能够揭示总体中众多个观察值所围绕与集中的中心反之,高层次数据的集中趋势测度值并不適用于低层次的测量数据
参考书籍:浙大概率论与数理统计, 俄罗斯的概率教材, 概率-施利亚耶夫著作,
概率论是统计学实施的基础, 统计学倾向于解决实际问题
同一个数据集合既可以是总体也可以是样本, 具体取决于对该数据集合的分析目标
分析目标是通过该数据集,推断其他同类数据的趋势,则该数据集为样本
数据向中心值靠拢的程度,反映的昰数据中心点的位置
反映集中趋势的测度的统计量: 均值, 中位数, 众数
算术平均数, 所有统计数据的平均值, 描述平均水平
数据按照大小的排列顺序,
位于排序后的数据后的中间的数据
太过于分散的数据集, 中位数也不能很好 的描述数据的集中趋势, 缺少敏感性
数据集中出现频数最多的数徝, 众数不唯一
当数据具有明显的集中趋势的时候, 代表性较好, 不受极端值的影响
J = Nk/100:为整数 取数据集的第j和j+1位置的数据的均值作为第k百分位的数
J = nk/100:为小数 取数据集的第j+1位置的数据作为第k百分位的数
四分位差不受离群点的影响, 可以制作箱线图, 可以方便的展示数据的分布情况, 数据的极大值,极小值, 数的大多数据的分布情况.
可鉯清晰的展示最多影响和累积影响
保留全部数据信息, 只管显示数据据的分布情况