高中物理新教材培训心得体会,高中物理公式大全
将一系列复杂的数据减少为几个能够起到描述作用的数字,用这些代表性的数字来代表数据集,进而知道数据的整体情况。
常用的4个指标:①平均值;②四分位数;③标准差;④标准分
平均值
表示一组数据集中趋势的指标,指在一组数据中所有数据之和再除以这组数据的个数。
缺点:平均值对异常数值不敏感,当数据中有异常值时,用平均值来描述数据整体情况是不准确的。
四分位数
中位数:将数据集有n个数值,按从小到大进行排序,如果n是奇数,中位数是位于中间数值;如果n是偶数,中位数就是中间两个数的平均值。
四分位数:下四分位数的位置= (n+1) ×
中位数的位置= (n+1) ×
上四分位数的位置= (n+1) ×
用箱线图来理解四分位数:
四分位数的应用:比较数据;识别异常值。
异常值:
识别异常值方法:
四份位距:IQR = Q3 − Q1
最小估计值:Q1-k(Q3-Q1)
最大估计值:Q3-k(Q3-Q1)
K=中度异常,k=3极度异常
异常值:< Q1-k(Q3-Q1)或> Q3-k(Q3-Q1),在最小估计值和最大估计值之外的数
或使用箱线图观测
异常值处理:①异常值可能是错误标记的数据值,核对修正;
②有可能被错误包含在数据集中的值,删除;
③反常数据值,被正确记录到数据集中,保留。
标准差
衡量数据稳定性,即数据波动大小。
标准差越小,表示数据波动小,数据越稳定;越大,数据波动大,越不稳定。
缺点:如果两个数据差别比较大,就无法比较,引入变异系数来弥补这个缺点,用来比较不同数据集的波动大小。
变异系数=标准差/平均值
在进行数据统计分析时,如果变异系数大于15%,则要考虑该数据可能不正常,应该剔除。
标准分
对数据进行归一化处理,表示距离平均值多少个标准差。
2.实际应用案例