通过图表或数学方法,对数据资料进行整理分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。
透过对数据资料的图像化处理,可将资料摘要变为图表,以直观了解整体资料分布的情况。通常会使用频数分布表与图示法,如多边图、直方图、饼图、散点图等。 研究者也可以透过分析数据资料,以了解各变量内的观察值集中与分散的情况。运用如集中量数,如平均数、中位数、众数、几何平均数、调和平均数。与变异量数,如全距、平均差、标准差、相对差、四分差。 为了表示测量数据与正态分布偏离的情况,会使用畸变、峰度这两种统计数据;为了解个别观察值在整体中所占的位置,会需要将观察值转换为相对量数,如百分等级、标准分数、四分位数等。
案例1:数据异常值识别
案例2:关于年龄的数据族分类
例:2005年拉丁美洲584样本的儿童街头工人和231伤残病例的统计特征(包含最大值最小值、均值和标准差)