多变量数据的统计描述与统计推断



上节我们说了多因素的方差分析,今天我们讨论另外一种情况,就是每个观察记录的观察指标不止一个,有多个反应变量(rsponsiblvariabls)。比如,血压记录会有收缩压、舒张压、脉搏等数据。由于这些指标是同一个对象的不同属性,因此我们要作为一个整体来描述观察对象,这种数据就是多变量数据(multivariatdata)。

多变量数据与多因素实验数据不同,多因素实验的反应变量只有一个,单变量方差分析(univariatANOVA)。多变量分析属于多元统计分析范畴。

描述统计量

对于还记得线性代数的同学,下面概念就不必解释了。忘记了,简单理解就是一个指标需要多个数据表达,那么这个写出来的时候就是一个指标是一串数字,多个指标就是多串数字,这样就构成了矩阵。数学上的东西可以不必太在意,知道意思就可以了。

均数向量:有n个观察对象,每个观察对象有m个反应变量,这样其中一个对象的一个观察值可以表达为一个向量,m个反应变量的样本均数就构成了一个均数向量。

离差矩阵:任意两个反映变量可以计算离差,用矩阵来表达。

协方差矩阵:样本协方差的矩阵。

相关矩阵:相关系数构成相关矩阵。

组间差别比较

配对设计均向量比较

成组设计两样本均向量比较

成组设计多样本均向量比较

上面三种常用的统计方法查看例子很容易明白。具体可以到医研云







































白癜风诚信医院
白癜风患者的饮食要求



转载请注明:http://www.jmrrc.com/swzdzz/9038.html