[多元变量统计]]和概率论中,散布矩阵是一种统计量,用于估计协方差矩阵,例如多元正态分布的协方差矩阵。
给定m维数据的n个样本,写作m×n矩阵 X = [ x 1 , x 2 , … , x n ] {\displaystyle X=[\mathbf {x} _{1},\mathbf {x} _{2},\ldots ,\mathbf {x} _{n}]} ,则样本均值为
其中 x j {\displaystyle \mathbf {x} _{j}} 是 X {\displaystyle X} 的第j列。[1]
散布矩阵是m×m正半定矩阵
其中 ( ⋅ ) T {\displaystyle (\cdot )^{T}} 表示矩阵转置,[2]乘法为外积。散布矩阵可更简洁地表为
其中 C n {\displaystyle \,C_{n}} 是n×n中心化矩阵。
给定n个样本的多元正态分布协方差矩阵的最大似然估计值可表为归一化散布矩阵
当 X {\displaystyle X} 的列从多元正态分布中独立采样时, S {\displaystyle S} 遵循威沙特分布。