拉丁超立方抽样(英语:Latin hypercube sampling,缩写LHS)是一种从多元参数分布中近似随机抽样的方法,属于分层抽样技术,常用于计算机实验或蒙特卡洛积分等。

简介拉丁超立方抽样(英语:Latin hypercube sampling,缩写LHS)是一种从多元参数分布中近似随机抽样的方法,属于分层抽样技术,常用于计算机实验或蒙特卡洛积分等。

麦凯(McKay)等人于1979年提出了拉丁超立方抽样。不过此前Eglājs于1977年独立提出过相同的抽样技术。1981年,伊曼(Ronald L. Iman)等进一步发展了该方法。

在统计抽样中,拉丁方阵是指每行、每列仅包含一个样本的方阵。拉丁超立方则是拉丁方阵在多维中的推广,每个与轴垂直的超平面最多含有一个样本。

假设有N个变量(维度),可以将每个变量分为M个概率相同的区间。此时,可以选取M个满足拉丁超立方条件的样本点。需要注意的是,拉丁超立方抽样要求每个变量的分区数量M相同。不过,该方法并不要求当变量增加时样本数M同样增加。1

分层抽样分层抽样(stratified sampling),又名层化抽出法,是统计学的一从统计总体(又称为“母体”)抽取样本方法。将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。从而保证样本的结构与总体的结构比较相近,从而提高估计的精度。相对于没有经过分层的抽样调查,其数据会被称为“未分层抽样”(unstratified samples)。

在社会统计调查(statistical survey),当总体内的“子总体”(subpopulations)之间的差异较大,对每个子总体分别进行分层抽样调查,会令统计调查结果更为准确。子总体的分层必须为互斥,即每个总体的成员均只能属于一个分层。之后,可对每个子总体进行简单随机抽样或系统抽样。这样可令调查的代表性改善。相对于简体随机抽样采取的算术平均值,分层的抽样应采用加权平均值。1

本词条内容贡献者为:

杜强 - 高级工程师 - 中国科学院工程热物理研究所