贺深泽 (Email:[email protected] )
x-=(x1+...+xn)/n, ------ (1)
(注:习惯上,均值由变量上方加“-”来表示,但某些语言不支持这一符号,故把 “_" 移至右上角,下同。)
内积
xiTxj=x1ix1j+...+xnixnj------ (2)
差乘和 spdij=(x1i-x-i)(x1j-x-j)+...+
(xni-x-i)(xnj-x-j)=xiTxj-
nx-ix-j ------ (3)
方差估计 σ2i=[(x1i-x-)2+...+(xni-x-i)2]/(n-1)
=[xiTxi-nx-i2 ]/(n-1)=spdii/(n-1)
------ (4)
协方差估计
cov(xi,xj)=[(x1i-x-i)(x1j-x-j)
+...+(xni-x-i)(xnj-x-j)]/(n-1)
=spdij/(n-1)------ (5)
相关系数
corr(xi,xj)= rij =cov(xi,xj)/(σiσj) (i,j=1,2,…,m; i≠j) =spdij/√(spdiispdjj)------ (6)
设一个向量为 x=(x1,...,xn )T,
则任何一个n×m 矩阵 X=(x1,x2,...,xm) 是实欧氏空间 IRn 中的超立方体。
以这样的矩阵作 m 个输出变量的采样方案,它就是超立方设计。
如果每个 x 的取值范围被随机地划分,该设计是随机设计。
如果每个 x 的取值空间被等距离地划分,它是一种边际分布均匀的特定的划分,
我们以后都默认超立方设计是边际分布均匀的。
rij=0 或 cov(xi,xij)=0, 或 spdij=0 ------(7)
则称 X 为零相关超立方设计,简称为零相关设计,
欧氏空间中的任何矩阵都对应一个相关矩阵 R=(rij) ,它 是一个对称矩阵,其对角线元素 为 1.
在对角线之外的元素的绝对值必有一个最大的相关系数,记作mcc
mcc=max{|rij| , i≠j; i,j=1,2,…,m}
如果所有向量xi 满足条件
xiTxj=0, (i≠j; i,j=1,2,...,m) ------(7)
则称 X 为正交超立方设计,记作 OHC。正交超立方设计的 mcc=0.
零相关的不一定是正交的。如果所有向量的均值为 0,则正交的超立方设计一定是零相关的。
零相关设计由下列变换令 a=x- 正交化,
x=x-a
再用下列变换令 b=1/Δ 可以使 X 标准化。
x=bx
如果 X 的 mcc 非常小,则该设计的相关性非常弱。此时,可以认为 X 是弱相关的。
一个设计的相关性的强与弱是相对的,单用相关系数的大小不能作出判别。同一个小的相关系数值,
例如 mcc=0.1 在小的运行数可能相关性足够弱,在更大的运行数则可能不够弱。
这与自由度有关。相关性是否足够弱,依赖于相关系数临界值,它是置信水平 α 与 自由度 (n-1) 的函数。相关系数临界值随自由度的变大而变小。
如果 mcc 大于相关系数临界值r α(n-2),则该设计至少有两个列向量相关性的置信水平小于 α,
即,该两个变量的相关性的置信概率大于 p=1- α,
此时称该设计的相关性置信水平小于 α 或相关性置信概率大于 p=1- α。
置信水平 α 与置信概率 p=1- α 是两个标准的统计判别量,应该作为设计的相关性的控制量,或判别准则。
这个值 α 取多大?依赖于具体工程的要求。
置信水平 α 与 相关系数负相关,而 P 值与相关系数正相关。所以一般使用 P 值作判别量,比较方便,更符合习惯。
按代数学观点,在欧氏空间中,给定第一个向量 X1是任何实向量, 可以依次计算出 X2,X3,...,
构成一个正交矩阵。但是,当若要求 X 的各列的水平满足水平等距离分划的条件,正交阵列不一定能够被构造出来。
正交超立方存在的条件是:
定理:零相关矩阵存在的必要条件是 n 为大于 3 的奇数或 4 的倍数。当 n=4k+2(k为正整数)时不存在零相关矩阵。
一个正交超立方如果存在,是多解的。
如果对点分布均衡性要求很高,需要逐一检查点的分布状况。单从相关矩阵难以作出判断。
如果采用合成构造法,例如张量积,产生极端不均匀分布的概率非常高。
对这类问题,我们另文专门讨论。
以田口正交表为例,当把这些正交表中代表拉丁符号的数字就当作是数字,用于定量变量的实验设计,
其相关矩阵是单位矩阵。这就意味着,它们是零相关的。在 Hedayat (1999)书中提到的正交阵列,OA(N,k,s,t),
除了OAI 和 OAII 两种类型外,也都是零相关的,因而中心化后是正交的。
不过,都不属于超立方类型, Hedayat 称之为固定水平或混合水平类型。
1. 前 言
正交设计是 20 世纪应用数学的伟大创造,从此,科学实验与工业技术开发可以有计划地进行,减少了实验数目, 缩短了开发周期,降低了开发成本,提高了开发质量,大大推动了科学与技术的发展。 我们最熟悉的田口正交表具有均衡分散,齐整可比的特点。 通过均衡地安排试验点消除试验误差,不仅可以研究定量因子,也可以研究定性因子, 不仅可以估计出因子的效应,还可以估计出因子的水平的效应。 上述特点表明,这类正交表是拉丁的,即向量的水平代表的是符号。所以,这类正交表又可以称为拉丁正交表,不定义数值特征。 这种齐整正交设计也有一些弱点。最主要的弱点有三个:- 试验数与水平数的幂成正比,随因子的水平数增加试验数迅速地增加。
- 试验点密度低。
- 大部分齐整正交表的因子的效应估计有混杂叠加现象。
2. 正交超立方
2.1 变量的数字特征
试验设计中,一个向量代表一个变量,向量的分量代表该变量的水平。 变量可以是定量的,它的水平是数值的。变量也可以是定性的,它的一个水平只是一个符号。 例如,原料的品种,产地,但原料的纯度是数值。 只有定量的变量才有数值特征。 所以,齐整的或拉丁的正交设计不定义数值特征(参考 Hedayat 1999)。 显然,拉丁正交表可以用于研究数值变量,那时便有数值特征。 一个向量 x=(x1,...,xn)T, 如果是数量的,即,xi是数值, 那么,该变量有数值特征,多少,大小等等。下面这些数值特征在实验分析过程中是非常重要的统计量: 均值2.2 正交超立方及正交性表征
我们现在给这种分划一个严谨的描述。 设每个向量 xi (i=1,2,...,m) 的变化区间的水平等距离分划为 Li=(l1i,...,lni)T, 其中 lki,(k=1,2,...,n) 都是实数, 且 lki<l(k+1)i,k=1,2,...,n-1,相邻两水平之间的间距为 Δ= l(k+1)i-lki 是一个常数,则称Li 为因子xi 的水平设计, 它的全体置换的集合记作Si, 有时也称 Li 为Si 的母向量。 若 X 的向量 xi=(x1i,…,xni)T 是Li 的一个置换, 则称 X 是一个超立方设计 记作 HC。 如果 l1i=1, Δ=1, 则称 X 为标准超立方。 如果 X 的所有向量满足条件2.3 正交拉丁超立方
McKay, Beckman, 和~Conover (1979) 将每个变量 xk 的范围按概率均匀地划分为 n 层, 每层采样一次,并称之为拉丁超立方采样(LHS)。 Ye(1998),Steinberg 和 Lin(2006) 让 LH 的每个xk 包含 n 个等间距的水平。 在采样空间引入距离属性,事实上给向量赋予了数值特征。 这是对随机设计的改进。使随机设计的边际分布均匀化。这就在事实上在形式上赋予了 LHS 设计数值特征, 因而与欧氏空间的超立方无异。 这样,在形式上,正交超立方与正交拉丁超立方在欧氏空间中得到统一。 超立方设计当然可以应用于定性因子,只需把代表水平的数值换成相应的符号即可。 由于点分布均衡分散,通过直接比较,可以实现因子优选。 如何处理 数据得到预报方程? 期待应用结果。2.4 正交超立方与齐整正交设计的差异
超立方的边际分布是均匀的,即每个变量的水平设计都是均匀的, 但其联合分布不一定是均匀的,甚至可能是非常不均匀的。 正交超立方设计可以是不齐整不规则的但必须是充分分散的。 满足正交的条件的阵列试验点分布可以是非常不均匀的,试验点甚至可能分布在一两条直线上, 这样的非常不均匀的正交阵列不应该列入正交设计的集合之中。 当使用随机构造方法构造正交超立方设计,由于随机性,点分布十分不均匀的概率很小。 9运行正交超立方w9h5o 的全部二维点阵图表明了这种情况。
2.3 正交超立方例
笔者已经在笔记本电脑上用直接法构造出运行数范围在 4 至 37 之间的超立方阵列。凡是(运行数) n≠4k+2 的阵列都包含零相关正交子阵。 n > 21 的阵列是目前文献上不能找到的。我的命名方法参考: 命名约定 三个正交超立方例(点击可浏览): w19h7o w21h7o w28h7o参考
- 田口玄一,《正交计划法》,丸善株式会社,东京, (1976).
- G.Taguchi, intdoduction to Quality Engineeering: Designing Quality into products and processes. Tokyo: Asian Productivity Organization, (1986)
- A.S.Hedayat, N.J.A.Sloane & John Stufken, Orthogonal Arrays: Theory and Applications,Springer,(1999).
- 贺深泽, 弱相关试验设计, 数学的实践与认识, 2009, 39 卷第 3 期
- McKay,M.D.,Beckman,R.J. & Conover,W.J. A comparison of three methods for selecting values of input variables in the analysis of output from a computer code. Technometrics, vol. 21, 239-245, (1979).
- Ye.K.Q, On the Orthogonal column Latin hypercubes and~their application in computer experiments, J.Am.Statist.Assoc. 93,1430-1439, (1998).
- Steinberge,D.M, Lin,D.K.J, A construction method for orthogonal Latin hypercube designs. Biometrika,93, 2,279-288, (2006).
Congratulations @shenzehe! You have completed the following achievement on Steemit and have been rewarded with new badge(s) :
Click on the badge to view your Board of Honor.
If you no longer want to receive notifications, reply to this comment with the word
STOP
To support your work, I also upvoted your post!
Do not miss the last post from @steemitboard:
SteemitBoard World Cup Contest - The results, the winners and the prizes
Downvoting a post can decrease pending rewards and make it less visible. Common reasons:
Submit