许宝騄在统计推断领域的工作
E.L.Lehmann
University Of California ,Berkeley
许宝騄在伦敦的University College共呆了四年(1936-1940)。那段时期,E.S.Pearson已经继承了他父亲的统计系系主任的职位,而那段时期的前两年(1936-1938),Neymann正好在那儿担任统计系的Reader,许先生在英国留学期间,写了一系列关于统计推断的重要文章,这些文章都是受到Neyman-Pearson观点的影响而写成的。
1938年,许宝騄在Neyman和Pearson主编的Statistical Research Memoirs,Vol2上发表了他的两篇文章。其中一篇[3]讨论Behrens-Fisher问题。分别记X和Y(i=1,…,m;j=1,…,n)为N(ξ,σ)和N(η,τ)的样本。许考虑统计量 u=(-)/(AS+AS),其中S=Σ(X-),S=Σ(Y-)。当A=A=N/[mn(N-2)],其中N=m+n时,u变成student的t统计量。当A=1/[m(m-1)],A=1/[n(n-1)],u就是Behrens-Fisher统计量u。
许宝騄找到了统计量u的密度函数的一系列展开,并利用它研究统计检验中否定域u≥c的功效函数,它是参数θ=τ/σ和λ=(η-ξ)/(+)的函数。这个工作是精确的分析结果,而不是渐近意义下的近似,Scheffé(1970)称它为“数学严格的典范”。在文中,他得到了u的随机界。Hájek,Lawton等人后来推广了他的结果(见Eaton和Olshen(1972))。许宝騄利用数字计算和分析工具得到了他的主要结论。结论认为,当=0而变化时,u和u均不能控制否定概率(m=n的情况除外)。但u对变化的敏感度较弱。
第二篇文章[4]讨论Gauss-Markov模型中方差的最优估计问题。由Gauss-Markov定理出发,他考虑的(a)二次型和(b)无偏估计Q。此外,他还加上(c)Q的方差独立于均值这个条件(这个条件是他在文[13]中讨论方差分析检验中功效函数的先导条件)。
许宝騄指出的通常估计在该类中具有一致最小方差的充要条件。他并且讨论了一些具体的模型。对于一样本情况, 的确具有一致最小方差这个性质。后来,C.R.Rao(1952)再次提出这个问题,并且将条件(c)改成Q为正定,而Seely(1971)进一步考虑等价的“不变性”条件。可以这么说,许宝騄的这篇文章是近年来开始大量研究的方差和方差分量的最优二次估计的开山之作。
许宝騄接着着手于小样本推断的研究工作。研究工作主要围绕单变量及多变量的线性假设检验问题,特别是关于这些检验的功效函数的性质的研究。这个领域中的第一篇文章[5]中,许先生得到了Hotelling 检验的功效。指出在非零假设之下,分布是一个非中心的变量和一个与之相独立的中心变量的比值的分布。他同时指出检验具有局部最大功效。此外,他还指出统计量的某些新的应用。
对统计量的研究,很自然地引向对单变量的一般线性假设问题的多变量推广。单变量的一般线性假设检验问题是由Kolodzieczyk(1935)提出的。为了推广早期文献中提出的几个例子,许宝騄在文章[10]中提出了一般多元线性假设检验问题的典型形式,并得到了协方差矩阵已知时,非零假设之下,似然比统计量的分布。对于协方差阵未知的情形,记为相关行列式方程的根。许考虑检验统计量和, 并证明了当样本量趋于无穷时,两者的渐近功效是相同的。在后来的文章[13]中,许宝騄将多元回归中的检验问题转化为典型形式,然后利用[10]中的结果得到解决。
在这一系列小样本文章中最重要的一篇是[13]。文中许宝騄得到单变量线性假设似然比检验的第一个最优性质。事实上,这是关于多于一个参数的假设检验的第一个整体最优性质。Kolodzieczyk早已证明,对于具有两个以上约束条件的线性假设检验问题,不存在一致最大功效相似检验。记表示似然比统计量的分布所依赖的唯一的非中心参数。许宝騄指出,似然比检验在功效函数只依赖于的所有检验中具有最大功效。后来人们才认识到,这个条件等价于自然的一类变换之下功效函数的不变性,其相应的最优性质之结果等价于该检验具有一致最优不变性。
这篇文章(指[13])所涉及的问题,后来在以下两个方面得到进一步发展。一方面,他的学生Simaika(1941)将许的理论应用到多元分析理论,主要是Hotelling 和多重相关系数理论。后来Wald(1942),Hsu(1945),Wolfowitz(1949)和Lehmann(1959)等人又进一步发展了他的理论。另一方面,许宝騄的这篇文章提供了得到一切相似检验的新方法。在许宝騄的建议之下,Simaika(1941)和Lehmann(1947)等将其应用到其它问题的研究中去,最后导致完全性概念的形成(Lehmann和Scheffé (1950) )。
参考文献
EATON, MORRIS L. and OLSHEN, RICHARD A. (1972).
Random quotients and the Behrens-Fisher problem. Ann.
Math. Statist. 43 1852--1860.
HSU, P. L. (1945). On the power functions for the -test
and the -test. Ann. Math. Statist. 16 278--286.
KOLODZIECZYK, S. (1935). On an important class of
statistical hypotheses. Biometrika 21 161--190.
LEHMANN, E. L. (1947). On optimum tests of composite
hypotheses with one constraint. Ann. Math. Statist 18
473--494.
LEHMANN, E. L. (1959). Optimum invariant tests. Ann.
Math. Statist. 30 881--884.
LEHMANN, E. L. and SCHEFFE, HENRY (1950).
Completeness, similar regions and unbiased estimation.
Sankhya 10 305--340.
RAO, C. RADHAKRISHNA (1952). Some theorems on
minimum variance estimation. Sankhya 12 27--44.
SCHEFFE, HENRY (1970). Practical solutions of the
Behrens-Fisher problem. J. Amer. Statist. Assoc.
65 1501--1508.
SEELY, JUSTUS (1971).Quadratic subspaces and
completeness.Ann. Math. Statist. 42 710-- 721.
SIMAIKA, J. B. (1941). On an optimum property of two
important statistical tests. Biometrika 3270--80.
WALD, ABRAHAM (1942). On the power function of the
analysis of variance test. Ann. Math. Statist.13 434--439.
WOLFOWITZ, J. (1949). The power of the classical tests
associated with the normal distribution. Ann. Math.
Statist. 20 540--551.