抽樣分配 Sampling distribution 與 中央極限定理
| 抽樣分配(Sampling Distribution) |
還在初段班,真的得加快速度了,何時才能進到統計學的精髓呢。
之前記錄下的推論統計,是由龐大的母體中抽取有限的樣本(簡稱抽樣),來推論母體的狀況。抽取出來的樣本,其數目有限,而且其統計量(Statistics如樣本平均數,標準差之類),還是會與母體的統計量有差異,但是如果經由重複地抽樣,得到許多『組』的樣本,每一組的樣本之統計量雖然都會有差異,但是經由其機率分配,可以推得近似母體之統計量,當然樣本規模越大,其準確性越高,就是每次抽取之樣本次數越高,其準確性就會提升,把『可能的』樣本組合列出,就可以計算其機率分配,進而從此來推論母體囉:)。
如果是以例子來說明的話,如果有一個n=100的母體,從中抽取n=2的樣本,與抽取n=10的樣本,雖然抽取的樣本數越多,所得到這組的統計量計算就會較為複雜,但是算得之統計量,當然較為近似母體。
所以我們可以得到下面兩個觀念:
(1)抽樣之後,經過計算所得之統計量,並非是母體的真實值(True Value),因為樣本只不過是母體的一部份。
(2)隨機抽樣所得的一組樣本,因為是隨機地抽樣,所以每次得的樣本均不會完全相同,當然所得的統計量也會有所差異。
| 樣本平均值之機率分配 |
母體平均數的推論,是統計學內推定理論最重要的一環,主要是利用樣本平均值之機率分配來求得。每次求得的樣本平均數雖然不一樣,但是經由其機率分配,可以推算出母體平均數的值。
樣本平均值之機率分配,其期望值E(x),也就是其機率分配的平均值,等於母體平均數:

其計算方式為:
1.首先列出抽樣樣本所有可能的情況,把所有情況都列出來吧!
2.計算出樣本的統計量,如樣本平均數或者標準差。
3.所得到的樣本平均數或標準差,雖然每組都不一樣,但是可以把此當作一個隨機變數函數,可以求得其機率分配與圖形,進而推論母體平均值。
此時很重要的要知道:
抽樣是否來自於獨立的選樣。
所以抽樣的精神一定要密切注意,否則很容易導致實驗的誤差,或者誤解。所以這在實驗設計中佔很重要的一部份。
樣本平均值之分配的平均數:
這聽起來很饒舌喔,其平均數就是期望值E(X)。
期望值E(x)=Xi x f(x)。
這個之前就有提過了,點數乘以相對次數=平均值。也稱作期望值。
舉例一下好了:
擲一骰子20次 出現點數如下:
4,3,4,2,5,1,6,6,5,2,2,6,5,4,6,2,1,6,2,4
平均值=全部加起來除以數目=76/20=3.8
另一種計算方式可以用點數乘以其相對次數:
1(2/20) + 2(5/20) + 3(1/20)....=3.8
這種計算平均值的方式,我們也給它另一個名稱為期望值。
所以只不過是另一種計算方式罷了。
=X * F(X)。也可以計算其變異數:
=X2f(x)-(
)2。所以上式求得之樣本平均值之機率分配的平均數=母體平均數。
樣本平均值之機率分配的變異數=母體變異數/樣本數n。
所以
母體平均值與變異數之表示法:

樣本平均值之機率分配的平均數與變異數之表示法:

| 中央極限定理(Central Limit Theorem) |
簡言之:無論母體的分配是否為常態分配,其樣本平均值之機率分配,只要母體變異不會太誇張,樣本數規模夠大,則樣本平均值的機率分配近似於常態分配。
圖示如下:
樣本規模為2:

樣本規模為3:

樣本規模為4:

當然如果母體為常態分配的話,從這個母體抽樣出來的樣本,當然
之機率分配也為常態分配。
但是如果當樣本規模很大時,分配是怎樣的呢?由圖可以看見,不論母體的機率分配為何,只要其樣本規模夠大,母體變異不會太誇張時,其樣本平均值之機率分配近似常態分配。
其樣本平均值之機率分配的平均值與變異數如前所述:

平均值與變異數如圖所示,而標準差為:
也就是變異數開根號啦。
所以可以把這個常態分配標準化:
近似於N(0,1)。
這裡有一個重要觀念,到底怎樣才能了解這個樣本平均值為常態分配呢?首先必須要觀看其變異程度,當然母體變異程度越大,其樣本平均值要呈現常態分布就越加困難,但是好險樣本平均值分配之變異數有除以n的開根號。所以只要n越大,就可以把樣本平均值之變異程度縮減,就會比較呈現常態分配的模樣。
那n到底要多大,才能說
近似常態分配?
通常n>30時,這時就可以大聲說出來啦,其
近似常態分配。
References:
1.http://en.wikipedia.org/wiki/Parameter
2.http://en.wikipedia.org/wiki/Central_limit_theorem
3.http://en.wikipedia.org/wiki/Variance
4.Statistics- Principles and Methods
Richard A. Johnson / Gouri K. Bhattacharyya

1樓
1樓搶頭香
Sealed
2樓
2樓頸推
Sealed
3樓
3樓坐沙發
必須先證明中央極限定理為真
且樣本抽樣符合中央極限定理的要求
才能作出樣本平均數的抽樣分配
4樓
福樓
我是初學者對統計只能用恐懼來形容,謝
謝您這麼細心的分析,目前雖然談不上實
質的受益,原因是我個人的邏輯推理與統計
的概念非常差,需要逐一步驟的研讀始能有
些微的長進,從今爾後我仍會持續的進入貴
站拜讀,雖然不認識您但仍謝謝您的無私教
導,謝謝
5樓
專業的5樓
請問一下
你的軟體是用甚麼跑的
因為我現在要用軟體跑中央極限定理的
應用
也就是現在給定母體為B(10,0.5)
分別求N=2,5,30的X平均數的抽樣分配
感謝你
6樓
6樓
請問何謂樣本平均數抽樣分配之平均數?謝謝
~
7樓
7樓
請問常態分配的標準化的分母應該除以n,而不是乘以n??
8樓
8樓
可以再多討論一點嗎? 謝謝
例如: analysis of variance,
analysis of covariance, p-
value, cohort study, Quasi-
experimental design,
statistical significance.