July 5, 2007

抽樣分配 Sampling distribution 與 中央極限定理

 抽樣分配(Sampling Distribution)

還在初段班,真的得加快速度了,何時才能進到統計學的精髓呢。

之前記錄下的推論統計,是由龐大的母體中抽取有限的樣本(簡稱抽樣),來推論母體的狀況。抽取出來的樣本,其數目有限,而且其統計量(Statistics如樣本平均數,標準差之類),還是會與母體的統計量有差異,但是如果經由重複地抽樣,得到許多『組』的樣本,每一組的樣本之統計量雖然都會有差異,但是經由其機率分配,可以推得近似母體之統計量,當然樣本規模越大,其準確性越高,就是每次抽取之樣本次數越高,其準確性就會提升,把『可能的』樣本組合列出,就可以計算其機率分配,進而從此來推論母體囉:)。

如果是以例子來說明的話,如果有一個n=100的母體,從中抽取n=2的樣本,與抽取n=10的樣本,雖然抽取的樣本數越多,所得到這組的統計量計算就會較為複雜,但是算得之統計量,當然較為近似母體

所以我們可以得到下面兩個觀念:

(1)抽樣之後,經過計算所得之統計量,並非是母體的真實值(True Value),因為樣本只不過是母體的一部份

(2)隨機抽樣所得的一組樣本,因為是隨機地抽樣,所以每次得的樣本均不會完全相同,當然所得的統計量也會有所差異。

 樣本平均值之機率分配

母體平均數的推論,是統計學內推定理論最重要的一環,主要是利用樣本平均值之機率分配來求得。每次求得的樣本平均數雖然不一樣但是經由其機率分配,可以推算出母體平均數的值

樣本平均值之機率分配,其期望值E(x),也就是其機率分配的平均值,等於母體平均數:



其計算方式為:

1.首先列出抽樣樣本所有可能的情況,把所有情況都列出來吧!

2.計算出樣本的統計量,如樣本平均數或者標準差

3.所得到的樣本平均數或標準差,雖然每組都不一樣,但是可以把此當作一個隨機變數函數,可以求得其機率分配與圖形,進而推論母體平均值。

此時很重要的要知道:

抽樣是否來自於獨立的選樣。

所以抽樣的精神一定要密切注意,否則很容易導致實驗的誤差,或者誤解。所以這在實驗設計中佔很重要的一部份。

樣本平均值之分配的平均數:

這聽起來很饒舌喔,其平均數就是期望值E(X)

期望值E(x)=Xi x f(x)

這個之前就有提過了,點數乘以相對次數=平均值。也稱作期望值。

舉例一下好了:
擲一骰子20次  出現點數如下:
4,3,4,2,5,1,6,6,5,2,2,6,5,4,6,2,1,6,2,4

平均值=全部加起來除以數目=76/20=3.8

另一種計算方式可以用點數乘以其相對次數:
1(2/20) + 2(5/20) + 3(1/20)....=3.8

這種計算平均值的方式,我們也給它另一個名稱為期望值
所以只不過是另一種計算方式罷了。

=X *  F(X)。

也可以計算其變異數:

=X2f(x)-()2

所以上式求得之樣本平均值之機率分配的平均數=母體平均數。
樣本平均值之機率分配的變異數=母體變異數/樣本數n。

所以

母體平均值與變異數之表示法:


樣本平均值之機率分配的平均數與變異數之表示法:


 中央極限定理(Central Limit Theorem)


簡言之:無論母體的分配是否為常態分配,其樣本平均值之機率分配,只要母體變異不會太誇張,樣本數規模夠大,則樣本平均值的機率分配近似於常態分配。

圖示如下:

樣本規模為2:



樣本規模為3:



樣本規模為4:




當然如果母體為常態分配的話,從這個母體抽樣出來的樣本,當然之機率分配也為常態分配


但是如果當樣本規模很大時,分配是怎樣的呢?由圖可以看見,不論母體的機率分配為何,只要其樣本規模夠大,母體變異不會太誇張時,其樣本平均值之機率分配近似常態分配

其樣本平均值之機率分配的平均值與變異數如前所述:


平均值與變異數如圖所示,而標準差為:

   也就是變異數開根號啦。


所以可以把這個常態分配標準化
  近似於N(0,1)。


這裡有一個重要觀念,到底怎樣才能了解這個樣本平均值為常態分配呢?首先必須要觀看其變異程度,當然母體變異程度越大,其樣本平均值要呈現常態分布就越加困難,但是好險樣本平均值分配之變異數有除以n的開根號。所以只要n越大,就可以把樣本平均值之變異程度縮減,就會比較呈現常態分配的模樣。

那n到底要多大,才能說近似常態分配?

通常n>30時,這時就可以大聲說出來啦,其近似常態分配。

References:
1.http://en.wikipedia.org/wiki/Parameter
2.http://en.wikipedia.org/wiki/Central_limit_theorem
3.http://en.wikipedia.org/wiki/Variance
4.Statistics- Principles and Methods 
Richard A. Johnson / Gouri K. Bhattacharyya

0推薦此文章
Today's Visitors: 0 Total Visitors: 2998
Personal Category: Uncategorized Articles Topic: 未分類

Reply
  • 1樓

    1樓搶頭香

    Sealed

  • Sealed at September 29, 2008 12:01 AM comment
  • 2樓

    2樓頸推

    Sealed

  • Sealed at November 22, 2008 03:08 PM comment
  • 3樓

    3樓坐沙發

    必須先證明中央極限定理為真
    且樣本抽樣符合中央極限定理的要求
    才能作出樣本平均數的抽樣分配

  • . at November 25, 2009 01:47 PM comment
  • 4樓

    福樓

    我是初學者對統計只能用恐懼來形容,謝
    謝您這麼細心的分析,目前雖然談不上實
    質的受益,原因是我個人的邏輯推理與統計
    的概念非常差,需要逐一步驟的研讀始能有
    些微的長進,從今爾後我仍會持續的進入貴
    站拜讀,雖然不認識您但仍謝謝您的無私教
    導,謝謝

  • at December 9, 2009 12:26 AM comment
  • 5樓

    專業的5樓

    請問一下
    你的軟體是用甚麼跑的
    因為我現在要用軟體跑中央極限定理的
    應用
    也就是現在給定母體為B(10,0.5)
    分別求N=2,5,30的X平均數的抽樣分配
    感謝你

  • 育昇 at January 5, 2010 03:27 PM comment
  • 6樓

    6樓

    請問何謂樣本平均數抽樣分配之平均數?謝謝
    ~

  • at December 5, 2010 01:09 PM comment
  • 7樓

    7樓

    請問常態分配的標準化的分母應該除以n,而不是乘以n??

  • alexa at December 29, 2010 07:46 PM comment
  • 8樓

    8樓

    可以再多討論一點嗎? 謝謝
    例如: analysis of variance,
    analysis of covariance, p-
    value, cohort study, Quasi-
    experimental design,
    statistical significance.

  • Bryan at April 21, 2011 01:39 AM comment | email
Post A Comment









Yes No



Please input the magic number:

( Prevent the annoy garbage messages )
( What if you cannot see the numbers? )
Please input the magic number

誰來收藏
Loading ...
unlog_NVPO 0