抽樣分佈和樣本分佈
抽樣分佈:
從已知的總體中以一定的樣本容量進行隨機抽樣,由樣本的統計數所對應的概率分佈稱為抽樣分佈。抽樣分佈是統計推斷的理論基礎。
如果從容量為 的有限總體抽樣,若每次抽取容量為 的樣本,那麼一共可以得到N取n的組合個樣本***所有可能的樣本個數***。抽樣所得到的每一個樣本可以計算一個平均數,全部可能的樣本都被抽取後可以得到許多平均數。如果將抽樣所得到的所有可能的樣本平均數集合起來便構成一個新的總體,平均數就成為這個新總體的變數。由平均數構成的新總體的分佈,稱為平均數的抽樣分佈。隨機樣本的任何一種統計數都可以是一個變數,這種變數的分佈稱為統計數的抽樣分佈。
樣本分佈:
總體是指考察的物件的全體,個體是總體中的每一個考察的物件,樣本是總體中所抽取的一部分個體,而樣本容量則是指樣本中個體的數目樣本分佈是用來估計總體分佈的。樣本分佈有區別於總體分佈,它是從總體中按一定的分組標誌選出來的部分樣本容量。
實際中很多不確定現象都可以用隨機變數描述,而應用中的一個十分重要的問題是找到隨機變數的分佈或其數字特徵。 例如:某進出口貿易公司進口了10萬臺微型計算器,按產品技術規定,使用壽命小於4000小時即為次品,且次品率大於1% 就不接受這批產品。如何得知這批產品的次品率呢?是否要測量每一臺計算器呢?顯然,這是不現實的,解決這個問題的好辦法就是 隨機抽樣,然後根據 抽樣檢驗得到的次品率來估計整批產品的次品率。也就是從10萬臺產品中按 隨機原則,抽取一部分***假如100件***產品組成一個樣本,由樣本***100件產品***次品率推斷整批產品的次品率。
這裡,我們把被觀察物件的全體***本例中的10萬臺計算器***稱作總體,把從總體中隨機抽取的***被抽中的100臺計算器***小群體稱作樣本,而樣本中所包含的個體單位數目稱為 樣本容量***100個***。
對於這批計算器,我們關心的是它的使用壽命***低於4000小時的比例有多少***的分佈,設X表示“任一臺計算器的使用壽命”,它是一個隨機變數,我們把隨機抽中的100件產品看作是100個隨機變數X1,X2……,X100,每一個計算器的使用壽命都是一個隨機變數,一旦測試完畢,測試的結果就是100個 觀測值x1,x2,……x100, 統計抽樣的任務就是根據測試結果x1,x2,……x100來估計總體X的分佈情況。
我們作如下概括:設X是一個 隨機變數,X1,X2……,Xn是一組相互獨立與X具有相同分佈的隨機變數,稱X為總體,X1,X2……,Xn為來自總體的簡單隨機樣本,簡稱樣本,n為 樣本容量,稱樣本觀察值為樣本值,由於按 隨機原則取樣,在試驗之前,人們無法知道試驗的結果,所以X1,X2……Xn,是一組隨機變數,而在試驗之後,得到一組X1,X2……,Xn的觀察值x1,x2,……xn,,它們則是一組確定的數值。
處方書寫樣本