單因素樣本分析
單因素方差分析用於完全隨機設計的多個樣本均數間的比較,其統計推斷是推斷各樣本所代表的各總體均數是否相等。以下是有小編為大家整理的單因素方差分析,希望能幫到你。
單因素方差分析的用途
完全隨機設計***completely random design***不考慮個體差異的影響,僅涉及一個處理因素,但可以有兩個或多個水平,所以亦稱單因素實驗設計。在實驗研究中按隨機化原則將受試物件隨機分配到一個處理因素的多個水平中去,然後觀察各組的試驗效應;在觀察研究***調查***中按某個研究因素的不同水平分組,比較該因素的效應。
計算公式
完全隨機設計的單因素方差分析是把總變異的離均平方和SS及自由度分別分解為組間和組內兩部分,其計算公式如下。
MS組間=離均平方和/組間自由度
MS組內=離均平方和/組內自由度
SS總=SS組間+SS組內
單因素方差分析:核心就是計算組間和組內離均差平方和。兩組或兩組以上資料,大組全部在一組就是組內,以每一組計算一均數,再進行離均平方和的計算:
SS組間=組間離均平方和,MS組間=SS組間/組數-1***注:離均就有差的意思了!!***
SS組內=組內離均平方和,MS組內=SS組內/全部資料-組數
F值=MS組間/MS組內
查F值,判斷見下面的分析步驟部份。
分析步驟
例5.1某軍區總醫院欲研究A、B、C三種降血脂藥物對家兔血清腎素血管緊張素轉化酶***ACE***的影響,將26只家兔隨機分為四組,均喂以高脂飲食,其中三個試驗組,分別給予不同的降血脂藥物,對照組不給藥。一定時間後測定家兔血清ACE濃度***u/ml***,如表5.1,問四組家兔血清ACE濃度是否相同?
本例的初步計算結果見表5.1下部,方差分析的計算步驟為
1***建立檢驗假設,確定檢驗水準
H0:四組家兔的血清ACE濃度總體均數相等,μ1=μ2=μ3=μ4
H1:四組家兔的血清ACE濃度總體均數不等或不全相等,各μi不等或不全相等
α=0.05
2***計算統計量F值
按表5.2所列公式計算有關統計量和F值
=5515.3665
ν總=N-1=26-1=25
ν組間=k-1= 4-1=3
ν組內=N-K=26-4=22
表5.3例5.1的方差分析表
變異來源
總變異
8445.7876
25
組間變異
5515.3665
3
1838.4555
13.80
組內變異
2930.4211
22
133.2010
3***確定P值,並作出統計推斷
以= 3和= 22查F界值表***方差分析用***,得P <0.01,按0.05水準拒絕H0,接受H1,可認為四總體均數不同或不全相同。拒絕或者接受均值相等的結論是最關鍵的一環。也是最主要的目標。分析的目的就是想知道,究竟有沒有差異。
其中不論是統計軟體的結論還是人工計算,對於這個問題的結果,有幾種說法,現在歸納如下:
①是否接受零假設:零假設也稱為無效假設,對於具體的問題,許多都是一個模式,但是,也不能脫離具體問題,例如,消費者的對於一個問題的評價在四組中有沒有差別,專業術語就是是否存在差異。如果,只有二組,就可以用簡單的引數檢驗。但是這裡有四組,所以,必須使用方差分析。零假設是消費者對於一個問題的評價在四組中沒有差別。好的,結果,最重要的P值也是統計表格的Sig值,如果小於0.05,就是推翻零假設,結論就是有區別,P值越小代表區別越大。還有一例,方差齊性:所有的分析當然希望方差齊性,這裡,零假設並不總是不如人願,零假設是方差齊性。如果小於0.05,說明方差不齊,所以並不是所有的小於0.05是研究者希望看見的。實際上,方差分析適用條件不是非常嚴格,例如對正態來說,只要不是嚴重的偏態,如果樣本量比較大,結果都跟穩定。對於方差齊性問題,只要所有組中最大最小方差之比小於3,檢驗結果也非常穩定。
數學原理就是小概率反證法,置信區間一般設為95%,所以,才以0.05為分水嶺,究竟拒絕還是接受零假設。這個零假設意義重大。
②是否有統計意義:如果P值小於0.05,就有統計意義,說明得到想要知道和證明的東西,有繼續深入分析的必要,也就是,如果大於0.05,說明,所有組別都沒有差別,也就根本不用二二比較。如果根據資料背景 ,也有收穫,就是,根本不用再研究,因為沒有差別。或者,再重新抽樣變換方法再研究。例如,在控制其他作用因素後,激素水平是否的確在二組間存在差異。這個例子是屬於醫學統計的,在病人的化驗單上,不僅有激素水平,還有五花八門的指標例如血脂,血糖,肌酐,白細胞等等,這些所有的指標都可以作為統計的物件,分為二組或者多組,進行差別分析。所以,方差分析的應用範圍很廣。
注意:根據方差分析的這一結果,還不能推斷四個總體均數兩兩之間是否相等。如果要進一步推斷任兩個總體均數是否相同,應作兩兩比較
二二比較:在做統計分析時候,需要有一些專業知識,但是,如果有些原理不知道,可以每一個都試一試。尤其對於複選框。然後將各種方法的結果進行對比,找出不同,並且找出不同的原因。
二二比較有將近二十種不同的方法,建議就是,都選,然後比較結果。這裡特別要提的方法也是最重要的方法是spss的LSD.LSD的方法敏感度最高,總的二類錯誤非常小,如果這種方法沒有檢驗出差別,結果100%沒有差別。有時,許多方法都是大同小異,就類似於在系統中設定的小數點不同,結果有些輕微差異。舉一反三,在許多統計軟體的方法中,也需要知道一些方法背景,然後到統計軟體操作。也就是幾秒鐘出來結果,挨個試,再跟理論對比。
擔保函樣本