如何使用SPSS處理缺失資料Missing?

Tags: 資料, 缺失,

我們在使用SPSS工具做資料分析時,有時會遇得到樣本量有缺失資料,那麼具體該如何處理這些缺失資料 Missing Data 呢?

工具/原料

SPSS軟體

缺失資料

方法/步驟

我們使用SPSS做資料分析的時候,有時會因為問卷的設定或者資料的儲存等原因,造成用於分析的資料部分缺失。我們分析資料前,需要先解決缺失資料問題,在再做分析。

如何使用SPSS處理缺失資料Missing Data?

在如圖所示的案例中,我們需要對這幾個變數做相關性分析。我們首先從Excel裡面匯入測試資料,依次點選“檔案-開啟-資料”,選擇我們需要的測試資料所在的Excel表格。

如何使用SPSS處理缺失資料Missing Data?

在圖示彈出的“開啟Excel資料來源”對話方塊中,我們在工作表下拉框中選擇“sheet2”(因為測試資料放在sheet2了),然後單擊確定即可。

如何使用SPSS處理缺失資料Missing Data?

接著,我們點開左下角的“資料檢視”,仔細觀看圖示各變數的資料,發現中間用單個句點來標識的地方沒有資料(這就是缺失資料,已用紅色框標註出來)。

如何使用SPSS處理缺失資料Missing Data?

缺失值分析

分析資料前,對於缺失值的處理非常重要,我們可以瞭解到缺失的原因,以及缺失值處理的正確與否能夠影響到後面的分析結果。首先,缺失值處理前,我們需要做一個缺失值分析。

如何使用SPSS處理缺失資料Missing Data?

我們依次點選選單欄“分析-缺失值處理”,然後會彈出【缺失值分析】對話方塊。這裡我們可以分析我們需要的分析缺失值的變數,和一些估計設定。

如何使用SPSS處理缺失資料Missing Data?

在圖示的案例中,我們選擇對5個變數做缺失值分析,我們把這5個變數從左側的框拖入到右側的“定量變數”框內(注意這5個變數沒有分類變數)。然後,在估計勾選“EM”和“迴歸”。

如何使用SPSS處理缺失資料Missing Data?

設定好後,我們點選確定,即可在輸出文件看到分析的結果。結果包括:單變數的統計。估計均值,估計標準差,EM相關性和迴歸估計的統計量。

如何使用SPSS處理缺失資料Missing Data?

均值替換法

在上一步分析的資料中,由於資料量不是很大,分析的結果比較正常,我們使用均值替換法,即用其他個案中該變數觀測值的平均數對缺失的資料進行替換。

如何使用SPSS處理缺失資料Missing Data?

在缺失值分析結果“單變數統計”表中,我們可以得到每個變數的均值,如圖所示,已用紅框標註。我們用每個變數的均值替換他們各自的缺失值。

如何使用SPSS處理缺失資料Missing Data?

我們依次點選選單欄“轉換-替換缺失值”,然後就會彈出【替換缺失值】設定視窗,把左側框內需要替換缺失值的變數拖入右側的“新變數”框內,然後輸入一個新的名稱,方法選擇“序列均值”。

如何使用SPSS處理缺失資料Missing Data?

如圖所示,我們已經用均值對每個變數的缺失值做了替換。在點選“分析-描述統計-描述”,即可統計表中顯示沒有缺失值。

如何使用SPSS處理缺失資料Missing Data?

多重替代法

處理缺失資料的另外一種替代方法為多重替代法,即從相似情況中或根據後來在可觀測的資料上得到的預設資料的分佈情況給每個預設資料賦予一個模擬值。

如何使用SPSS處理缺失資料Missing Data?

具體的操作步驟為,依次點選選單欄“轉換-替換缺失值”,然後就會彈出【替換缺失值】設定視窗。

如何使用SPSS處理缺失資料Missing Data?

我們首先把左側框內需要替換缺失值的變數拖入右側的“新變數”框內,然後輸入一個新的名稱,方法選擇“點處的線性趨勢”或“線性插值法”。

如何使用SPSS處理缺失資料Missing Data?

單擊確定,即可返回輸出文件結果,在圖示的“替換缺失值-變數結果”表中,我們可以看到有3個變數的4個缺失值已經被替換了。

如何使用SPSS處理缺失資料Missing Data?

我們再回到“變數檢視”,會發現此處多了3個新的變數(即替換有缺失值生成的3個新變數);在資料視圖裡面,也會發現新變數相比舊變數已經填充上了新資料。

如何使用SPSS處理缺失資料Missing Data?

刪除缺失行

對於缺失值的處理還有另外一種方法,那就是刪除缺失行,即即刪除SPSS 資料列表中缺失值所在的資料行。(注意:如果資料量較少不可取)

如何使用SPSS處理缺失資料Missing Data?

如果所示,我們需要刪除有缺失資料的第7、10、13、20行所有資料。刪除的方法有兩種:第一種可以手動刪除,在資料檢視即可操作;第二種,點選”資料“按鈕,彈出下拉選單,進入其中“選擇個案”選項,選擇”使用篩選器“,新增你要處理的case,然後在輸出中,你若選擇”刪除未選擇個案“,結果就是將有缺失值的case刪除掉。

如何使用SPSS處理缺失資料Missing Data?

如圖所示,我們已經把所有的缺失資料所在的case都刪除完了,原有的25個case已經變成了現在的20個。

如何使用SPSS處理缺失資料Missing Data?

注意事項

資料量如果比較少,不適用刪除缺失行。

資料量較多建議使用多重補充法。

相關問題答案