在數據處理的時候,一般來說數據都是正態分佈的,按照正態分佈的性質,三個標準差以外的數據都,可以被看作是錯誤的數據從而排除掉,現在跟大家分享一下如何根據標準差來篩選數據。
方法/步驟
要想按照標準差篩選數據,必須先要求出每個數據的Z分數,如圖所示,在菜單欄上執行analyze--descriptive statistic--descriptive,打開描述統計對話框
將我們要篩選的數據放入到變量對話框中,勾選save standardized values as variables,這樣就能輸出Z分數了,點擊ok按鈕,輸出結果
我們看到,在數據窗口中多了一列數據,這就是我們求得的z分數,接下來要根據這組數據。來篩選數據
在菜單欄上執行data---select cases,打開數據篩選對話框
我們對case按照標準差進行選擇,需要根據條件來選擇,所以選擇if conditions is satisfied,點擊if來設置條件
在這裡我們輸入公式Zx2 <= 3 & Zx2 >= -3 ,這個條件的意思就是選擇數值在3和-3之間。點擊continue按鈕,返回到主對話框
在主對話框中,點擊ok按鈕,開始處理數據
最後我們看一下處理的效果,超過三個標準差的數據在前面都有一個斜槓表示刪除了。以後處理數據的時候他們就不參與了