聚類是一個將case分類的數據,它不是一個嚴格的統計方法,所以是一個很有爭議的方法。但是因為沒有可以替代他的方法,所以現在大家也都在用。
方法/步驟
依次點擊:analyse--classify--hierarchical cluster,打開分層聚類對話框
在聚類分析對話框中,
將聚類用到的變量都放到variables中
將地區變量放入case標籤中,他的意思是每一個數據都用地區這個值來命名
點擊plot按鈕,打開對話框,設置要輸出的圖
在打開的對話框中,勾選dendrogram,然後點擊continue按鈕。這個dendrogram是層次聚類譜系圖,最後我們還會分析這個圖
點擊method按鈕,設置聚類的方法
如圖所示,通常我們用到的聚類方法是wards method,接著我們需要把變量轉換成z分數,點擊continue按鈕
點擊save按鈕,填寫希望保存的聚類類別數範圍3--8,據此選項,spss將在數據編輯窗口中添加7個變量,分別標明聚類數位3--8類情況下各省市所屬的類
設置輸出的聚類類別數範圍3--8,點擊continue按鈕
點擊ok按鈕,開始輸出數據處理的結果
你看到的下面的這個表格叫做聚類過程表,其內容並不是經常被關注,因為大部分實際應用中,聚類的具體過程是被忽略的。但是聚類係數可以幫助我們判斷將數據分為幾類最合適,判斷的方法是,相鄰的兩個數據變化的幅度顯著大於前面的係數的變化範圍,這時候分類在這裡就是最好的
最後是層次聚類譜系圖,從這個圖中可看到聚類的過程,根據你的需求選擇分類的組數