【Excel數據挖掘】分割數據的方法?

分割數據就是將數據一分為二,比如一個工作表有200行數據,我們要將其中70%的行分割出去用於其他的目的,那麼我們可以使用這個功能。通常我們在建立模型的訓練數據集和測試數據集的時候會用到改方法:

打開要分割的數據,在菜單欄上執行:數據挖掘--示例數據

打開了示例數據嚮導對話框,點擊下一步

設置數據源,也就是我們要分割什麼數據,這裡選擇默認的表格,點擊下一步,如果你的數據在數據庫中,可以選擇外部數據,然後寫上查詢語句

選擇抽象類型,如圖所示,有兩種類型,一種是隨機抽樣,這個大家都理解,管就是過渡抽樣,也就是第二個選項大家不容易理解,舉一個例子,假如教師和學生的理論比例是1:30,但是我們的數據不滿足這個比例,這可能是抽樣誤差造成的,為了滿足1:30的比例,我們選擇過渡抽樣,一般我們都是選擇第一個,點擊下一步

設置分割的百分比,一般我們使用70%的數據作為訓練數據集,點擊下一步

設置這70%和30%的數據表名稱,我們默認系統給出的名稱,然後點擊完成

我們看到在Excel中多出來了兩個表格,這就是上一步我們填寫的兩個名稱

相關問題答案