學習weka一段時間了,可總感覺還是理解的不時很明白,今天看到一個大牛人的部落格,他對waka的各個方面的使用簡明扼要的寫了幾篇文章,看了這幾篇文章後,我的感覺是,文章不是特別的深,但是各方面的例子舉得都有,對整個weka的使用有了更進一步的認識,而且博主alex對程式碼做了很詳細的註釋,真是煞費苦心。確實是好文章,我認為特別是對初學者,更加適合,這裡整理下,把連結給出來,推薦給大家,方便大家學習,在此非常感謝alex!
Weka學習一(分類器演算法)
從前年開始使用weka最資料探勘方面的研究,到現在有一年半的時間了。看到我們同組的兄弟寫了關於weka方面的總結,我也想整理一下。因為網上的資料實在是太少,記得剛接手的時候,真是硬著頭皮看程式碼。不過到現在看來,也積累了很多的程式碼了。希望能夠在這裡跟大家分享一下學習weka的樂趣與經驗...
Weka學習二(聚類演算法)
上次我介紹了分類器的使用方法,這次我來介紹一下聚類演算法。聚類演算法在資料探勘裡面被稱之為無監督學習(unsupervised learning),這是與分類演算法(supervised learning)相對的。在它們兩者之間還一種叫做半監督學習(semi-supervised learning)這個我會在後面的文章中重點介紹...
Weka學習三(ensemble演算法)
前兩次我們講了資料探勘中比較常見的兩類方法。這次我來介紹一下ensemble(整合技術),總的來說,ensemble技術是歸類在分類中的。它的主要原理是通過整合多個分類器的效果來達到提高分類效果的目的...
Weka學習四(屬性選擇)
在這一節我們看看屬性選擇。在資料探勘的研究中,通常要通過距離來計算樣本之間的距離,而樣本距離是通過屬性值來計算的。我們知道對於不同的屬性,它們在樣本空間的權重是不一樣的,即它們與類別的關聯度是不同的,因此有必要篩選一些屬性或者對各個屬性賦一定的權重。這樣屬性選擇的方法就應運而生了...