資料清洗是什麼意思?
General 更新 2022年9月13日
資料清洗是指把一些雜亂無章的,和不可用的資料清理掉,留下正常的可用資料,從而提高資料質量。資料清理主要從資料的準確性、完整性、一致性、唯一性、適時性、有效性幾個方面來處理資料的丟失值、越界值、不一致程式碼、重複資料等問題。
資料清洗是什麼意思
資料清洗是對資料進行重新審查和校驗的過程,目的在於刪除重複資訊、糾正存在的錯誤,並提供資料一致性,是整個資料分析時必不可缺少的步驟。
資料清洗的原理的利用有關技術,如數理統計、資料探勘或預定義的清理規則將髒資料轉化為滿足資料質量要求的資料。
資料清理工作一般得在計算機的幫助下完成,其中包括了資料有效範圍的清理、資料邏輯一致性的清理和資料質量的抽查。
操作環境
品牌型號:通用
系統版本:通用