阳光石油网|石油技术交流|石油人论坛

 找回密码
 欢迎注册
查看: 4797|回复: 0

数据清洗

[复制链接]
  • TA的每日心情
    奋斗
    2020-1-2 10:07
  • 签到天数: 4 天

    [LV.2]偶尔看看I

    发表于 2018-7-10 10:51:14 | 显示全部楼层 |阅读模式

    马上注册,下载丰富资料,享用更多功能,让你轻松玩转阳光石油论坛。

    您需要 登录 才可以下载或查看,没有账号?欢迎注册

    x
    本帖最后由 姜宝胜 于 2018-7-10 10:52 编辑

          如果把机器学习比作是做饭,那么最初的数据清洗相当于洗菜和摘菜。数据清洗能够加深对数据的深入理解,对后续的算法应用有着至关重要的作用。数据清洗通常以数据可视化的方式初步探索数据的分布方式、正态检验。填补缺失数据,数据异常值的处理、数据转换、基于数据库的清洗。相关图书主要有《用python进行数据分析》该书主要介绍了python3个库numpy(数组),pandas(数据分析)和matplotlib(绘图)的学习。从pandas库的数据分析工具开始利用高性能工具对数据进行加载、清理、转换、合并以及重塑;利用matpIotlib创建散点图以及静态或交互式的可视化结果;利用pandas的groupby功能对数据集进行切片、切块和汇总操作;处理各种各样的时间序列数据。链接:https://pan.baidu.com/s/1x2T9gB4RO8i8GRC4BigygA 密码:0ihn


    您需要登录后才可以回帖 登录 | 欢迎注册

    本版积分规则

    QQ|Archiver|手机版|小黑屋|阳光石油网 ( 鲁ICP备2021003870号-1 )

    GMT+8, 2024-5-19 03:03 , Processed in 0.057157 second(s), 19 queries .

    Powered by Discuz! X3.4 Licensed

    Copyright © 2001-2021, Tencent Cloud.

    快速回复 返回顶部 返回列表