4
数据清洗与整合
P01: 金融数据获取、管理与初步分析
1
封面
2
项目总览
3
数据获取与口径
4
数据清洗与整合
5
描述性统计与可视化
目录
4.1
清洗步骤
4.2
存储策略
4
数据清洗与整合
4.1
清洗步骤
缺失值检测与必要填补
日期与代码字段标准化
重复记录去除
离群收益率标注
宽表与长表互转
多表按键合并并核对行数变化
4.2
存储策略
基础格式: CSV
进阶格式: Parquet
在本项目规模下,Parquet 在列式读取和类型稳定性方面更适合后续扩展。
3
数据获取与口径
5
描述性统计与可视化