跳转至

Pandas技巧

本文总阅读量次 ,原创教程,严禁转载

我攥了很久才汇总出这篇小技巧合集,Pandas数据分析小技巧手册。

小技巧1:如何使用map对某些列做特征工程?

小技巧2: 使用 replace 和正则清洗数据

小技巧3:使用 melt 如何对数据透视分析?

小技巧4:已知 year 和 dayofyear,怎么转 datetime?

小技巧5:如何将分类中出现次数较少的值归为 others?

小技巧6:如何快速找出 DataFrame 所有列 null 值个数?

小技巧7:如何处理和填充空值?

小技巧8:如何用 Pandas 快速生成时间序列数据?

小技巧9:如何重新排序 DataFrame 的列?

小技巧10:如何完成数据下采样,调整步长由小时为天?

小技巧11:100G数据如何先随机读取1%?

小技巧12:通过标准差如何找出异常值?

小技巧13:通过分位数如何找出异常值?

小技巧14:如何修复非法值?

小技巧15:如何过滤重复值?

小技巧16:如何使用 apply 去掉特殊字符?

小技巧17:如何使用 cut 做数据分箱?

小技巧18:如何使用 rank 做排名?

小技巧19:如何使用 category列转数值?

小技巧20:如何快速拿到数据最多的3个分类?

小技巧21:如何使用 count 统计词条出现次数?

小技巧22:DataFrame转定制的json

技巧23: 筛选出满足要求的分组

技巧24: 对每个分组做聚合

技巧25: 批量随机生成时间戳

技巧26: 使用滑动窗口找出频繁刷单用户

更多小技巧陆续推送中...