ai-100 day10 記錄
2 min readMar 29, 2020
去除離群值
去除離群值方法
- 对数转换: 用ln()
- 缩尾: 把離群值設為分别在第 2.5 百分位和第 97.5 百分位进行缩尾
- 截尾: 移除離群值data
- 插值
ref:
原本數據, 有些點是比較偏遠(ex >4000)
原數據:
把資料壓縮在指定range ( df[column].clip(min, max))
直接去除比遠的資料
去除離群值
去除離群值方法
ref:
原本數據, 有些點是比較偏遠(ex >4000)
原數據:
把資料壓縮在指定range ( df[column].clip(min, max))
直接去除比遠的資料