ai-100 day10 記錄

Ngchiwa Ng
2 min readMar 29, 2020

--

去除離群值

去除離群值方法

  • 对数转换: 用ln()
  • 缩尾: 把離群值設為分别在第 2.5 百分位和第 97.5 百分位进行缩尾
  • 截尾: 移除離群值data
  • 插值

ref:

原本數據, 有些點是比較偏遠(ex >4000)

原數據:

把資料壓縮在指定range ( df[column].clip(min, max))

直接去除比遠的資料

--

--

Ngchiwa Ng
Ngchiwa Ng

Written by Ngchiwa Ng

Backend/iOS Engineer, rock the world

No responses yet