0


Tabular Playground Series - Jan 2022

介绍

每月的表格数据的playground

1月的地址:https://www.kaggle.com/c/tabular-playground-series-jan-2022/

指标

要求使用的指标是 SMAPE对称平均绝对百分比误差(Symmetric Mean Absolute Percentage Error)

注意点:当真实值有数据等于0,而预测值也等于0时,存在分母0除问题,该公式不可用!

Python代码如下

# https://www.kaggle.com/c/web-traffic-time-series-forecasting/discussion/36414

def SMAPE(y_true, y_pred):
    denominator = (y_true + np.abs(y_pred)) / 200.0
    diff = np.abs(y_true - y_pred) / denominator
    diff[denominator == 0] = 0.0
    return np.round(np.mean(diff),5)

说明

2021年的每月Tabular Playground 都是使用CTgan对真实数据的训练后生成的新数据,可以理解为脱敏的数据,因为11和12月的比赛我没参加,所以不知道其他具体情况,但是今年1月份的比赛变成了真实数据(据说)。
但是规则没变,还是前三名。

本次比赛类似以前的M5,但是数据量要少很多,我觉得甚至可以直接分组训练。

比赛的tag使用 TPS-Jan22,链接如下:
https://www.overfit.cn/tag/tps-jan22

记录[+]

2022-01-04T13:51:31+08:00 更新指标和python实现代码
2022-01-03T22:56:44+08:00 加入更新

“Tabular Playground Series - Jan 2022”的评论:

还没有评论