介绍
每月的表格数据的playground
1月的地址:https://www.kaggle.com/c/tabular-playground-series-jan-2022/
指标
要求使用的指标是 SMAPE对称平均绝对百分比误差(Symmetric Mean Absolute Percentage Error)
注意点:当真实值有数据等于0,而预测值也等于0时,存在分母0除问题,该公式不可用!
Python代码如下
# https://www.kaggle.com/c/web-traffic-time-series-forecasting/discussion/36414
def SMAPE(y_true, y_pred):
denominator = (y_true + np.abs(y_pred)) / 200.0
diff = np.abs(y_true - y_pred) / denominator
diff[denominator == 0] = 0.0
return np.round(np.mean(diff),5)
说明
2021年的每月Tabular Playground 都是使用CTgan对真实数据的训练后生成的新数据,可以理解为脱敏的数据,因为11和12月的比赛我没参加,所以不知道其他具体情况,但是今年1月份的比赛变成了真实数据(据说)。
但是规则没变,还是前三名。
本次比赛类似以前的M5,但是数据量要少很多,我觉得甚至可以直接分组训练。
比赛的tag使用 TPS-Jan22,链接如下:
https://www.overfit.cn/tag/tps-jan22