社区首页
Pytorch
kaggle方案总结
人工智能
大数据
竞赛
后端
前端
程序开发
分享探索
社区首页
残差链接
从贝叶斯视角解读Transformer的内部几何:mHC的流形约束与大模型训练稳定性
近期研究揭示了一个有趣的现象:Transformer内部确实在执行贝叶斯推理:只不过不是符号化的方式而是几何化的。
登录可以使用的更多功能哦!
登录
作者榜
资讯小助手
资讯同步
内容小助手
文章同步
Deephub
公众号:deephub-imba
奕凯
公众号:奕凯的技术栈