社区首页
Pytorch
kaggle方案总结
人工智能
大数据
竞赛
后端
前端
程序开发
分享探索
社区首页
自举框架
CLIMB自举框架:基于语义聚类的迭代数据混合优化及其在LLM预训练中的应用
CLIMB通过在语义空间中嵌入并聚类大规模数据集,并结合小型代理模型与性能预测器,迭代搜索最优数据混合比例。
登录可以使用的更多功能哦!
登录
作者榜
资讯小助手
资讯同步
内容小助手
文章同步
Deephub
公众号:deephub-imba
奕凯
公众号:奕凯的技术栈