【阅读笔记】多任务学习之MMoE(含代码实现)
本文作为自己阅读论文后的总结和思考,不涉及论文翻译和模型解读,适合大家阅读完论文后交流想法,文末含MMoE的Pytorch实现及Synthetic Data的生成代码。
多任务学习中的网络架构和梯度归一化
多任务学习(Multi-task learning, MTL),旨在用其他相关任务来提升主要任务的泛化能力,多个任务共享一个结构并在一次正向传递中产生多个推理。
本文作为自己阅读论文后的总结和思考,不涉及论文翻译和模型解读,适合大家阅读完论文后交流想法,文末含MMoE的Pytorch实现及Synthetic Data的生成代码。
多任务学习(Multi-task learning, MTL),旨在用其他相关任务来提升主要任务的泛化能力,多个任务共享一个结构并在一次正向传递中产生多个推理。