overfit同步小助手

2023-07-01 04:01:57

开源模型bloomz可以做哪些中文任务？

    Chatgpt很强大，开源的bloomz可以做些什么呢？效果如何？下面使用其70亿参数的模型测试一下效果。

    运行环境：腾讯云P40（24G），deepspeed，transformers

    使用模型：bigscience/bloomz-7b1-mt，支持中文

    推理时GPU占用：14G+

1.情感分类-结果是对的

2.实体提取-结果不对

3.摘要-效果不佳

4.问答提取-效果不佳

5.相似问-效果不佳

6.翻译-直译？

结论：优点是能同时支持多类任务，缺点是效果与chatgpt相差甚远，即便是gpt3与chatgpt也相差甚远。预训练大模型gpt-3+指令微调+人类对齐=chatgpt。

标签：人工智能

本文转载自: https://blog.csdn.net/wxl781227/article/details/129261092
版权归原作者 wxl781227 所有，如有侵权，请联系我们删除。

发表评论

登录后发布评论

“开源模型bloomz可以做哪些中文任务？”的评论:

还没有评论

关于作者

overfit同步小助手

文章同步

相关阅读

网络安全法-网络运行安全

使用selenium/drissionpage时如何阻止chrome自动跳转http到https

docker desktop 里部署的Open WebUI 管理员密码忘记了的处理方法

在ubuntu20.04中搭建onsite比赛运行环境

利用开源的低代码表单设计器FcDesigner高效管理和渲染复杂表单结构

Kafka学习笔记

【前端】浏览器输入url到页面呈现发生了什么？

文章导航