文章目录
10月10日,我们迎来了2024年的《人工智能全景报告》(《State of AI Report 2024》),该报告已连续七年发布,成为AI行业流行的风向标。
报告链接:https://docs.google.com/presentation/d/1GmZmoWOa2O92BPrncRcTKa15xvQGhq7g4I4hJSNlC0M/edit?usp=sharing
2024年的《State of AI Report》由AI投资人 Nathan Benaich 和 Air Street Capital 团队制作,有213页,涵盖了研究进展、行业趋势、现有政策、安全问题、未来预测五个方面,对最新的 AI 发展现状和未来预期进行了深度分析。
Part 1:研究进展
1.1 模型性能提升与竞争
前沿实验室模型性能趋同,OpenAI的o1在推理计算上有优势,Llama 3缩小了与闭源模型差距。同时,中国模型在社区排行榜表现出色。
图:OpenAI在推出o1后保持了其领先地位,规划和推理成为主要的研究前沿。
图:前沿实验室的性能正在趋同
图:Llama 3 缩小了开放式和封闭式模型之间的差距。
图:随着开放源码获得大量社区支持,也成为监管方面的热点问题。它可能被用来混淆不同权重、不同数据集、不同许可和不同访问方法的开放性实践。
图:尽管受到制裁,中国的 LLM 仍在排行榜上名列前茅,中国开源项目在全球赢得拥趸。
1.2 模型技术创新
- 架构优化:如尝试模型压缩、混合架构探索等,提高性能并降低资源需求。
- 数据利用:合成数据应用增加,但存在模型崩溃风险;数据筛选方法改进,如JEST。
- 多模态发展:VLMs性能提升,扩散模型在图像和视频生成上更先进。
- 生物医学应用拓展:AI用于生物分子研究和医学领域,但评估和基准测试存在不足。
图:更好的数据整理方法能否降低训练计算要求?
图:VLMs 实现开箱即用的 SOTA 性能
图:图像生成的扩散模型越来越复杂
图:人工智能荣获诺贝尔奖
基础模型展示了它们超越语言的能力,多模态研究推动了数学、生物学、基因组学、物理科学和神经科学的发展。
图:AlphaFold 3:超越蛋白质及其与其他生物大分子的相互作用
Part 2:行业趋势
2.1 硬件竞争格局
- NVIDIA 市场地位稳固,AMD 和 Intel 挑战困难;
- AI芯片初创公司发展各异。
英伟达(NVIDIA)仍是全球最强大的公司之一,享受着市值达到3万亿美元的辉煌时刻,而监管机构也正在调查生成式人工智能(GenAI)内部的权力集中问题。
图:英伟达(NVIDIA)仍是全球最强大的公司之一
图:老牌竞争对手未能与英伟达缩小差距
图:AI芯片初创公司发展各异:与英伟达不同,他们大多已从销售系统转向开放模型之上的推理接口。
2.2 商业模式转变
- 企业盈利挑战:一些AI初创公司估值高但盈利难,大型模型提供商收入增长但成本也高。
- 产品多元化:从模型构建转向产品设计,如聊天机器人与编码环境结合等。
- 行业应用拓展:在医疗、法律、机器人等多领域应用增加,同时面临版权等问题。
图:一些AI初创公司估值高但盈利难
图:OpenAI 的 o1 是最优质的型号,其价格和延迟溢价都很高。
图:人工智能实验室从建立模型转向设计产品
图:GenAI 应用继续快速增长
Part 3:现有政策
3.1 各国监管举措
- 美国有行政命令,各州有不同规则;
- 欧盟AI法案通过;
- 中国进入监管执行期;
- 英国有相关立法动向。
3.2 数据隐私与安全
各国监管聚焦数据抓取问题,对科技公司提出规范要求。
Part 4: 安全问题
识别并降低未来高能力人工智能系统可能给我们带来的灾难性风险。
4.1 安全意识转变
从强调安全到加速应用,同时安全研究也在加强。
图:从美国国会听证会和全球巡回宣传AI(存在)安全议程的时代,领先的前沿模式公司正在加速向消费者分发其人工智能产品。
4.2 安全风险应对
- 越狱攻击与防御:相关研究增多,但防御难度大。
- 潜在攻击形式:包括训练数据污染、偏好数据操纵等。
- 模型可靠性提升:探索提高模型可靠性的方法,如评估和改进不确定性估计。
图:随着攻击面的扩大,开发人员对越狱的研究也在不断深入
图:针对红队模型提出无穷无尽的潜在攻击是一项挑战。实验室正越来越多地使用 LLM 来扩展查找和修补漏洞的过程,其中包括 Meta 的两个团队。
图:LLMs 主要存在两种可靠性错误:与内部知识不一致的反应(幻觉)和与外部知识不一致的信息共享。
图:我们能否将已知的未知因素公之于众?LLM 通常很难为其输出结果指定可靠的置信度估计。
Part 5:未来预测
预测覆盖了人工智能领域的各个方面,从大型投资到无代码应用的兴起,再到数据隐私和人工智能法规的实施,甚至还涉及了开源技术的竞争、市场领导者的挑战、人形机器人的发展趋势。
5.1 2025十大预测
报告的最后部分,作者提出了他们对未来一年AI发展趋势的一些预测:
- 一个主权国家向美国的大型人工智能实验室投资超过100亿美元,引发国家安全审查。
- 一个完全没有编码能力的人创建的应用或网站走红,比如进入苹果应用商店前100名。
- 前沿实验室在案件开始审判后,对数据收集的实践方式发生了重大转变。
- 早期欧盟人工智能法案的实施结果比预期的要宽松,立法者可能会担心他们做得太过分了。
- 开源的OpenAI o1替代品在一系列推理基准测试中实现超越。
- 挑战者未能在英伟达的市场地位上取得任何有意义的突破。
- 由于公司难以实现产品市场契合,对人形机器人的投资水平将下降。
- 苹果在设备上的研究取得了强劲的成果,加速了围绕个人设备上人工智能的势头。
- 由人工智能科学家生成的研究论文被一个主要的机器学习会议或研讨会接受。
- 一个以「生成式人工智能」为元素互动的视频游戏将会取得突破性地位。
5.2 2023年度报告预测结果
对比去年的10大预测,我们来看看今年实现了几个?
去年报告预测的 10 项,有 5 项被证明是正确的,有 3 项被证明是错误的,有 2 项还没有完全达到,可以等明年再看看。
5.2.1 正确预测
- 好莱坞级别的制作公司开始使用生成式人工智能来制作视觉特效。
证据:虽然大部分效果还不理想,但生成式人工智能视觉特效已经在Netflix和HBO的作品中出现。
- 美国联邦贸易委员会(FTC)或英国竞争与市场管理局(CMA)基于竞争理由调查微软/OpenAI的交易。
证据:两个监管机构都在调查合作伙伴关系。
- 在全球人工智能治理方面,进展非常有限,会超出高层次的主动承诺(high-level voluntary commitments)。
证据:是的,来自布莱切利和首尔峰会的承诺仍然是自愿和高层次的。
- 一首由人工智能创作的歌曲进入公告牌Hot 100前10名或Spotify 2024年热门榜单。
证据:歌曲「Heart on My Sleeve」就是例子,也可以看到一首由人工智能创作的歌曲在德国中位列第27名,并保持了几天。
- 随着推理工作负载和成本的显著增长,一家大型人工智能公司(例如OpenAI)收购或建立了一个专注于推理的人工智能芯片公司。
证据:据报道Sam Altman正在筹集大量资金来实现,而谷歌、亚马逊、Meta和微软等公司也在继续构建和改进他们自己的人工智能芯片。
5.2.2 错误预测
- 有生成式人工智能媒体公司因其在2024年美国选举期间的滥用行为受到调查。
解释:目前还没有,但让子弹飞一会。
- 自我改进的人工智能智能体在复杂环境中(例如AAA级游戏、工具使用、科学探索)超越了现有技术的最高水平。
解释:还没有,尽管在开放性方面有一些比较有前景的工作,如在游戏上的强劲表现。
- 科技IPO市场解冻,至少看到一家以人工智能为重点的公司上市(例如DBRX)。
解释:虽然the Magnificent Seven公司已经获得了强劲的增长,但私营公司仍在等待市场稳定;人工智能芯片公司Cerebras已经申请IPO。
5.2.3 不确定预测
- 在生成式人工智能的扩展热潮中,有一个团队花费超过10亿美元来训练一个大规模模型。
解释:还没有完全达到,可以等明年再看看。
- 金融机构推出GPU债务基金,以取代风险投资股权美元用于计算资金。
解释:还没有,一些风险投资基金传闻提供GPU以换取股权,但还没见过有人走上债务路线。
想要继续阅读报告,请在公众号HsuDan回复「AI20241010」即可获取。
欢迎各位关注我的个人微信公众号:HsuDan,我将分享更多自己的学习心得、避坑总结、面试经验、AI最新技术资讯。
版权归原作者 快乐小码农 所有, 如有侵权,请联系我们删除。