每天都有大量信息涌现,我们的注意力很容易被分散,表面上看似了解了很多,但真正有价值的信息却少之又少。由于注意力有限,如何高效利用它获取高质量的信息一直是我关注的问题。除了主动订阅优质信息源外,还需要从各种推荐的信息流中提取对自己有用的信息,这也成为了我信息消费的核心需求。
每天接触到的内容主要是文章、播客和视频。我阅读文章较多,因此我最优先考虑的是利用 AI 帮我提前阅读,按结构化方式输出核心观点和全文摘要,然后通过这些摘要和总结决定是否需要详细阅读。
为此,我开始体验和寻找市面上的 AI 工具,看看哪款能满足我的需求。
AI 总结产品体验
我挑选并使用了几款市面上的 AI 总结类产品,同时也手动构建了自己的 AI 总结 bot,在这个过程中对自己的需求和现有的 AI 产品有了一些思考。
现有产品体验
通义智文
最初我尝试了通义智文,它可以对网页链接、PDF 文件、专业论文和电子书进行总结。但是很快我发现它与我的需求不符。原因在于它只提供概述和摘要,且总结质量较低,部分我关注的内容并未包含在内。此时需要我主动提问,它才能给出相关内容。而我期望的是一个完整的结构化信息,让我可以基于自己的关注点展开提问。
当然,它也有一些优点,比如支持对阅读内容做笔记和翻译原文等,只是这些功能并不是我所需要的。
Podwise
偶然间我发现了一款名为 Podwise 的 AI 总结播客内容的产品,令我眼前一亮。它的口号与我的理念不谋而合:“Read, before Listen”。
Podwise 不仅支持查找播客、订阅播客、文字转播客、内容摘要、关键词总结、精彩语录,还能分享到笔记软件中。最让我满意的是它可以直接用脑图总结播客内容,这使得内容结构非常清晰。有了框架后,我可以对感兴趣的内容进行深入探索。
试用后,我觉得 Podwise 非常不错,但由于每月有免费使用次数限制(每月免费使用 4 次),于是我转向了国内的音频总结类产品——阿里的通义听悟。
通义听悟
语音转文字后,内容更容易被索引,摄取效率也更高,我可以更容易地找到自己感兴趣的内容。然而,通义听悟的使用体验不如预期。全文摘要、章节速览和发言总结这些功能的结果都比较生硬。此外,需要我主动从文本中寻找信息,而不是将整理好的内容呈现给我。
我尤其不理解,为什么通义智文和通义听悟都如此重视笔记功能,却不好好做总结。想来只有一个原因,那就是底层模型不够强,只能通过视觉层的功能来弥补模型的不足。想到这里我也释然了,毕竟 Podwise 用的是 GPT-4。
Podwise 给我的启发是,AI 总结的内容可以通过更加结构化的方式表达出来,尤其是通过脑图的方式,这让我能够快速看清内容的结构信息。结合我的初衷,我的需求变成了希望 AI 帮我总结内容并按照脑图或 Markdown 结构输出。
Kimi
后来,当 Kimi 变得流行起来时,我发现之前折腾的那些事情,Kimi 都可以直接支持,而且表现相当出色。无论是长文档、文字网页,还是播客链接、视频链接,它都可以解析并总结,然后按照你想要的方式展示出来,比如展示为 Markdown 或 Mermaid 格式。
Kimi 的内容详细程度可以根据你的提示词(Prompt)进行定义。当你想深入了解某个知识点时,可以直接与它继续对话,回答质量也相当不错。这让我再次有了一种如获至宝的感觉。
Kimi 的能力不仅仅局限于总结,它在联网搜索和翻译方面也处理得很好。在内容总结这个场景下,Kimi 的模型能力明显比通义强不少。
在不断寻找和尝试的过程中,我也在思考为什么不自己动手做一个 AI 应用?现在通过提示词的方式快速生成一个 AI 产品还是很令人兴奋的,而不再需要编写代码或开发程序。
尽管 Kimi 本身就支持通过提示词实现我需要的功能,但每次都现发指令去执行比较麻烦。Kimi 可以通过预设提示词的方式,把常用的提示词设置为常用语,一键呼出使用,非常贴心。只需不断优化自己的提示词,就能让大模型输出想要的总结。
Coze
Coze 支持用户快速、低门槛地搭建自己的 Chatbot,并可以将这些机器人一键发布到不同的平台进行应用。
在 Coze,我可以选择底层的模型(免费使用 GPT-4),输入自己的提示词(AI 可以帮助优化提示词),然后选择对应的插件(AI 可以帮助选择),基本就可以运转起来了。如果有进一步的需求,可以引用自己的知识库数据,甚至可以通过关联多个 bot 搭建一个 Agent 完成一系列任务。通过预览查看总结效果,不断调整提示词来达到自己想要的效果。
使用感受总结
AI 总结的质量很难评估,相同的内容在不同的模型上表现会有差异。要知道哪个模型的总结质量更高(目前来看,GPT-4 和 Claude 明显更强一些),必须先阅读原内容,再回头对比 AI 的总结。
评价总结效果时,我最看重以下几点:
- 内容不能偏离核心主题,不能大量遗漏;
- 输出的内容结构清晰,最好能配合一些图表;
- 输出的文字可读性强,表述方式不要太生硬。
从构建 Prompt 的角度来看,步骤可以拆解为:
- 将音视频转成文字;
- 基于文字内容进行总结;
- 按照结构化要求进行输出。
在执行层面,这些步骤可以通过两种方式实现:
- 使用大模型进行总结,总结效果取决于模型能力、自己的 Prompt、自己的知识库和平台插件;
- 使用现成的 AI 产品进行总结,这取决于模型能力、别人的 Prompt 和现有的微调。
思考与疑惑
在折腾的过程中,尤其是使用 AI 总结时,我不禁思考:AI 总结的内容是「准确」的吗?
每个人对内容价值的判断是不一致的。相同的内容,AI 认为重要的部分,我可能并不在意。如果我基于 AI 的总结结果去判断是否进行下一步阅读,反而可能遗漏我认为重要的部分。
「准确」这个问题可以进一步拆解为几个问题:
- 它总结的内容是否有遗漏或重复?
- 它总结的内容是否存在偏见与误差?
- 它总结的内容与原文真正想表达的一致吗?
AI 现阶段无法像人类那样深入理解文本或视频内容的深层含义和上下文联系,它的表现受限于训练的数据源和模型推理能力,从实现原理来看,可以说是在玩文字游戏。
开始怀疑之后,我又产生了几个相关问题:
- 从价值角度看,AI 总结帮我提高了多少效率?真的提高了吗?
- 会不会反而让我舍弃了一些自主思考和判断的机会?
以及:我真的能放心把总结的任务交给它吗?
带着这些疑问,我开始慢慢寻找答案。
以下是一些网友的观点:
一口新饭:憋了很久,但最终还是决定说出来的一个看法:最没有意义的 AI 应用就是那些「总结类产品」。原因如下:
- 它不能代替你阅读。总结的意义在于阅读之后,而不是阅读之前;
- 在「节省」时间的同时,它也让你离「一手信息源」越来越远。我们现在接触的很多已经是二手信息,这种没有阅读的「总结」是三手、四手、五手知识;通过「总结」学到的不是知识,而是以为自己学到知识的幻觉(或虚荣心)。
- 总结的本质是对具象知识的吸收和高度抽象。总结的最大获益者是做出总结的人,而不是阅读总结的人。跳过具象知识,就像猪八戒吃人参果:「你不知道有籽没籽儿,有核没核,它到底是个什么味儿啊」- 一个 80 后西游记迷控制不住的引用。
- 试图通过阅读总结学知识,是很多人「懂得很多道理,却依然过不好这一生」的原因。学习知识,获得智慧,没有捷径。
- 一个更加现实的问题是:你无法确定 AI 总结的准确性。想要确定它的准确性,你需要去读原文。所以,为什么还要费这个劲?(如果是读书,人家已经有了一个准确的 summary: 目录。如果是读论文,人家已经有了摘要。而书籍和论文是最好的信息源。)
- 这种 AI summary 甚至都不是可靠的内容筛选器。即使它总结得准确,这种高度抽象会导致那些越是正确的内容,被总结出来的越是那些「老生常谈」的大道理。看起来都千篇一律。你会错过很多好的内容。
Axton:GPT 类的语言模型本身就是一种有损压缩,再被良莠不齐的套壳软件继续有损压缩一遍,还能剩下什么呢?读这类总结就是看个热闹。所以总结类应用最大的用途就是帮助在视频中定位,比如大约在 7 分钟的时候开始讲什么了。
JimmyWong:并不是任何内容都适合 AI 总结,比如闲聊访谈类的播客就不适合,内容太过分散;或者短视频或者 vlog,很多都是只有画面,没有说话内容,这些都没法总结。
这些内容会更加适合 AI 总结:
- 主题较为明确的播客或视频,如:TED 视频
- 手机或者数码产品分享视频,如各种评测
- 新闻或者时事类播客或视频
我觉得自己还是需要一款 AI 内容总结工具的,只是需要区分内容去使用:
- 对于主题明确但内容较长,或者是英文内容,先用 AI 去总结或翻译;
- 基于总结的框架,再去判断是否需要进一步精读;
- 在精读过程中探索更一手的信息,主动思考并记录笔记;
- 阅读完成后,再整体人工总结一遍,吸收消化。
前两步是让 AI 帮助自己筛选过滤内容,然后进入主动阅读环节;后两步则是对优质内容进行学习和思考。切勿太依赖 AI 工具,把什么都丢给它去阅读总结。记住自己的出发点:在信息洪流中,更好地聚焦与思考。
最后,不得不说,AI 内容总结在当前阶段并不完美,但还是有它的价值。随着 AI 能力的提升,我相信这些问题大部分会得到解决。总有一天 AI 能切实帮到我们,让生活更加方便和智能。
如果您喜欢这篇文章,请关注公众号,获取最新资讯和独家内容!⬇️⬇️
版权归原作者 cha111 所有, 如有侵权,请联系我们删除。