作者:禅与计算机程序设计艺术
随着人工智能领域的飞速发展,智能机器人的需求量也在逐渐增长。目前,对于虚拟助手而言,主要分为三类:
- 任务型虚拟助手:主要针对特定任务,例如闲聊、工作助手、新闻推送等,通过对话或指令完成任务。
- 社交型虚拟助手:可以实现社交功能,如聊天、互动、情感交流等,用户可以通过语音进行沟通。
- 智能体助手(Chatbot):具备一定智能、语言理解能力,可以根据用户输入完成指定功能。 基于上述特点,笔者认为,目前的智能语音助手主要面临三个难题:
- 数据孤岛问题:不同类型的数据(文本、图像、声音等)被存放在不同的地方,导致无法形成统一的数据集,从而难以训练模型。
- 模型设计困难:当前的模型往往采用规则或者统计模型,但是缺乏足够的灵活性和可扩展性。
- 计算资源限制问题:硬件性能已经满足不了日益增长的对话请求,导致计算资源的紧张问题。 由此,我们期待一个具有更好的人机交互能力、数据共享和处理能力、自主学习能力的多样化的智能语音助手出现。## 2.基本概念术语说明### (1)ASR(Automatic Speech Recognition,自动语音识别) ASR是指将声音转化为文字的过程。它包括以下几个步骤:
- 发音:人类的声音通过麦克风被发送到外界。
- 采集:麦克风将声音信号转换成数字信息。
本文转载自: https://blog.csdn.net/universsky2015/article/details/131799018
版权归原作者 禅与计算机程序设计艺术 所有, 如有侵权,请联系我们删除。
版权归原作者 禅与计算机程序设计艺术 所有, 如有侵权,请联系我们删除。