网友提问 :问:如何看待大模型为语音产业带来的新机会?
2024-06-13 00:00:00
科大讯飞 (002230): 回答:答:1、原来的语音合成、语音识别、机器翻译等单点技术,通过大模型的理解能力、文本生成能力在后台加持提升,实现了语义理解、指令跟随、多轮对话、情绪感知、超拟人合成,真正使得语音交互得到提升。OpenAI 最新发布的 GPT-4o 涉及的超拟人、全双工对话、端到端的极致体验速度,展示了人机交互能达到更好的水平,对整个语音市场都是一个非常大的推动。其中,超拟人合成,使得说话不再是朗读腔调,而是真的像人一样自由对话;全双工交互,可以同时进行信号的双向传输,人机对话可以随时打断和继续;语音到语音的端到端建模可实现快速反应的极致交互体验。2、语音领域的几乎所有应用都值得用新方式重构一遍,这是当前语音产业面临的全新战略机遇。例如所有企业的客服机器人等都可以重新做一遍;7×24小时营业场所的部分岗位、企业中的服务类岗位等都可以使用数字员工;汽车、手机、家庭助手等终端的智能语音服务也能得到很大提升,产业空间巨大。
2024-06-13 00:00:00