网友提问 :2、为什么海天收入里一直是语音占比较高,而CV、NLP占比较低,是因为语音生产的技术门槛更高吗?

2024-03-01 00:00:00

海天瑞声 (688787): 回答:首先,相比于CV和NLP,语音是更早实现商业化落地的人工智能技术,比如天猫精灵、小爱同学、小度等智能音箱,苹果Siri、三星Bixby、腾讯微信语音交互等手机终端语音助手等产品纷纷推出市场,使用到智能语音的产品更为丰富和广泛,因此推高了市场上语音数据需求。此外,相比CV、NLP,语音数据的获取难度更高,一方面,市面上开源或网络获取的数据集质量和规模均较为有限,很难满足要求。以语音合成技术为例,对语音数据音质要求更为严苛,通常需要专业录音棚环境录制的10小时以上的音频;另一方面,为了实现最佳合成效果,通常音频需要覆盖多类音素组合以及多类情感表达,需要专业的数据服务商根据不同语种的发音特点以及客户具体使用场景进行综合设计,因此客户通常需要外购语音数据。另外,相比于竞对,海天在语音方面积累深厚,尤其是多语种方面的积累和能力,可以更好服务境外公司全球化布局。截至目前,公司已覆盖超过200种语种/方言,同时储备的高质量语音数据集达到1,041个,积累量全球领先。以上因素,共同使得公司语音收入占比较高。当前,随着市场端客户群体在自动驾驶、LLM、文生视频/图等应用方向研发投入的逐步抬升,公司在视觉、NLP方向的收入预期也将同步提升。

2024-03-01 00:00:00

热门互动

海天瑞声股票

海天瑞声
法定名称:
北京海天瑞声科技股份有限公司
公司简介:
公司前身为北京海天瑞声科技有限公司,成立于2005年5月11日。
经营范围:
AI训练数据的研发设计、生产及销售业务。
注册地址
北京市海淀区成府路28号4-801
办公地址
北京市海淀区成府路28号4-801

热搜牛散

热门股票

Copyright © 2016 特特股 tetegu.Com All Rights Reserved