网友提问 :4、大模型预训练会涉及到版权数据,在版权数据方面,海天的价值是什么?
2023-09-08 00:00:00
海天瑞声 (688787): 回答:海天瑞声的价值主要体现在多版权数据的汇集、版权数据的清洗、以及基于客户大模型的后续服务。首先,海天瑞声可以汇聚不同版权方的数据,针对客户需求进行不同版权数据的提供。同时,海天瑞声可以针对客户具体定制化需求,对版权数据进行精细化清洗。虽然版权数据本身已为高质量数据,但仍无法直接用于模型训练,需经过高质量清洗后才能使用。例如,通常需将版权数据中重复数据以及不符合法律法规的相关内容进行清洗,以更好帮助大模型节约训练算力以及使大模型在训练后具备良好的法律道德价值观。
2023-09-08 00:00:00