网友提问 :您好,贵公司半年报看到收录30亿篇,积累存储数据规模接近500TB,用的是NGram语言模型,是否能优化,训练出类似ChatGPT的聊天工具?
2023-02-13 15:09:58
开普云 (688228): 回答:尊敬的投资者,您好,感谢关注。公司的语言模型技术类型较为丰富,包括以Ngram技术为代表的传统NLP技术、以GPT为代表的预训练语言模型和以BERT为代表的掩码语言模型,这些语言模型由于其运算效率、训练数据量要求、处理精细标注问题能力的不同分别适合于不同的应用场景。例如数智安全产品中的文本高速分类采用了Ngram语言模型,数智安全产品中错敏信息检查采用了以BERT为基础的掩码语言模型,数智内容产品中的稿件续写、文本摘要采用了以GPT为基础的预训练语言模型。
2023-02-13 15:09:58