网友提问 :5、能否介绍下公司汤姆猫垂类模型的语料来源及未来的语料增长来源?
2024-06-20 00:00:00
汤姆猫 (300459): 回答:答:数据是数字时代的能源,是未来的生产要素。公司正通过打造会聊天的汤姆猫系列产品,构建新的 AI 应用场景,沉淀汤姆猫儿童垂类大模型,驱动儿童行为认知对话数据飞轮,赋能公司整体业务发展。公司现有线上 APP 在全球范围内拥有非常庞大的用户基础,公司通过积累相关业务数据,可以持续实现 AI 业务的双向循环反馈。在初期阶段,公司训练垂类模型的数据来源于:(1)“会说话的汤姆猫家族”IP 旗下积累了系列动漫影视剧本,目前该部分数据用于训练 IP人物的性格特征与价值观;(2)公司通过利用公开数据或采购部分结构化数据用于训练垂类模型;(3)在公司汤姆猫 AI 讲故事产品中,公司也在与部分优质内容合作伙伴开展合作,共同丰富产品内容;(4)公司主打陪伴、交互的 AI 应用产品测试过程中,公司持续搜集的用户闭环反馈、合规行为数据将是产品更新迭代及垂类模型训练的重要数据支撑。
2024-06-20 00:00:00