网友提问 :董秘你好!请问Yan 1.0大模型有什么突出特点?他的数据来源是哪里?与其他大模型相比有什么优势?预计什么时候面向市场推广?预计会给公司收益有什么帮助?
2024-05-06 15:24:07
岩山科技 (002195): 回答:您好,感谢对公司的关注。
公司生成式AI(AIGC)业务于2024年1月发布了国内首个非Attention机制的通用大模型——“Yan 1.0模型”。Yan架构没有采用Transformer架构及Attention机制,将计算复杂度从Transformer架构标准Attention机制的O(n^2*d)(其中n表示序列长度、d表示特征维度,^2指平方)降低为O(n*d)(线性复杂度),从而提高了Yan架构模型的训练效率和收敛速度。
在对比实验情况下Yan 1.0模型拥有相较于同等参数Transformer架构Llama 2模型更高的训练推理效率、吞吐量及记忆能力,更低的机器幻觉表达,同时支持CPU无损运行并100%支持私有化应用。原生结构的Yan架构模型,在零压缩、零裁剪的情况下,依然能够流畅运行于主流消费级CPU设备。
公司生成式AI(AIGC)业务现阶段商业化的重点主要在尝试为企业客户提供本地化应用和部署,满足客户对于数据隐私、安全及低成本部署上的需求,目前尚未形成规模收益。
谢谢。
2024-05-16 16:54:01