
- 董秘您好!请问贵公司是否已经部署了DeepSeek?如果已经部署了,请问主要应用于哪些具体的业务?公司接入DeepSeek有哪些成本、收益方面的考量?如果公司计划在未来再进行部署,计划将DeepSeek应用于什么具体的业务呢?我们投资者非常期待您的回复,谢谢!
2025-03-12 19:21:26
尊敬的投资者:您好,目前公司已经完成DeepSeek本地化部署,主要用于公司数据内部的生产业务,辅助公司进行数据预标注,进一步提升数据生产效率,降低处理成本。感谢您的关注!2025-03-12 19:21:26
[ 详细 ] - 公司是否评估过DeepSeek大模型(尤其是其推理优化与合成数据技术)对训练数据需求的影响?未来是否有计划针对DeepSeek的模型架构(如MoE、强化学习)开发定制化数据集,以提升双方技术协同性?”
2025-02-21 15:33:30
尊敬的投资者,您好:(1)Deepseek推出了一系列模型,其中V3模型依然使用了预训练、以及SFT等训练方式,其中预训练阶段的token使用量达到了14.8T,远超GPT4等同类可比大模型预训练阶段的数据使用量,且在后训练阶段也使用了一定规模的标注数据,这也更加说明海量以及高质量数据对于基础模型能力提升的重要意义。(2)关于让大家震撼的R1模型,基于目前的公开信息来看,其部分优势体现在推理类任务上,尤其是那些具备较强的规则性、可以推导的任务类型上,确实不需要大量的人工标注,但是对于其他领域(尤其是更为广阔的垂向领域)的复杂问题,依然需要观察,我们认为高阶的数据专家的参与依然非常重要。(3)此外,数据质量不仅影响模型获取和表达知识的能力,还决定了模型生成内容的风格和准确性,帮助DeepSeek实现了在输出端的文采能力提升。 其一,高质量数据可以提升模型表达和推理能力。优质数据包含准确、连贯且富有表现力的语言样本。例如,包含CoT数据可以引导模型在推理时进行反思,进而在生成回答时展现出清晰的逻辑和优美的语言表达。这正是DeepSeek模型能够生成既准确又具有华丽文风的关键因素之一。其二,高质量数据可以降低噪音和确保一致性。数据中的错误、噪音或不一致信息会导致模型生成内容出现语法或逻辑问题。高质量的数据则能有效减少这些问题,使模型更好地学习到语言规律,从而提高整体生成质量。 其三,高质量数据可以提升泛化能力。数据的多样性和全面性使得模型在面对不同领域和任务时都能生成高质量的回答。丰富且准确的样本帮助模型在多种场景下自如切换风格,无论是精炼的技术解答还是文采斐然的创意写作,都能游刃有余。 (4)往未来看,MoE等算法架构会发挥各自优势,进一步助推模型向产业端发展,真正让大模型技术深入滲透到各个行业中,这一过程中必将凸显专业知识的直要性,需要更多数据、以及数据专家的参与,因此我们看好并期待未来大模型在各行业百花齐放的局面。2025-02-21 15:33:30
[ 详细 ] - DeepSeek的API调用成本仅为OpenAI的1/30,可能推动更多企业使用大模型。公司是否观察到下游客户因大模型普及而新增数据采购需求?在智能驾驶、多模态等场景中,是否有与DeepSeek生态客户协同拓展的计划?
2025-02-21 15:33:30
尊敬的投资者,您好:(1)Deepseek模型的出现以及推理成本的大幅降低,有望进一步助推模型向产业端发展,真正让大模型技术深入滲透到各个行业中,这一过程中必将凸显专业知识的直要性,需要更多数据、以及数据专家的参与,因此我们看好并期待未来大模型在各行业百花齐放的局面。然而,DeepSeek模型发布的时间相对较短,市场对其应用还需要一定时间来逐步反应和呈现。但公司会持续关注市场需求变化,不断建设和完善自身数据服务能力,以更好适应DeepSeek带来的新兴数据需求。(2)目前公司在为各类模型厂商提供包括智能驾驶等各类场景下的各类多模态数据服务/产品。以智能驾驶为例,公司为模型训练提供精准、高质量的智能驾驶场景数据,帮助模型更好地学习和理解复杂的路况信息;在多模态场景中,公司可提供图像、文本、语音等多类数据服务,助力模型提升多模态交互能力的提升。未来,公司会为各类生态客户在相关场景中提供数据产品/服务,共同探索更多业务发展机会。2025-02-21 15:33:30
[ 详细 ] - 国家发改委明确公共数据运营服务费实行政府指导价管理,并建立成本核算机制。公司作为数据要素服务商,如何通过技术降本(如自动化标注、合成数据)提升在公共数据授权运营中的竞争力?是否已探索与政府或国企合作开发标准化数据产品?
2025-02-21 15:33:30
尊敬的投资者,您好:(1)公司持续进行算法投入,积累了各领域的算法模型超过200个,应用于公司内部的数据生产过程,旨在提升数据处理效率、形成规模效应,进而实现降本增效。(2)未来,公司将积极尝试接洽,探索公共数据相关数据业务。2025-02-21 15:33:30
[ 详细 ] - 国家数据局强调‘数据价值需体现在企业降本增效中’。公司2023年境内收入占比65%,未来是否会依托公共数据开放政策(如政务、医疗数据),进一步扩大国内政企客户占比?在数据回流、基层治理等场景中有无新增订单?
2025-02-21 15:33:30
尊敬的投资者,您好:(1)公司非常重视国家数据局关于数据价值体现在企业降本增效的相关政策导向,并且也关注到了公共数据开放政策带来的机遇,未来公司将积极探索,公共数据相关业务,力争进一步扩大国内政企客户范围。(2)未来,公司将积极尝试接洽,探索相关数据业务。2025-02-21 15:33:30
[ 详细 ] - DeepSeek的崛起是否加速了行业对智能化数据生产的需求?公司在算法辅助标注、自动化质检等领域的技术投入,能否应对Scale AI等新兴竞争对手的挑战?
2025-02-21 15:33:30
尊敬的投资者,您好:(1)DeepSeek发布前,数据服务行业对智能化标注的要求和需求就在不断提升,因为伴随整个AI行业发展,行业数据需求体量不断增加,数据标注成本和效率的控制成为算法客户关注的重要指标,所以,智能化标注一直以来都是行业重要的发展方向。(2)目前,公司已在多数场景下引入了智能化标注,即通过算法进行预先标注,实现高效的人机协同。未来,公司也将持续进行算法的优化和迭代,以持续提升标注效率以及扩大覆盖场景。2025-02-21 15:33:30
[ 详细 ] - DeepSeek涉及大量数据处理,公司作为数据合规标杆企业,是否已与类似大模型厂商探讨数据采集、标注中的合规解决方案?未来是否可能将数据安全能力输出至DeepSeek生态?
2025-02-21 15:33:30
尊敬的投资者,您好:(1)公司历来重视数据安全管理,在采集和标注等环节均符合模型厂商的数据合规要求。公司在数据安全方面实现了多项工作成果。资质方面,公司取得北京市规划和自然资源委员会行政许可,获得乙级测绘资质,为公司智能驾驶采集业务拓展奠定基础;开展信息系统等级保护测评工作,获得等保三级备案证明;继续持有ISO27001信息安全管理体系认证、ISO27701隐私信息管理体系认证,在行业内具备较强的数据安全与隐私保护能力。行业参与方面,公司根据自身实践经验撰写的《人工智能训练数据资源全生命周期风险识别与管理应用案例》获评中央网信办人工智能企业典型应用案例;公司成为中国信通院数据安全推进计划成员单位;公司根据实践经验总结、撰写的《人工智能基础数据业务之个人信息收集活动的合规审计》案例获选中国信通院、中国内审协会“全国首届数字化审计论坛”评选的“个人信息保护合规审计先锋实践案例”,公司数据安全管理工作获得了行业认可。(2)公司在为各大模型厂商提供数据服务时,都将严格遵守国家相关法律法规,确保数据服务全流程的安全合规。2025-02-21 15:33:30
[ 详细 ] - DeepSeek-R1模型在规则性任务中减少了对标注数据的依赖,但公司强调垂类领域仍需高质量数据。请问公司在医疗、法律等专业领域的专家知识积累能否转化为与DeepSeek合作的差异化优势?是否已探索合成数据与人工标注的融合方案?
2025-02-21 15:33:30
尊敬的投资者,您好:(1)DeepSeek目前不是公司客户。目前,公司已为部分大模型厂商提供医疗和法律相关数据处理服务,相关数据处理经验将为公司拓展垂类标注服务奠定重要基础,在未来大模型向垂向拓展时,更好抓住市场机遇。(2)数据合成技术虽然可以作为数据采集的有效辅助,但也存在较强的局限性,会降低真实世界各类特征的训练效果,因此目前仅可作为数据采集的一种辅助方式。合成数据可以认为是人工智能行业发展到一定阶段的必然产物。从目前数据服务行业来讲,以计算机视觉场景为例,合成数据主要应用于某些高危的、罕见的corner case的模拟训练当中,但合成数据毕竟是由机器生成的虚拟数据,其数据质量以及真实性仍无法替代真实场景数据,因此按照目前的技术路线,绝大多数企业仍在使用真实场景数据进行模型训练。但公司会紧密关注合成数据技术的发展,根据最新的行业动态及时调整公司业务布局。2025-02-21 15:33:30
[ 详细 ] - 国家数据局明确公共数据需‘供出来、用起来’,并发布智能网联汽车等20个示范场景。公司作为AI训练数据龙头,是否已通过技术平台(如自动化标注)或合资公司(如河北数海)参与相关场景建设?在公共数据授权运营的政府指导价框架下,公司如何通过降本增效提升盈利能力?
2025-02-21 15:33:30
尊敬的投资者,您好:(1)目前公司数据产品/服务可服务于智能驾驶、内容生成、机器人、智慧医疗、智慧教育、智慧金融等22种创新应用场景。智能驾驶一直以来都是公司重要业务板块。以智能驾驶为例,公司在数据处理平台以及算法上进行持续投入,目前已具备3D点云语义分割、BEV(鸟瞰图)、千万大点云以及4D标注等各类行业前沿数据标注能力,同时平台集合各类前沿算法,在数据处理工具迭代以及算法赋能方面均处于行业领先水平,目前,公司智能驾驶服务客户数量已经超过90家。(2)公司持续进行算法投入,积累了各领域的算法模型超过200个,应用于公司内部的数据生产过程,旨在提升数据处理效率、形成规模效应,进而实现降本增效。2025-02-21 15:33:30
[ 详细 ] - 国家数据局提出‘公共数据先行’,并发布第二批20个示范场景(如智能网联汽车、新能源等)。公司作为AI数据服务商,是否已参与相关示范场景建设?在公共数据治理、标注、合规流通等领域有何技术储备或合作案例?
2025-02-21 15:33:30
尊敬的投资者,您好:(1)目前公司数据产品/服务可服务于智能驾驶、内容生成、机器人、智慧医疗、智慧教育、智慧金融等22种创新应用场景。以智能驾驶场景为例,公司在数据处理平台以及算法上进行持续投入,目前已具备3D点云语义分割、BEV(鸟瞰图)、千万大点云以及4D标注等各类行业前沿数据标注能力,同时平台集合各类前沿算法,在数据处理工具迭代以及算法赋能方面均处于行业领先水平,目前,公司智能驾驶服务客户数量已经超过90家。(2)目前,公司暂未在公共数据相关领域进行拓展,未来,公司将积极尝试与相关部门/企业接洽,探索业务合作可能。2025-02-21 15:33:30
[ 详细 ] - DeepSeek近期发布的模型强调多模态数据与垂类场景的深度适配。请问公司在智能语音、自然语言处理等领域积累的多语种、多音色标准化数据集,是否已针对此类大模型的训练需求进行优化?未来是否会推出适配MoE(混合专家)架构的专项数据产品?
2025-02-21 15:33:30
尊敬的投资者,您好:(1)公司在智能语音、计算机视觉以及自然语言等多模态领域积累深厚,公司相关数据集产品和服务已为国内外众多多模态大模型的研发提供支持。(2)MoE等算法架构将会发挥其优势,进一步助推模型向产业端发展,真正让大模型技术深入滲透到各个行业中,这一过程中必将凸显专业知识的直要性,需要更多数据、以及数据专家的参与,因此我们看好并期待未来大模型在各行业百花齐放的局面。截至24年6月,公司已积累超过1,650个标准化数据集产品,可服务于各类大模型架构的开发;同时,公司也可提供大模型各类架构下的数据定制服务。2025-02-21 15:33:30
[ 详细 ] - DeepSeek的低成本API策略可能推动更多中小企业使用大模型,进而催生数据标注的长尾需求。请问公司是否已通过平台化、自动化技术降低服务成本,以捕捉此类增量市场?目前中小客户收入占比是否有提升趋势?
2025-02-21 15:33:30
尊敬的投资者,您好:(1)公司持续进行算法投入,积累了各领域的算法模型,应用于各类数据生产过程,旨在提升数据处理效率、形成规模效应,进而实现降本增效,以更好获取市场认可,捕捉增量市场。(2)相关收入数据,还请您参考公司即将发布的2024年年度报告,感谢您的关注!2025-02-21 15:33:30
[ 详细 ] - 国家数据局要求公共数据授权运营机构具备‘数据安全及合规能力’。公司已建立成熟的数据安全体系,这是否为竞标公共数据项目提供了差异化优势?与Scale AI等对手相比,公司如何通过‘技术+合规’双壁垒抢占市场份额?
2025-02-21 15:33:30
尊敬的投资者,您好:(1)公司在数据安全方面实现了多项工作成果。资质方面,公司取得北京市规划和自然资源委员会行政许可,获得乙级测绘资质,为公司智能驾驶采集业务拓展奠定基础;开展信息系统等级保护测评工作,获得等保三级备案证明;继续持有ISO27001信息安全管理体系认证、ISO27701隐私信息管理体系认证,在行业内具备较强的数据安全与隐私保护能力。行业参与方面,公司根据自身实践经验撰写的《人工智能训练数据资源全生命周期风险识别与管理应用案例》获评中央网信办人工智能企业典型应用案例;公司成为中国信通院数据安全推进计划成员单位;公司根据实践经验总结、撰写的《人工智能基础数据业务之个人信息收集活动的合规审计》案例获选中国信通院、中国内审协会“全国首届数字化审计论坛”评选的“个人信息保护合规审计先锋实践案例”,公司数据安全管理工作获得了行业认可。(2)除了上述数据安全能力,公司还具备较强的技术实力,公司历来重视技术研发,持续进行算法、平台等能力维度的提升,实现人机协同效率,不断提升数据处效率和降低成本。例如,在智能驾驶业务方面,公司推出了新一代智能驾驶数据处理平台DOTS-AD,该平台可支持更多场景、更多传感器、以及更前沿的自动驾驶感知算法需求,可覆盖市面上主流3D、2D-3D融合、4D标注需求以及更为前沿的数据处理能力(包括:BEV鸟瞰图标注、点云叠加标注等);同时,算法中台功能更加完善,2D算法准确率持续提升,3D算法功能逐步完善;此外,平台操作的友好度同比提升,助力人工标注效率的提升。技术与数据安全将在未来更好助力公司业务拓展。2025-02-21 15:33:30
[ 详细 ] - 董秘您好,公司主营数据处理,本次deep seek在技术上取得突破引发了资本市场的波动,请问第一,海天瑞声是否与deep seek有业务往来?第二deep seek在采用无监督学习方法和弱监督学习方法的技术突破之后,对公司数据业务的影响会有多大?有哪些有利的展望和不利的展望,公司将如何应对新的变化?
2025-02-10 15:43:34
尊敬的投资者,您好: 1、截至目前,公司暂未与DeepSeek有任何形式的合作。未来,公司将积极尝试接洽,探索业务方面的合作可能。 2、我们也很关注DeepSeek模型,它的出现确实带来了很多技术上的突破,具体如下: (1)DeepSeek模型是一系列模型,比如V3模型依然使用了SFT等训练流程。 (2)关于让大家震撼的R1模型,基于目前的公开信息来看,其部分优势体现在推理类任务上,尤其是那些具备较强的规则性、可以推导的任务类型上,确实不需要大量的人工标注,但是对于其他领域(尤其是更为广阔的垂向领域)的复杂问题,依然需要观察,我们认为高阶的数据专家的参与依然非常重要。 (3)往未来看,DeepSeek模型的出现,有望强力助推会产业发展更进一步,真正让大模型技术深入渗透到各个行业中,这一过程中必将凸显专业知识的重要性,这一过程需要更多数据专家的参与,因此我们看好并期待未来各行业百花齐放的局面。 感谢您的关注!2025-02-10 15:43:34
[ 详细 ] - 请问当前公司客户中以通用大模型企业为主,还是垂直模型行业为主,有大概的比例吗? Deepseek模型的出现,降低了人工数据标注的需求,请问公司目前人工数据标注业务收入占比高吗?
2025-02-10 15:43:34
尊敬的投资者,您好: 1、公司客户群体较为丰富,我们很欣喜地看到垂域模型的客户呈现增长态势。 2、我们也很关注DeepSeek模型,它的出现确实带来了很多技术上的突破,就您关心的问题,我们的看法如下: (1)DeepSeek模型是一系列模型,比如V3模型依然使用了SFT等训练流程。 (2)关于让大家震撼的R1模型,基于目前的公开信息来看,其部分优势体现在推理类任务上,尤其是那些具备较强的规则性、可以推导的任务类型上,确实不需要大量的人工标注,但是对于其他领域(尤其是更为广阔的垂向领域)的复杂问题,依然需要观察,我们认为高阶的数据专家的参与依然非常重要。 (3)往未来看,DeepSeek模型的出现,有望强力助推会产业发展更进一步,真正让大模型技术深入渗透到各个行业中,这一过程中必将凸显专业知识的重要性,这一过程需要更多数据专家的参与,因此我们看好并期待未来各行业百花齐放的局面。 感谢您的关注!2025-02-10 15:43:34
[ 详细 ] - 董秘新年好,基于商业秘密的原因,目前很多公司的数据是不能拿出去给大模型训练的。但是,随着低成本大模型的出现,很多公司的自有算力已经足够运行大模型封闭训练公司数据。此时,公司需要专业的基础数据服务公司将其专有数据整合成大模型能够吸收的形式,这是一块新的市场,请问公司有布局的计划吗?
2025-02-10 15:43:18
尊敬的投资者:您好,大模型的低训练以及推理成本,将进一步加速大模型向产业以及应用端的拓展,而大模型想要实现应用端落地,则需要在基模型的基础上,针对特定领域进行post-training,SFT和强化学习,以学习特定领域的知识并用恰当的表述方式进行表述,而这背后依赖的是高质量的训练数据,以及更加智能化、工程化的数据处理能力。目前,公司的训练数据产品/服务已覆盖工业、教育、医疗、法律等专业领域,未来,公司业务也会伴随AI向产业和应用端加速落地,实现数据服务范围的进一步拓展。2025-02-10 15:43:18
[ 详细 ] - 请问公司目前业务是否与DEEPSEEK存在关联或者合作?如果目前没有关联,那是否有计划接入DEEPSEEK?
2025-02-10 15:43:18
尊敬的投资者:您好,截至目前,公司暂未与DeepSeek有任何形式的合作,也暂未接入DeepSeek模型。未来,公司将积极尝试接洽,探索业务方面的合作可能;同时也将尝试接入DeepSeek以更好服务于数据生产业务。2025-02-10 15:43:18
[ 详细 ] - 尊敬的董秘您好,请问贵公司是否会考虑或 已经接入幻方量化的deepseek或与deepseek进行业务合作?
2025-02-10 15:43:18
尊敬的投资者:您好,截至目前,公司暂未与DeepSeek或幻方量化有任何形式的合作,也暂未接入DeepSeek模型。未来,公司将积极尝试接洽,探索业务方面的合作可能;同时也将尝试接入DeepSeek以更好服务于数据生产业务。2025-02-10 15:43:18
[ 详细 ] - 尊敬的上市公司您好:AI训练数据市占率国内第一,Deepseek与量化投资机构幻方的技术生态关系密切,海天瑞声是幻方的核心数据服务商,通过幻方这一纽带,海天瑞声间接为Deepseek提供数据支持。尊敬的董秘这条消息是否属实
2025-02-07 15:36:27
尊敬的投资者:您好,截至目前,公司暂未与DeepSeek或幻方量化有任何形式的合作,未来将积极尝试接洽,探索业务方面的合作可能。2025-02-07 15:36:27
[ 详细 ] - 尊敬的董秘你好,请问公司和幻方的DeepSeek(深度求索)公司有没有合作。
2025-02-07 15:36:27
尊敬的投资者:您好,截至目前,公司暂未与DeepSeek或幻方量化有任何形式的合作,未来将积极尝试接洽,探索业务方面的合作可能。2025-02-07 15:36:27
[ 详细 ]