各有关单位:
为贯彻落实市委、市政府关于人工智能产业发展和数据要素市场化配置改革工作部署,促进人工智能语料数据开放和交易,根据《深圳市打造人工智能先锋城市的若干措施》(深工信规〔2024〕13号)和深圳市市级财政专项资金有关管理规定,我局制定了《深圳市人工智能语料券专项资金操作规程》,现予以印发。
深圳市政务服务和数据管理局
2025年6月26日
深圳市人工智能语料券专项资金操作规程
第一章 总 则
第一条 为落实《深圳市打造人工智能先锋城市的若干措施》(深工信规〔2024〕13号,以下简称《若干措施》),进一步规范本市人工智能语料券专项资金的组织实施和监督管理,促进语料开放共享和交易,推动数据要素市场建设,依据市级财政专项资金有关管理规定等,结合本市实际,制定本规程。
第二条 本规程适用于市政务和数据主管部门组织实施的语料券专项资金管理活动,是市政务和数据主管部门组织实施语料券专项资金发放、制定申报指南的重要依据。
第三条 语料券专项资金是指市政务和数据主管部门为支持企业购买非关联方语料或企业按照相关要求开放语料的活动(以下简称“购买或开放语料活动”),由市级财政预算安排的具有专门用途的资金。语料券专项资金的发放具体包括语料采购资助和语料数据开放奖励两种方式。
前款所称语料采购资助,是指对企业通过数据交易所购买非关联方语料进行人工智能大模型研发和应用的活动,予以一定比例的资助。语料数据开放奖励,是指对企业通过深圳市公共数据开放平台开放符合要求的语料的活动,予以一定额度的奖励。
第四条 语料券专项资金的组织实施,应当遵循精准施策、公开透明、程序规范的原则,实行总额控制、自愿申报、规范审核、加强监管的闭合式管理模式。
第五条 市政务和数据主管部门负责制定和发布语料券专项资金的申报指南,并组织申请、受理、审核与核准等工作。
第六条 市政务和数据主管部门根据工作需要,依法依规委托提供专项审计、专家评审、数据合规等服务的第三方机构,协助开展事务性、辅助性以及专业化工作。
受委托的第三方机构应按约履责,按规定做好相关信息的安全管理和保密工作。
第二章 发放标准
第七条 市政务和数据主管部门每年设置最高5000万元作为语料券专项资金,具体发放金额根据当年度专项资金预算安排确定。
第八条 语料券专项资金按以下标准发放:
(一)语料采购资助
1.对于当年度符合条件的申报企业,每年按不超过语料采购总费用30%,最高200万元予以资助。语料采购总费用以直接用于语料数据采购的费用为准。具体资助金额根据语料采购总费用、数据量、应用成效等维度综合打分评定。
2.应用成效可以参考数字深圳联合创新中心(人工智能实验室)等平台或市场成效验证结果。
3.采购语料应用的项目获得省级以上人工智能类、科学技术进步类奖项,或者获得省级以上人工智能、科学技术相关创新平台资格认定的,可适当予以加分。
4.申报企业获得创新型中小企业、专精特新中小企业、专精特新“小巨人”中任意一个认定的,可适当予以加分。
(二)语料数据开放奖励
1.对于当年度符合条件的申报企业,每年按照下列标准进行奖励:
(1)申报企业在申报期限内累计开放语料数据规模达到以下标准之一(满足各类型中的任意一项数量即可,其他类型数据可以参照以下类型并根据实际情况评定),给予不超过40万元的奖励:
通用类,预训练文本类数据不低于10万条、标注文本类数据不低于1万条、指令集/图片类数据不低于1万组/张、音频/视频类数据不低于100小时、结构化数据不低于10万条;具身智能类,多模态数据不少于1万条(至少包含文本、RGB、深度三个模态)、动作与运动控制数据不少于1万条、人类行为数据不少于1万条、仿真场景不少于2000个、数字资产模型不少于1万个。
(2)申报企业在申报期限内累计开放语料数据规模达到以下标准之一(满足各类型中的任意一项数量即可,其他类型数据可以参照以下类型并根据实际情况评定),给予不低于40万元,最高100万元的奖励:
通用类,预训练文本类数据不低于6000万条、标注文本类数据不低于60万条、指令集/图片类数据不低于60万组/张、音频/视频类数据不低于2000小时、结构化数据不低于1000万条;具身智能类,多模态数据不少于5万条(至少包含文本、RGB、深度三个模态)、动作与运动控制数据不少于5万条、人类行为数据不少于5万条、仿真场景不少于1万个、数字资产模型不少于10万个。
2.奖励金额根据企业年度开放语料的数据量、质量、更新频率、应用成效等维度综合评定。
3.应用成效可以参考数字深圳联合创新中心(人工智能实验室)等平台或市场成效验证结果。
第三章 申报条件和申报材料
第九条 申报企业应当符合以下条件:
(一)申报企业为在深圳市内(含深汕特别合作区,下同)实际从事生产经营活动的企业及其控股子公司,以及该企业依法设立的分公司;
(二)申报2025年度语料券专项资金的企业应于2024年1月1日至2025年9月30日期间签署语料采购合同或完成语料数据的开放;申请2026年度语料券专项资金的企业应于2025年9月30日至2026年9月30日期间签署语料采购合同或完成语料数据的开放;
(三)企业采购或开放的语料应有明确、清晰、合理的适用场景;
(四)用于申报语料采购资助和语料开放奖励的数据,应当通过合规评估,申报企业应当提交数据交易所或第三方专业机构出具的数据合规报告;
(五)法律法规规章规定的其他条件。
第十条 除满足本规程第九条规定的申报条件外,申报语料采购资助的企业,应当同时满足以下条件:
(一)申报企业应当从事人工智能大模型研发和应用相关业务;
(二)申报企业应当通过数据交易所完成语料采购;
(三)申报企业采购语料用于开展人工智能大模型研发和应用的实施地应当在深圳市内,且该研发和应用项目不属于政府投资建设或购买服务项目。
第十一条 语料券每年度申报一次,由市政务和数据主管部门发布申报指南。申报企业应当在本规程规定的申报时限内,一次性提交当年度语料采购或开放的相关材料。
申报单位应当按照申报指南具体要求提交材料,对所提交材料的真实性、完整性和合规性负责,不得弄虚作假、套取专项资金。
申报单位应当配合相关部门完成监督、审计和统计等工作,并按要求开展问题整改。
第十二条 申报企业不可就同一购买或开放语料活动向有关部门多头申报。
第十三条 申报企业实施语料采购和开放活动,应当符合国家安全、商业秘密、个人隐私等相关法律法规规章要求,并依法采取保护措施。涉及个人隐私、个人信息和商业秘密的语料,申报企业应当取得权利主体的合法授权。如语料涉及科技伦理、科技安全等敏感领域,申报企业应当严格执行法律法规规章和相关科技伦理规定,做好风险防范。
第十四条 申报企业根据申报条件提交材料,包括但不限于:项目申请书、语料合规评估确认相关文件、生产经营和项目实施地说明、关联方允许开放语料的授权材料、语料采购或开放情况佐证材料、应用成效佐证材料(如有)、材料真实性承诺书等,具体以申报指南为准。
第四章 组织实施
第十五条 语料券专项资金的组织实施,包括组织申请与受理、审核与核准两大环节。
第十六条 组织申请与受理通过线上与线下相结合、以线上为主的方式进行,确有问题及需要的可通过窗口受理方式提交申请。相关工作程序如下:
(一)线上申请。市政务和数据主管部门分别于2025年9月底、2026年3月底前在市财政专项资金统一管理平台(以下简称“管理平台”)发布当年度申报指南。申报企业应根据申报指南的要求,通过广东政务服务网、“i深圳”、深圳市政务服务中心等渠道,提交相关申报材料。
(二)线上预审。市政务和数据主管部门对线上申报企业提交的项目申请书以及相关申报材料进行材料齐全性、内容合规性的形式预审。对存在问题的申报材料,应当向申请企业一次性告知补齐或修改意见以及再次提交的时限要求。
(三)纸质材料提交。如企业选择通过深圳市政务服务中心窗口提交申请材料,或者根据在线预审环节需要提交纸质材料完成材料真实性确认的,申报企业应当在规定的时限内,通过市政务服务中心综合受理窗口提交相关纸质材料。
(四)受理。通过审核后,市政务和数据主管部门向申请企业发出受理回执。
第十七条 审核与核准程序内容如下:
(一)实质性审查
1.业务审查。市政务和数据主管部门应当对申请材料的有效性、合规性等内容进行实质性审查。
2.专家评审。市政务和数据主管部门可以委托第三方机构组织专家组(由5人及以上单数专家组成),依据评审规则对项目进行打分,初步确定资助或奖励金额,并出具专家评审报告。专家评审可以根据实际需要,采取书面材料集中评审与答辩,或现场评审的方式进行。评审规则由市政务和数据主管部门另行制定。
3.专项审计。市政务和数据主管部门委托经政府采购服务中标的具备资质的审计机构,对发放方式、实施内容、实际支出费用、发放标准和申报条件等内容实行专项审计,并出具专项审计报告。
4.现场核查。根据应用成效确认等需要,市政务和数据主管部门可以对项目进行现场核查,申报企业应当根据要求准备相关材料并现场提交展示。
5.合规确认。市政务和数据主管部门制定合规确认原则,对购买或开放语料活动的数据合规情况进行审查,并委托第三方机构开展合规评估。
(二)征求意见。市政务和数据主管部门对实质性审核通过的企业就是否存在重复申请、生产经营指标数据是否存在超出误差等情况进行核查,如有需要,可以向市各主管部门和各区征求意见。
(三)确定发放方案。对通过上述审核程序的申报企业,市政务和数据主管部门综合专家评审、专项审计、现场核查、合规确认情况,结合年度预算安排,确定语料券专项资金拟发放企业和拟发放金额。
(四)社会公示。市政务和数据主管部门通过“i深圳”、管理平台等向社会公示发放方案,公示期限为5个工作日,公示内容应包括拟发放企业和拟发放金额。自然人、法人和非法人组织可以在公示期内向市政务和数据主管部门提出异议。市政务和数据主管部门组织对被提出异议的项目开展复审与调查,并将项目调查核实情况反馈给提出异议的单位或个人。
(五)拨付资金。在公示期内无异议或异议不成立的,市政务和数据主管部门及时下达资金拨付计划,按有关规定与市财政部门协同办理资金的拨付手续。
第五章 监督管理
第十八条 市政务和数据主管部门应当严格按照本规程相关规定,制定语料券专项资金年度申报指南。
第十九条申报企业使用虚假材料或者其他不正当手段骗取、套取语料券专项资金的,一经查实,市政务和数据主管部门追回全部已发放资金及利息。
第二十条 申报企业、第三方机构在语料券专项资金组织实施工作中,如存在弄虚作假、隐瞒事实、串通作弊、出具虚假报告等违法违规行为以非法骗取和侵占专项资金的,市政务和数据主管部门应根据国家和省、市有关法律法规规章规定,追究相应法律责任。
第二十一条 市政务和数据主管部门工作人员在语料券专项资金管理活动中存在滥用职权、玩忽职守、徇私舞弊等不依法履职的行为,依法依规追究行政责任。
第六章 附 则
第二十二条 本规程规定的语料券发放措施与我市市级层面其他同类优惠措施不重复享受。
对于已获得国家或省级财政支持的项目,我市各级财政对同一项目累计资助金额不得超过该项目经审计认定的投资额。
第二十三条 本规程所称语料是指经过采集、加工等数据处理,可直接用于开发和训练人工智能大模型的数据集合,具体包括文本、图像、视频、语音等形态。
本规程所称数据交易场所是经省、市人民政府依法批准成立的,组织开展数据交易活动的交易场所。
第二十四条本规程自2025年6月30日起施行,有效期2年。