序号 | 拟开放数据集 | 企业名称 | 数据集有关说明 |
1 | 用户画像与行为数据集 | 中国电信股份有限公司深圳分公司 | 包含流量使用量趋势、用户价值分档等字段,相关数据为统计数据。申报主体已做匿名化处理,未发现包含具体个人和企业等主体的敏感信息,以及违反国家安全、商业秘密、个人隐私等相关法律法规规章等情况。相关数据以结构化表格形式提供。 |
2 | 境外漫游数据集 | 包含漫游类型、漫游地区top3、费用分档、流量分档等字段数据,相关数据为统计数据。申报主体已做匿名化处理,未发现包含具体个人和企业等主体的敏感信息,以及违反国家安全、商业秘密、个人隐私等相关法律法规规章等情况。相关数据以结构化表格形式提供。 |
3 | 基于驻留模型的街道级人口归属数据 | 中国联合网络通信有限公司深圳市分公司 | 包含深圳市下辖各级行政区、街道级别发生过驻留情况的人口号码归属情况数据,相关数据为统计数据。申报主体已做匿名化处理,未发现包含具体个人和企业等主体的敏感信息,以及违反国家安全、商业秘密、个人隐私等相关法律法规规章等情况。相关数据以结构化表格形式提供。 |
4 | 基于迁移模型的街道级市内外人口流动数据 | 包含流入地、流出地和流动人口数量数据,相关数据为统计数据。申报主体已做匿名化处理,未发现包含具体个人和企业等主体的敏感信息,以及违反国家安全、商业秘密、个人隐私等相关法律法规规章等情况。相关数据以结构化表格形式提供。 |
5 | 基于交通工具模型的流动人口画像数据 | 包含流出深圳用户不同流动方式的性别年龄段分布数据,相关数据为统计数据。申报主体已做匿名化处理,未发现包含具体个人和企业等主体的敏感信息,以及违反国家安全、商业秘密、个人隐私等相关法律法规规章等情况。相关数据以结构化表格形式提供。 |
6 | AI订单分类训练数据表 | 华测检测认证集团股份有限公司 | 包含订单起始信息、样品名称、食品分类、执行标准等多维度订单相关字段。申报主体已做脱敏处理,未发现包含具体个人和企业等主体的敏感信息,以及违反国家安全、商业秘密、个人隐私等相关法律法规规章等情况。相关数据以结构化表格形式提供。 |
7 | 方言音频转写数据集 | 深圳市百川数安科技有限公司 | 包含方言音频文件,以及音频名称、音频时长、音频大小、音频采样率、比特率和转写文本等结构化字段,涵盖湖南话、山西话、四川话、河南话等多种方言。申报主体已做脱敏处理,未发现包含具体个人和企业等主体的敏感信息,以及违反国家安全、商业秘密、个人隐私等相关法律法规规章等情况。相关数据以音频和结构化文本形式提供。 |
8 | 建筑施工现场安全隐患识别对话数据集 | 深圳市智造建筑信息科技有限公司 | 包含安全隐患图片,数据集包含image和conversations两部分。申报主体已做脱敏处理,未发现包含具体个人和企业等主体的敏感信息,以及违反国家安全、商业秘密、个人隐私等相关法律法规规章等情况。相关数据以图片和文本形式提供。 |
9 | 工业生产瑕疵标注数据集(磁材、玻璃、泡罩板、软包电芯行业) | 深圳市深视创新科技有限公司 | 包含缺陷样品图片及其标注文本。申报主体已做脱敏处理,未发现包含具体个人和企业等主体的敏感信息,以及违反国家安全、商业秘密、个人隐私等相关法律法规规章等情况。相关数据以图片和文本形式提供。 |
10 | 植物类图片数据集 | 深圳市华傲数据技术有限公司 | 包含植物图片及对应结构化描述信息。申报主体已做脱敏处理,未发现包含具体个人和企业等主体的敏感信息,以及违反国家安全、商业秘密、个人隐私等相关法律法规规章等情况。相关数据以图片和文本形式提供。 |
11 | 中文词条问答对数据集 | 包含中文百科词条,涵盖环境、体育、工业、财经、地理等多个专业领域。申报主体已做脱敏处理,未发现包含具体个人和企业等主体的敏感信息,以及违反国家安全、商业秘密、个人隐私等相关法律法规规章等情况。相关数据以文本形式提供。 |