北京人工智能数据训练基地正式启用

YE 2024-04-09 09:31:52 0 0 0 生成海报

这是国内第一个人工智能数据训练基地，主要职能是组织数据供给方、加工服务方、模型训练方“进场”合作，推动高质量数据价值释放，助力通用模型和行业垂类模型训练精调。

近日，北京人工智能数据训练基地正式启用。同日，北京规模最大的公共算力平台——北京亦庄人工智能公共算力平台也同步正式启用。

北京人工智能数据训练基地正式启用

据悉，此次启用的北京人工智能数据训练基地是国内第一个人工智能数据训练基地。其职能主要是组织数据供给方、加工服务方、模型训练方“进场”合作，推动高质量数据价值释放，助力通用模型和行业垂类模型训练精调。

目前，已有35家企业参与到了训练基地的建设中，分别负责数据供给、数据加工、数据需求、平台运营等7个方面。其中，共有13家企业为训练基地提供了总计6.8T的数据。

作为人工智能成长的“养料”，数据不仅要保持足够供给，还需做好数据版权、权责分配等合规工作。面对安全之问，北京人工智能数据训练基地以“监管沙盒”机制进行了回应。

监管沙盒的优势在于，能够减少创新理念进入市场的时间与潜在成本，降低监管不确定性，防止风险大面积外溢引发危害事故。

具体来看，政策创新方面，监管沙盒将遵循弱版权保护政策、通知移除规则、风险补偿规则和创新纠纷解决机制，降低潜在数据风险；在数据安全方面，监管沙盒将通过完善的技术安全保障措施降低数据安全隐患，确保数据存储、加工和交付的安全，并即时监管数据使用的合规性。

算力方面，北京亦庄人工智能公共算力平台可提供算力达3000P，算力规模在北京排名第一。

北京市经济和信息化局数据显示，截至2022年10月，北京拥有人工智能核心企业1048家，占我国人工智能核心企业总量的29%。

2023年11月，全国首个数据基础制度先行区——北京数据基础制度先行区启动。根据《北京数据基础制度先行区创建方案》，到2030年，北京汇聚高价值数据资产总量达到100PB，数据交易额达到100亿元，数据产业规模超过1000亿元。

2024年《北京市政府工作报告》指出，要统筹推进数字产业化，开展数据资产入表、数据跨境便利化服务等综合改革试点；推动算力中心、数据训练基地、国家区块链枢纽节点等一批重大项目落地，新建5G基站1万个以上。

来源：21世纪经济报道