国家数据局等部门:以科学数据支持大模型开发 支持开展人工智能大模型开发和训练

国家数据局等部门印发《“数据要素×”三年行动计划(2024—2026年)》的通知。通知提出,完善数据资源体系,在科研、文化、交通运输等领域,推动科研机构、龙头企业等开展行业共性数据资源库建设,打造高质量人工智能大模型训练数据集。加大公共数据资源供给,在重点领域、相关区域组织开展公共数据授权运营,探索部省协同的公共数据授权机制。引导企业开放数据,鼓励市场力量挖掘商业数据价值,支持社会数据融合创新应用。健全标准体系,加强数据采集、管理等标准建设,协同推进行业标准制定。加强供给激励,制定完善数据内容采集、加工、流通、应用等不同环节相关主体的权益保护规则,在保护个人隐私前提下促进个人信息合理利用。

以科学数据支持大模型开发,深入挖掘各类科学数据和科技文献,通过细粒度知识抽取和多来源知识融合,构建科学知识资源底座,建设高质量语料库和基础科学数据集,支持开展人工智能大模型开发和训练。探索科研新范式,充分依托各类数据库与知识库,推进跨学科、跨领域协同创新,以数据驱动发现新规律,创造新知识,加速科学研究范式变革。

THE END
分享
二维码
< <上一篇
下一篇>>
文章目录
关闭
目 录