“十五五” 时期数据资源高效流通利用研究报告
数据巳成为关键生产要素。 在数字经济时代, 数据作为与传统生产要素(土地、 劳动力、 资本、 技术)并列的新型要素, 其价值本质在于通过汇聚、 加工和应用, 优化资源配置、 提升生产效率并创造经济价值。 这一地位的确立源于数据在经济社会发展中的核心驱动作用, 它不仅是信息社会的基础资源, 更是推动新质生产力发展的核心引擎。
习近平总书记指出, 数据是数字经济时代的基础性资源、重要生产力和关键生产要素。 近年来大模型技术不断取得突破, 大规模高质量训练数据的投入在其中起到了关键作用,也进一步将?“?以数据为中心的人工智能?“?推向一个新阶段。
在国家层面, 以《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》 (“数据二十条”?)为核心框架的数据基础制度体系巳经构建。
该体系围绕数据产权、流通交易、收益分配、安全治理四大支柱深化制度建设,旨在激活数据要素潜能并规范市场秩序。 这?一“?四梁八柱”式的制度设计, 正从政策框架向实操落地转化, 为数字中国建设筑牢制度根基。
流通利用具有显著紧追性。?一要突破经济增长瓶颈。 通过数“ 十五五”?时期(2026—2030年), 推动数据资源高效据流通优化资源配置, 提升全要素生产率, 显著降低传统要素(资本、 劳动力)错配成本。 二要满足新质生产力培育的追切需求。 人工智能、 生物育种等战略新兴产业依赖高质量数据融合;数据流通滞后将直接阻碍大模型训练、 新材料研发等关键创新进程, 削弱国际竟争力。 三要破解数据要素市场化改革的深层次梗阻。权属界定模糊导致企业?“?不敢流通”等制度性堵点亟待疏通;数据跨境流动、 隐私保护等风险尚未建立系统化治理框架;安全与效率的平衡面临挑战。 四要抓住全球竟争格局重构的战略窗口期。 加速应对以美国为首的数据跨境流动规则体系, 提升我国数据跨境流通能力与数字贸易规则话语权。 因此, “ 十五五”时期需以流通效率跃升为核心突破口, 系统破解制度、 技术、 安全三重约束。
AI大模型爆发对数据流通利用提出新挑战。AI时代对数据处理的规模与速度要求实现了数量级的跃升, 且数据呈现出巨量小文件、 单一?目录海量文件等独特特征;CPU、 网络的新发展也需要全新软件的匹配, 这都对面向AI时代的分布式文件系统提出了新挑战。 伴随千行百业的数字化转型迈向深水区, AI、 HPC、 大数据等新型关键应用正加速融入企业生产决策系统, 其对业务体验和底座支撑的要求也水涨船高, 既有的存储产品及解决方案难免捉襟见肘。 尤值?一提的是, 生成式AI浪潮打开了?“?潘多拉魔盒?", 激活了视频、语音、 文本、 图片等海量非结构化数据的潜能。 很多企业数据中心汇聚了不同应用的多种类、 多格式、 多协议数据, 这对实时分析、 智能决策、 节能减碳提出前所未有的挑战, 以存力变革推动数据服务跃迁势在必行。
本报告着眼于健全AI领域数据资源高效流通利用的政策措施, 提出适应AI应用的数据资源高效流通利用技术路径, 打造高性能分布式存储全闪化数据基础设施底座, 健全精准高效的数据管理体系,构建智能化、 一体化的数据流通利用平台, 深化AI领域数据资源高效流通利用场景, 促进数据高质量供给、 高效流通利用, 降低社会用数成本和用数门槛, 赋能实体经济, 促进社会高质量发展, 打造国际竞争新优势,构建?“数据要素?X?人工智能“?双向赋能的发展格局。