搜索热词:
搜索
  • 首页
  • 资讯中心
  • 中国开发区
  • 协会服务
  • 中国开发区协会
  • 投稿

    收藏

    微信
    公众号

    扫一扫

    关注公众号

    加入QQ
    交流群

    留言

    《中国开发区》

    打开菜单

    收起菜单

    通知公告

     当前位置:首页> 新闻 前沿观察 数智开发区建设专业委员会 新闻动态 行业动态

    中国工程院院士孙凝晖:建设面向智能时代的国家数据基础设施

    来源:国家数据局 发布时间:2025年02月10日 15:36 字体: 分享:

    文|中国工程院院士孙凝晖

      党的二十届三中全会明确提出“建设和运营国家数据基础设施,促进数据共享”,按照党中央、国务院决策部署,国家发展改革委、国家数据局、工业和信息化部编制和发布了《国家数据基础设施建设指引》,指导推进数据基础设施建设,推动形成横向联通、纵向贯通、协调有力的国家数据基础设施基本格局,打通数据流通动脉,畅通数据资源循环,促进数据应用开发,培育全国一体化数据市场,夯实数字经济发展基础,为数字中国建设提供有力支撑。

      01数据已经成为智能时代的关键生产要素

      随着新一轮科技革命和产业变革的深入推进,数据成为继土地、劳动力、资本和技术之后的“第五个关键生产要素”,深刻改变着生产、生活和社会治理方式。在数据驱动的智能时代,数据被赋予了资源要素与价值加工两重属性,数据的资源要素属性包括数据的生产、获取、传输、汇聚、流通、交易、权属、资产、安全与隐私等。数据的价值加工属性是指原始数据需要经过生产、流通和加工等多个环节才能增值,原始数据的价值不大,加工越深入则增值越大,通过加工工艺(即算法)和加工动力(即算力),对数据进行深加工和模型提炼才能实现数据的价值释放。

      纵观人类历史,每一个时代变革都会孕育出新的基础设施,农业时代是交通基础设施,工业时代是能源基础设施,信息时代是互联网基础设施,到如今在数据驱动的智能时代,是数据基础设施。智能的本质是数据的百炼成钢,数据基础设施是面向社会提供公共的数据采集、汇聚、传输、加工、流通、利用、运营、安全服务的一类新型基础设施,它集成硬件、软件、模型算法、标准规范、机制设计等在内,形成一个有机整体,贯穿数据价值释放的全生命周期。

      02数据基础设施的参考模型与技术体系

      《国家数据基础设施建设指引》将数据基础设施体系划分为四部分:算力设施,流通设施,网络设施和安全设施,其中,网络设施和安全设施是传统的信息基础设施,算力设施和流通设施是新型基础设施。网络设施提供高速泛在的连接能力,算力设施提供数据深加工的关键计算能力,流通设施提供跨域数据高效流转的流通能力,安全设施保障数据要素关联计算和共享流通过程的安全。四个设施共同支撑数据要素能够“供得出、流得动、用得好、保安全”。

      我们认为,数据基础设施从数据全生命周期的视角也可以将参考模型分为四层:数据汇聚层、数据流通层、数据加工层和数据应用层。第一层是数据汇聚层,进行行业和政府的数据资源建设,实现海量数据的汇聚、标注、清理,建设国家级的数据枢纽与数据战略储备,解决“供得出”的问题。第二层是数据流通层,构建数据流通体系,解决数据“流的动”的问题,其中关键组件包括:数据标识,实现数据空间中的数据入库、全域索引;数据交换,实现数据空间中的全域发现和可信交换;数据访问,实现数据空间中的数据访问与操作、高效传输。第三层是数据加工层,是以数据件等统一抽象封装加工的对象,以算力网提供“无尽”的算力供给,以模型网管理与调度各类Build-in模型,解决数据“用得好”的问题。第四层是数据应用层,基于AI基础大模型、BigData模型和HPC模型等三类模型,构建算法层的基础设施,通过AI Agent等技术实现复杂任务的处理,赋能千行百业。

      03“东数西算”工程为数据基础设施建设打下良好基础

      国家发展改革委推动的“东数西算”工程是我国在算力网领域最早的政府行动计划,在推动算力的基础设施化上发挥了先导作用。“东数西算”工程稳步推进两年多取得很大的进展,算力资源集中向八大国家算力枢纽内汇聚,特别是西部枢纽节点充分利用了绿电资源。在技术创新方面也取得了明显的成效,包括:异属算力并网、异构智算统一纳管、算力站间直连网络;算力跨域调度、算网协同调度、广域数据快递;超算互联网应用模式、城市/省域算力网运营等。“东数西算”工程正在形成自己的技术体系。

      《国家数据基础设施建设指引》的发布,将进一步与“东数西算”工程、全国一体化算力网建设相结合,以人工智能应用为牵引,不断促进各类新增算力向国家枢纽节点集聚,推动算力、算法和数据的融合创新,打通数据共享流通的动脉,夯实我国数字经济的基础。

      04对国家数据基础设施建设的建议

      (一)统筹建设数据利用与数据流通两类基础设施

      数据基础设施中的数据流通和数据利用是两套系统,当前阶段应优先发展数据利用基础设施,做强需求端,由需求端拉动流通端,最终实现整个数据基础设施的互联互通。

      回顾互联网初期,互联网信息的供给端有动力共享自己的信息,互联网用户建设一个网站,接入互联网,希望全世界的人都来访问和使用。当前阶段数据的需求端有动力利用数据,但供给端没动力提供数据。需要先把数据的利用做好,价值增值做大,才能激发起数据供给端的动力,才有可能推动数据的流通。

      (二)统筹数据基础设施技术体系的统一和差异

      当前数据基础设施的技术体系五花八门,各成一体。历史上网络协议有OSI七层模型,操作系统有宏内核和微内核两种架构,数据基础设施技术体系的参考架构和关键技术组件应该统一起来。

      数据具有强大的场景特性,不同场景下数据的增值模式、数据的流通管理方式都是不同的,应针对不同场景分类抽象,构建多个不同的技术体系技术栈,来具体建设不同的数据空间基础设施实例。

      


    中央社会工作部国家发展和改革委员会教育部科学技术部工业和信息化部民政部财政部自然资源部人力资源和社会保障部生态环境部住房和城乡建设部交通运输部农业农村部商务部退役军人事务部应急管理部海关总署国家税务总局国家统计局国家版权局国家互联网信息办公室国务院新闻办公室中国工程院国务院发展研究中心
    浙江省开发区研究会广东省工业园区协会内蒙古开发区协会山西省开发区协会云南省工业园区协会天津市开发区协会中国信息技术服务与外包产业联盟中国中小企业协会江苏省开发区协会安徽省开发区协会湖南省开发区协会福建省开发区协会山东省开发区协会北京市开发区协会上海市开发区协会广东省工业园区协会浙江省开发区研究会中国保税区出口加工区协会
    中国新闻网新华网人民网凤凰网联合早报网南都网央视网网易第一财经每日经济新闻和讯网光明日报参考消息新华每日电讯
    中国职业技术教育网中国国际投洽会绿色发展信息服务平台广西钦州保税港区
  • 国家部委
  • 社会团体
  • 新闻媒体
  • 开发区
  • 留言箱