2015年,我国提出实施国家大数据战略。2017年,习在中央政治局第二次集体学习时强调,要瞄准世界科学技术前沿,集中优势资源突破大数据核心技术,加快构建自主可控的大数据产业链、价值链和ECO,以数据为纽带促进产学研深层次地融合,形成数据驱动型创新体系和发展模式,培育造就一批大数据领军企业,打造多层次、多类型的大数据人才队伍。
数据是人类社会持续健康发展的忠实记录者,它的获取、处理与应用在人类社会持续健康发展中一直扮演着重要角色。互联网加快速度进行发展带来无处不在的信息技术应用,海量数据随着这一进程不断产生,蕴含着巨大的社会、经济、科研价值,成为继物质、能源之后的第三大战略资源,急需重新审视和发展。信息技术的发展为数据处理提供了自动化方法和手段,“大数据”概念应运而生。
大数据并不是近几年才诞生的新奇词语。从抽象概念到科学研究,再到各领域应用,大数据技术正进入新的快速地发展阶段。
1998年,美国科学家约翰·马西在一份国际会议报告中指出:随着数据量迅速增加,必将出现数据难理解、难获取、难处理和难组织四个难题,并用“大数据”来描述这一挑战。2007年,数据库领域先驱人物吉姆·格雷指出,大数据将成为人类触摸、理解和逼近现实复杂系统的有效途径。“数据 计算机 算法模型”的方法借助大数据,为人类探索客观世界提供了继实验观测、理论推导、计算仿真后的第四种手段。
如果说大数据概念兴起的这两个节点,还局限于科学技术创新前沿领域,那么以2012年一本书的畅销为标志,大数据概念“飞入寻常百姓家”。这一年,牛津大学教授维克托·迈尔—舍恩伯格在其著作《大数据时代:生活、工作与思维的大变革》中指出,数据分析将从“随机采样”“精确求解”“强调因果”的传统模式演变为大数据时代的“全体数据”“近似求解”“只看关联不问因果”的新模式。
究竟什么是大数据?目前的共识是,大数据泛指无法在可容忍的时间内用传统信息技术和软硬件工具进行感知、获取、管理、处理和服务的巨量数据集合,具有数据规模大、来源丰富、类型复杂、变化迅速等诸多特征。大数据技术本质是提供一种人类认识复杂系统的新思维和新手段。大数据时代的到来,标志信息化跨越以单机应用为特征的数字化阶段、以互联网应用为特征的网络化阶段,郑重进入以数据深度挖掘与融合应用为特征的智慧化阶段。
大数据开启的信息化新阶段,代表新一代信息技术的全新应用,孕育出以数据为主要生产要素、继农业经济和工业经济之后更高级的经济形态——数字化的经济,全球加速步入数字社会。在数字化的经济和数字社会中,数据是新型生产资料,云计算、物联网和5G是新型生产工具,AI是新型生产力,区块链则是解决互联网生产关系中数据难以开放共享的新型生产关系。大数据及新一代信息技术最终的应用形态表现为软件,因此,软件定义也被视为数字化的经济和数字社会的新型生产方式。
大数据已受到许多国家、许多行业的格外的重视。如果能有效组织和使用大数据,将对社会经济、科学研究、国家治理等产生巨大推动作用,孕育着前所未有的机遇。我国在运用大数据提升国家治理现代化水平、保障和改善民生方面取得巨大进展和成效。
虽然听起来有些抽象,但大数据离我们的日常生活并不遥远。比如北京、浙江等部分地区应用大数据简化群众办事流程、优化办事体验、提升办事效率,从原来“来回跑”到现在“最多跑一次”和“一次都不跑”,实现“数据多跑路、群众少跑腿”。北京、上海、浙江、广东、贵州等地纷纷成立省级大数据局,全面推动电子政务和智慧城市建设向大数据转型和升级,深刻改变城市管理的认知方式、思维方法、工作方式和协作方式。大数据是城市智慧运行的“好帮手”,各地纷纷建设“城市大脑”,通过数据提供全局态势感知、定量分析研判、科学智能决策的技术上的支持,让决策统一到“一张底图和多个图层”上来,挂图指挥、科学决策、闭环提升,逐步实现“像绣花一样”管理城市。
一般来说,各类大数据分析应用可分为三个层次。第一层是描述性分析应用,是指从大数据中总结、抽取有关信息和知识,帮助人们分析发生了什么,并呈现事物发展历史。比如,新型冠状病毒肺炎疫情防控中的大数据应用大多数都属于这一类:社区管控有“健康码”,基层防控有“密切接触者测量仪”,复工复产有“三色码”,还有移动通信运营商14天机主活动轨迹数据查询等。可以说,大数据技术成为新型冠状病毒肺炎疫情防控重要科学技术手段之一。
第二层是预测性分析应用,是指从大数据中分析事物之间关联关系、发展模式等,并据此预测事物发展的新趋势。仍以新冠肺炎疫情防控为例,通过融合运营商与网络公司位置数据,可以定量支持人口流向趋势变化分析与研判,便于预测发展的新趋势、分析区域风险、实现精准防控。
第三层是决策性分析应用,是指在前两个层次基础上,分析不同决策的效果,并对决策进行指导和优化。决策性分析强调因果关系,不仅要“知其然”,还要“知其所以然”。例如,大数据与流行病学有机结合,在宏观的、总体趋势的研判基础上,进一步精准预估高风险区域、高风险人员数量,为医疗资源、物资、防控措施等提供更为科学、精准的决策依据。
经过近几年积极探索和实践,我国在大数据技术、产业、应用等各方面都取得显著进展。同时,大数据和人工智能、区块链、物联网等新一代信息技术融合,开拓出更大进步空间。其中,在自主创新研发方面也取得不小进展。我们应该进一步加强自主研发,尤其是集中资源建设自主创新的底层技术开源平台。
不久前召开的中央会会议强调,加快5G网络、数据中心等新型基础设施建设进度。与传统基础设施建设相比,新型基础设施建设侧重突出产业转型升级新方向。以大数据为代表,“新基建”体现出快速推进产业高端化发展大趋势。大数据研发技术人员应抓住机遇,做好新技术融合功课,赋能“新基建”建设。
大数据是全球数字化、网络化与智能化浪潮的重要代表性技术之一。我们的工作方式、生活方式、连接方式、协作方式或将被改变、被优化、被完善,我们每一个人都将成为其中一分子,成为数字社会的亲历者、见证者和建设者。