大数据编织“中国结”
2012年,阿里巴巴推出大型数据分享平台“聚石塔”,为当年的“双十一”提供云服务。这可能是许多人与“大数据”的第一次接触。
那时候,“大数据”对于很多人来说,还是个陌生的词汇。
现如今,“大数据请把这条视频推给更多需要的人”“我被大数据选中了”“请大数据推给我更多这样的消息”等与大数据相关的语句已成为网民在互联网平台的常见表达。
从全年存储市场出货容量仅为1EB,到仅一家短视频平台用户每天上传的数据量便达到上亿TB。从一个科学概念,到服务于广大居民生产生活乃至形成产业、带来规模效益。这十年,中国的点点滴滴正在被数据记录,大数据技术也推动着中国经济社会发展。
2012-2021年移动互联网流量发展情况
数据来源:工信部官网
“码”上出行
“柳书记,又来了一批大数据。”在北京市海淀区小南庄社区居委会,每天都会出现这样的声音。
说这话的人,是小南庄居委会一位普通的基层社区工作者,近期,她最重要的工作就是做好新冠肺炎的基层疫情防控。她说的“大数据”是北京市是为精准防控开发的大数据筛查系统中派发到社区的流调信息。她喊的柳书记,是小南庄社区党委书记,也是这个有4000多人居住的社区疫情防控工作的第一责任人。
小南庄居委会基层工作者(左)和柳书记(右)
听到同事的喊话,柳书记立即打开电脑上的大数据核查系统,登陆账号,系统派发到本社区的需发通知居民名单便映入眼帘。点进每一条目录,该居民因何原因被列入筛查名单,当前有哪些信息需要确认,根据政策应该采取几天的健康监测或者是居家隔离要求等等,一目了然。柳书记按照系统上提供的该被追踪者的联系电话打过去,确认该人员信息无误后提示道:“根据疫情防控政策要求,您需要居家健康监测3天,并做2次核酸检测,社区内的核酸检测地点是……”2分钟的对话结束后,柳书记在系统内“已电话确认”的栏目里打了勾。不出半小时,最新一批需点对点沟通的居民信息就全部触达完毕。
图片
柳书记对照系统信息拨打流调电话
这是新冠肺炎疫情防控形式下,小南庄居委会每位基层工作人员的常态,也是北京市138个街道办事处、2717个社区网格化管理的缩影。这个系统网络将居民使用的“健康宝”“大数据行程卡”与公安、卫健委、海关、电信运营商等多源数据密织成网,组成了北京市疫情防控的“软屏障”。
柳书记也是2003年非典的亲历者。
“(那时候)你不知道病毒在哪里,也不知道社区里的感染者有多少,只能每家每户漫无目地消杀。医院告诉我们某某生病了,我们再联系他周围的住户。”谈及非典时期的基层工作,柳书记表现出当时工作带来的无奈、恐慌和无头绪。
2020年初,新冠疫情刚刚发生时,健康宝、大数据行程卡还没有上线。正值新春佳节,本应是阖家团圆的日子,社区工作者却需要在门口24小时轮岗。柳书记对记者说:“(当时)我们不知道谁是从武汉回来的,只能通过居民有没有拉杆箱来判断。但是一旦有居民不如实报备自己的行程,可能一周、两周都不会被发现。”
“那个冬天太冷了。”当柳书记回想起2020年年初24小时轮岗守大门的日子,如是说。
人流量大、人员杂,仅凭人力完成对新冠肺炎疫情的防控难度太大。
图片
小南庄居委会工作人员
“通信行程卡”项目在这一背景下启动。1月23日,工业和信息化部指导信通院与三大运营商共同启动了“通信行程卡”项目。48小时内,“14天国际漫游出访查询”服务便上线了,解决了部分出入境旅客无法自证过往行程、无法返回居住地及工作地等问题。2月13日,用户发送短信进行到访地查询的功能上线,面向全国推广。2月29日,全国通用的“通信大数据行程卡”正式上线,解决了柳书记们不知居民从哪里来的难题。
图片
中国移动行程卡监控大屏
这套系统的上线,将行程轨迹调查的时间由几天缩减到几分钟。这背后,是大数据技术二十几年来技术的积累。
中国移动相关负责人告诉《中国电子报》,近20年来,中国移动的大数据平台系统一直在演进。从2002年采用数据仓库建设的经营分析系统,到2009年开始逐步开展新兴MPP技术、Hadoop技术的试点应用,再到2015年大规模推进集中化大数据平台的建设。中国移动的大数据平台数据量从TB级到PB级爆炸式增长,截至目前,日采集数据量已经达到16万亿条,近6.5PB,日处理量超过27PB,沉淀数据资产超600PB。正是基于长久以来的技术积累,各大运营商才得以为疫情精准防控注智赋能。
“移动侧行程卡上线前期每日查询量不到1000万,当前日查询量峰值已超过2.6亿次。”中国移动相关负责人如是说。查询量的变化,侧面证明数据正成为防疫的重要依据。
图片
中国移动全国疫情监控系统项目参与者
在大数据的辅助下,基层工作者可以实现个性化、精准化防控。柳书记和她的同事终于不必整日等在大门口,靠有无拉杆箱判断居民行程。基层防疫工作从大门口搬到了办公室,甚至是家里。
“线”上办事
2020年1月24日,除夕夜。
在为了防控疫情忙碌的不只有基层工作者。
正当全国人民欢度新春佳节之际,北京市大数据中心紧急调度相关厂商开展防疫科技攻关,融信数联首席分析官张广志也接到了任务:为掌握新冠肺炎疫情扩散情况,急需一套大数据态势感知分析系统。当晚,这支为应对新冠肺炎疫情扩散蔓延组建的技术团队便成立了,他们的任务,是通过三大运营商提供的数据,结合新冠肺炎感染者流调情况,整理一张北京疫情扩散情况的动态地图,供北京市疫情防控管理决策部门使用。
要描述一个具有2000多万人口城市的疫情扩散情况,并非易事。据张广志回忆,隐私计算是最难的环节。一个系统要融合疾控部门与公安部门流调数据、卫健委统计的发热门诊数据、三家运营商提供的数据等多个来源,不仅各来源的数据彼此不能“见面”,还要避免同时使用多个运营商账号的用户信息的干扰。这意味着系统的搭建就像是摸黑造房子:没有人知道每一片砖瓦长什么样子。基于在算力、云平台、网络基础设施等领域打下的基础,隐私计算问题终于解决。17天后,该系统及时交付并稳定运行。
图片
北京市疫情扩散情况监控大屏
在城市常态化管理过程中,以“数治”优化“人治”也成为城市治理的常见思路。解决“大城市病”,简化办事流程,建设数字政府。近十年来,我国政府机关改革的进程中总不乏大数据的影子。
2015年前后,“大城市病”成为困扰我国诸多城市发展的难题。交通拥堵、就医难、停车难……解决大城市病,成为许多一二线城市提升居民生活水平的关键。在杭州,拥堵问题曾是居民的“心头恨”。三甲医院浙一医院、浙二医院曾位列全国三甲医院周边拥堵的榜首,高峰时段有400余辆车围绕两家医院排队等候,最长入院等候时间近4个半小时。同时,医院地处杭州交通的重要节点,周边合围区域的工作日延误指数峰值高达4.63。通过数字化建设,上城区小营街道凭借城市大脑整合医院周边的泊位资源,排摸出16个停车场及公共道路上共计3309个泊位,通过场库导视系统设计6条最优停车轨迹,打造15分钟停车圈。城市大脑停车系统上线“先离场、后付费”功能,每辆车出停车场的时间缩短至2秒左右。
图片
浙一医院周边停车导视牌
要评估政府服务水平提升的效果如何,大数据同样可以发挥作用。一个五年计划周期内,政府公共服务效能究竟有何提升,南京市建邺区发布了“十四五”公共服务指数。将居民、组织列为公共服务的需求侧,将政府提供的服务列为公共服务的供给侧,通过比对需求侧与供给侧的数据,便可了解政府公共服务水平有何提升。比起人的主观判断,数据为管理效果评估提供了重要说服力。
“云”上生产
在青岛莱西市工业园区,坐落着一家乳制品饮料加工厂——天惠乳业。这是一家创建于2002年的企业,日产能达到200余吨。和所有具备一定规模的企业一样,随着产品种类的增加,设备种类和数量也在不断增加。日渐繁杂的生产产生了大量设备运行状态、生产信息、维保信息等需要处理的数据。传统仅仅依靠人工记录的手段已经无法对设备产能情况进行准确描摹。
“难追踪、难查询、难统计是企业设备采集与管理中的三大难题。”天惠乳业企业负责人在接受《中国电子报》记者采访时这样表示。
难追踪,是指产品种类增多、订单量增大,导致生产设备数据量巨大,难以追踪设备管理状况;难查询,是指设备运行状态、设备耗能分析耗时长,设备状态难以及时掌握;难统计,是指工人特别是老工人采用纸质化手段进行定期点检、巡检的数据不便于管理查看、保存和分析。
为解决这一问题,卡奥斯首先选择了从硬件上重新部署,建设工业物联网,打通信息壁垒。卡奥斯COSMOPlat首先从部署边缘网关入手,对天惠乳业生产车间进行了网络设计与改造。
部署边缘网关,为的是改变工厂的数据采集基础设施。
图片
改造后的天惠乳业实时数据大屏
“数据采集、数据管理、数据处理和数据分析是工业大数据生命周期的四个阶段。而其中,数据采集是成本最高的环节,也是极具难点的环节。”清华大学大数据系统软件国家工程实验室总工程师王晨如是说。
改变了工厂数据采集的方式,散落在各个车间、各台设备上的数据,便集合到一处,设备间的生产信息被打通,每个工序的实时参数均可以从物联设备中抓取。天惠乳业负责人表示,通过改造,企业的设备维修成本降低了40%,备品备件库存下降了20%。
图片
天惠乳业设备管理看板
对于一家流程化企业而言,在没有工业大数据的情况下,产品出现质量问题,很大程度要凭经验“猜”出问题出在哪个环节。工人师傅“猜”对了,问题就能解决。若是“猜”不对,工厂便又要多一批废品,原材料成本、生产过程的能耗也随之浪费了。流程数据追溯,对于流程化的企业而言显得尤为重要。
广东东岛新能源是一家专注于研发生产及销售锂离子动力电池材料的企业,也是一家典型的流程型制造企业。原材料种类多、不同原材料之间差别大带来的质量问题,也长期困扰着该企业。由此,树根互联为企业搭建起根云平台,对几十种参数进行量化,对每包原料进行全程追溯。这样一来,哪批产品有什么样的特征、在不同环节应该采用什么样的参数,便可被个性化对待,建立配方指令单时,配比组合可以更加精确。
树根互联联合创始人、CEO贺东东在接受《中国电子报》记者采访时表示,经过云上大数据管理,东岛新能源每投入100吨原材料,合格品从原先的85吨上升到93~95吨之间。
图片
承德金隅水泥有限责任公司
这样的问题解决逻辑同样适用于重工业企业。承德金隅水泥有限责任公司以生产、销售石灰、水泥熟料等为主要经营范围。该企业选择了“设备上云+大数据”的管理方式,通过东方国信提供的综合管控系统平台,进行水泥配料综合寻优、循环经济资源处置数字化寻优等综合分析,熟料和水泥质量有了显著提升,全厂停机故障率减少了50%。
伴随着我国从制造业大国向制造业强国转型,我国制造业也在经历从流程驱动走向数据驱动的蝶变。现如今,工业大数据已经成为大数据产业的重要分支,产业规模连年上升,有分析机构预测,预计2022年我国工业大数据市场规模将达到346亿元。