数据躺在服务器里,每年20万运维费照交,却从未被真正打开过——这不仅仅是深圳某区的故事,更是整个行业心照不宣的常态。
2019年,深圳某区住建局。600万,砸进了一个数据治理项目。
验收那天,专家看了半小时PPT,签字,通过。系统上线。
然后——没人用。
数据躺在那里,格式还是老样子,科室之间该不共享还是不共享。每年20万运维费照交,系统就在服务器里躺着。
600万,换来一个"我们做过数据治理"的交代。
你是不是觉得这故事很眼熟?说实话,在政府信息化这个圈子里,这种事太普遍了。大部分数据治理项目,最后都是这个结局——验收即死亡。
但今天我不想讲"系统建了没人用"这个老话题。我想讲的是:这些脏活累活,为什么始终没人愿意做?
先说一个触目惊心的数据。2023年,全国数据产存转化率只有2.9%。
什么意思?你辛辛苦苦采集、存储、管理的数据,真正被用起来的,不到3%。海量数据,源头即弃。
这个数字来自《全国数据资源调查报告》,国家数据局2024年5月发布的。我第一次看到的时候愣了半天——我们天天喊"数据资产",结果90%以上的数据,从生下来就没被用过。
但你仔细想想,不奇怪。因为数据的脏活累活,实在太苦了。
01 三套系统,四个月协调
我在深圳参与过一个气象数据治理项目,3000万预算,我担任总架构师。
拿到这个项目的时候,我以为最难的是技术方案。结果发现,最难的是——气象数据分布在三个地方。
政务云一批,政务外网一批,自己的机房还有一批。三个地方,三套标准,三个安全域。
你不能简单地把它们搬到一起,得一套一套地打通。光存储方案,我们就改了六版。
为什么?政务云那边说:"数据出去可以,但必须走专用通道,你们先把方案拿给我们审批。"
政务外网那边说:"专用通道?我们外网没有这个接口,你们得自己解决。"
自己机房那边说:"我们是自有机房,数据安全我们自己负责,凭什么让你们统一管?"
三个部门,三种逻辑,三套利益。你说服了这个科室,那个科室又提出新要求。
有一回,政务云的负责人直接跟我说:"张工,你们这个方案,我们不签。"
我说:"为什么不签?" 他说:"你们没按我们的格式来。" 我说:"我们按国标格式走的,你们这个是企业标准,比国标还严。"
他说:"那是你们的事。反正我们这关过不了。"
当场僵住。
最后怎么解决的?不是靠技术,是靠领导拍桌子。分管副市长开了一次专题会,三个部门当场签了责任书,这才把路铺平。
你问我这中间花了多少时间?四个月。四个月,就为了打通三个系统的数据。
02 一个项目,被迫拆成两个
做政府项目,有个特别奇葩的坑——你以为写的是"数据治理",按"服务"的方式报预算。结果申报上去,直接被政数局打回来。
那天我接的电话,对方语气很平静,但每个字都像刀子:
"张工,你们这个项目,我们看了一晚上。有个问题——你们这里既有数据治理服务,又有数据处理工具开发。这两个东西,不能放在一个项目里报。"
我试图解释:"但我们这个本质上就是一个数据治理项目啊,工具只是辅助手段。"
对方反问:"那你们那个数据清洗工具,算不算软件开发?算的话,你就得按软件工程的规范来,写需求规格说明书、测试报告、用户手册。这些你们都有吗?"
我愣了一下:"这个,我们当时没按这个模板来准备。"
"那你们就补。补完了我们再上会。" 啪,电话挂了。
我当时坐在办公室里,盯着电脑屏幕,脑子里一片空白。补?那就意味着整个项目方案重写。预算得重新算,评审得重新过,时间节点得重新排。
抬头看了看窗外,天已经黑了。旁边同事问我怎么了。我说:"两个字,打回来。重写。"
后来怎么过的?是把整个项目拆成了两个子项目,一个走服务,一个走软件开发。一个项目变成两个项目,两套流程,两套评审,两次上会。
两个月,就耗在这件事上。真正写代码的时间可能只占20%,剩下80%的时间,我在跟人解释"为什么这个项目需要两种不同的申报方式"。
有一天下班,我跟同事吐槽:"政府项目最大的问题就是,定义权不在你手里。"
他说:"何止定义权,解释权都不在你手里。" 我觉得他说得对。
03 在沙滩上盖房子
气象数据是敏感数据,涉及公共安全和个人隐私。按规定,这些数据应该做分类分级管理。
但是——分类分级的标准呢?
国家气象局出了一份讨论稿。注意,是"讨论稿",不是正式文件。没有正式标准,就没有合规依据。
你说你这个数据是"一般数据",凭什么?依据是什么?验收的时候拿什么给专家看?
最要命的是,你自己定的标准,专家不认。专家问:"你这个分级依据是什么?" 你说:"参照国家气象局的标准。"
专家追问:"国家气象局哪个文件?" 你说:"讨论稿。"
专家直接驳回:"讨论稿不是正式文件,不能作为依据。" 当场卡住。
你说:"那能不能用行业惯例?" 专家说:"行业惯例不具备法律效力。"
你还能说什么?
所以项目里专门加了一部分:研究气象数据分类分级的方法论。听起来很专业,说白了就是——花几十万,去研究"到底应该怎么分级"。
这不是数据治理,这是学术研究。但你没有选择。没有标准,你就得自己造标准。
有一句话怎么说来着——"在沙滩上盖房子,最后还得自己挖沙子。"
04 16个系统,一家家磕下来
深圳BIM平台,1个多亿的项目。这个项目里有一个特别有意思的任务——要跟16个系统做对接。
什么系统?智慧住建、智慧城管、智慧应急、智慧交通……每个系统都有自己的数据格式,自己的接口标准,自己的安全要求。
你得一家一家地去协调。人家凭什么配合你?你能给他什么好处? 数据格式不兼容怎么办?联调测试的时候出了问题谁负责?
有一家单位的信息化负责人直接跟我说:"张工,你们这个接口文档,我们看了,看不懂。"
我说:"这是行业标准格式。"
他说:"行业标准我们用不上,我们系统是定制的,你们得按我们的格式来。"
我说:"按你们格式来,我们的工作量要增加三倍。"
他说:"那是你们的事。反正我们这边没有额外的人力配合你们。"
当场僵住。
后来怎么推下去的?项目负责人亲自出面,一家一家地拜访,一家一家地解释。请吃饭,喝茶,送资料,反复沟通。这才勉强把进度推起来。
你知道这中间有多少扯皮的事?三天三夜讲不完。
05 政治任务从天而降
你以为做完一个项目规划,万事俱备了。然后市政府来了一个通知——"气象公共数据授权运营试点场景建设",交给你们一并完成。
这是政治任务,不能拒绝。但这个任务,原本不在你的项目规划里。
没有预算,没有人员,没有时间。你得硬着头皮接下来。
当时我的第一反应是:这不是我们能决定的事。但上面说:"这是市里定的,你们配合就行了。"
配合?项目边界不断扩大,工期不断压缩,资源不断吃紧。原本承诺的交付节点,推迟了三个月。原本可以做得精细的地方,只能草草了事。
有一段时间,整个团队天天加班到晚上十点。不是技术问题,不是方案问题,是政治任务突然砸下来,你没有拒绝的权利。
这不是执行的问题。这是项目管理里最难受的一种情况——范围蔓延,而且是自上而下的范围蔓延。
有一句话说得好:"在体制内做事,最难的不是怎么做,而是做完之后发现,需求变了。"
06 为什么没人愿意做?
说了这么多,你会发现一个规律——这些脏活累活,有一个共同特点:不出成绩,但特别容易背锅。
数据治理做好了,没人在乎,因为"本来就该这样"。数据治理做砸了,全都知道,因为系统崩了,业务停了,投诉来了。
而且,这些工作的成果,很难量化。你说我花了半年时间,打通了三个系统的数据接口——领导问:有什么用?你怎么说?
说"以后查数据快一点"?但"快一点"怎么算绩效?怎么写进验收报告?
所以聪明人的选择是:少做这些事,多做那些看得见、摸得着、能写进PPT的东西。
有一句话说得很扎心:"在政府信息化这个行当里,最受欢迎的不是解决问题的人,是制造新项目的人。"
因为新项目意味着新的预算、新的考核、新的机会。而数据治理?那是打基础。基础谁看得见?
07 脏活,才是真正的壁垒
但我想说一个反直觉的观点——正因为这些事没人愿意做,所以它们才是真正的壁垒。
大家都在追热点、追风口、追新技术。大模型火了,全都去做大模型。智能体火了,全都去做智能体。
但真正底层的、支撑这些上层应用的数据治理、系统对接、标准统一——愿意做的人,少之又少。
为什么?因为太苦了。太慢了。太不性感了。没有爆款,没有融资,没有媒体报道。只有无尽的协调会、无尽的公文、无尽的解释。
但也正因为如此——谁真正把脏活做扎实了,谁就建立了真正的护城河。
你的数据质量比别人好,你的系统比别人稳定,你的数据治理经验比别人丰富——这些东西,不是花几十万买一套系统就能解决的。是需要时间、需要踩坑、需要交学费,慢慢磨出来的。
有一句话说得好:"潮水退去的时候,才知道谁在裸泳。但脏活做扎实的人,早就建好了防波堤。"
还有一句:"大家都在盖楼的时候,你去打地基。等楼盖完了,发现地基最值钱的,只有你。"
前几天有个同行跟我聊,说他想转行做AI。我说:AI是好赛道,但你知道AI落地最缺什么吗?不是算法,不是算力,是干净的数据、成熟的场景、懂行的团队。
这些东西从哪来?从脏活里来。从那些没人愿意做的数据清洗、系统对接、标准制定里来。
你没有这些东西,AI就是空中楼阁。有了这些东西,你才有资格谈AI。
所以——如果你正在做一个看起来特别土、特别慢、特别不出成绩的数据治理项目,别急着抱怨。
把它做好。这可能才是你未来最大的资本。
IITC工信人才交流中心数据治理工程师认证办理丁老师:135-2209-4648
数据治理的路上没有鲜花和掌声,只有一个个需要打通的数据孤岛,一套套需要统一的标准规范,一次次需要耐心的沟通协调。
但正是这些看不见的基础工作,支撑着数字化转型这座大厦。当所有人都仰望AI的星空时,总得有人低头夯实脚下的土地。
这些土地不会说话,不会宣传自己,但它们决定了整座大厦能建多高,能立多
