第06版:八一评论 PDF版下载

解放军报客户端

兵在掌上阅 亮剑弹指间

用心清洗“脏数据”


■刘师苑

针对数据科学领域的一项调查显示,当被问及“工作中面临的最大障碍”是什么,接近一半被调查者的回答是“脏数据”。

什么是“脏数据”?简单地说,它是由于重复录入、并发处理等不规范操作,产生的冗杂、混乱、无效数据。这些数据如同垃圾一样,不仅没有价值,还会带来“污染”,需要耗费时间精力去“清洗”,所以被形象地称为“脏数据”。

“脏数据”可能造成重大损失。有一家保险公司,将客户资料保存在数据库中,并规定:录入新数据之前,要搜索数据库中是否存在相关记录。但是,一些录入员图省事,跳过搜索环节直接输入记录,使数据重复录入,导致系统运行缓慢、搜索结果不准确,最后数据库彻底失灵,造成巨大经济损失。该公司这才如梦初醒,花大力气清洗“脏数据”,最终清除了近4万条有问题的记录。

数据有问题,苦心构建的数据库就失去了价值。正因如此,处理“脏数据”的工作不仅十分必要,而且越早越好。清洗“脏数据”,就是检测和清除那些冗杂、混乱、无效数据,以保证数据的正确性、可靠性、完整性和一致性。对于清洗“脏数据”的方法,有专家提出两条建议,一是约束输入,二是规范输出。从根本上说,就是要排除数据处理过程中“自由发挥”的空间。

对部队建设而言,文电通知多、杂、乱的问题,一直没有得到彻底解决。虽然各级都有明确要求,但机关发文电通知“各自为战”的现象屡禁不止。一名基层干部表示,在最繁忙的时候,一天要接听十几个电话通知,且“一个电话一个令”,各部门通知“打架”、指示“撞车”、任务“冲突”的现象时有发生。这样的文电通知,让基层增加了负担、耗费了精力、产生了困扰,不仅很难产生什么效益,而且会造成系统的运转速度变慢、运转成本提高,甚至导致系统过载失灵。说到底,这是政绩观发生了偏移,犯了形式主义和官僚主义的错误。

实际上,各单位的日常工作中,“火上了房”“水进了门”的紧急情况毕竟不多,不少“紧急文电”其实含有水分,存在调整优化的空间。应当改变“加法”的惯性思维,多些“减法”的科学举措,像清洗“脏数据”那样约束输入、规范输出,严格控制“自由发挥”的空间,切实避免游离于战斗力之外的空转虚耗,真正把心思和精力向能打仗、打胜仗聚焦。

您的IE浏览器版本太低,请升级至IE8及以上版本或安装webkit内核浏览器。