2021中国数字新基建产业发展大会

零售数字化新基建,从数据治理开始

2021-04-08 09:37:23
彭建真
文章摘要: 数据治理的重要性不言而喻。对于大部分零售企业来说,由于内部数据构成复杂,每次具体应用时需要服务商重新清洗,费时费力,效率很低。对企业内部数据进行标准化治理,是有效利用的第一步。

2020年4月,针对社会各界广泛关注的新型基础设施建设概念,国家发改委在其例行新闻发布会对新基建的概念首次做了定义:新型基础设施是以新发展理念为引领,以技术创新为驱动,以信息网络为基础,面向高质量发展需要,提供数字转型、智能升级、融合创新等服务的基础设施体系。

因此新基建包括三方面内容:信息基础设施,融合基础设施,以及创新基础设施。

寻找零售数字化新基建的落脚点

对于这三方面内容,具体到零售行业,新基建的落脚点在哪里?

线下实体零售企业已经纷纷开始了数字化转型的步伐,而在去年,伴随疫情的出现,以及随之而来消费习惯剧变,大部分零售企业加快了数字化转型的部署节奏。

今天,大部分零售企业在数据收集的途径和意愿得到极大提高。随着零售企业对于数据的重视,随之而来的是企业数据大量沉淀,如何有效的盘活和使用数据,也日趋成为各企业关注的焦点。

在和业内企业的交流中,我们发现,目前很多线下零售企业希望走出经验决策的传统经营模式,或多或少都在使用数据化的系统工具,帮助企业进行分析和决策。这些企业少则三五个系统,多则几十个系统,但各系统往往分属于多个供应商,企业内部的数据也呈现孤岛状,如何有效使用数据,满足各业务部门具体业务场景需求,同时避免重复开发和资金浪费,就成为信息和数据部门面临的难题。在缺乏统一数据框架协调的情况下,难免会出现头痛医头,脚痛医脚的现象。

因此,从目前企业普遍面临的现状看,要有效的利用数据解决企业实际问题,真正实现数字化转型,企业内部数据治理势在必行。只有率先形成一个标准的数据底层,数据驱动决策智能化才能顺利进行。

因此,我们认为零售企业数字化的第一步在于数据治理,所谓的数据治理,就是零售企业从使用零散数据变为使用统一主数据、从主数据混乱到井井有条的过程。

认识数据治理的重要性

数据治理的重要性不言而喻。对于大部分零售企业来说,由于内部数据构成复杂,每次具体应用时需要服务商重新清洗,费时费力,效率很低。对企业内部数据进行标准化治理,是有效利用的第一步。

首先,数据治理是企业智能化决策的基础。

从数据应用的角度来看,用户和消费者的满意和复购,是所有数据智能化的最终目地。针对用户进行大数据的计算,需要的数据维度,数据之间的关联性,数据及时性,传统的数据库和IT系统无法满足。这时候数据治理就非常关键,数据有效治理之后,让企业内部多系统数据融合,按需建立数据表索引,混合云部署,让针对用户的大数据计算成为可能。

其次,数据治理可以有效确保企业数据安全性。

随着数据成为新的生产要素,越来越多的企业重视数据安全性,但是传统线下企业数据结构混乱,让数据安全性不能得到有效保障,数据泄密时有发生。虽然组织和制度是保证数据安全性的重要保障,但是,从技术上隔离才是数据安全性的根本解决方案。

数据治理的过程中,采用成熟、专业的数据库防泄漏技术平台,实现数据外泄行为的记录、告警及阻断从而实现数据防泄漏目标,可以确保企业核心重要数据的安全。

第三,数据治理可以帮助企业应对快速变化的商业环境。

电商,O2O,外卖,直播,社区团购,互联网企业抢夺消费者的方式层出不穷。底层数据治理好的企业,可以快速跟进社区团购,直播等新商业模式,减少线下实体门店客流减少的损失;反之,数据基础不牢的企业,开发一套新的应用的时间和产品稳定性都不尽人意,一套预约自提系统,都会因为线上线下的库存难以实时打通,让用户体验大打折扣。

随着零售企业商业模式不断演进,完善的数据治理架构,便于通过元数据进行扩充,然后提供其数据的相关性、可访问性、可搜索性、合规性,提供新业务的决策依据。

如何进行数据治理—数据的三层结构

企业如何进行数据治理,会采用不同的方法和路径。

总体而言,第一步对企业数据进行归集和标准化。

信息化领域有一个说法就是“垃圾进,垃圾出”,意指用脏乱的数据做样本,产生的研究成果也是毫无价值的。数据的污染可能发生在数据产生、采集、传输、流转、加工、存储、提取、交换等各个环节,因此要保证数据治理目标的实现,就必须对数据进行全流程的管控,要在数据标准、数据质量、数据文件交换、元数据、数据生命周期、主辅数据源、数据安全、数据责任等方面形成统一的数据治理规范。

第二步就是数据模型管理和标签梳理。

数据治理的核心是数据模型管理。目前企业原始数据库中存在大量的字段和表没有注释,意思含糊不清,同名不同义、同义不同名,冗余字段、枚举值不一致的现象普遍存在。这些问题都会直接影响系统对数据的识别。数据建模让数据结构更加丰富和结构清晰化,便于数据口径统一。企业沉淀了大量数据模型之后,要及时做保留或删除管理,不做数据模型管控,那么这些历史问题会给新一代系统改造带来很多困扰。

除此之外,数据标签是对数据实体特征的符号表示,每一个数据标签都是我们认识、观察和描述数据实体的一个角度。因此内部统一标签也至关重要。商品标签包含了条码、规格、口味、图片、包装等信息。顾客标签包括性别、年龄、地区、兴趣爱好、产品偏好、购买力、忠诚度等等。

在实际的数据治理中,数据资源目录、数据分类、数据标签是相互配合、相辅相成的。建立良好的数据资源目录的第一步就是明确数据资源的分类,根据数据分类去组织资源、编目,之后是为数据资源打上数据标签,让数据资源更贴近用户、更容易管理,以便充分发挥出数据的价值。

第三步是企业算法和人工智能应用。

在对企业数据进行归集和标准化,并对数据模型进行管控和标签梳理之后,就可以对数据进行管理,并辅之以相应算法和人工智能,在具体业务场景应用。

以数据模型管理为例:人工智能可以帮助企业实现经验模型与计算机模型的完美融合,构建商品和会员的知识图谱。

以元数据管理为例:人工智能实现对非结构化数据的采集和关键信息的提取,并实现元数据的维护和整理。

再以主数据管理为例:主数据是企业核心业务实体的数据,是在整个价值链上被重复、共享应用与多个业务流程的,并与各个业务部门与各个系统之间共享的基础数据。在复杂数据主数据系统中,机器学习,自然语言处理等人工智能技术可以帮助定义和维护数据匹配规则,以及确定与主数据相关的记录,建立交叉引用等规则。

新基建在某种程度上已经成为国家战略,可以预见,未来几年,全国零售业将迎来一次数字化建设的高潮,借助零售新基建的落地,我们期待业内零售企业快速提升数据管理和应用能力,让中国的零售行业变成一个高效的行业,更好的为消费者服务。

信息化软件服务网 - 助力数字中国建设 | 责编:夏丽
文明上网,理性发言!请遵守新闻评论服务协议
评论