法国敏柏宁敏白灵北京 https://m-mip.39.net/baidianfeng/mipso_4326406.html引用本文:朱绍臣.敏捷数据管理平台(ADM)金融行业解决方案[J].信息安全与通信保密,00(增刊1):6-66.
摘 要
敏捷数据管理平台ADM产品,以“数据”为中心,以“安全”为前提,以“敏捷”为目的,打造一套上中下游数据统一管控的平台型解决方案,解决金融用户面临的数据交付周期长、数据使用消耗较大存储资源、数据孤岛难以管理等痛点问题。敏捷数据管理平台,围绕着专利技术“虚拟数据库”技术,实现数据使用的全生命周期管理,帮助用户实现数据使用的高效性与安全性,在银行、证券等金融单位的数据治理中得到广泛认可。
关键词:数据库虚拟化;数据治理;数据快速交付;数据脱敏;拷贝数据管理
内容目录:
0 引 言1 数据使用中遇到的痛点问题1.1 数据交付的时间周期较长1. 数据使用时的存储资源消耗较大1.3 数据孤岛难以管理 敏捷数据管理平台解决方案.1 敏捷数据管理平台简介. 敏捷数据管理平台方案拓扑.3 敏捷数据管理平台方案解析3 敏捷数据管理平台适用场景及价值3.1 备份数据有效性验证场景及价值3. 敏感数据脱敏场景及价值3.3 测试数据管理场景及价值4 结 语
0
引 言
在数字化转型的大环境下,生产数据作为金融单位的核心资产,为了更大限度的发挥数据价值,其生产数据副本被频繁应用在准生产环境、测试环境、统计分析环境、培训环境等,如何更加安全、高效的使用业务数据,是金融单位所面临的一大挑战。
1
数据使用中遇到痛点问题
1.1 数据交付的时间周期较长
以银行为代表的金融单位,其单个业务数据库的数据在几T至几十T不等,而数据使用的频率较为频繁。数据交付通常采用直接从业务系统中导出数据,或者从备份系统中恢复数据,然后再拷贝到数据使用环境中导入,一系列动作下来,少则几个小时,多则几天,甚至更长。
IT领域极其注重效率,为了提升效率,出现了不少的新技术,如敏捷开发,解决了开发效率问题,容器解决了环境交付的问题,在开发、环境准备方面均实现了效率的大幅提升,却让数据交付成了阻碍高效率的绊脚石,因此,急需解决数据快速交付问题,以满足对“高效率”的要求。
1. 数据使用时的存储资源消耗较大
数据交付到使用环境后,需要消耗较多的存储资源以满足数据的实际使用。测试环境是数据使用最为频繁的一个环境,并且有多副本使用的需求,以1TB数据交付给10个测试环境为例,需要消耗10TB的存储资源;如果几十甚至上百套业务数据交付给测试环境时,则要消耗几百TB甚至更多的存储资源。
随着数据量的逐年快速递增,以及新业务的上线,将会有更多的数据交付给测试环境进行系统测试,因此要消耗更多的存储资源。
数据使用需要消耗更多的存储资源,为了满足数据使用,需要不断的新购存储,这既增加了采购成本,也增加了维护成本,但最终仍没有从根本解决存储资源消耗的问题,一直处在补漏状态。
1.3 数据孤岛难以管理
每一个交付使用的测试数据都是一个个独立的数据孤岛,导致测试数据难以管理,并且存在数据泄露的安全隐患;测试数据在使用时,根据测试需要,往往要保留多个数据版本,很容易造成数据版本的管理混乱,也容易产生大量的僵尸数据,消耗相对短缺的存储资源。
2
敏捷数据管理平台解决方案
.1 敏捷数据管理平台简介
上讯信息针对金融用户所面临的数据使用的痛点问题,结合实际应用场景,研发了一款集数据备份、备份数据自动化恢复验证、敏感数据脱敏和测试数据快速交付于一体的数据全生命周期管理产品——敏捷数据管理平台(AgileDataManagement,ADM)。
. 敏捷数据管理平台方案拓扑
敏捷数据管理平台ADM的方案拓扑图,如图1所示。
图1敏捷数据管理平台解决方案拓扑
.3 敏捷数据管理平台方案解析
部署方式:旁路部署
ADM的数据获取:(1)现有环境中未部署备份系统,可通过ADM平台的自主备份方式实现生产数据的实时备份;()现有环境中已部署备份系统,如NBU、Commvault、Networker等备份系统,ADM可实现对接备份系统,实现数据获取。
ADM的数据存储:ADM在实现数据获取之后,数据会被存放在ADM的存储池中,实现数据的压缩存储,数据压缩比例可以达到3:1;ADM存储池可实现数据存储即压缩,降低数据存储时的存储资源的消耗。
ADM的虚拟数据库功能:数据库虚拟化为ADM的核心功能,已获得了相应的国家专利,可以将存储在ADM平台中的数据,通过创建虚拟数据库的方式实现数据的快速交付。而通过虚拟数据库交付的数据,可以帮助用户解决以下四个问题:
(1)解决数据交付周期长的问题。通过创建虚拟数据库,可将数据在几分钟之内实现快速挂载及拉起数据库。
()解决数据使用时存储消耗较大的问题。通过虚拟数据库交付的数据,其基准数据为主动备份或对接备份系统获取到的数据,并通过数据共享技术将一份基准数据创建出多个虚拟数据库进行交付,并且将每个虚拟数据库的变量进行单独存储,这样既可以达到节省存储资源的效果,也可以达到虚拟数据库之间互不干扰。而虚拟数据库交付到目标环境则是通过网络挂载的方式实现,并不消耗最终数据使用环境的存储资源。其数据交付的效率及存储资源占用,可通过常见数据交付方式与ADM数据交付方式的对比,有一个深刻的了解,如图所示:
图敏捷数据管理平台数据交付对比
(3)解决数据孤岛问题。ADM所交付的虚拟数据库,其数据均集中存放在ADM的存储池中,可通过ADM进行集中统一管理。通过ADM交付的虚拟数据库,可以很方便的将数据进行回收,杜绝僵尸数据的存在,达到节省存储资源的效果。
(4)解决数据版本的管理问题。通过ADM创建的虚拟数据库可以实现数据的在线快照,记录数据的重要状态,实现数据版本的有效管理。
ADM的数据脱敏功能:ADM作为一个数据管理的平台型产品,需要考虑到敏感数据交付使用的安全性,而数据脱敏则是在数据使用流程中必不可少的一个环节。ADM平台的数据脱敏功能,既可以实现文本脱敏,也可以实现异构数据库脱敏,既可以实现传统脱敏系统的ETL抽取式脱敏,也可以结合虚拟数据库使用,实现自动化的数据脱敏平台,既可以帮助用户快速提供脱敏数据源,也可以帮助用户将脱敏后的数据进行秒级分发。
3
敏捷数据管理平台适用场景及价值
3.1 备份数据有效性验证场景及价值
场景:备份数据是数据安全的最后一道防线,大部分用户在生产网络中已部署了如NBU、Commvault等常见备份系统,为了保证备份数据的可恢复性及可用性,需要经常对备份数据做恢复校验,而手动恢复校验比较耗时耗力,因此导致了做备份数据恢复校验的频率不够。
价值:采用ADM实现备份数据的恢复校验,可以将NBU、Commvault等备份系统的备份策略导入到ADM平台中,并根据备份策略创建不同的恢复任务,且恢复任务可以进行恢复排期,帮助用户实现自动化的周期性的备份数据恢复校验,节约了大量的人力成本,且增加了备份数据恢复的频率,为备份数据的可恢复性可用性提供了更好的保障。
3. 敏感数据脱敏场景及价值
场景:生产数据作为用户的核心资产,在提供业务数据使用时需要将敏感数据进行脱敏处理,保证数据使用的安全性。在保证数据安全的同时,在测试环境中还需要考虑到数据的关联性、仿真性。
价值:ADM的脱敏功能,内置了百家姓、名字库、地址库等多种数据库,并具备几十种脱敏算法,可以根据数据使用的需求,将数据脱敏成高仿真的假数据,并且可以保证脱敏后数据的关联性,不影响数据的正常使用。
而数据脱敏与虚拟数据库的结合使用,更是可以帮助用户搭建一套自动化的脱敏平台,既满足了数据脱敏的要求,也提高了脱敏源数据的准备与脱敏后数据分发的效率。
3.3 测试数据管理场景及价值
场景:测试环境是数据使用最为频繁的一个场景,涉及到数据交付、数据版本管理、数据安全管控等问题,也是数据治理最容易忽视的一个场景,做好测试数据的管理工作才会使得数据治理方案更加完善。
价值:采用ADM实现测试数据管理,可以帮助用户实现测试数据的分钟级交付,提升百倍以上的数据交付能力;同时也可以帮助用户节约十倍以上的存储资源;可以帮助用户实现测试数据的版本管理,杜绝僵尸数据;同时也可以实现测试数据的集中统一管理,降低数据泄露的风险。
4
结 语
敏捷数据管理平台ADM产品,是以“数据”为中心,以“安全”为前提,以“敏捷”为目的的一套上中下游数据统一管控的平台型解决方案,解决金融用户面临的数据交付周期长、存储资源消耗较大、数据孤岛难以管理等痛点问题,帮助用户实现数据使用的高效性与安全性,并在银行、证券等金融单位中得到广泛认可。
作者简介
朱绍臣,学士,高级产品经理,主要研究方向为数据备份、数据交付、数据管理。
选自《信息安全与通信保密》00年增刊1期(为便于排版,已省去原文参考文献)
网络强国建设的思想库
安全产业发展的情报站
创新企业腾飞的动力源
投稿网址: