如果你对数据管理有兴趣,读DAMA是一个不错的选择,但《DAMA数据管理支持体系指南(原书第2版)》洋洋洒洒近800页,要读完读懂实属不易。
现在有了AI的助力,我帮大家重新编排了DAMA17个章节 的核心内容,共2.5万字,分三篇给你讲完,历史文章见下:
第12章到第17章
这是第三篇,从,共六个章节,包括、、、、及
为了降低理解门槛,本文会按照以下方式进行解读:
首先,每章的开头会先讲个故事,让你知道why。
其次,给出本章节的内容框架,方便你抓住中心思想。
最后,针对框架详细展开,让你深入理解。
每篇你只需要花10-20分钟,就能对数据知识管理体系有个全面的了解,让我们开始吧。
第12章 元数据管理
(一)数据的故事
某大型零售连锁企业决定实施元数据管理项目,以提升数据治理能力和决策效率。该企业面临以下挑战:
数据定义分散在多个系统中,难以统一理解和使用
数据血缘关系不清晰,难以追踪数据来源和变化
缺乏对数据资产的全面了解,无法有效管理和利用
各部门对同一数据项的解释不一致,影响跨部门协作和决策质量
为解决这些问题,企业计划建立一个集中的元数据管理系统,整合来自各个业务系统、数据仓库、报表工具等的元数据,并基于此开发元数据管理应用。在实施过程中,他们需要考虑:
如何设计元数据架构,满足不同用户的需求
如何收集和整合来自不同源系统的元数据
如何确保元数据的质量和一致性
如何开发适合不同用户群的元数据查询和分析工具
如何推动组织重视和使用元数据
这个案例涵盖了本章将要讨论的多个方面,包括元数据架构、元数据集成、元数据质量管理等。接下来,让我们深入探讨元数据管理的相关概念和方法。
(二)内容的框架
(三)详细的内容
1、引言
元数据通常被定义为"关于数据的数据"。它描述了数据本身、数据表示的概念以及数据与概念之间的关系。元数据的范围广泛,包括技术和业务流程、数据规则和约束、逻辑和物理数据结构等。
元数据的重要性可以通过图书馆的类比来理解:没有目录的图书馆就像没有元数据的组织。元数据帮助组织理解和管理其数据资产,评估数据质量,支持数据处理、维护、集成、保护和治理。
(1)业务驱动因素
良好管理的元数据有助于:
提高数据可信度
增加战略信息价值
提高运营效率
防止使用过时或不正确的数据
减少数据研究时间
改善数据使用者和IT人员之间的沟通
降低项目失败风险
缩短产品上市时间
降低培训成本和员工流动影响
满足监管合规要求
(2)目标和原则
元数据管理的主要目标包括:
确保数据内容理解和使用的一致性
整合不同来源的元数据
保证元数据的质量、一致性、及时性和安全性
提供标准的元数据访问途径
推广技术元数据标准以实现数据交换
实施元数据管理应遵循的原则:
获得组织承诺和高层支持
制定元数据战略
采用企业视角
潜移默化元数据的价值
确保员工了解如何访问和使用元数据
重视元数据质量
制定和审核元数据标准
建立反馈机制
(3)基本概念
元数据与数据:元数据也是一种数据,应该用数据管理的方式进行管理。组织应该关注元数据的用途,而不是理论上的区分。
元数据的类型 主要分为三种:
业务元数据:如数据定义、业务规则、数据所有者等
技术元数据:如数据库表结构、ETL作业信息等
操作元数据:如数据加载时间、访问统计等
3. 元数据来源 元数据来自多种来源,包括应用程序、数据库、建模工具、
数据集成工具等。
4. 元数据架构类型
集中式架构:单一元数据存储库
分布式架构:实时从源系统检索元数据
混合式架构:结合集中式和分布式特点
2、活动
(1)定义元数据战略
元数据战略描述组织如何管理其元数据,以及从当前状态到理想状态的实施路线。步骤包括:
启动元数据战略计划
组织关键利益相关方访谈
评估现有元数据资源和信息架构
开发未来元数据架构
制定分阶段实施计划
(2)理解元数据需求
确定需要哪些元数据,以及元数据的详细程度。考虑更新频率、同步情况、历史信息、访问权限等因素。
(3)定义元数据架构
设计元数据管理系统的架构,包括:
创建元模型
应用元数据标准
管理元数据存储
(4)创建和维护元数据
通过各种流程创建元数据,并持续维护以确保质量。关键原则包括责任、标准和改进。
(5)查询、报告和分析元数据
提供元数据查询和分析功能,支持数据资产管理。
3、工具
主要的元数据管理工具是元数据存储库,它包括整合层和手工更新接口。元数据管理工具允许采集多种来源的元数据,支持元数据交换和标准化。
4、方法
(1)数据血缘和影响分析
追踪数据在系统间的流转,分析数据变更的影响。这有助于理解数据流动路径,提高数据质量,简化系统维护。
(2)应用于大数据采集的元数据
为非结构化数据添加元数据标签,便于在数据湖中管理和使用数据。
5、实施指南
(1)就绪评估/风险评估
评估组织的元数据管理现状,识别风险,为改进元数据管理实践提供基础。
(2)组织和文化变革
克服文化阻力,提高元数据管理的优先级,寻找合适的试点项目,获得高层支持。
6、元数据治理
(1)过程控制
定义标准,管理元数据的状态变化,开展质量提升活动。
(2)元数据解决方案的文档
维护元数据主目录,包括元数据管理实施状态、源和目标、更新计划等信息。
(3)元数据标准和指南
制定和使用元数据标准,开发指导方针,持续监测其有效性。
(4)度量指标
建立元数据管理的度量指标,包括元数据存储库完整性、管理成熟度、使用情况等。
结语:元数据管理是现代数据治理的基石。通过建立健全的元数据管理体系,组织可以更好地理解、控制和利用其数据资产,提高数据质量,支持决策,确保合规,并在数据驱动的时代保持竞争优势。随着数据量的爆炸式增长和数据形式的日益复杂,元数据管理将继续发挥关键作用,帮助组织在数据的海洋中航行。
第13章 数据质量
(一)数据的故事
全球零售巨头 RetailCo 近年来面临着严重的数据质量问题。公司发现:
客户投诉率上升 30%,其中 60% 与错误的产品信息、定价或库存状态有关。
营销活动的转化率下降 25%,主要是由于客户联系信息不准确。
库存管理效率低下,导致每年约 5000 万美元的库存积压和缺货损失。
财务报告经常需要手动调整,增加了合规风险。
为解决这些问题,RetailCo 启动了一项全面的数据质量管理计划。他们面临以下挑战:
如何在庞大复杂的 IT 环境中(包括 50+ 业务系统)评估当前数据质量状况?
如何在众多数据问题中识别并优先处理最关键的问题?
如何制定切实可行的数据质量改进策略和目标?
如何在一个拥有 10 万员工的全球组织中推动数据质量文化的建立?
如何衡量数据质量改进的效果并向高层管理者证明其价值?
这个案例涵盖了本章将要讨论的多个方面。接下来,让我们深入探讨数据质量管理的相关概念和方法。
(二)内容的框架
(三)详细的内容
1、引言
数据质量是指数据满足其预期用途的程度。高质量数据对组织实现战略目标至关重要,但多种因素可能导致低质量数据的产生,如缺乏规划、孤岛式系统设计、不一致的开发过程等。
数据质量管理的主要目标包括:
根据数据消费者需求,使数据适合预期用途
定义数据质量控制的标准和规范
实施测量、监控和报告数据质量水平的过程
数据质量管理原则:
重要性: 关注最重要的数据
全生命周期管理: 覆盖数据从创建到处置的全过程
预防: 重点放在预防数据错误上
根因修正: 解决问题的根本原因
治理: 数据治理支持高质量数据的开发
标准驱动: 基于可测量的标准定义数据质量需求
客观测量和透明度: 客观一致地测量数据质量水平
嵌入业务流程: 在业务流程中实施数据质量标准
系统强制执行: 系统强制执行数据质量要求
与服务水平关联: 将数据质量纳入服务水平协议
2、基本概念
数据质量: 数据满足数据消费者需求和期望的程度。
关键数据: 对组织及其客户最重要的数据。可根据监管报告、财务报告、商业政策等要求评估。
数据质量维度: 数据的可测量特性,如完整性、准确性、一致性、及时性等。
例如:
完整性: 必填字段的填充率
准确性: 数据与实际情况的一致程度
及时性: 数据更新的及时程度
一致性: 不同系统间数据的匹配程度
数据质量和元数据: 元数据定义数据所代表的内容,是评估数据质量的基础。
ISO 8000数据质量标准: 定义了可测试的数据质量特性。
数据质量改进生命周期: 包括计划、执行、检查、处理四个阶段的循环过程。
3、活动
定义高质量数据: 了解业务需求,定义术语,识别痛点。
定义数据质量战略: 制定与业务战略一致的数据质量改进计划。
识别关键数据和业务规则: 确定最重要的数据及其质量要求。
执行初始数据质量评估: 了解数据实际状况,为改进提供基础。
识别改进方向并确定优先排序: 结合数据分析和业务影响确定优先级。
定义数据质量改进目标: 设定具体可衡量的改进目标。
开发和部署数据质量操作: 实施监控、测量和报告数据质量的过程。
4、工具
主要工具包括:
数据剖析工具: 生成统计信息,识别数据模式
数据查询工具: 深入分析数据问题
建模和ETL工具: 影响数据质量的设计和处理工具
数据质量规则模板: 捕获数据质量期望
元数据存储库: 存储数据定义和质量要求
5、方法
预防措施:
建立数据输入控制
培训数据生产者
定义和执行规则
实施供应商数据质量协议
纠正措施:
自动修正
人工检查修正
人工修正
质量检查和审核代码模块: 创建可重用的数据质量检查模块。
有效的数据质量指标: 定义可测量、业务相关、可控的指标。
统计过程控制: 使用控制图监控数据质量过程。
根本原因分析: 识别并消除导致问题的根本原因。
6、实施指南
就绪评估/风险评估: 评估组织对数据质量管理的准备程度。
组织与文化变革:
提高认识
培训员工
改变思维方式
在绩效考核中纳入数据质量指标
开展数据质量相关的奖励计划
7、数据质量和数据治理
数据质量管理应作为整体数据治理的一部分。数据治理可以通过以下方式支持数据质量管理:
设定优先级
协调决策
制定和维护标准
报告企业范围内的数据质量
提供指导和沟通机制
监控和报告绩效
结语: 有效的数据质量管理是实现数据价值的基础。它需要组织上下的共同努力,包括技术实施和文化变革。通过持续的评估、改进和监控,组织可以不断提升数据质量,为业务决策和运营提供可靠支撑。数据质量管理应作为整体数据治理的重要组成部分,与其他数据管理实践协同推进,以最大化数据资产的价值。
第14章 大数据和数据科学
(一)数据的故事
某跨国零售公司决定实施大数据和数据科学项目,以提升决策能力和运营效率。该公司面临以下挑战:
数据分散在多个系统中,难以整合分析
传统报表无法满足实时决策需求
缺乏对客户行为和市场趋势的深入洞察
数据量快速增长,传统技术架构难以应对
为解决这些问题,公司计划建立大数据平台,整合来自销售、库存、客户关系管理等系统的数据,并基于此开发数据科学应用。在实施过程中,他们需要考虑:
如何选择合适的大数据架构和技术栈
如何处理和整合海量异构数据
如何开发适用于不同场景的预测模型
如何在组织内推广数据驱动的决策文化
这个案例涵盖了本章将要讨论的多个方面。接下来,让我们深入探讨大数据和数据科学的相关概念和方法。
(二)内容的框架
(三)详细的内容
1、引言
大数据和数据科学是21世纪重要的技术变革,使组织能够生成、存储和分析海量数据,从而预测和干预行为,获得深刻洞察。
大数据的特征(6V):
数据量大(Volume):指数据规模巨大,通常在TB级以上。
数据更新快(Velocity):指数据产生和处理的速度非常快,有时需要实时处理。
数据类型多样(Variety):指数据格式多样,包括结构化、半结构化和非结构化数据。
数据黏度大(Viscosity):指数据使用或集成的难度较高。
数据波动性大(Volatility):指数据变化频繁,有效期短。
数据准确性低(Veracity):指数据的可靠程度不高,存在不确定性。
数据科学是一门跨学科领域,将数据挖掘、统计分析和机器学习与数据集成整合,构建预测模型,探索数据模式。
2、基本概念
数据科学过程:
定义战略和业务需求:明确项目目标和预期成果
选择数据源:确定需要的数据及其来源
采集和提取数据:从各种系统中获取数据
设定数据假设和方法:制定分析策略
集成和调整数据:清洗、转换和整合数据
使用模型探索数据:应用统计和机器学习算法
部署和监控:将模型投入使用并持续优化
大数据架构组件:
数据源:如业务系统、传感器、社交媒体等
数据集成:ETL(提取、转换、加载)或ELT(提取、加载、转换)过程
数据存储:如数据湖,用于存储各种类型的原始数据
分析工具:如Hadoop、Spark等大数据处理框架
可视化展现:数据可视化和报表工具
数据湖:一种存储各种类型和结构数据的环境,允许存储原始数据,可供多种场景使用。与传统数据仓库不同,数据湖采用"先存储,后结构化"的方式。
机器学习:人工智能的一个分支,探索能够从数据中学习的算法。分为三类:
监督学习:基于已标记的训练数据学习
无监督学习:从未标记数据中发现模式
强化学习:通过与环境交互学习最优策略
预测分析:使用统计模型和机器学习算法,基于历史数据预测未来结果。
规范分析:在预测分析的基础上,进一步对影响结果的行动进行定义和建议。
3、活动
定义大数据战略和业务需求
选择数据源
获得和接收数据源
制定数据假设和方法
集成和调整数据进行分析
使用模型探索数据
部署和监控
4、工具
MPP无共享技术:大规模并行处理(Massively Parallel Processing)技术,将数据分布在多个处理节点上并行处理,适用于大数据分析。
分布式文件数据库:如Hadoop,适合存储和处理各种类型的大量数据。Hadoop的核心组件包括HDFS(分布式文件系统)和MapReduce(分布式计算框架)。
数据库内算法:在数据库内部直接执行分析功能,避免数据移动,提高效率。
大数据云解决方案:云服务提供商提供的大数据存储和分析平台,如Amazon EMR、Google BigQuery等。
统计计算和图形语言:如R语言,专门用于统计分析和数据可视化的编程语言。
数据可视化工具:如Tableau、Power BI等,用于直观展示复杂数据关系和模式。
5、方法
解析建模:开发和评估预测模型的过程,包括数据准备、特征工程、模型训练、验证和测试等步骤。
大数据建模:处理大规模数据集的建模技术,需要考虑数据分布、并行计算等因素。
6、实施指南
战略一致性:确保大数据项目与组织整体战略目标一致。
就绪评估/风险评估:评估组织在技术基础设施、人才储备、数据管理能力、文化适应性等方面的准备程度。
组织与文化变迁:推动数据驱动的决策文化,包括培训、激励机制调整、组织结构优化等。
7、大数据和数据科学治理
数据安全:制定保护个人隐私和敏感数据的政策,包括数据加密、访问控制、匿名化等措施。
元数据管理:谨慎管理与大数据集相关的元数据(描述数据的数据),包括数据来源、格式、更新频率等信息。
数据质量:评估和保证大数据环境中的数据质量,包括完整性、准确性、一致性等方面。
可视化渠道管理:为不同用户群(如高管、分析师、运营人员)提供适当的可视化工具和报表。
度量指标:
技术使用指标:如系统性能、资源利用率等
加载和扫描指标:数据加载速度、查询响应时间等
学习和故事场景指标:模型准确率、业务价值实现程度等
结语: 大数据和数据科学为组织提供了前所未有的机会,可以从海量数据中获取洞察,优化决策,创新业务模式。然而,成功实施大数据项目需要组织在技术、人才、流程和文化等多个方面进行变革。通过建立合适的架构、培养数据科学人才、实施有效的治理,组织可以充分释放大数据的潜力,在数据驱动的时代保持竞争优势。
第15章 数据管理成熟度评估
(一)数据的故事
某大型金融机构决定对其数据管理能力进行全面评估,以提升整体数据治理水平。该机构面临以下挑战:
数据质量参差不齐,影响业务决策和监管报告的准确性
缺乏统一的数据标准和流程,导致数据孤岛和重复
不同部门对数据管理成熟度的认知存在差异
难以确定数据管理改进的优先领域和具体措施
为解决这些问题,该机构计划实施数据管理成熟度评估(DMMA)项目。在实施过程中,他们需要考虑:
如何选择合适的评估框架和方法
如何确保评估的客观性和全面性
如何解读评估结果并制定改进计划
如何推动组织变革,提升数据管理文化
这个案例涵盖了本章将要讨论的多个方面。接下来,让我们深入探讨数据管理成熟度评估的相关概念和方法。
(二)内容的框架
(三)详细的内容
1、引言
数据管理成熟度评估(DMMA)是一种基于能力成熟度模型(CMM)的评估方法,用于评估组织数据管理能力的当前状态,并为改进提供指导。
解释: CMM最初由美国国防部开发,用于评估软件承包商的能力。现在,这一概念已被广泛应用于多个领域,包括数据管理。
DMMA的主要目标包括:
评估关键数据管理活动的当前状态
识别优势和弱点
确定改进机会和优先级
制定改进计划
DMMA通常定义5-6个成熟度级别,从低到高依次为: 0级:无能力 1级:初始/临时 2级:可重复 3级:已定义 4级:已管理 5级:优化
解释:
0级:组织完全不具备相关能力
1级:能力依赖于个人,缺乏标准化流程
2级:建立了基本流程,但可能不一致
3级:流程已标准化并在组织内推广
4级:能够量化管理流程绩效
5级:持续优化流程,追求卓越
2、基本概念
评估标准:每个成熟度级别都有与被评估流程相关的具体标准。评估时通常使用1-4分的量化评分。
解释:评估标准是判断组织在特定领域达到何种成熟度级别的具体指标。例如,对于数据质量管理,2级可能要求有基本的数据质量检查流程,而4级可能要求有自动化的数据质量监控系统。
评估框架:常见的DMMA框架包括:
CMMI数据管理成熟度模型(DMM)
EDM委员会DCAM
IBM数据治理委员会成熟度模型
斯坦福数据治理成熟度模型
Gartner的企业信息管理成熟度模型
解释:这些框架提供了评估数据管理成熟度的结构化方法。每个框架都有其特点和适用范围,组织需要根据自身情况选择合适的框架。
评估维度:通常包括活动、工具、标准、人员和资源等方面。
解释:
活动:评估特定数据管理流程的执行情况
工具:评估支持数据管理的技术工具的使用情况
标准:评估数据管理相关的政策、标准和指南的制定和执行情况
人员和资源:评估数据管理相关的人才、技能和资源配置情况
3、活动
规划评估活动
定义目标
选择框架
定义组织范围
定义交互方法
计划沟通
解释:规划阶段是确保DMMA成功的关键。需要明确评估目的,选择适当的评估框架,确定评估范围(可能是整个组织或特定部门),决定如何收集信息(如访谈、问卷),以及如何与利益相关者沟通。
执行成熟度评估
收集信息
执行评估
讨论并达成共识
解释:这是DMMA的核心阶段。通过各种方法收集数据,根据选定的框架进行评估,并与相关人员讨论结果以达成共识。这个过程可能会揭示不同部门对数据管理认知的差异。
解释结果及建议
报告评估结果
制定管理层简报
解释:将评估结果转化为有意义的洞察和建议。需要清晰地展示当前状态、差距和改进机会,并以管理层能理解和行动的方式呈现。
制订有针对性的改进计划
根据评估结果制定路线图
设定改进目标和时间表
解释:基于评估结果,制定具体的改进计划。这个计划应该包括短期、中期和长期目标,以及实现这些目标的具体行动步骤。
重新评估成熟度
定期进行重新评估
跟踪进展趋势
解释:DMMA不是一次性活动,而应该是持续改进的循环过程。定期重新评估可以衡量改进效果,识别新的挑战,并调整改进计划。
4、工具
数据管理成熟度框架
沟通计划
协作工具
知识管理和元数据存储库
解释:这些工具支持DMMA的执行。成熟度框架提供评估标准,沟通计划确保利益相关者的参与,协作工具支持信息收集和共享,知识管理和元数据存储库帮助管理评估过程中的各种信息和文档。
5、方法
选择DMM框架的标准包括:易用性、全面性、可扩展性、内置的演进路径、行业适用性、抽象或详细程度、非规定性、按主题组织、可重复性、中立性和培训支持。
解释:这些标准帮助组织选择最适合自己需求的评估框架。例如,一个高度regulated的行业可能需要更详细和严格的框架,而一个新兴行业可能更适合灵活和可扩展的框架。
6、实施指南
就绪评估/风险评估: 识别潜在风险及缓解策略,如缺乏高层支持、范围过大、资源不足等。
组织和文化变革: DMMA结果应作为推动组织变革的催化剂,促进数据驱动文化的形成。
解释:DMMA不仅是技术评估,还涉及组织文化和变革管理。需要高层支持,明确责任,并将DMMA结果与组织的战略目标相结合。
7、成熟度管理治理
DMMA过程监督: 应由数据治理团队或指导委员会负责监督DMMA过程。
度量指标:包括DMMA评级、资源利用率、风险敞口、支出管理、DMMA的输入和变革速度。
解释:这些指标帮助组织衡量DMMA的效果和数据管理能力的提升。例如,DMMA评级直接反映成熟度水平,资源利用率反映效率提升,风险敞口反映风险管理能力的改善。
结语: 数据管理成熟度评估为组织提供了一个客观评估和持续改进数据管理能力的框架。通过定期评估、制定改进计划并跟踪进展,组织可以逐步提升其数据管理水平,从而更好地支持业务目标和满足监管要求。DMMA不仅是一个技术评估工具,更是推动组织文化变革、建立数据驱动决策的重要手段。要充分发挥DMMA的价值,需要高层的承诺、跨部门的协作,以及将评估结果与具体行动相结合。
第16章 数据管理组织与角色期望
(一)数据的故事
某跨国制造企业"GlobalTech"决定重构其数据管理组织,以应对日益复杂的数据环境。GlobalTech面临以下挑战:
各地区和部门的数据管理实践不一致,导致数据质量和可用性问题
缺乏明确的数据所有权和责任划分,影响决策效率
数据管理人才分散,难以形成合力
难以在集中控制和本地灵活性之间找到平衡
GlobalTech的CIO意识到,要解决这些问题,需要建立一个新的数据管理组织结构。她开始研究数据管理组织的最佳实践,并着手制定计划。接下来,让我们深入探讨数据管理组织与角色的相关概念和方法。
(二)内容的框架
(三)详细的内容
1、引言
随着数据领域的快速发展,组织需要改进管理和治理数据的方式。当前,大多数组织正面临着越来越多的数据挑战:
数据格式多样、数量庞大,来源于不同渠道
数据管理复杂性加剧
数据消费者要求更快速、更方便地访问数据
需要及时解决关键业务问题
数据管理和数据治理组织需要足够灵活,才能在不断发展的环境中有效工作。为此,组织需要澄清关于所有权、协作、责任和决策的基本问题。
本章将描述在组建数据管理或数据治理组织时应该考虑的一组原则,同时涉及数据治理和数据管理,因为数据治理为数据管理组织执行活动提供指导和业务背景。
解释:数据治理和数据管理的关系:
数据治理:制定策略、标准和政策
数据管理:执行具体的数据相关活动
2、了解现有的组织和文化规范
在定义任何新组织或尝试改进现有组织之前,了解当前组织的企业文化、运营模式和人员都非常重要。需要考虑以下方面:
数据在组织中的作用
数据驱动的关键流程是什么?
如何定义和理解数据需求?
数据在组织战略中扮演的角色如何?
关于数据的文化规范
实施或改进管理和治理结构时,是否存在潜在的文化障碍?
数据管理和数据治理实践
如何以及由谁来执行与数据相关的工作?
如何以及由谁来做出有关数据的决策?
工作组织和执行方式
项目和运营执行之间的关系是什么?
哪些委员会框架可以支持数据管理工作?
汇报关系的组织方式
组织是集中的、分散的、层级化的,还是扁平化的?
技能水平
从一线员工到高管、领域专家和其他利益相关方的数据知识和数据管理知识水平如何?
在形成现状描述之后,还需要评估对当前状态的满意度,以便深入了解组织的数据管理需求和优先级。例如:
组织是否拥有制定合理、及时的业务决策所需的信息?
组织是否对其收入报告有信心?
组织是否跟踪关键绩效指标?
组织是否遵守所有数据管理有关的法律?
解释:能力成熟度模型(CMM) CMM是一个评估组织在特定领域能力成熟度的框架,通常包括5个级别:0级:初始(无组织的、临时性的) 1级:可重复(基本的项目管理) 2级:已定义(流程标准化) 3级:可管理(定量管理) 4级:优化(持续改进)
大多数寻求改进数据管理或治理实践的组织,都处于能力成熟度范围的中间级别。理解和适应现有的组织文化和组织规范,对建立相关的数据管理组织非常重要。
3、 数据管理组织的结构
数据管理组织设计中的一个关键步骤是确定组织的最佳运营模式。运营模式是阐明角色、责任和决策过程的框架,它描述了人们如何互相协作。
(1)分散运营模式 在分散运营模式中,数据管理职能分布在不同的业务部门和IT部门。委员会是互相协作的基础,委员会不属于任何一个单独的部门。
优点:
组织结构相对扁平
数据管理组织与业务线或IT部门具有一致性
对数据要有清晰的理解,相对容易实施或改进
缺点:
让过多的人员参与治理和制定决策
实施协调决策通常比集中发布号令更加困难
一般不太正式,可能难以长期维持
难以定义数据所有权
(2)网络运营模式 通过RACI(谁负责,Responsible;谁批准,Accountable;咨询谁,Consulted;通知谁,Informed)责任矩阵,利用一系列的文件记录联系和责任制度,使分散的非正规性组织变得更加正式。
优点:
结构扁平、观念一致、快速组建
采用RACI,有助于在不影响组织结构的情况下建立责任制
缺点:
需要维护和执行与RACI相关的期望
(3)集中运营模式 所有工作都由数据管理组织掌控。参与数据治理和数据管理的人员直接向负责治理、管理职责、元数据管理、数据质量管理、主数据和参考数据管理、数据架构、业务分析等工作的数据管理主管报告。
优点:
为数据管理或数据治理建立了正式的管理职位
拥有一个最终决策人
职责明确,决策更容易
可以按不同的业务类型或业务主题分别管理数据
缺点:
实施通常需要重大的组织变革
将数据管理的角色从核心业务流程正式分离,存在业务知识逐渐丢失的风险
(4)混合运营模式 混合运营模式包含分散模式和集中模式的优点。在混合模式中,一个集中的数据管理卓越中心与分散的业务部门团队合作,通常通过一个代表关键业务部门的执行指导委员会和一系列针对特定问题的技术工作组来完成工作。
优点:
可以从组织的顶层制定适当的指导方向
有一位对数据管理或数据治理负责的高管
业务团队具有广泛的责任感,可以通过业务优先级调整给予更多的关注
受益于专门的数据管理卓越中心的支持
缺点:
需要配备额外的人员到卓越中心
业务团队可能有不同的优先级,需要从企业自身的角度进行管理
中央组织的优先事项与各分散组织的优先事项之间可能发生冲突
(5)联邦运营模式 作为混合运营模式的一种变体,联邦模式提供了额外的集中层/分散层,这在大型全球企业中通常是必需的。
优点:
提供了一个具有分散执行的集中策略
对于大型企业来说,可能是唯一可行的模式
能够根据特定数据实体、部门挑战或区域优先级来确定优先级
缺点:
管理起来较复杂
层次太多,需要在业务线的自治和企业的需求之间取得平衡
(6)确定组织的最佳模式 评估当前的组织结构是集中的、分散的,还是混合的、层级化的或相对扁平的?描述相关部门或区域的独立性。他们的运作几乎是自给自足的?他们的要求和目标是否有很大的差异?最重要的是,尝试确定决策是如何做出的(如民主或强制性指令),以及如何实施这些决策?
(7)DMO替代方案和设计考虑因素 构建一个运营模式时,需注意以下要点:
通过评估当前状态来确定起点
将运营模式与组织结构联系起来
考虑:组织复杂性+成熟度、领域复杂性+成熟度、可扩展性
获得高层支持——这是可持续发展模式的必要条件
确保任何领导机构(指导委员会、咨询委员会、董事会)都是决策机构
考虑试点规划和分批次实施
专注于高价值、高影响力的数据域
使用现有的资源
永远不要采用一刀切(One-Size-Fits-All)的方法
4、关键成功因素
建立成功的数据管理组织需要考虑以下10个关键因素:
高管层的支持:确保受数据管理规划影响的利益相关方获得必要的指导。
明确的愿景:确保所有受影响的利益相关方理解数据管理的重要性及其影响。
主动的变更管理:规划、管理和保持变更,解决人们面临的挑战。
领导者之间的共识:确保对数据管理规划的一致性和统一支持。
持续沟通:及时、公开、频繁地沟通,确保利益相关方了解变化和期望。
利益相关方的参与:了解并回应受影响群体的需求和关切。
指导和培训:为不同群体提供适当类型和层次的培训。
采用度量策略:评估数据管理计划的进展和效果。
坚持指导原则:建立长期遵循的规则、约束、标准和行为准则。
演进而非革命:采取渐进式改进,最大限度地减少重大变化或大规模高风险项目。
5、建立数据管理组织
(1)识别当前的数据管理参与者 从已经参与数据管理活动的团队开始,找出谁可能已经担任了所需的角色和职责。编制"数据人员"清单后,找出差距,确认执行数据策略还需要哪些其他角色和技能。
(2)识别委员会的参与者 让合适的人员加入指导委员会,并充分利用他们的时间。可以考虑利用现有委员会推进数据管理工作,但需要确保数据管理工作能获得足够关注。
(3)识别和分析利益相关方 利益相关方是指能够影响数据管理规划或被其影响的任何个人或团体。利用利益相关方分析来确定最佳的参与方法,并根据影响度和兴趣度对利益相关方进行优先排序。
(4)让利益相关方参与进来 清楚地阐明每个利益相关方对项目成功不可或缺的原因,并将数据管理过程的输出与他们的个人目标和职业目标关联。
6、数据管理组织与其他数据相关机构之间的沟通
(1)首席数据官(CDO) CDO通常负责建立组织数据战略、协调资源、建立数据治理标准等。数据管理组织通常可以通过CDO进行报告。
(2)数据治理 数据治理为数据管理提供了一个框架,使其与业务优先级和利益相关方保持一致。数据治理办公室和数据管理组织之间应该建立紧密的合作关系。
(3)数据质量 数据质量管理是数据管理实践和组织的关键能力。数据质量计划可以演变为与总体数据管理计划类似的运营模式。
(4)企业架构 企业架构团队负责设计并记录组织的总体蓝图。数据架构是数据管理组织有效运行的关键能力,数据架构师可以安排在数据管理组织或企业架构团队中。
(5)管理全球化组织 全球化组织需要特别注意遵守标准、同步流程、明确责任制度、培训和交流、有效监控和度量、发展规模经济、减少重复性工作等方面。
7、数据管理角色
(1)组织角色 包括集中式数据管理服务组织和联邦式数据管理服务方式。
(2)个人角色
执行官角色:如CDO、CIO、CTO等。
业务角色:如数据管理专员、业务流程分析师等。数据管理专员通常被认为是领域专家,负责数据质量、元数据、主题域或数据库。他们的职责可能包括:
定义业务术语和有效值
定义数据属性
维护数据质量要求和业务规则
识别和解决数据问题
为数据标准、策略和过程提供输入
IT角色:包括不同类型的架构师、开发人员、数据库管理员等。具体包括:
数据架构师:负责数据架构和数据集成的高级分析师
数据建模师:负责捕获和建模数据需求、数据定义、业务规则等
数据库管理员:负责结构化数据资产的设计、实施和支持
数据安全管理员:负责确保对不同保护级别数据的受控访问
数据集成架构师:负责设计数据集成和提高企业数据资产质量
分析/报表开发人员:负责创建报表和分析应用解决方案
应用架构师:负责集成应用系统
技术架构师:负责协调和集成IT基础设施
IT审计员:负责包括审计数据质量和数据安全性的IT内部或外部审计
混合角色:需要同时具备业务和技术知识,包括:
数据质量分析师:负责确定数据的适用性并监控数据的持续状况
元数据专家:负责元数据的集成、控制和交付
BI架构师:负责商务智能用户环境设计
BI分析师/管理员:负责支持业务人员有效使用商务智能数据
BI项目经理:负责协调整个公司的BI需求和计划
解释:这些角色的划分反映了数据管理是一个跨职能、跨领域的工作,需要业务和IT紧密合作。每个角色都有其特定的职责,共同构成了完整的数据管理体系。
总结:建立有效的数据管理组织是一个复杂的过程,需要考虑组织文化、结构、角色定位等多方面因素。本章详细讨论了不同的运营模式、关键成功因素、建立过程以及各种角色定义,为组织构建数据管理体系提供了全面的指导。
第17章 数据管理和组织变革管理
(一)数据的故事
想象一下,一家名为"GlobalTech"的大型制造企业正面临一个严峻的挑战。公司的各个部门都在使用不同的数据系统,导致信息不一致、重复和错误频出。例如,销售部门报告的月度销售数据与财务部门的记录总是存在差异,客户服务部门经常因为缺乏准确的库存信息而无法及时回应客户询问。
GlobalTech的CEO意识到,如果不解决这些数据问题,公司将在激烈的市场竞争中落后。于是,他决定启动一项全公司范围的数据管理变革计划。然而,当他和管理团队开始实施这个计划时,他们很快发现,仅仅引入新的技术和系统是远远不够的。
真正的挑战在于如何说服员工改变他们长期以来的工作习惯。比如,如何让销售人员养成及时、准确输入客户数据的习惯?如何让不同部门的员工开始共享和协作处理数据,而不是各自为政?如何让管理层在决策时更多地依赖数据,而不是凭直觉行事?
面对这些挑战,GlobalTech的CIO提出了一个大胆的想法:除了技术升级,他们还需要一个全面的变革管理计划来改变公司的文化和员工的行为。这个计划不仅要解决技术问题,还要处理人员、流程和文化等方面的挑战。
接下来,让我们深入探讨数据管理和组织变革管理的相关概念和方法。
(二)内容的框架
(三)详细的内容
1、引言
对于大多数组织而言,改进数据管理实践需要改变人们协作的方式和对组织中数据所起作用的理解,以及他们使用数据和部署技术来支持组织流程的方式。成功的数据管理实践需要:
学习横向管理:根据信息如何在公司中流动来调整数据责任制度,而不是仅仅按照部门划分。
打破信息孤岛:将原本各自为政的数据管理方式转变为全公司共同参与的信息管理工作。
提升数据质量意识:让整个组织,而不仅仅是IT部门,都重视信息质量。
建立数据管理文化:将关注数据质量从简单的"数据清理和评分"提升为公司的基本能力。
量化数据管理价值:衡量糟糕数据管理带来的损失,以及good数据管理产生的价值。
这种级别的变更不是通过技术实现的,即使适当使用软件工具可以支持交付。相反,它是通过对组织管理的变革采取谨慎和结构化的方法来实现的。各级组织都需要做出改变,最重要的是要对变革进行管理和协调,以避免进入死胡同、丧失信心,以及对信息管理职能及其领导力造成损害。
2、变革法则
组织变革管理专家总结了一套基本的"变革法则",这些法则描述了为什么变革并不容易,在变革过程之初就认识到这些问题有助于取得成功:
组织不变革,人就变。变革发生在人们认识到变革带来的价值而发生行为变化时,而不是因为新组织宣布成立或新系统实施上线。
人们不会抗拒变革,但抵制被改变。如果人们参与变革定义,理解变革愿景及其发生的时间和方式,他们更可能接受变革。
事情之所以存在是惯性所致。了解当前数据管理实践的起源,将有助于组织规避历史错误。
除非有人推动变革,否则很可能止步不前。如果想有所改进,就必须采取新措施。
如果不考虑人的因素,变革将很容易。变革的挑战来自于如何处理人与人之间的自然差异。
变革不仅需要变革推动者关注系统,更重要的是需要关注人的因素。变更推动者要积极听取员工、客户和其他利益相关方的意见,以便在问题出现之前发现问题,并更顺利地执行变更。
3、并非管理变革:而是管理转型过程
变革管理专家威廉·布里奇斯(William Bridges)强调转型过程在变革管理进程中的核心地位。他把转型过程定义为人们适应新环境的心理过程,分为三个阶段:
结束:舍弃当前状态。
相持:当前状态尚未完全结束,新的状态还未完全开始。
新开始:建立新的状态。
布里奇斯认为,组织变革失败的一个最大原因是,推动变革的人很少思考结局,因此无法管理结局对人们的影响。
4、科特的变革管理八大误区
约翰·科特(John P.Kotter)总结了组织执行变革遭遇失败的八大误区:
过于自满
未能建立足够强大的指导联盟
低估愿景的力量
10倍、100倍或1000倍地放大愿景
允许阻挡愿景的障碍存在
未能创造短期收益
过早宣布胜利
忽视将变革融入企业文化
5、科特的重大变革八步法
科特提出了重大变革的八步法模型,提供了一个支持可持续长期变革的框架:
树立紧迫感
建立指导联盟
发展愿景和战略
沟通传达变革愿景
授权员工采取行动
创造短期收益
巩固成果并促成更多变革
将新方法融入企业文化
6、变革的秘诀
Gleicher公式描述了组织需要在适当的地方克服变革阻力的因素:
C = (D × V × F) > R
其中,C代表变革,D代表对现状的不满程度,V代表对更好替代方案的愿景,F代表实现目标所采取的第一步行动,R代表组织中的阻力。
7、创新扩散和持续变革
创新扩散理论解释了新思想和新技术如何、为何以及何种速度在文化中扩散。该理论将采纳者分为五类:创新者、早期使用者、早期大众、晚期大众和落伍者。
创新采纳遵循五步循环过程:知悉、说服、决策、实施和确认。
8、持续变革
为了实现持续变革,组织需要:
保持紧迫感/不满意感
构建长期愿景
维护和扩展指导联盟
展示相对优势和可观测性
9、数据管理价值的沟通
有效的沟通计划对于获得对数据管理项目的持续支持至关重要。沟通计划应该:
有明确的目标和期望的结果
为受众量身定制
使用适合的媒介
传达数据管理的有形和无形价值
分享具体的成功案例
进行基础数据管理概念的教育培训
结语
成功的数据管理变革需要全面的变革管理策略。通过理解变革的本质、采用系统化的方法、有效沟通,以及持续关注人的因素,组织可以更好地实现数据管理实践的改进,从而充分发挥数据的价值。
恭喜你,你已经阅读完了所有内容,相信你对DAMA已经建立了全局视野,现在的你,可以有选择的去阅读原书相关章节,并致力于实践。