分享好友 最新动态首页 最新动态分类 切换频道
关于大数据治理的研究与分析
2024-11-07 21:46

关于大数据治理的研究与分析

关于大数据治理的研究与分析

1数据治理的背景和现状

1.1数据治理背景

随着网络和信息技术的不断普及,人类产生的数据量正在呈指数级增长。大约每两年翻一番,根据监测,这个速度在2020 年之前会继续保持下去。这意味着人类在最近两年产生的数据量相当于之前产生的全部数据量。

大量新数据源的出现则导致了非结构化、半结构化数据爆发式的增长。信息数据的单位由TB-PB-EB-ZB的级别暴增。这些由我们创造的信息背后产生的这些数据早已经远远超越了目前人力所能处理的范畴。如何管理和使用这些数据,逐渐成为一个新的领域,于是大数据的概念应运而生。

关于大数据治理的研究与分析 物联网世界网

  图1 数据治理背景图

1.2数据治理现状

大数据的快速发展,使它成为IT领域的又一大新兴产业。据中央财经大学中国经济管理研究院博士张永力估算,国外大数据行业约有1000亿美元的市场,而且每年都以10%的速度在增长,增速是软件行业的两倍。我国2012年大数据市场规模大约4.7亿元,2013年增速将达到138%,达到11.2亿元,产业发展潜力非常巨大。我国大数据飞速发展的背后存在诸多的问题:相关利益交织,协调难;方案规划容易,落地困难;过度依赖技术工具;对于数据没有明确区分。

关于大数据治理的研究与分析 物联网世界网

  图2 数据现状分析图

2数据治理策略

2.1数据治理要素

关于大数据治理的研究与分析 物联网世界网

  图3 数据治理要素分析图

2.2数据治理策略

第一步:落实合适的人员负责治理。

任何成功的数据治理计划的第一个步骤就是,要在本企业找到CEO可以授权的人,然后让该人负责项目的具体实施。没有什么能取代强有力的领导人。

数据治理是涉及人事的一个难题,这需要在许多不同的利益相关者之间达成共识。因而,在本企业里面选定这样的领导人是一项重要工作。治理官员一旦选定下来,就要成立由企业的利益相关者组成的治理委员会,制订监管政策、向CEO及董事会报告进度。

第二步:调查清楚所处环境。

一旦选定了领导小组,就要调查当前情形,并清查不同部门在不同领域的当前最佳实践。领导小组需要越过独立系统看待问题,而企业数据治理评估方法对这项工作来说必不可少。这有助于比较本企业的数据治理计划目前处于什么状态,并且提供了一份路线图以便确定以后的目标。

第三步:制订数据治理策略。

数据治理评估之后,治理委员会就应当考虑制订远景,希望公司的数据治理实践在接下来的几年达到何种目标,根据这种需求为未来制订远景。委员会应当向后规划,并且制订切合实际的里程碑和项目计划来填补相关的缺口。具体办法就是制订关键绩效指标来跟踪进度,并且向CEO和董事会提交年度报告来证实成果。

第四步:算出数据价值。

估算数据价值。要是公司不知道数据的价值,它们就无法提高、保护或者评估数据对账本底线的价值。数据不是一种普通商品,而是像水龙头里出来的水--对生命至关重要,又往往被人们认为是理所当然的。你要是不知道某物的价格,就无法算出它的价值。

如果你想算出数据的价值,就要根据用户权限和IT服务的效用,为数据建立内部市场。当本企业的每个人都在直接付费获取IT服务和数据时,数据的价值就成了公司价目表上的一部分。

第五步:算出风险概率。

知道数据在过去是如何使用和滥用的,这有助于了解数据在将来会如何被危及和披露。每家企业都有一些原因,如一些事件和损失在独立系统、层次体系和商业报告中消失。这些数据已经可供使用,却没有被大多数企业所使用。收集这些数据,与其意义联系起来,并研究长期的损失趋势,这可以帮助任何企业把风险管理转变成基于事实的商业智能方法,从而可分析过去事件,预测未来损失,改变当前的政策要求,成为未来改善风险缓解策略。

第六步:密切关注控制措施的效果。

数据治理在很大程度上涉及企业的组织行为。企业每天在变化,因而它们的数据、价值及风险也在迅速变化。遗憾的是,大多数企业每年对自己只评估一次。要是公司无法改变组织控制措施来满足每天或者每周出现的需求,也就谈不上变化治理。

关于大数据治理的研究与分析 物联网世界网

  图4 数据治理实施建议图

3元数据管理

3.1元数据的定义

技术元数据是存储关于数据仓库系统技术细节的数据,是用于开发和管理数据仓库使用的数据,它主要包括以下信息:数据仓库结构的描述,包括仓库模式、视图、维、层次结构和导出数据的定义,以及数据集市的位置和内容;业务系统、数据仓库和数据集市的体系结构和模式;

业务元数据从业务角度描述了数据仓库中的数据,它提供了介于使用者和实际系统之间的语义层,使得不懂计算机技术的业务人员也能够“读懂”数据仓库中的数据。业务元数据主要包括以下信息:使用者的业务术语所表达的数据模型、对象名和属性名;访问数据的原则和数据的来源;系统所提供的分析方法以及公式和报表的信息;具体包括以下信息:企业概念模型:这是业务元数据所应提供的重要的信息,它表示企业数据模型的高层信息、整个企业的业务概念和相互关系。

3.2为什么要进行元数据管理

关于大数据治理的研究与分析 物联网世界网

  图5 数据管理分析图

3.3数据模型标准化

关于大数据治理的研究与分析 物联网世界网

  图6 数据模型示意图

3.4标准化体系(数据定义&模型设计)

标准化体系:一定范围内的标准按其内在联系形成的科学的有机整体。标准化体系它规定了质量方针、目标、职责和程序,并通过建立相关体系进行过程管理、质量策划、质量控制、质量保证和质量改进。

关于大数据治理的研究与分析 物联网世界网

  图7 标准化体系示意图

4主数据

4.1主数据的定义

企业主数据分散存储在企业各系统内,是对企业至关重要的核心业务实体的数据,比如客户、合作伙伴、员工等。

4.2为什么要作主数据管理

主数据管理(MDM Master Data Management)描述了一组规程、技术和解决方案,这些规程、技术和解决方案用于为所有利益相关方(如用户、应用程序、数据仓库、流程以及贸易伙伴)创建并维护业务数据的一致性、完整性、相关性和精确性。

主数据管理的关键就是“管理”。主数据管理不会创建新的数据或新的数据纵向结构。相反,它提供了一种方法,使企业能够有效地管理存储在分布系统中的数据。主数据管理使用现有的系统,它从这些系统中获取最新信息,并提供了先进的技术和流程,用于自动、准确、及时地分发和分析整个企业中的数据,并对数据进行验证。

关于大数据治理的研究与分析 物联网世界网

  图8 数据管理原因分析图

4.3如何做好主数据管理

通过单一平台上成熟的多领域MDM集中主数据的管理,从而消除点对点集成,简化您的结构,降低维护成本,改进数据治理。Informatica MDM(主数据管理)能够通过以下步骤帮助企业成功进行多领域主数据管理:

1. 建模:用灵活的数据模型定义任意类型的主数据

2. 识别:快速匹配和准确识别重复项目

3. 解决:合并以创建可靠、唯一的真实来源

4. 联系:揭示各类主数据之间的关系

5. 治理:创建、使用、管理和监控主数据

4.4主数据实施流程

关于大数据治理的研究与分析 物联网世界网

  图9 数据管理实施流程图

4.5主数据管理体系

关于大数据治理的研究与分析 物联网世界网

  图10 主数据管理体系流程图

5数据质量管理

5.1数据质量问题

·数据的值域

·数据的定义

·数据的完整性

·数据的有效性

·业务规则

·结构完整性

·数据转换

·数据流

5.2组织架构设计

关于大数据治理的研究与分析 物联网世界网

  图11 架构分析图

5.3数据质量治理流程

关于大数据治理的研究与分析 物联网世界网

  图12 数据质量治理流程图

5.4数据治理管理方法

建立合理的数据管理机构、制定数据质量管理机制、落实人员执行责任、保障组织间高效的沟通、持续监控数据应用过程和领导强有力的督促是保障企业数据质量的关键。

关于大数据治理的研究与分析 物联网世界网

最新文章
谷歌SEO里,你既爱又恨的SEO工具是什么?
在SEO行业的摸爬滚打中,我逐渐发现,那些让人又爱又恨的工具,往往是最具争议也是最有效的。今天,我们就来聊聊我在谷歌SEO实战中,对某个既爱又恨的SEO工具的深刻体会。一、谷歌SEO里,我难以割舍的双刃剑作为一名SEO老鸟,我深知每个工
揭秘2024新奥资料,免费获取精准资源全攻略
随着科技的飞速发展和信息时代的到来,资料获取变得日益重要,对于即将迈入新奥时代的我们来说,掌握一手的、精准的2024新奥资料,无疑将为我们的发展带来巨大的优势,本文将为您详细介绍如何免费获取这些精准资料,助您在新奥时代站稳脚跟
域名收录 批量查询域名收录的方法
互联网世界是一个庞大而复杂的网络,每天都有数以亿计的网页在其中产生、消失,网站的排名与权重更是对于一个网站的存在和发展至关重要。但是,对于普通用户来说,如何了解一个网站的真实情况?如何判断一个网站的价值与可信度?这就需要借
生成式人工智能赋能社区教育
生成式人工智能(以下简称AI)为主要特征的第四次科技革命,将对我国社区教育产生全方位的冲击及影响,成为未来社区教育变革的重要推手。研究AI驱动的社区教育变革特征,剖析未来面临的现实挑战,阐明应对策略,对促进我国未来社区教育高质
ai创作产品设计怎么用ps打开及文件操作指南
随着科技的不断发展人工智能()在设计领域的应用越来越广泛多设计师开始借助技术实创作。本文将为您详细介绍怎么样采用Photoshop(PS)打开创作的设计文件以及实文件操作的方法。创作设计是指利用人工智能技术,通过算法和模型对设计元素
网站改造大揭秘:如何让你的网站百度收录量大幅攀升?
一、优化网站结构在此次设计改造中,首先对整个网站架构作了深度优化。我们力求以科学合理的布局和清晰明了的导航指引,让使用者可以快速获取所需信息,提升了用户体验的满足感。此外,我们也将网页加载速度作为重点考虑因素,希望能为大家
长尾关键词搜索,挖掘用户需求之秘密利器!
摘要:长尾关键词搜索是一种有效的挖掘潜在需求的方法,它能够帮助企业发现并利用那些不太被关注但具有特定用户群体的关键词。通过长尾关键词搜索,企业可以深入了解用户的兴趣和需求,进而优化产品和服务,满足用户的个性化需求。这一秘密
百度推广怎么做关键词优化,效果更好?
在互联网营销这片浩瀚的海洋中,百度推广无疑是众多企业扬帆起航的重要平台。作为一名在数字营销领域摸爬滚打多年的实践者,我深知关键词优化对于百度推广效果的重要性。今天,我将结合过往的实战经验,与大家分享如何精准地优化关键词,让
江西南昌seo网站优化
江西南昌SEO网站优化 - 南昌网站排名优化公司南昌SEO网站优化,是指通过优化网站的结构、内容、代码和外部链接等因素,提升网站在搜索引擎中的排名,从而增加网站的曝光度、流量和转化率。作为江西省南昌市的一家专业网站排名优化公司,我
# 讯飞输入法功能怎么样关闭与相关设置详解:全面指南
在数字化时代智能输入法为使用者提供了极大的便捷。讯飞输入法作为国内领先的人工智能输入法其强大的功能为客户带来了丰富的输入体验。有些使用者可能因为个人惯或隐私考虑期望关闭讯飞输入法的功能。本文将详细介绍讯飞输入法功能的关闭方
相关文章
推荐文章
发表评论
0评