数据库集成(数据集成的三种方法)
大家好,今天来为大家分享数据库集成的一些知识点,和数据集成的三种方法的问题解析,大家要是都明白,那么可以忽略,如果不太清楚的话可以看看本篇文章,相信很大概率可以解决您的问题,接下来我们就一起来看看吧!
异种数据库集成的主要技术有哪些
CIMS是一个综合的计算机应用系统,由多个不同的功能系统组成,如ERP、PDMS等,这些系统因数据对象的不同有可能使用了不同的数据库系统。另外,企业实施CIMS工程一般都要经历几个发展阶段,由于技术或市场等原因,在不同时期配置的数据库系统可能会不一样。这样,在一个企业的CIMS中,难免会包含几种不同的数据库系统。这里所说的不同,可能是基于不同数据模型的DBMS,如关系型的或对象型的。也可能虽然都是关系型的,但不同商家的产品其SQL API不尽相同。这些就是CIMS中面临的异种数据库的集成问题。异种数据库集成的主要技术有以下几种:
1)数据的迁移和转换
利用数据转换程序,对数据格式进行转换,从而能被其它的系统接收。这种方法处理简单,已为大多数用户理解和接受。许多数据库管理系统DBMS都自带有一些数据转换程序,也为用户提供了方便。但这种方式当数据更新时会带来不同步的问题,即使人工定时运行转换程序也只能达到短期同步,这对于数据更新频繁而实时性要求很高的场合是不太适用。
2)使用中间件
中间件(middleware)是位于Client与Server之间的中介接口软件,是异构系统集成所需的粘接剂。现有的数据库中间件允许Client在异构数据库上调用SQL服务,解决异构数据库的互操作性问题。功能完善的数据库中间件,可以对用户屏蔽数据的分布地点、DBMS平台、SQL方言/扩展、特殊的本地API等等差异。
使用中间件的异种数据库集成有以下几种方法:
(1)通用SQL API即在Client端的所有应用程序都采用通用的SQL API访问数据库,而由不同的DBMS Server提供不同的数据库驱动程序,解决连接问题。通用的SQL API又可分为嵌入式SQL(ESQL——Embedded SQL)和调用级SQL(CLI——Call Layer Interface)。ESQL是将SQL嵌入到C、Pascal、COBOL等程序设计语言中,通过预编译程序进行处理,因而SQL的所有功能及其非过程性的特点得到继承。CLI则采用一个可调用的SQL API作为数据存取接口,它不需要预编译过程,允许在运行时产生并执行SQL语句。由于CLI更为灵活,现在应用较广,如Microsoft的ODBC、IBM的DRDA、Borland的IDAPI、Sybase的Open Client/ Open Server等等。来源:www.examda.com
(2)通用网关网关(gateway)是当前流行的中间件方案。在Client端有一个公共的客户机驱动程序(Gateway Driver);在Server端有一个网关接受程序,它捕获进来的格式和规程(Format and Protocol,FAP)信息,然后进行转换,送至本地的SQL接口。
(3)通用协议通用协议是指公共的FAP和公共的API,并且有一个单一的数据库管理接口。公共FAP支持适用于所有的SQL方言的超级设置或容忍全部本地SQL方言通过。
(4)基于组件技术的一致数据访问接口例如,Microsoft推出的UDA(Universal Data Access)技术,分别提供了底层的系统级编程接口和高层的应用级编程接口。前者定义了一组COM(组件对象模型)接口,建立了抽象数据源的概念,封装了对关系型及非关系型各种数据源的访问操作,为数据的使用方和提供方建立了标准;后者是建立在前者基础上的,它提供了一组可编程的自动化对象,更适合于各种客户机/服务器应用系统,尤其适用于在一些脚本语言中访问各种数据源。
3)多数据库系统
在CIMS环境下,从系统和规模上来解决异种数据库集成的方法为多数据库系统。所谓多数据库系统就是一种能够接受和容纳多个异构数据库的系统,对外呈现出一种集成结构,而对内又允许各个异构数据库的“自治性”。来源:www.examda.com
这种多数据库系统和分布式数据库系统有所不同。多数据库系统不存在一个统一的数据库管理系统软件,而分布式数据库系统是在一个统一的数据库管理系统软件的管理与控制之下运行的。多数据库系统主要采用自下而上的数据集成方法,因为异构情况在前而集成要求在后,而分布式数据库系统主要采用自上而下的数据集成方法,全局数据库是各个子库的并集。多数据库系统主要解决异种数据库集成问题,可以保护原有的数据资源,使各局部数据库享有高度“自治性”,而分布式数据库系统是在数据的统一规划下,着重解决数据的合理分布和对用户透明的问题。当然,两者之间在技术上有很多交叉,可以互相借鉴。多数据库系统一般分为两类:
(1)有全局统一模式的多数据库系统。多个异构数据库集成时有一个全局统一的概念模式,它是通过映射各异构的局部数据库的概念模式而得到。
(2)联邦式数据库系统。各个异构的局部数据库之间仅存在着松散的联邦式耦合关系,没有全局统一模式,各局部库通过定义输入、输出模式进行彼此之间的数据访问。到目前为止,没有商品化的多数据库系统,在CIMS环境中实施有一定难度。
数据集成的三种方法
数据集成的三种方法
目前数据集成的一般方法可以概括为联邦式、中间件式、数据仓库模式等。(1)联邦模式该模式构建的数据集成系统是由自治的多个数据库系统的协作组成,各个数据源之间提供相互访问的接口。该架构的集成系统以全局模式整合各异构数据源的数据视图。全局模式描述异构数据源的数据结构、语义和操作,是虚拟的数据源的数据视图,能够让用户透明地进行数据访问。用户根据全局模式向系统发出访问请求,系统将这些请求变换为各个异构数据源在自治系统内能够执行的操作。构建全局模式与异构数据源数据视图间的映射关系和处理用户在全局模式查询请求是该模式需要解决的两个关键问题。
(2)中间件模式在中间件模式的数据整合系统中,中间件一般位于数据层和应用层的中间,向下可以对不同的数据库系统进行协调,向上可以向不同的应用提供统一的访问接口和数据模式,中间件系统主要是为分布式环境中的异构多数据源提供统一的检索服务,各个数据源仍然具有各自的独立性。中间件模式的架构通常由中介器和包装器组合构成。其中,中介器能够将针对全局模式的查询进行分解后,生成为针对不同异构数据源的子查询交由包装器执行,查询结束后将所有子查询的结果汇总后以统一的格式返回给用户:针对不同数据源的包装器,可以将不同数据源中的异构数据转换成整合系统可以处理的统一格式的数据(3)数据仓库模式数据仓库是面向主题的、集成的、和时间相关的数据集合,数据被归类为广义的、功能独立的、没有重叠的主题,用于数据分析和决策支持的系统,也是针对企业应用提出一种数据整合方法。该模式采用在单一的数据仓库中存储多个异构数据源的副本的方式,定期的由ETL(Extract,Transform,Load)工具从不同数据源中对数据进行抽取、转换,然后将其装载到数据仓库中,在数据仓库的基础上构建数据管理系统,处理用户的数据访问请求。
数据集成的方法有哪些
比较常用的的两种数据集成方式
第一编码集成:通过编写代码方式实现源端数据处理后传输到目标端。优点:成本低。缺点:无法应对多任务数、数据复杂度高、需求变化多的场景,后期维护困难。
第二工具集成:使用ETL工具实现源端数据处理后传输到目标端。优点:效率高、能快速响应需求,一般都有监控预警功能。缺点:需要一定的学习成本,付费软件成本高。推荐下免费的ETL工具,希望对大家有帮助。如国外的Kettle,国内的DataX、ETLCloud社区版。如果考虑数据安全等因素,建议选择国内的产品,ETLCloud社区版有社区服务,能较好解决技术组成问题。
什么是数据集成
数据集成项目有多种类型,主要包括:
企业数据仓库:从众多的系统中提取数据到通用数据仓库,供报告、分析或商业情报之用
数据移植和合并:将现有系统的数据转化或合并为新系统和应用的格式和结构
主数据管理(MDM):生成单一的视图、集中注册,或客户、产品、供应商等主数据的数据集中地
云计算的数据集成:用软件即服务(SaaS)应用集成留在公司内的数据
运营数据集成:跨应用或数据库进行实时的数据访问、转化和交付
B2B
数据交换:跨企业边界集成客户/合作伙伴/供应商数据
信息使用期限管理:着重于应用和数据库存档、测试数据管理、数据隐私和应用淘汰。
文章到此结束,如果本次分享的数据库集成和数据集成的三种方法的问题解决了您的问题,那么我们由衷的感到高兴!