打印

集群的基本常识

集群的基本常识

一. 概述

随着互联网技术、通信技术的快速发展,各行各业信息化建设也从通常的文字录入、办公自动化发展到业务活动的信息化。税务行业作为国家政府的一个重要窗口,其信息化建设是各省市发展电子政务的一个重要环节。国家税务总局提出的“以纳税申报和优化服务为基础,以计算机网络为依托,集中征收,重点稽查”的新征管模式,促进税收征管的法制化、规范化、科学化、制度化,各省市地税局都在根据原有网络系统、税收业务系统的实际情况着手新建或扩建一个先进、实用、安全、有地区扩展能力和升级潜力的税收管理信息网络系统
建立完整、高效、实用、方便的税收业务应用系统税务电子化建设的重点,包括管理服务、征收核算、税务稽查和办公自动化,同时考虑决策支持系统。所有的应用系统都需要性能强大、高度可用的数据库后台支撑系统。
在近几年,IA平台的服务器系统和解决方案得到了长足的进步,可以用来构筑稳固可靠的数据中心平台。浪潮是国内服务器市场的领导厂商,利用先进的服务器技术和解决方案,可以为税务系统的提供性能强大、稳固可靠的全面解决方案。
IA平台的服务器(PC服务器)近年来随着CPU的推陈出新和整体结构的不断完善,在越来越多的关键业务中发挥着重要的作用。多台中档的PC服务器构建的负载集群系统可以为业务系统提供足够的接入能力,多台高档的PC服务器构建的数据库集群集群系统可以提供强大的数据处理性能,为业务系统提供强劲、稳固的后台系统。基于集群技术的PC服务器平台凭借价格优势和强大的性能保证正取代RISK小型机成为许多关键业务的首选。

二. 集群技术的优势

集群技术作为PC服务器进入关键业务的技术后盾,提供高性能、均衡负载、高可用性、高管理性、扩展性、价格等六重优势:

1. 高性能
在集群的处理节点上选择性能强大的PC服务器,可为整个系统注入强大的动力。处理节点之间高速互连,并接入业界领先的SAN架构的存储平台,可为大量数据的交互提供高速可靠的通路。
2.均衡负载
根据不同类型的集群,其集群的管理机制可以在两个层面上对业务进行均衡,不仅可以把众多的用户请求均衡到多台节点机上进行处理,还可将单个用户的大量负载平衡分布到处理节点上,从而提高整个系统的处理能力,缩短响应时间。集群系统所具有的负载均衡功能要优于普通的故障切换高可用性系统(fail over HA,故障切换HA),后者在增加处理节点时,并不能通过应用的负载均衡提高整体系统的性能。
3. 高可用性
在PC服务器的硬件设计上,从处理节点到存储设备采用了大量的冗余、容错技术,提供了单台服务器系统的可靠性。即使单个处理节点出现硬件或软件故障,集群系统能将应用透明、平滑的切换给健康的处理节点,整个系统不会出现任何中断,而且任何一个交易都不会丢失。整个系统的可用性达到了99.99%以上,不但远远高于单机系统,也明显高于故障切换高可用性系统。后者在主节点发生故障时,主节点还没有完成了交易可能因为切换而丢失。
4.集中管理
为了降低管理的复杂性,在系统设计上采用集中的控制台,对处理节点、存储系统和网络进行监控和管理,有效的降低了管理复杂度和系统费用。
5.高扩展性
集群系统可以根据实际需要先搭建一个较小的系统,随着业务的扩展集群系统可随时动态添加处理节点,而不影响整个系统的运行。
6.价格
PC服务与小型机相比,其价格便宜,同时随着业务的扩展,只需增加新的PC服务器与原有的服务器一起为应用服务,保证原来的投资。

三. 集群技术简介

集群技术就是将多台PC服务器通过内部高速互连,配合完成某项工作,实现整体性能的线性增长,降低整体价格。它是一组相互独立的服务器,相互协作如同一个系统。集群的主要组成部分包括多个处理节点、一个集群互连、一个共享磁盘子系统。集群系统通过共享磁盘存取和管理数据资源,实现工作任务的协同处理。
集群往往由多台服务器组成,每个节点有自己特定的系统内存以及自己的*作系统、数据库实例和应用软件。
集群提供了改进的容错能力和模块化的系统扩展能力。一旦系统出现故障,集群仍能够保证对用户的高可用性。冗余的软硬件组件,例如附加的节点、互连以及磁盘,避免了单点故障从而保证能够提供高可用性。

1. 集群的分类
集群系统由一组PC服务器通过互联系统协同工作,为一类或几类应用服务,所以,根据集群系统完成的工作任务类型的不同,它所采用的工作机制也不一样,通常我们根据集群系统完成的三类典型应用,将集群系统分为三类:
。WEB负载均衡集群系统
WEB负载均衡集群系统通过一个流量管理的节点(可以是一个流量管理软件、软硬一体的流量管理机)或带流量管理系统的交换机,将用户的连接请求分配到多台PC服务器,这些PC服务器可以完成相同的或不同的功能。通过负载均衡集群系统,大量的负荷可以分配到多台性能较低的服务器上,既可以保护用户原有的投资,也可以动态地进行扩展,不需将原系统应用暂停,同时,多台服务器共同工作,当一台出现故障时, 流量管理节点可以及时侦测到,用户的请求将会分配到其余的健康的服务器上,用户的使用没有影响,管理员只需将故障服务器修复后再动态加入集群系统即可,应用无须暂停。
。并行计算集群系统(HPC)
在进行油田勘探、天气预报、动画制作、生命科学等的研究中,往往是一个大型的科学计算工程,它需要一个高性能的超级计算机才能在特定的时间内完成大量的计算和数据的交换。这个高性能的超级计算机并不是一个通用的大型机或小型机就能满足要求,通常根据不同的特定计算内容和性能要求的不同由几台到上百台PC服务器通过内部高速互连设备连接而成。一个并行计算集群系统有一个统一的管理、监控和调度节点,通过这个单一的入口,可以对集群内部的各服务器节点进行管理、监控和任务的调度,通过内部的高速互联网络交换数据,共同完成一个庞大的工程。
。数据库集群系统
大量的用户产生的大负荷以及业务活动的繁忙所产生的海量数据都要求当前的应用系统必须有一个性能强大、高度可靠的数据库后台支撑系统。数据库的集群系统由多台PC服务器和磁盘阵列柜组成。集群系统内部的各台服务器共同承担用户对数据的请求,共同享有数据资源,既能均衡负载提高系统的性能又能互相容错,提高系统的可靠性和可用性。

2. 传统数据库集群系统

传统的数据库集群系统,根据各服务器节点对占有数据资源的不同模式可以分为三种类型:共享磁盘方式、无共享方式和联合数据库方式。

。共享磁盘方式
在共享磁盘方式下,集群中每一个节点对所有磁盘有着平等且直接的访问机会。这种方法提供了很好的容错能力,即使只剩下一个节点,所有剩余的数据也可以访问。如果一个节点失败,系统将在剩余集群节点间动态地重新分配工作负载。但是这种方式用磁盘子系统来做高速缓冲同步是很慢的,整个集群的可伸缩性能也受到共享磁盘子系统的限制。
。无共享方式
在传统的无共享体系结构中,数据库文件通过各个节点的运行的实例来进行分区,每一个实例或者节点与各个截然不同的数据子集有着密切的关系,并且对此数据的所有存取均由“所属的”实例独立执行。在这种模式下,数据库的并行执行是直接基于数据分区模式的,当数据精确分区后,系统的可伸缩性非常强。但是,当变化的业务需求影响到数据时,通常要求用户对这些数据手工进行重新组织或重新分区,所以管理十分麻烦。另外,无共享体系结构的容错能力低于共享磁盘的方式。
。联合数据库方式
联合数据库也叫分布式数据库,严格来讲不是真正的集群数据库。一个联合数据库包含多个单独的数据库服务器节点,其中每一个节点运行一个独立的数据库,每一个数据库又有各自的数据库字典。联合数据库方式有很多基础缺陷,比如缺乏数据库节点之间的数据参照完整性,受限制的查询功能以及对数据库字典的手工一致性管理问题等。所以,采用分布式数据库的应用很有限
人生本是过程,结果并不重要,享受过程,永不放弃!

TOP

四.数据库集群解决方案

1.方案概述

浪潮高可用数据库集群系统是在浪潮与Oracle紧密合作下完成的,它是基于Oracle 的高性能数据库集群系统。它主要面向重负载和要求极高可用性的高端数据库应用环境,定位于大型数据库应用领域,包括数据仓库应用、联机事务处理、联机事务分析等,为具有高性能、高可用性需求的用户提供解决方案。
我们提供的方案基于集群计算的思想,由多个处理节点、集群互连和共享存储设备组成,服务器节点采用SMP技术,相互协作如同一个系统。计算节点采用高性能的浪潮NF800服务器,存储节点采用基于SAN架构的光纤通道磁盘阵列,数据库采用Oracle 数据库,并选择Oracle 并行数据库构筑一个高可靠、高性能的集群系统。集群采用共享高速缓存的体系结构,它结合了共享磁盘集群和非共享集群两者的优点,代表目前最先进的集群技术方向。
利用该方案,我们可以用便宜的IA服务器替代小型机系统构筑性能更高、可用性更高、容易使用和管理成本更多的数据中心。
浪潮数据库集群系统与上述三种传统的方式不同,它通过与ORACLE的密切合作,解决了传统数据库集群无法解决的既能提供高度的容错性能与灵活性,又能提供极高的接近线性的可伸缩性。共享高速缓存集群数据库系统
浪潮基于Oracle的Cache Fusion体系结构是解决这一难题的关键技术。Cache Fusion体系结构是Oracle公司独创的全新的共享高速缓存体系结构,它为大规模的数据集中应用带来了共享磁盘和无共享数据库的好处,同时又避免了二者体系结构的弊端。这是通过使用快速出现的磁盘存储和互连技术而实现的。


备注:Cache Fusion为高速缓存的相干性使用了可伸缩的共享高速缓存,消除了磁盘I/O。
采用浪潮高性能服务器和Cache Fusion体系结构的集群,实现了低成本的高性能运算,提供了以下的好处:

。可伸缩性
用户通过虚拟数据库服务名连接到数据库上。集群系统将在各个计算节点之间自动平衡用户负载,客户端不用关心具体节点服务器的物理地址。服务器负载均衡功能的实现,提升了数据库的性能,主要是通过两种途径:第一、将大用户量的并发访问分担到多台节点机上并行处理,缩短用户等待响应的时间,并且能够接受更多用户的并发访问;第二、将单个用户重负载的运算分担到多个节点机上并行处理,系统处理能力得到大幅度提高。另外,在硬件集群体系结构中采用了高速的数据通道和磁盘节点,大大减少了数据传输的延迟,释放了系统的处理资源。
RAC数据库集群能够自动适应快速变化的业务需求及随之而来的工作负荷的改变。通过动态地重新分配数据库资源,从而可以在节点之间用最小化的磁盘I/O和低的延迟通信来优化利用集群系统资源。随着业务的增长,系统也可以从容的增加处理能力。在系统建设初期,先使用2节点集群进行数据处理,随着业务的发展,可以对系统进行升级,或动态增加节点数,即可获得处理性能的提高,这体现了集群系统很好的可扩展性和可伸缩性。
。高可用性
基于浪潮服务器的高可用数据库集群提供了真正的高可用性解决方案,是满足24*7可用性的最佳平台。关键突破是在大多数数据库恢复期间能提供完整的数据块访问。由于内存结构的重建很快,磁盘IO*作较慢,所以本系统很快将失败节点排除在集群映像之外,使失败屏蔽开用户,实现了透明的应用切换,并提供了N-1节点失败的容错能力。
。可管理性
基于浪潮服务器的数据库集群实现了真正意义上的单系统访问数据库,它提供了从任何节点到所有磁盘设备和远程高速缓存进行无缝数据访问的能力。此单系统映像延伸到所有数据库管理*作。安装、配置、备份、升级以及监控等*作只需进行一次,然后会自动发布到集群中所有的节点上去。通过各种Oracle工具可以帮助管理和配置集群系统。
。灵活的并行机制
数据库表的并行*作,支持智能化计算默认值。在多用户多并行计算环境中,支持自适应多用户特征。相对于基于静态分区的方法,集群在负载分布的功能传递和节点间数据传输方面,将得到更优的性能。
。灵活的实施
对于税务征管等业务应用,相对于传统的小型机的方案,基于浪潮服务器的数据库集群非常容易实施,并提供最大的灵活性。在主机或小型机系统中,常常需要对系统分区,或者将应用或应用模块在不同数据库之间分段。系统分区和应用分段是一项艰难的任务,它很难适应系统需求和工作负载的变化趋势。而这个问题在我们提供的方案中得到解决,应用程序可以动态地移动数据库资源,来适应变化的业务需求和工作负载。

2.系统结构分析:

从网络结构上分析,浪潮数据库集群系统由内部互联网、外部互联网、存储区域网三网连接高性能的浪潮服务器和光纤盘阵构成。通过外部互联网,将数据库后台系统和前端的应用服务器、WEB服务器、客户端连接在一起,保证充足的带宽完成用户的各种应用请求;内部互联网将多台数据库服务器相互连接,保证集群系统的健康侦测、缓存数据的同步和负荷的分配,在集群的某个节点出现故障时,通过内部互联系统,其它的主机及时接管故障节点的工作,保证用户请求的顺利完成;存储区域网(SAN)通过光纤通道的交换机和主机适配卡(HBA)将多台数据库服务器和光纤存储设备连接在一起,提供共享的数据存取空间,满足多台数据库服务器共同工作的要求。
浪潮数据库集群系统可以根据应用的需要选择WIN2K SERVER 或LINUX*作系统,在*作系统之上的数据库集群系统选择ORACLE 9I RAC,它是整个系统协同工作的关键。在实际部署中,可以根据应用的规模选择服务器的数量和存储设备的容量,在小型的应用里,如果我们选择两台数据库服务器,那么我们可以将内部互连网的交换机简化为直连线,存储区域网也可将光线通道交换机简化为服务器与光纤盘阵直连,在缩小投资的同时也牺牲了系统的扩展性。
浪潮数据库集群系统结构图如下:



浪潮数据库集群系统结构图(三网)




简化的浪潮数据库集群系统结构如下图所示:















浪潮数据库集群系统结构图(简化)

附录:数据库基准评测数据

一. 基于小型机构建的数据库集群系统的基准测试

测试系统采用多台小型机和光纤通道磁盘阵列柜搭建了一个三层结构的应用环境,中间层用4台小型机组成,数据库层用2台小型机组成,存储采用光纤通道的盘阵。测试软件采用标准的数据库基准测试软件包LOADRUNNER,测试系统能够承载的并发用户数和连接反应速度。

测试系统结构图:



服务器和软件的配置表:

中间件服务器 数据库服务器 光纤盘阵
CPU: 8 x PA-8600 at 550MHzMemory: 32GBDisks: 2 x 18 GBUNIX千兆交换机互连 CPU: 4 x PA-8600 RISC at 550MHzMemory:16 GBDisks: 2 x 36GBUNIX千兆交换机内部连接光纤通道交换机连接盘阵 双控制器5.36TB disk 两台数据库共享
Oracle Application Server,Forms ServersCMConnection Managers Database Server

测试结果:

并发用户数 平均反应时间 90%用户反应时间
2296个 1.16s 2.16s
注:90%用户反应时间为90%的用户登录后系统的反应时间


二. 基于IA架构服务器构建的数据库集群系统基准测试

测试系统采用多台PC服务器和光纤通道磁盘阵列柜搭建了一个三层结构的应用环境,中间层用10台PC服务器组成,数据库层用2台PC服务器组成,存储采用光纤通道的盘阵。测试软件采用标准的数据库基准测试软件包LOADRUNNER,测试系统能够承载的并发用户数和连接反应速度。

测试系统结构图:



服务器和软件配置表:

中间件服务器 数据库服务器 光纤盘阵
CPU: 4 x Pentium III XEON at 500MHz ,2MB L2-cacheMemory: 4GBDisks: 3 x 9.1GBWINNT 4.0千兆交换机互连 CPU: 4 x Pentium III XEON at 500MHz ,2MB L2-cacheMemory:4GBDisks: 3 x 9.1GBWINNT 4.0千兆交换机内部连接光纤通道交换机连接盘阵 双控制器10*9.1G disk 两台数据库服务器共享
Oracle Application Server,Forms ServersCMConnection Managers Database Server

测试结果:

并发用户数 平均反应时间 90%用户反应时间
3248个 2.23s 3.81s
注:90%用户反应时间为90%的用户登录后系统的反应时间


三. 测试分析

小型机和PC服务器构建的数据库集群系统整体性能相当。由于PC服务器系统中间层采用40个XEON 500M 的CPU(10*4=40),而小型机系统的中间层采用32个550M CPU(4*8=32),所以PC服务器系统比小型机系统有更多的接入能力。数据库层两个系统的配置相当,由于PC服务器系统的用户数更多,系统的反应时间比小型机系统慢,我们可以通过选择更高主频CPU(如700M,900M)提高系统的反应速度。
人生本是过程,结果并不重要,享受过程,永不放弃!

TOP

可惜无法贴图片
人生本是过程,结果并不重要,享受过程,永不放弃!

TOP

你把地址弄上来啊

TOP

我怎么没有看到贴图的功能啊
人生本是过程,结果并不重要,享受过程,永不放弃!

TOP

好!

TOP

已收藏。

TOP

收到
一起进步

TOP

值得顶

TOP

好!

TOP

VERY,GOOD;没有图片,能不能做成WORD传到上面。

TOP

是呀有图片就好了!

TOP

一个字,好!

TOP

好东西,不过没有文档,遗憾。

TOP

有图片就更好了!不过还是要顶!

TOP

不错,值得我认真学习一下!谢了!^_^
[size=1][fly][color=blue]三人行 必有我师[/color] [/fly][/size]

TOP

照顶,不误。
唐忆书

TOP

好!
谢谢
[fly] 笑看老人前辈墓 无山无树好种玉蜀黍 [url]http://www.283.com.cn/createbbs/default.asp[/url][fly]

TOP

有图就好了。。?

TOP

做个文档下载吧!

TOP