成都盛海瀚洋科技有限公司
综合布线设备运维服务,AI中枢平台集成、弱电安防系统项目,成都盛海瀚洋科技有限公司
客服热线13072870093
智慧IT运维监测 综合解决方案

智慧IT运维监测 综合解决方案

智慧 IT运维监测

综合解决方案

1  项目概述

1.1  项目建设背景

随着互联网的发展、企业的业务结构不断变化、业绩不断提升和创新,综合一体化管理软件的需求越来越大,再加上IT运维工作本身的复杂性逐步增加,逐渐步入各大小企业中。xxx(后续简称xxx)业务经过近多年的建设和积累,早已达到了一定的规模,但现有的支持工作模式已经非常落后,而且非常单一,经常被拉去救火,网络故障,业务无法访问事故层出不穷。还常常面对业务人员的牢骚和抱怨,运维水平已很难适应本单位业务的进一步发展,急需一套通用性和可扩展性强的综合监控管理系统对整个单位IT数据网络和主机应用的节点设备进行监管。

综合管理平台需要实现实时定位故障源和故障指标,把本公司数据网络和主机应用中存在的安全和故障隐患解决在业务发现之前,为本单位提供差异化的网络服务,无感知的业务服务,以尽量减少网络故障对业务的影响,彻底扭转目前的被动局面,提升公司的企业形象。

1.2  项目建设目标

本次项目建设的目标如下:

u  {C}一体化的综合监控运维平台

本次系统建设的目标是:在本单位建立一套集服务器监控、网络设备监控、系统业务监控以及安全监控于一体的IT管控系统。

u  {C}建立24*7无人值守机制

通过综合监控运维系统实现对主机、应用系统、数据库、中间件和网络安全设备等实时监控和管理,提高信息安全预防、应急、处理等能力,提升系统安全性,降低安全风险。

u  {C}主动服务模式,建立标准的服务流程

明确定义xxx运维服务的运维服务提供者、运维服务使用者、运维服务管理者。同时需采取合理、高效的运维管理组织结构,同时实现24小时无人值守,减轻在基础设施运维工作中的压力。

2  需求分析

2.1  项目面临问题

2.1.1     业务现状

目前xxx单位主要包括以下业务子系统:

X1数据中心:

数据中心

部署系统

运维人员

X1

UF2.0灾备

 

 

网上交易

 

 

呼叫中心

 

 

合规系统

 

 

风控系统

 

 

CRM系统

 

 

运营平台

 

 

公司官网

 

 

OA系统

 

 

财务系统

 

X2数据中心:

数据中心

部署系统

运维人员

X2

UF2.0核心交易系统

 

 

网上交易

 

 

PB系统

 

 

O32投资管理系统

 

 

S32股转系统

 

 

其中OA系统采用HP系列服务器和PC工作站,服务器采用双机主备方式,同一时刻只有1台数据库服务器作为主机,系统故障时可人工切换数据库服务器主机。数据库管理系统采用Oracle,数据存储设备为HP EVA4400

网上交易系统采用2HP服务器作为数据库服务器,服务器操作系统为HP-UNIX。数据库管理系统采用Oracle,数据存储设备为HP EVA4400。该系统服务器采用双机主备方式,同一时刻只有一台数据库成为主机,系统故障时可以自动或人工切换数据库服务器主机。

PB系统采用1PC服务器为通信服务器,2PC服务器为数据库服务器,操作系统均用Windows 2000,数据库管理系统为Microsoft SQL Server 2000

O32投资管理系统系统包含正、反向隔离设备一套、防火墙一台,交换机3台。

据调研统计,该公司总共运维对象有:

l  {C}交换机设备

l  {C}路由器设备

l  {C}防火墙设备

l  {C}主机系统

l  {C}小机系统

l  {C}Linux平台

l  {C}业务系统

等等

2.1.2     面临问题

目前,对业务/系统的运维工作,IT部分还存在以下几方面的问题:

 

(1)  {C}无法实时掌握系统软、硬件的运行状况;总是被动的接收到业务反馈,抱怨后,才得知网络或者业务出现问题了。

(2)  {C}未建立业务视图,问题发生后,无法实现快速发现、故障定位,延长了问题的解决时间;

(3)  {C}未实现生产环境的自动化监控功能,系统维护难度大且容易出错。

(4)  {C}没有自动化手段落地故障预防的措施;

(5)  {C}未实现24*7小时无人值守的自动化监控功能,系统维护难度大且容易出错。

2.2  项目建设必要性分析

2.2.1     {C}外部形势-倒闭企业IT技术升级

IT技术正在成为企业的神经中枢,越来越多的企业希望借助IT技术这一关键的战略资源提升公司的竞争优势,进而实现公司的战略目标。然而,随着网络建设和系统部署越来越深入,大多数企业面临着如何确保业务系统的稳定运行的难题。手工运维或者孤立工具的运维难度已经成为IT部门乃至企业发展得瓶颈,在面临诸多不可能完成的任务的时候,如何成功的部署IT运维产品,并利用IT标准化管理实现业务与IT的对称发展,是每个企业亟待解决的事情。

2.2.2     {C}内部管理-迫切需要建设运维管理平台

目前传统的运维工具早无法拉动企业战车,目前xxx企业随着业务的扩展,生成环境里早已由成百上千台网络设备,服务器等设备堆积起来,并划分了生产网络、办公网络等多个网络环境。IT部门肩负着全公司生产业务系统可持续性运转。整个公司里业务系统几十套到上百套,而且流程复杂,面临着设备分散,业务交叉、被动救火等一系列的IT管理难题。

为了摆脱IT运维管理故障的困扰,IT管理人员使用了各种手段和传统的工具,去排查网络,主机,硬件,业务等故障,信息就像各个孤岛之间无法及时有效的传递,业务的发展已经迫切要求IT部门对运维工作进行平台化和精细化的管理。

因此,需要一套综合监控运维平台把所有的对象集中化的管理起来。

3  解决方案设计

根据客户的实际需求,需设计一套端到端的基于B/S架构的综合IT基础架构综合管理系统,可对整个网络内的各种网络设备、安全设备、服务器、虚拟化主机、存储设备、操作系统、等关键应用系统等的IT对象实现全方位、可视化、统一集中监控和管理。

3.1  设计原则

1战略性原则

要综合考虑目前已有的、正在建设的、以及将要建设的各种业务系统的数据存储、管理和安全的需求,以满足系统长期的发展要求,并具备提供对电力系统引入的基于工作流的流程管理技术。

2)安全性原则

监控系统的首要任务是保证数据的安全,不会增加现有应用系统的复杂性,更不会降低现有应用系统的稳定性。

3)实用性原则

监控系统应根据益阳电力系统的当前情况以及未来的发展建设需求提供具有针对性的、可行的、可实施的技术解决方案。

4) 先进性原则

系统应采用当前国内外计算机监控领域先进的技术和解决方案。

5) 开放性原则

采用符合国际国内标准的通用协议,以利于与对其他系统监控的实施向用户提供,支持各种主流计算机平台、操作系统以及数据库厂商的各类软硬件产品。

6)可靠性原则

监控系统应该在系统结构、设计方案、设备选择、技术服务等方面综合考虑,保证系统能够安全无故障运行。

7) 可扩展性原则

系统设计不仅要充分满足用户现有业务的需求,而且要充分考虑未来业务及系统的各种发展需要。

8)易维护性原则

监控系统要提供简洁、方便、有效的管理工具和界面,以便于维护人员的日常管理和维护。

3.2  技术方案设计

根据客户的具体需求,我们建议采用卓豪公司智慧IT设备监测技术解决方案。IT设备监测能够为监视IT基础架构、管理关键的业务应用、了解网络中的用户行为,提供高效的IT运维管理等提供全面而又切实可行的途径与手段,实现IT环境的可视化管理。无论何时,无论网络,应用服务器,系统,数据库中的那个部分出现故障,IT设备监测都能自动生成告警并通过email发出通知给管理员。让用户在第一时间发现故障,及时进行故障排查,迅速恢复业务,同时利用基于ITIL的服务台(可选模块),系统可以自动指派问题,规范并提高IT服务管理水平。

3.3  系统架构图

如下为智慧IT设备监测的系统架构图:

 

4  产品功能模块描述

4.1  网络设备监控

智慧IT设备监测中的网络监控模块可以对网络设备(交换机、路由器、防火墙、安全设备)、动力环境设施(支持SNMP管理协议)提供全面的故障和性能管理。它能自动发现网络、分组设备并显示在直观的图中,实时监控设备,在出现故障时即时发出告警,另外还提供了广泛的报表和图表。

网络管理主要功能包括如下:

网络设备发现:能够并行作业,利用SNMPICMP等针对IP网络的设备、端口、接口以及之间的关系进行自动发现;能通过发现向导来指定要发现的网络;能随时通过添加网络功能来添加新的网络,从而扩大管理范围。

拓扑视图管理:能创建自定义视图,将用户所感兴趣的设备分组并集中管理。能为不同设备间添加连线,重排设备;能设定背景图像;还能创建打开其它业务视图的捷径图标;并能为自定义视图指定权限,使不同的用户可以查看及管理不同的自定义视图。可以在Web界面上对自定义视图进行编辑.

路由器监控:能够监测路由器各端口的流量、利用率和出错率等信息。能够监测路由器本身的CPU利用率、内存利用率、缓冲统计数据等。

交换机监控:能够监测交换机各端口的流量、利用率和出错率等信息。能够监测路由器本身的CPU利用率、内存利用率、缓冲统计数据等。

支持防火墙监控:能够监测防火墙各端口的流量、利用率和出错率等信息。能够监测防火墙本身的CPU使用率,内存使用率,活动连接数等参数。

网络流量分析:实现对WANLAN深入流量分析。能够收集和分析诸如NetFlowJFlowSFlow等流量。深入分析网络流量接口明细,例如应用、资源、目的地、会话以及QoS。除增强网络监控和排除故障外,可以提供带宽趋势信息,便于规划容量。可以生成丰富的网络级或设备级的报表,以便分析可用性、应答时间、网络流量、接口利用率或应用应答时间。

网络链路质量监控:不良的WAN链路会影响业务,网络管理软件有助于基本的WAN监控并在发现WAN问题时大有用处,使用WAN示图帮助您可视化WAN链路。当链路失败时,示图会反映出来,并根据严重性以红色,橙色或粉色显示。

4.1.1     网络拓扑展现

智慧IT设备监测中的网络监控模块能够并行作业,利用SNMPICMP等针对IP网络的设备、端口、接口以及之间的关系进行自动发现;能通过发现向导来指定要发现的网络;能随时通过添加网络功能来添加新的网络,从而扩大管理范围。

下图所示为网络拓扑发现的网络拓扑图。在发现的网络拓扑图上,还可以执行放大、缩小等操作,此外,网络拓扑图还提供多种展现方式,包括分层布局显示、对称布局显示、直角布局显示以及环形布局显示。

4.1.1.1     拓扑视图管理

能创建自定义视图,将用户所感兴趣的设备分组并集中管理。能为不同设备间添加连线,重排设备;能设定背景图像;还能创建打开其它业务视图的捷径图标;并能为自定义视图指定权限,使不同的用户可以查看及管理不同的自定义视图。可以在Web界面上对自定义视图进行编辑.

 

 

4.1.2     路由器,交换机详细信息

下图所示为路由器或者交换机设备的详细配置信息和端口清单。

包括设备名称、设备型号、IP地址、CPU利用率、网络接口连接情况等。

 

下图所示为网络端口的详细信息。包括端口的状态、端口流量等。

 

 

 

4.1.3     防火墙监控

能够监测防火墙各端口的流量、利用率和出错率等信息。还能够监测防火墙本身的CPU使用率,内存使用率,活动连接数等参数。还可以通过自定义SNMP监控,监视用户指定的性能指标。

4.1.4     负载均衡等其它设备

智慧IT设备监测中的网络监控模块支持F5,Array等负载均衡设备的监控,支持监控负载均衡设备的cpu利用率,内存利用率,连接数,网口利用率等指标。

利用智慧IT设备监测中的网络监控模块的打印机监控功能,操作人员可以在出现故障(如纸张堵塞)时即时接收到告警。智慧IT设备监测能够检测出墨粉不足/无墨粉,纸张不足/无纸张等状况。

网络管理员可以为接口通信量、出错率等设置打印机监控阈值,只要发现运行异常就会通过email/SMS通知管理员。

4.1.5     {C}网络接口/链路监控

智慧IT设备监测中的网络监控模块能通过监控和诊断交换机端口来获得流量、利用率和出错率等信息,从而验证是否符合SLA(Service Level Agreement)。通过呈现准确的端口流量和利用率信息,智慧IT设备监测能帮助用户发现LAN中的流量最大的端口。

下图列出了网络设备的所有端口清单,并用不同的颜色标注网络端口的状态,如果

 

 

4.2  主机系统监控

当今的业务网络中通常包含多种操作系统和服务器,而对每个运行关键任务的系统进行监视是对系统管理最基本的要求。当某些系统处于最佳性能状态时,其它系统的性能就可能下降。要确保所有系统的最佳性能,就需要快速地分析和检修问题。网络管理的最终目标就是使网络在毫无干扰的情况下正常运行,要做到这一点,就需要了解系统中每个设备/系统的状态,例如它们的负载情况以及使用的有效性等。

4.2.1     主机监控概述

当今的业务网络中通常包含多种操作系统和服务器,而对每个运行关键任务的系统进行监视是对系统管理最基本的要求。当某些系统处于最佳性能状态时,其它系统的性能就可能下降。要确保所有系统的最佳性能,就需要快速地分析和检修问题。网络管理的最终目标就是使网络在毫无干扰的情况下正常运行,要做到这一点,就需要了解系统中每个设备/系统的状态,例如它们的负载情况以及使用的有效性等。

应用管理连同系统管理使IT管理员能够识别所报告的问题是由底层的操作系统或应用造成的,还是某个服务引起的。这将有助于对资源进行快速有效的调整并减少应用的瓶颈。

性能和事件数据被存档以便评估服务级的顺应性、估定IT需求,并有效制定增加计划。系统监视包括监视系统负载、磁盘利用、内存利用和CPU利用。

智慧IT设备监测系统提供支持以下系统的监控:

n  {C}Windows

n  {C}Linux

n  {C}AIX

n  {C}HP-UX / Tru64

n  {C}Sun Solaris

 

Windows监视

能管理Windows 2000NT2003XPWindows管理功能通过自动化的事件检测和纠正,能优化Windows系统性能、提交全面的管理报表并确保可用性。

Linux监视

Linux是基于UNIX的一个常用的公开源代码的操作系统。Linux管理功能通过自动化的事件检测和纠正,有助于优化Windows系统性能、提交全面的管理报表并确保可用性。还能监视Linux系统中运行的进程。

Solaris监视

Solaris是一个基于Sun Microsystems UNIX的操作系统,被广泛的用于具有高可靠性的多处理器机器,其特点是具有较高的伸缩性。Solaris管理功能通过自动化的事件检测和纠正,有助于优化Windows系统性能、提交全面的管理报表并确保可用性。还能监视Solaris系统中运行的进程。

IBM AIX监视

 IBM AIX管理功能通过自动化事件检测和纠正,有助于优化IBM AIX系统性能,提交全面的管理报表并确保其可用性。还能监视AIX系统中运行的进程。

HP-Unix监视

HP-Unix管理功能通过自动化事件检测和纠正,有助于优化HP-Unix系统性能,提交全面的管理报表,确保高可用性。Applications Manager还能监视HP Unix系统中运行的进程。

4.2.2     主机状态监控

系统能够按照设定的频率对主机及其主要组件(CPU、内存、硬盘等)的状态进行监控,当系统无法检测到该主机时,会以各种方式进行标注。

对于多CPU、多硬盘、多网卡的主机,系统除了显示总体的情况外,还分别显示每个组件的情况,例如:如下图所示:

4.2.3     硬件监控

智慧IT设备监测支持对主流 HP,Dell,HuaWei等厂商服务器的硬件监控:支持对温湿度,风扇,电源,硬盘等硬件指标的监控。具体监控效果图如下:

4.2.4     端口监控

智慧IT设备监测监控系统级服务以了解可用性和应答时间是确保服务器管理计划得以完成的必要因素。智慧IT设备监测可监控下列服务的可用性和应答时间:

DNS,IMAP,  SMTP,Echo,  LDAP,  Telnet,FTP,  NNTP,  Web,Finger,  POP,  WebLogic,HTTPS     

智慧IT设备监测的服务监控功能还提供了所监控服务的可用性图表和报表,用户可以选择在服务降级时发送通知。

4.2.5     进程监控

智慧IT设备监测能够发现服务器中运行的所有进程,并列出诸如进程ID、名称、路径和参数。使用进程模板,可以从统一窗口发现、管理和设置阈值。通过远程进程诊断,能够实时查看基于CPU和内存利用率的进程排行,并可从远程终止有问题的进程。

4.2.6     {C}Windows服务监控

智慧IT设备监测允许用户在本地监控Windows服务,能面向网络中的多个服务器远程监控Windows服务。能通过WMI来监控Windows服务,并且不需要在远程机器上安装代理。

  除监控如HTTPLDAPSMTP等系统级服务外,智慧IT设备监测还可以监控如AlerterFTPNet LogonDHCP ServerIASPrint SpoolerWindows服务。当服务失败时,智慧IT设备监测可以自动重启Windows服务或服务器。

4.2.7     {C}URL&网站监控

仅仅通过检查可用性和响应时间(TCP端口),无法知道网站是否正常。智慧IT设备监测可以监控URL地址并查询页面某一文本。当文本缺失时,立即生成告警,从而实时了解网站的运行情况。智慧IT设备监测网站监控支持http⁄httpsNTLM验证的站点。

  智慧IT设备监测能检查URL,其能访问且呈现页面。能监控公共网站以及内部互联网上运行的Web应用的可用性和健康状况。还能提供网站的可用性和性能趋势。

4.2.8     自定义脚本监控

脚本的灵活性广受网络服务器管理员的欢迎,许多管理员更喜欢使用自定义脚本来获取他们需要的数据。使用智慧IT设备监测的自定义脚本监视功能,您可以导入这些监视脚本或者在管理控制台添加新的脚本。智慧IT设备监测的脚本监视支持PowershellLinux shell脚本、VBScriptPerlPython脚本,帮助您管理WindowsLinux或其它您已经使用的监视脚本。

这些自定义脚本监视器也得到监控部分的故障管理功能的支持,可以实现

  • 为脚本的输出设置阈值,如果出现违反阈值的情况,则立即通过邮件或短信获取通知
  • 将告警反映到自定义操控板、全屏视图或者Web告警,帮助网络操作中心管理员
  • 基于脚本的输出自动化一个IT工作流序列
  • 触发一个矫正动作来修复一个异常的情况

在编辑窗口,您可以点击测试脚本立即对脚本进行测试,将重要的脚本模板导出为XML文件,在用户社区共享或者用于导入。

4.2.9     日志监控

智慧IT设备监测能对分布式Windows主机的事件日志、Unix主机、路由器、交换机和其他支持syslog的设备的系统日志,进行收集,分析,报告和归档。该软件生成图表和报表,帮助分析系统问题,且不影响网络性能。

u  {C}Windows日志管理功能

智慧IT设备监测的IT设备监测模块支持Windows事件日志监控功能提供了许多自动的规则,用于监控网络中所有windows服务器和工作站的重要安全日志。这样您就能轻易地检测诸如失败登录、由于密码错误而导致登陆失败、帐户锁定、访问安全文件失败、窜改安全日志等事件。还可以创建许多自定义规则用以巩固公司所采用的安全策略。

u  {C}SYSLOG分析功能

智慧IT设备监测的IT设备监测模块基于规则读取接收的syslog,并关联告警,通知相关人员或采取措施。管理员通常对大量的日志信息束手无策,智慧IT设备监测基于规则读取syslog,帮助管理员挑选和分析有用的日志消息,以便于及时解决网络问题。

日志帮助管理员发现和分析内部和外部的威胁,研究系统使用情况,管理员监控Syslog和事件日志主要用于:

ü  {C}安全审计 (用户行为、认证违例和事件等)

ü  {C}设备和系统管理 (系统事件、设备故障、内核消息、驱动错误、文件系统、系统温度问题、网络连接等)

ü  {C}应用和服务性能管理(应用或服务可用性、错误、性能降级,数据库警告等)

智慧IT设备监测的IT设备监测模块支持多种平台(Linux, UNIX, AIX Solaris)多种设备(任何可以输出syslog的设备)。智慧IT设备监测集日志监控和网络监控于一体,实现全面的网络管理。

ü  {C}通过UDP接收日志消息

ü  {C}自动拆分消息,显示发送者、设备、严重度和内容

ü  {C}轻松创建规则,识别所需的重要syslog

ü  {C}通过设备名称、严重度过滤,关键词匹配

ü  {C}对接收的syslog关联严重度并生成告警

ü  {C}通过Syslog widget及时了解网络中发生的事件

ü  {C}实时了解syslog进入智慧IT设备监测的流率

 

4.3  虚拟化监控

IT设备监测支持对主流虚拟化的监控管理,包含VMware,Hyper-V,Citrix等厂商,下面依VMware厂商为例:

VMware是虚拟化解决方案的领导厂商。应用监控功能支持监控VMware ESX/ESXi服务器以及其中的虚拟机,保证其正常运行。

智慧IT设备监测的VMware监视器不需依赖代理,即可为您提供深入的VMware虚拟化服务器监视方案,为整个服务器架构(物理机和虚拟机)提供一个单独的故障和性能控制窗口。除了基于SNMPWMI的监视方法,智慧IT设备监测同时也借用VMware API,帮助您:

l  {C}立即开始监视VMware服务器:无需繁琐的配置,您所要做的仅仅是设置VMware服务器的主机名称、HTTPS凭证,这新信息会用来发现、映射和监视主机上的所有虚拟机。

发现完成后,包括Esx和其上的虚拟机,有如下效果图:

 

l  {C}当资源利用率违反严重阈值时发出告警通知:这里的30余个关键可用性和性能监视器已经预置了阈值方案,您需要做的就是将您的通知配置文件关联到这些监视器。支持的告警机制包括短信、Web告警等,您甚至可以通过自定义脚本设置补救动作,如当CPU利用率超过90%时重启VM示例中的Windows服务。

l  {C}了解哪个ESX服务器资源不足:根据CUP和交换内存的消耗主机排行,您可以快速定位不健康ESX服务器,打开它的操控版,调查对应的资源信息。在同一快照页面,您可以查看最近的告警历史报表,它们可以支持您快速排除故障,如参照CPU利用率过高的告警,查看相应的历史报表,可以显示哪个CPU核心占用率过高以及那个虚拟机在那段时间占用了大部分的资源。

l  {C}快速识别故障虚拟机并才采取补救动作:管理员通过虚拟机排行可以快速识别故障虚拟机,然后深入分析,判断是什么进程或应用影响了应用的性能。同时,智慧IT设备监测提供超过70VMware监视器,如CPU、内存等的相关监视器,帮助管理员甄别和排除潜在的虚拟机故障。

l  {C}内建70VMware基础架构性能报表:智慧IT设备监测为主机和虚拟机提供超过70个与CPU、内存、磁盘和网络利用率等相关的报表,这些报表可以导出为PDFXLS格式,且可以随时用来排除利用率相关故障,了解资源的利用趋势,制定正确的容量规划决定。您还可以为所有的排行报表设置计划,定期自动发送到指定的邮件地址。

CPU历史报表

内存历史报表

磁盘历史报表

4.3.1     {C}Vmware指标查看

应用监控功能通过标准APIVMware ESX/ESXi服务器连接,监控主机服务器以及虚拟机的健康状态和性能。从而通过一个控制台,即可监控IT设施的物理和虚拟组件。

  • CPU利用率
  • 内存利用率
  • 磁盘使用状况
  • 网络利用率
  • ESX/ESXi服务器排行
  • 硬件参数
  • 深层次的报表

4.4 自动化运维

管理员的日常任务通常是排除网络故障或者执行维护任务。这种第一级的故障排除步骤,和重复费时的维护任务,现在可以通过IT设备监测强大的IT自动化工作流引擎来自动执行。

    功能特点:

u  {C}免编码的IT工作流自动化

IT工作流自动化模块,内建超过70个的工作流程检查和动作,分别归类在9个分类下,包括VMware ESX动作,帮助您构建一个强大的工作流规则,满足您的IT管理需求。您仅需要使用这些检查流和动作,就可以非常方便的在工作流构建器中创建您需要的流程。

   您不再需要浏览复杂的脚本和代码,来配置您的自动化IT管理。IT设备监测工作流自动化采用友好的用户接口,免除编码的设计,帮助您快速构建工作流规则。

 

u  {C}方便灵活的流构建器

  您可以在直观的流构建器中,通过简单的拖放操作,即可创建工作流程。

出来新建工作流之外,您还可以在工作流构建器中编辑现有的工作流,配置它的条件或工作。

u  {C}从网络故障或者日常任务开始IT流程

对于按照标准流程进行的IT任务,如网络故障的一级检测、日常的维护任务,甚至是为了特定的目的,您可以通过IT设备监测工作流自动化模块,自动化执行这些任务。

 

u  {C}记录IT工作流流程到XML文件,随时取用

经验丰富的管理员可以使用IT设备监测,对他们熟知的机构IT设置,创建工作流规则,满足组织的要求。上下文关系的工作流程,帮助他们自动化管理IT设施,保证最小的故障时间,同时减少修复故障所消耗的时间。对于有结构的,耗时间的,有用的文档可以导出为XML文件,IT工作流自动化支持用户将他们创建的流程导出为XML文件,将之用于其它的IT设备监测实例。

u  {C}详尽的工作流执行日志报表,帮助审计和跟踪工作流的进展和日志

所有执行的工作流都会记录在“执行日志”下,用于将来的审计。这对于管理员来说,非常方便,他可以查看这个报表,知道在特定的时间有哪些工作流执行了。

I

 

4.5  {C}3D机房建模

   随着网络规模及设备的增加,数据中心机房越来越复杂。对机房的3D展示有助于降低IT管理的难度,提高运维的效率。尽管有许多3D机房建模工具可以帮助你实现数据中心和机柜的可视化,但大多数工具仅仅是静态展现,无法实时显示机房设备的健康状况,且很难与数据中心监控系统集成。

通过智慧 的3D机房建模工具,IT管理员能够构建一个动态的3D视图,实时呈现每个机柜上设备的健康状况。当时设备性能下降或出现故障时,通过红色标注,点击即可查看设备的详细性能数据。

 

4.6  {C}NOC大屏

智慧 监控部分功能可以实现多个页面的轮循展示,针对有多张拓扑的现场可以在一个大屏幕下实现滚动播放的效果,如下图显示:

 

 

 

4.7  无线监控

IT设备监测支持监控和维护不同类型的无线设备,如接入点、无线路由器、交换机、笔记本电脑、WiFi系统等。

监控无线网络的必要性

如今组织中的大多数员工使用无线网络(WifiVPN)进行日常活动。因此,确保无线网络不受停机影响是业务连续性的关键。

网络中无线设备的数量通常多于有线设备的数量。因此,监视它们对于确保整个网络不会陷入计划外停机非常重要。

利用IT设备监测强大的网络监控功能,您可以监控以下重要的无线网络参数,以确保您的无线网络保持最佳的性能:

·       {C}无线强度:监控和管理接入点总数、用户数、接入点信号强度等因素。

·       {C}无线网络流量:监控无线客户端系统接收的总字节数、接入点接收的总字节数等。

·       {C}无线网络利用率:监控各种参数,这些参数可以帮助您记录无线网络的利用率,比如cpu利用率、内存利用率、发送到站点的总字节数、磁盘利用率、客户机传输的总字节数等。

无线网络的强度 

无线网络的强度对确保网络稳定和业务连续性起着至关重要的作用。弱网络可能导致慢速连接,有时甚至会终止无线网络中一些设备的连接。为了帮助监控您无线网络的强度,确保所有的设备不会在无线网络失去连接, IT设备监测提供了一组监视器,可用于监视几个重要参数,负责确保稳定的无线信号强度:

跟踪访问点的总数

接入点是一个传送和接收数据的站。无线网络中的各种设备通过接入点连接,以便彼此进行交互。

接入点的数目会影响无线网络的连通性范围,以及网络的连接强度。

IT设备监测允许您跟踪无线网络中的接入点总数。您还可以查看与连接到特定接入点的设备相关的统计信息。

监控总用户数

大多数无线网络在任何特定时刻都只支持有限数量的设备。所支持的最大设备数量取决于业务需求以及组织愿意在无线网络基础设施上花费的成本。

IT设备监测允许您查看在任何特定时间点连接到您的无线网络的用户总数。

你也可以设置多个阈值,当用户数量超过一个特定的阈值时,就会收到警报。

无线网络流量

如果无线网络流量超过安全带宽限制,可能会导致不必要的连接中断,甚至可能导致停机。

为了防止您的网络因流量过大而中断,IT设备监测允许您跟踪无线网络中的流量。

您可以设置多个阈值,并通过多个媒体(web控制台、电子邮件、短信、androidiPhone应用程序)获得警报,以防无线网络中的流量超过预先定义的阈值限制。

设置多个阈值的好处是,即使在流量达到临界带宽限制之前,也可以防止对无线网络造成重大影响。

您可以监控各种参数,如无线客户端系统接收的总字节数、接入点接收的总字节数等,从而全面了解无线网络中的流量,并主动采取措施确保连接不受过量流量的影响。

4.8  存储监控

智慧里的存储管理模块支持多厂商的存储区域网络(SAN)和网络附加存储(NAS)监控工具,能够监控EMCHPIBMCiscoBrocadeDELLADICSUNQLogicEmulexJNI等主要厂商的Storage Array、光纤交换机、磁带库、服务器和HBA等存储设备。

具备以下功能:

发现存储设备

n  {C}使用SNMP, CLI , SNIA's SMI-S和厂商指定规则自动发现存储设备

n  {C}发现诸如RAID、磁带库、磁带驱动器、光纤交换机、HBA和主机服务器等存储设备

n  {C}支持所有主流厂商的存储设备

n  {C}端到端设备建模,包括附属组件

n  {C}支持在运行时通过Web用户界面

 

资产管理

n  {C}实时的设备清单

n  {C}管理员可以输入诸如设备位置、厂商和技术支持等信息

n  {C}监控物理和虚拟资产

n  {C}列出例如CPU、磁盘、内存和IO等全部系统资源信息

n  {C}显示HBA卡以及端口明细

n  {C}设备问题报表归档

可视化管理

n  {C}显示设备及其互连的拓扑图

n  {C}链路明细表显示链路名、源和目标

n  {C}用不同颜色表示设备及其互连的状态

n  {C}深入分析视图 - 子图和设备属性视图

 

故障管理

n  {C}监控诸如电源、温度、风扇、电池等故障问题

n  {C}收集状态变更通知

n  {C}指派人员、注释、清除和删除等管理功能

n  {C}根据自定义规则,通过电子邮件或短信通知管理员

n  {C}基于预定规则,升级警报

实时报表

n  {C}监控指定端口的数据,包括实时数据、主要时段的数据,以用于排除故障

n  {C}基于SNMP、非侵入的方式采集光纤通道端口数据

n  {C}查询光纤通道统计数据并用图表显示交换机上每个端口

n  {C}显示实时数据的图表

业务报表

n  {C}自动发送每日和每周告警报表

n  {C}帮助IT团队分析趋势、利用率等

n  {C}提供可用性和性能趋势的一览报表

n  {C}提供告警、厂商、故障工单等信息的综合报表

n  {C}通过报表识别利用过度或不足的资源

4.9  {C}IP地址和端口管理

追踪和管理IP地址,追踪连接到指定交换机端口的设备和交换机中空闲的端口数量,是比较典型的日常网络管理任务。使用电子表格或者单独的工具来管理,会浪费掉不少的时间,而且还增加了任务的复杂程度。IT设备监测的IP地址管理和交换机端口管理为您带来一个综合的IP地址管理和交换机端口映射管理平台。

4.9.1     {C}IP地址管理模块

该插件支持管理员创建分层的子网树视图,来表示位置或使用、亦或者单位,在视图下添加子网。通过这种方式,管理员可以很方便的找到目标子网,获取需要的信息。

在用户界面,管理员可以通过拖放的方式,将子网放置到,重命名树节点,添加或删除子网,扫描组中所有的子网,使用IP地址、MAC地址等进行检索。

该模块具有以下功能点

1)   {C}点到点的IP地址追踪

对于每个IP地址,这个插件提供对应的DNS名称、MAC地址、状态、系统名称、设备类型以及它连接到的交换机名称、交换机端口、别名、所属者等. 除此之外,管理员也可以在子网和设备明细级别,为每个设备添加自定义字段。

2)   {C}历史IP地址追踪 

某个特定IP的历史信息,使用这个工具,管理员可以追踪指定日期内,指定的IP地址分配到了哪个用户。当指定的IP地址或地址空间出现变更时,立即获取通知,如

·         {C}从瞬态到可用或已用的IP地址

·         {C}如果DNS正向查询,或反向查询失败,或者DNS查询返回了一个不同的IP地址

·         {C}如果子网的IP利用率低于或高于指定的百分比

3)  {C}IP地址管理工具

卓豪智慧IP地址管理工具是一个全面的网管工具集,提供了网络和系统管理员常用的30多款工具,包括IP地址管理、交换机端口管理、外来设备监测、配置文件备份、带宽监控、设备监控等等。包含以下功能点:

²  {C}IP地址管理 扫描IPv4 & IPv6子网,识别已用和可用IP地址。它利用预定义的用户策略,帮助用户管理静态DNS环境中的IP地址。扫描某个子网,并提供该子网中IP地址的可用性状态。用户以此可以检测出某个特定IP是保留还是可用

²  {C}Ping工具 - 用于ping网络节点,检查其连接状态

²  {C}SNMP Ping - 用于ping网络节点,检查是否启用SNMP

²  {C}网络扫描 - 用于使用ICMPSMMP来检查一段IP地址是否可用,正向、反向解析IP对应的MAC地址。

²  {C}Proxy Ping - 用于从某远设备Ping另一台远程设备

²  {C}Trace Route - 用于记录从主机到目的主机经过的路线

4.9.2     交换机端口映射

该插件具有以下功能特点:

1)  {C}实时映射插入每个交换机端口的设备

·         {C}连接设备(工作站、智能电话等)的IP/MAC地址明细

·         {C}VLAN信息、端口状态(管理和操作状态,以及端口速度)和其可用性

2)  {C}交换机端口映射历史信息

与历史IP地址追踪相似,这个工具可以帮助管理员找到特定时间段内连接到指定交换机的设备。

3)  {C}优化的搜索能力

支持您通过MACIP地址、DNS名称或设备地址查询设备。

4)  {C}获取通知 

在交换机端口状态发生变更(瞬态/可用/已用),或者设备连接到的端口发生变更时,即时发出通知。

4.10   流量分析功能

智慧IT设备监测 流量分析模块是专门用于监视网络活动,帮助用户了解流量构成、协议分布和用户活动的软件。与传统基于SNMP、网络探针、实时抓包分析方法不同,它利用Flow技术来收集网络中有关流量的重要信息。集流量收集、分析、报告于一体,回答谁(Who)在什么时间(When)、什么地方(Where)、执行什么行为(What)等最关心的问题。为全面了解企业的网络活动,合理有效分配和规划网络带宽提供科学的依据,从而保证企业的关键业务应用畅通运行.

智慧IT设备监测 流量分析模块 支持多厂商、多种流技术:支持Cisco, 3COM, Juniper, Foundry Networks, HP,Huawei,H3C等等主流设备,支持NetFlow, sFlow, cflowd, J-Flow, IPFIX, NetStream主流技术。

4.10.1   带宽检测和流量分析

带宽监控报表为每一个接口显示当前开启了NetFlow接口的带宽利用率平均值、峰值。通过带宽利用率统计,您能够对访问指定接口的主机、应用程序和会话占用了多少带宽实时可视。智慧IT设备监测流量分析模块是一款强大的带宽监控器,让您实时掌握带宽使用情况。

历史带宽使用趋势

u  {C}支持IP或者应用协议分析

通过创建IP组和接口组,了解各部门的带宽使用情况:智慧IT设备监测 流量分析模块能够根据IP地址创建部门,监控每个部门的带宽利用并分析流量。IP分组后,就可以在一个界面查看所有组的流量信息,如流入流量、流出流量等。您也可以设置告警,及时发现网络问题。

创建设备组,授予用户访问权限:智慧IT设备监测 流量分析模块能够根据设备创建分组,监控每个设备分组的带宽利用并分析流量。可以创建许多用户,指派不同的访问权限,只允许其查看流量图表、生成流量报表等等。

支持基于IP或者应用的流量分析,提供网络内应用占用带宽的详细情况,包括应用产生的流量、协议、端口以及来源和目的IP、占带宽百分比等。

u  {C}支持会话分析

支持对网络中的所有会话进行统计分析,并集中查看,提供来源IP、目的IP、应用类型、来源及目的端口、协议类型、DSCP及会话产生的流量等信息。

怎样能够监控各个应用程序占用带宽的情况? 智慧IT设备监测流量分析模块带宽监控器让您对占用带宽最多的应用程序实时可见。通过带宽使用情况,你还可以查看源、目标和会话排行。与使用传统工具相比,使用这些信息,排除网络故障并解决网络问题所花费的时间更少。

4.11   配置管理功能

智慧IT设备监测的配置管理功能,可对交换机、路由器、防火墙等网络设备的配置进行统一集中的管理。支持批量配置海量设备,自动备份配置文件,实时跟踪配置变更,快速恢复正确配置。避免由错误配置引起的网络故障,防止未授权的配置变更,自动化执行配置管理任务,从而提高网络管理的效率,有效降低人力成本。

4.11.1   配置管理能解决问题

  • IT专家分析指出大部分网络中断的最常见原因是错误的配置变更。在IT企业中,网络管理员管理大量的网络设备,很多情况下他们需要进行无计划的配置变更。随着配置变更日益频繁,跟踪对配置所做的变更面临巨大的挑战。当出现网络中断,排除故障将成为棘手的问题。配置管理模块将帮助将设备配置信息存储在一个安全的中央存储库,并从统一控制台有效管理。
  • 网络设备是企业的重要部分,任何随意的配置变更都有可能造成网络故障。即使进行正确的配置变更,也需要安全人员确保变更不影响网络安全。配置管理可帮助网络安全人员全面控制配置变更。
  • 随着关键网络资源和信息管理受到日益严重的威胁,要求IT管理人员不仅符合标准实践、内部安全策略、严格的政府法规和行业方针,而且要保证策略的实施以及网络设备符合所规定的策略。利用配置管理,有助于实现这一目标。
  • 现在IT领域特别地需要自动化。IT管理人员一直在寻求自动化且省时的解决方案,从而降低操作费用,提高生产率。配置管理可自动执行所有配置任务,提高效率。

4.11.2   功能列表

支持配置CiscoHPNortelJuniperForce103ComD-linkFoundryDellEnterasysBlue CoatProximNetScreenNETGEARFortiNet、华为、H3C等近30家厂商的网络设备。

u  {C}自动发现和备份配置信息

可自动发现网络设备,并将设备的配置信息集中加密存储在数据库中。通过设定时间间隔,系统可定期备份设备的配置文件,以便跟踪对设备所做的所有变更,以及在需要时迅速恢复之前的配置。

u  {C}批量配置设备

内置丰富的参数配置模板并支持自定义模板,批量应用到几十台甚至是几百台的路由器或交换机设备。在短时间内准确无误地完成大量网络设备的参数配置,快速执行网络改造、设备升级等网络维护任务。

u  {C}配置版本比对

将每一次改动记录为一个配置版本。通过比对不同的配置版本,利用不同的颜色(蓝色-改动的、绿色-新增的、红色-删除的)来帮助管理人员快速辨认出配置版本之间的区别,有助于快速定位问题根源和纠正配置。

快速恢复正确配置

在对每次配置更改备份的同时,管理员可将设备的最佳工作配置设置为"基线版本"。当由于错误的配置变更引起网络故障时,可快速回归到基线版本,保证网络正常运行,大大降低故障修复时间。

实时跟踪配置变更

系统通过监听设备配置更改时产生的Syslog系统消息,来实时监视配置变更,捕获更改配置的人员(Who)、更改内容(What)、时间(When)IP地址(Where)等信息,并能够自动发送邮件告警,通知管理人员。

权限控制和审批机制

系统提供管理员、超级用户、操作员三种用户角色,通过分配角色和分组设备,控制用户更改设备的配置。借助于配置更改审批机制,可以对网络设备配置实现更安全的控制,防止未授权的配置变更。

强大的设备和搜索功能

系统提供强大的搜索功能,通过键入关键词、字符串或短语,快速查找设备和配置,有助于从海量设备中快速定位到指定设备和配置,实现更加快捷的设备配置管理。

5  项目实施方案

5.1  项目实施前提条件

5.1.1     安装环境要求

确保要安装智慧IT设备监测的系统达到最低系统配置要求:

推荐配置:

处理器

2.6 GHz Quad Core Processor或以上

内存

8GB

硬盘

250 GB (SAS / SSD)

操作系统

64 Windows server 2008 R2 或以上

数据库

POSTGRESQL / Microsoft SQL Server (2005 或以上)标准版或企业版

 

5.1.2     设备发现前提

 

实施内容

监控类型

前提条件

添加网络设备

网络设备(包括路由器、交换机、防火墙等)

开启SNMP协议,使用UDP161端口

添加主机

LINUX主机

开启SNMP协议,使用UDP 161端口

使用SSH协议,使用管理员组账号。端口:TCP 22

AIX主机

使用SSH协议,使用管理员权限账号,具备svmon -G执行权限。端口:TCP 22

HP-UX主机点

使用SSH协议,使用管理员权限账号。端口:TCP 22

Solaris 主机

使用SSH协议,使用管理员权限账号。端口:TCP 22

添加虚拟化主机

ESXI主机150

使用vCenter中有管理权限的账号;默认端口为443使用ESXI主机有管理权限的账号;默认端口为443

虚拟机

添加其他资源

AD或者Exchange

监视Exchange服务器,监控账号必须有"Administrator" 权限。按照下面的步骤添加活动目录监视器:输入监视器的显示名称。

使用WMI方式监视需要的端口有:

1) Windows管理规范(WMI)(默认为:TCP 445

2) 远程过程调用协议(RPC)(默认为:TCP 135

3) 目标机器使用大于1024的随机端口来响应远程连接(DCOM)(默认为:TCP 10251030

 

5.2  实施架构图

5.2.1     专业版

 

对应一般的中小企业,IT设备监测完全可支持管理多达500个节点或100000个接口,实施架构图如下:

备注:

 

²  {C}监控服务器部署在网络操作中心或者数据中心。

5.2.2     企业版

IT设备监测企业版专门为大型企业开发定制,采用中心探针架构,满足企业不断增长的监视和管理需求,不必在可靠性等问题上妥协。 使用 IT设备监测企业版 ,可以管理多个远程位置,它允许您为企业网络监视添加多个探针,在不同的位置部署轮询引擎。 中心服务器设计用于提供各个位置的可见性信息,扩展网络规模,报告各探针的健康性等。

 

备注:

²  {C}中心服务器部署在网络操作中心或者数据中心。

²  {C}分布式服务器部署在远程位置,并在中心服务器上注册。探针服务器甚至可以通过防火墙或代理服务器来连接中心服务器。

²  {C}探针在网络中执行发现、映射、监视和检测任务,将结果报告给中心服务器。

²  {C}在探针和中心服务器之间的信息,是通过HTTP/HTTPS发送XML实现的,这些数据是非常安全的。

²  {C}中心服务器核对这些数据之后,将它们显示在操控台上,方便管理员进行监视和管理。

²  {C}本地管理员可以访问探针服务器的Web控制台,对探针服务器进行相关的操作。

²  {C}在中心服务器的集成控制台上,您可以鸟瞰整个网络的性能

5.3  项目团队组成

项目组是项目最终成功的基础和保证,我们所建立的项目组结构是基于IPTs(Integrated Product Teams)方法,如下图所示。这种方法的特点是,它能够最有效地把各类管理、业务和技术人员结合到一起,包括软件、硬件、通讯与网络、测试、支持等方面的工程师。这种结构将是企业网络管理信息系统成功的重要保证。

项目领导小组

用户项目经理

公司项目经理

{C} {C} {C} {C} {C}

 

 

姓名

职务

项目承担角色

参与阶段

资历

刘亮

卓豪项目经理

项目经理

系统实施支持、用户培训

特长:IT规划、IT项目管理及技术管理、项目实施;

十年以上综合监控项目,运维服务管理平售前,实施,售后支持经验。

王佳敏

卓豪实施工程师

实施工程师

系统技术支持、用户培训

特长:专业的实施售后维护主力,售后问题处理,系统升级等方面具有丰富的经验;具有ITIL Foundation 认证

400

卓豪售后支持团队

售后技术经理

售后维护

专业的售后维护主力,负责工作日全天候的对客户进行支持与问题解决;

 

5.4  项目实施计划

如下列表为本项目的初步实施计划,具体实施时以实际情况为准。

 

 

5.5  项目实施风险控制

5.5.1     风险认识

风险,多指对项目“不利”的不确定因素。这些不利的风险存在于任何项目中,并往往会给项目的推进和项目的成功带来负面影响。风险一旦发生,它的影响是多方面的,如导致项目产品/服务的功能无法满足客户的需要、项目费用超出预算、项目计划拖延或被迫取消等,其最终体现为客户满意度的降低。因此,识别风险、评估风险并采取措施应对风险即风险管理有着十分重要的意义。

1)   {C}风险管理的步骤

项目的风险是多方面的。为此,项目风险管理主要有以下几个步骤:风险识别、定性/定量风险分析、风险应对计划编制及风险监控。

2)   {C}风险识别

风险识别是指识别并记录可能对项目造成不利影响的因素。风险识别不是一次性的工作,而需要更多系统的、横向的思维。几乎所有关于项目的计划与信息都可能作为风险识别的依据,如项目进度及成本计划、工作分解结构、项目组织结构、项目范围、类似项目的历史信息等。

3)   {C}风险分析

其次,通过风险识别过程所识别出的潜在风险数量很多,但这些潜在的风险对项目的影响是各不相同的。“风险分析”即通过分析、比较、评估等各种方式,对确定各风险的重要性,对风险排序并评估其对项目可能后果,从而使项目实施人员可以将主要精力集中于为数不多的主要风险上,从而使项目的整体风险得到有效的控制。

4)   {C}风险应对

最常采用的应对威胁的几种措施是:规避、减轻、转移、接受。

5)   {C}风险监控

风险监控主要包括以下任务:

在项目进行过程中跟踪已识别风险、监控残余风险并识别新风险。

保证风险应对计划的执行并评估风险应对计划执行效果。

对突发的风险或“接受”的风险采取适当的权变措施。

5.5.2     风险处理机制

5.5.2.1   {C}汇报制度

1、在项目组服务人员已确认风险影响的情况下,应在第一时间向本项目组负责人进行汇报,各级人员均应在第一时间向上级汇报;

2、如果出现暂时无法联系的情况,可越级汇报或通知可联系到的项目组成员。

5.5.2.2   {C}升级制度

在风险影响处理过程中,按照职能、层次分别进行升级。

故障升级管理说明表:

类别

定义

职能升级

当风险解决的时间已经超过解决期限的50%, 若处理人员仍未找到相应的解决方案,应立即将故障情况通知上级负责人转给应急副总指挥(由公司相关领导兼任)协调二线支持。

当风险解决的时间已经超过解决期限的80%, 若二线支持仍未找到相应的解决方案,应立即将故障转给应急副总指挥和总指挥(由公司相关领导兼任),协调专家团队等三线支持。

层次升级

若在风险解决期限内, 风险未能解决, 应通知应急指挥更高一级的管理人员。

 

6  项目培训方案

6.1  培训目的

培训作为工程实施的一个重要环节,对整个项目的实施至关重要,通过系统的培训,使得工作人员得到日常工作需要的专业技术知识和经验,从而保障整个系统的顺利运行。

我公司对用户培训的目的是使负责不同工作的人接受不同的技术培训,让工作人员能够掌握有关系统设备和软件的使用、维护和管理的工作,达到能独立进行管理、故障排除、日常测试维护等工作的目的,保证我们所提供的设备和软件能够正常、安全地运行,培训内容以专业化为宗旨,使每个接受培训的人都成为该领域的专家,建立起一支训练有素的技术队伍。确保技术和管理人员能独立进行管理、运行、故障处理及日常维护等工作,确保系统能正常运行,为今后更好的发展奠定良好的基础。

我们将根据系统设计实施的实际需要,在项目建设过程中,安排针对公司不同层面的提供专业培训和知识转移。 

u   {C}在项目实施过程中,公司为业务人员和技术员提供多层次的循序渐进的培训(产品架构、使用操作、系统安装配置、系统维护等)

u   {C}我们将采取多种、多层次的执行和检查手段来确保成功的知识转移和培训。

6.2  培训内容

项目培训由我公司资深技术工程师负责授课,采取现场培训方式。

 

培训内容

时间(天)

主讲教师

培训对象

培训方式

系统基本使用操作培训

1

资深工程师

技术人员、

业务人员

幻灯片讲演、现场操作

系统模块使用操作培训

1

资深工程师

技术人员、

业务人员

幻灯片讲演、现场操作

系统基本配置培训

1

资深工程师

技术人员、

业务人员

幻灯片讲演、现场操作

系统使用答疑

1

资深工程师

技术人员、

业务人员

幻灯片讲演、现场操作

小计

4

 

 

 

 

6.3  培训计划

 

培训时间

培训内容

课长

主讲教师

培训地点

2020-02-10

智慧IT设备监测使用培训

1

资深工程师

现场会议室

2020-02-10

智慧IT设备监测售后培训

1

资深工程师

现场会议室

 

7  售后服务方案

7.1  售后服务承诺

我们的技术支持宗旨是保证运行在客户现场的卓豪软件能够稳定、正常、可靠地运行,保证客户的业务能够连续地运转。

我们将建立一套严密有序的技术支持制度,并在组织机构上予以落实。整个服务支持包括对应用软件及设备的服务支持。

我们将逐渐把系统维护技术通过培训、现场操作等方法转移给客户。

7.2  售后服务内容

7.2.1     服务内容

购买产品所获得标准产品维护和技术支持内容:

编号

提供服务

描述

1

工作时间

5X8

2

问题答复

2 个工作日

3

E-Mail支持

4

电话支持

5

网络会议支持

6

服务包

7

小版本升级

8

在线访问

工作时间:周一至周五9:00 AM – 17:30 PM(北京时间),法定节假日除外。

7.2.2     服务报告

7.2.2.1     问题报告体制

客户怀疑软/硬件可能产生的任何问题都可与本公司联系,并根据问题的严重性来决定联络的方法。基于问题报告系统,本公司将软/硬件问题分为四个等级:

第一等级:疑问或建议;

第二等级:会引起用户不便但有替代途径;

第三等级:会引起用户不便且无替代途径,但用户应用仍可运行;

第四等级:问题严重。由于系统软/硬件的故障引起用户系统及应用的非正常停止。

7.2.2.2     故障处理体制

对于软硬件系统发生的任何故障,本公司将根据故障的严重性采取不同的响应方式。

第一等级:不影响系统正常运行的一般性故障,本部将通过市内公共电话网,进行远程维护,或者在二十四小时内上门维护排除故障;

第二等级:系统个别服务不正常,但不影响整个系统运行,本公司将在四小时内响应,进行支持维护;

第三等级:系统严重故障,部分服务不正常,但系统仍可运行,本公司将在四小时内响应,派遣工程师进行现场维护;

第四等级:网络系统或主机系统严重故障,系统瘫痪,本公司将立刻专人应答,现场解决问题。

7.3  售后维保周期

参考本次的合同要求,本次售后维保服务有效期为x年。

8  项目验收

8.1  项目验收标准

双方项目组成员共同进行系统验收,结束项目工作。

工作内容

l  {C}与客户一起对系统各部分进行系统验收;

l  {C}向客户方项目经理正式移交系统;

l  {C}向客户方项目经理正式移交所有最终版本的项目文档;

l  {C}向客户出具产品验收清单;

l  {C}客户方签署系统验收文档。

完成标志

l  {C}客户方签署产品模块验收清单

实施方责任

l  {C}提交客户系统验收清单;

l  {C}全程参与产品验收工作;

l  {C}提交并且介绍系统后期服务指引;

l  {C}提交本阶段“完成标志”中所有需要提交的文档。

客户责任

l  {C}组织项目组成员参加产品验收工作;

l  {C}客户方项目经理要对本阶段的工作内容进行确认;

l  {C}客户方项目经理要对下一阶段的工作计划调整进行确认;

l  {C}若乙方提交验收通知3个工作日后甲方不进行验收或不提出异议的情况下,视同验收通过;

8.2  项目验收阶段

 推荐项目验收为系统上线的1个周内,确保:

u  实施已完成

u  系统优化策略已完成

u  培训已完成

u  文档已交付

8.3  项目交付物

<xxx项目实施技术方案.doc>

<xxx项目实施进度表.doc>

<xxx项目卓豪IT设备监测管理员使用手册.doc>

 

9  附录:成功案例

案例1中国石油长庆油田公司--监控项目

用户概况

中国石油长庆油田公司(PCOC)是隶属于中国石油天然气股份有限公司(Petro China)的地区性油田公司,总部设在陕西省西安市,工作区域在中国第二大盆地--鄂尔多斯盆地,横跨陕、甘、宁、内蒙古、晋五省(区),勘探总面积37万平方公里。

面临问题

近年来,长庆油田公司的基础网络建设已具备了相当的规模,基本已经达到运营商规模和标准,在基础设施建设、信息技术应用等方面取得了较好的成绩。但如何实现对分布式大规模的油田网络环境统一监控和集中管理,快速定位和排查故障是长庆油田网络管理人员急迫需要解决的问题。

 

解决方案

长庆油田通信处在对比国内外主流的网络管理系统并充分的测试之后,最终部署了卓豪ManangeEngine IT设备监测网络性能监控管理平台,实现对分布于不同地域的20多家机构,3000多台设备的统一集中管理。

通过IT设备监测统一网络管理及监测平台,将油田生产、办公相关网络设备纳入其中,实现油田网络管理监控,实时了解油田整体网络运行状态,预测分析网络运行质量,二级单位能够监控单位内部网络运行状态,掌握网络运行情况,快速判断、追踪定位并响应网络故障。设置监控中心、监控分中心。监控中心进行全网管理,监控分中心对本区域内单位或本单位网络进行管理。监控中心分配管理员的帐号、权限和访问域等。各监控分中心可以单独监控各自的网络设备,也可以由监控中心集中管理。监控分中心实现对各二级单位的网络设备运行数据的采集、管理、存储,集成数据库进行数据的本地存储,并通过安全的传输方式将数据上传至监控中心。

 

系统能够设置多个不同级别的管理人员帐号,具体包括:公司层面的管理部门如:应急预警中心等,公司层面的运行维护部门如:通信处等;二级单位层面分为厂级领导和信息管理部门、作业区等不同级别,不同级别帐号可查看不同的登录界面、拓扑图及管理设备。

 

最终实现了以下目标:

u  消除监控死角

长庆油田设备数量众多,网络建构复杂,因此本项目首先要解决的问题是通过建设全面的监控管理平台将主干网络和二级网络均纳入到监控平台中来。以网络可用性监控为主线,构建全覆盖的网络监控平台,能够主动、及时地发现问题,并调度资源解决问题,形成 IT 运维管理主动服务的新局面。

u  快速定位故障

快速搜索设备,高效定位故障点,及时故障告警,灵活告警机制让管理人员第一时间掌握故障信息,迅速作出响应,快速恢复系统运行。建立集中的告警分析及展现平台,提供灵活、自动化的事件处理能力。当故障产生时,可以进行故障的快速定位,发现故障原因,调度资源快速恢复系统服务,从而缩短故障解决时间,降低维护成本,提高系统整体可用性。

 

u  变被动管理为主动管理

改变二级部门传统管理的被动局面,随时掌握局域网运行情况,在正常生产受影响前,及时将故障排除,提供安全高效的网络环境。

 

客户受益

长庆油田在正式上线卓豪智慧IT设备监测网络监控平台后,真正意义上实现了IT网络、业务系统从透明到可视的转变,在一个界面上对所有IT设备、系统的运行、性能情况了如指掌,随时随地掌握IT业务支撑系统的状态,及时有效对安全隐患进行定位和排查,从而彻底解决了油田大规模分布式网络环境管理的难题。

效果图:

案例2中国移动宁夏移动项目

用户概况

中国移动通信集团宁夏有限公司IT系统的建设经过多年的积累,已经初步形成了一定的规模,并已构建形成了覆盖公司总部以及相关业务协作单位的网络系统,并已实现与诸多移动内部业务系统的网络互连。

面临问题

由于移动网络的特殊性,网络管理必须满足高可用性、高可靠性、高稳定性的要求。宁夏移动是典型的异构型网络,包括了多厂商、多类型、多型号的设备,此外,移动通信网络的建设加速,要求网管平台具有可扩展性,能适应宁夏移动不断发展的需求。

解决方案

经过测试和对比,宁夏移动决定利用智慧IT设备监测平台将相关的IT网络设备、安全设备、主机设备等进行集中监控和统一管理,主要包括本地路由器、交换机和防火墙,本地统一网管应用平台的主机设备,以及集团业务专线的网络设备等进行实时的性能监控,故障定位和告警,报表统计以及设备日志管理。

借助直观的网络拓扑图和机房视图,可以清晰地了解网络结构、机房设施以及业务应用系统,及时地发现和定位问题,极大地降低了网络运维的难度。

效果图:

案例3正荣地产集团综合监控项目

用户概况

正荣集团创立于1998年,是一家全国性综合投资控股集团,总部位于中国上海。2016年,正荣集团启动全新战略,将原有"一主两翼"升级为"三驾马车"的发展格局。旗下有正荣地产、正荣产业和正荣资本三大业务板块。集团秉承“正直构筑繁荣”的核心价值观,奉行“客户思维、匠心品质、精英团队、幸福企业”的企业文化,坚守“让幸福无处不在”的使命,追求“打造百年正荣,助力社会繁荣”的发展愿景。

面临现状

 

随着正荣集团业务的迅猛发展,IT核心业务系统采用了不同厂商、不同品牌、不同型号的服务器、网络设备,系统软件等,在给业务工作带来便利的同时,系统本身的维护、安全运行、故障定位、信息监控也面临新的挑战。目前IT负责运维的业务系统几十套,而且品牌厂商众多,频繁的各种故障,宕机发生导致业务系统无法正常运转。尤其是几个核心业务系统,核心线路经常性的延迟,丢包,导致IT工程师火速救援,加班频频,丑态百出。再加上IT内部工程师都是身兼多职,忙的团团转。

但是人工巡视运行方式已不能满足需要,迫切需要建设一套IT监控平台对各系统进行统一监控,节省人力管理成本、增强系统的稳定性、可用性和安全性,全面提升对IT资源的动态可视化能力、运行维护能力以及持续优化能力。

解决方案

经过测试和对比,正荣地产决定利用智慧IT设备监测平台作为统一监控运维的平台。

本次项目实施的范围涵盖了网络设备监控功能,服务器监控功能,虚拟化监控功能,无线监控,业务监控,数据库监控,脚本监控功能,告警功能等功能。

具体实施效果图:

网络拓扑图:

 

实施效果及客户评价:

盛海瀚洋提供的需求解决方案完全满足我们对监控项目的需求,实施团队专业的实施能力,为该项目顺利落地提供了有利的保障。通过IT设备监测+Applications Manager整体的解决方案的部署,实现了 本环境内基础架构和业务平台的一体化的监控,实时监控服务器存在的性能不足+业务系统存在的潜在风险。

智慧一体化的监控平台已经提升了我们的处理事故的方式,完全由被动变成了主动,而且实现了24*7小时无人值守的效果;每天早上收到可用性Report里我们才知道某条专线曾经又断开过,某台服务器又发生过重启;

案例4 招商局项目综合监控项目

用户介绍

201210月,招商局集团在蛇口数据中心机房,将总部及属下的 招商国际、招商地产、招商物流、香港公司 等企业进行数据大集中管理。

 

项目背景

机柜

 210

网络 / 安全设备

 600 +

端口流量分析

60 +

服务器

1600 +

 

效果图

 

 

 


友情链接: hao123百科    360导航    360安全浏览器    2345网址大全    疯狂新闻网    181信息网    涨口碑    昆鹏展防腐木    pos机   

在线客服 :     服务热线:13072870093     电子邮箱: 510710751@qq.com

公司地址:成都市龙泉驿区

成都盛海瀚洋科技有限公司 一、公司简介 成都盛海瀚洋科技有限公司是一家专业提供:机房建设,企业运维服务,政府单位信息化建设,综合布线、安防监控、网络工程、集团电话、考勤门禁、停车场系统、广播会议系统、音响...

图片描述
Copyright © 成都盛海瀚洋科技有限公司 www.cdshhy.com版权所有 备案号:蜀ICP备19008832号