0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮存储亚健康状态监控功能保障用户数据服务的可靠、高效

科技绿洲 来源:浪潮存储 作者:浪潮存储 2022-05-09 14:40 次阅读

“亚健康”这个词不仅在生活中被熟知,而且大家经常使用的信息系统中也会经常遇到;亚健康状态,顾名思义,是存储系统介于健康状态和故障状态之间的一种状态,系统仍在运行且功能正常但处于降级模式的一种情况,它的存在会造成系统性能严重低于预期。

浪潮存储基于对亚健康状态的研究,在分布式存储平台进行技术创新,研发了亚健康状态监控功能,对硬件、系统、网络等进行实时监测,当系统发现运行过程中存在亚健康状态时,可快速定位原因、上报、并对处于亚健康的部件进行必要的处理,降低亚健康状态对存储系统的影响,保障用户数据服务的可靠、高效。

过去因大部分应用系统规模较小,一般会将亚健康状态划归到故障进行处理,系统在这种情况下虽处于亚健康状态,但仍可以对外提供服务,处于亚健康的部件却被当成故障处理扩大了亚健康状态的影响范围,有时甚至会导致系统不可提供服务,也造成了资源浪费。近十年,随着新技术的快速发展,以及分布式系统部署规模的增加,亚健康状态对于存储系统的破坏已经越来越显著,之前亚健康状态处理方式已经不适合现在的大规模系统。亟待更加智能、高效的机制来保障存储系统健康运行。

亚健康状态是隐形的系统杀手

以网络亚健康为例,网卡故障、驱动程序故障、设备故障、接线松动、温度过高过低等都可能引起网络亚健康状态,尽管产生网络亚健康状态的原因众多,但其对外表现的现象相对简单,主要是网络时延的增加和网络丢包率的增加。如下为网络丢包率和时延对分布式存储系统性能的影响。

在一个分布式存储系统中,单个节点网络丢包率或网络时延增加时,存储系统的性能会极快速的下降,5%的丢包率或50ms时延,就足以使存储系统性能下降一半左右。

从网络亚健康实例中可以看出,亚健康状态对系统的危害,微小的一个亚健康状态,对系统性能的影响都是巨大的。此外CPU、内存、硬盘模块、网卡等硬件部件、操作系统以及软件运行均有可能进入亚健康状态。

浪潮存储基于大量来自企业、大学、实验室等案例的亚健康状态的研究,进行了故障分类和根因分析,可以看出,硬件亚健康状态占比33%,网络亚健康状态占比38%,这两类故障占比超过整体的70%。

亚健康状态监控

让分布式存储运行更稳定

基于对亚健康状态的表象根因等分析与研究,浪潮在分布式存储上实现了亚健康状态监控功能,对硬件亚健康状态、系统亚健康状态以及网络亚健康状态的实时监控,当系统发现运行过程中存在亚健康状态时,可快速定位亚健康状态的原因、上报故障、并对亚健康的部件进行必要的处理(如尝试恢复、隔离部件等),最大限度的降低亚健康状态对存储系统的影响。

浪潮分布式存储AS13000配置了亚健康状态监控之后可以进行亚健康状态监控告警服务的同时还具有如下优势:

01精准定位

亚健康状态的场景复杂,症状、根因众多,检测难度大。亚健康状态监控系统通过建立硬件亚健康检测、网络亚健康检测以及系统亚健康检测的机制,有效的覆盖了亚健康状态的各种检测场景,再加上检测信息的精准分析,能更精准的定位亚健康状态。

02快速处理

存储系统长期以亚健康状态的状态运行,会影响整体性能,监控功能可以在短期内发现亚健康状态,并及时做出必要的处理。以往为了确保系统运行的稳定性,运维人员预计需要每周执行一次巡检脚本,对整个集群进行健康巡检。这种方式一方面时效性差,平均3-4天才可以发现问题;另一方面是巡检脚本检测并不全面。亚健康状态监控可以150秒内发现网络亚健康状态并进行网口隔离处理、30分钟内发现系统亚健康状态并告警、60分钟内发现磁盘温度异常并告警等;平均发现系统亚健康状态并处理的时间缩短了四分之三,并且检测的项目更全面、结果更准确。

具备亚健康状态监控功能的分布式存储AS13000,已经在金融、通信、教科研、医疗等行业规模部署,在运行过程中亚健康状态监控功能快速响应机制,降低了亚健康状态对存储系统的影响与运维成本,保障了客户业务,让企业轻松应对数字经济时代的海量数据挑战。

审核编辑:彭菁
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 浪潮
    +关注

    关注

    1

    文章

    460

    浏览量

    23865
  • 存储系统
    +关注

    关注

    2

    文章

    410

    浏览量

    40864
  • 数据服务
    +关注

    关注

    0

    文章

    36

    浏览量

    9870
收藏 人收藏

    评论

    相关推荐

    5G用户数突破10亿大关

    工信部近期发布的数据显示,我国移动电话用户规模在保持稳定的基础上持续增长,而5G用户数更是迎来了历史性突破,成功迈过了10亿户的大关。 截至11月末,我国三家基础电信企业以及中国广电的移动电话
    的头像 发表于 12-25 09:58 114次阅读

    微软否认使用用户数据训练AI模型

    近日,微软公司正式否认了一项关于其使用Microsoft 365应用程序中客户数据来训练人工智能模型的指控。这一声明旨在澄清近期在社交媒体上流传的某些用户的疑虑和误解。 此前,部分用户在社交媒体平台
    的头像 发表于 12-02 10:33 144次阅读

    programmer烧写用户数据到flash-v1

    今天有客户提出怎样把用户数据写入到flash的操作,本来以为写的programmer都不支持了,但是经过多次验证发现还是可以的,可能之前的验证哪里有点问题吧。 一、通过SPI Active或者SPI
    的头像 发表于 11-28 15:13 841次阅读
    programmer烧写<b class='flag-5'>用户数据</b>到flash-v1

    企业云存储如何收费?企业云存储收费标准

    企业云存储的收费方式因不同的服务提供商和具体的服务选项而异,通常从用户数量、存储容量、功能、混合
    的头像 发表于 10-09 14:55 343次阅读

    请问DIX4192要读取或者写入状态用户数据寄存器的逻辑是什么?

    使用DIX4192通过SPDIF发送和接收用户数据,配置为48kHZ的采样率,每次进入到接收块开始中断,延时2ms去读取Register Page 1的寄存器. 这样配置后,上电运行几秒钟后,锁相环会UNLOCK.下面是寄存器配置,请问一下要读取或者写入状态
    发表于 09-30 07:06

    SpaceX星链全球用户数量突破400万

    SpaceX的星链(Starlink)服务再次刷新纪录,宣布其全球用户数量已突破400万大关。这一成就标志着自今年5月底以来,短短四个月内,星链新增用户量即达百万之众,展现出其低轨道宽带卫星网络的强劲增长势头。
    的头像 发表于 09-29 18:17 661次阅读

    随机存储器的特点和结构

    随机存储器最显著的特点是其易失性,即当电源关闭时,存储在RAM中的数据会立即丢失。这是因为RAM依赖于电流来维持其存储数据
    的头像 发表于 09-26 18:18 902次阅读

    这是几种HTTPS代理保障用户数据安全的方式#HTTPS代理

    HTTP
    jf_62215197
    发布于 :2024年08月23日 08:14:11

    闪存的哪些扇区可用于用户数据存储

    我想问一下闪存的哪些扇区可用于用户数据存储(例如配置、登录名/密码)。目前,我正在使用外部存储器,但使用板载闪存的某些扇区会更便宜。我尝试在用 blank.bin 编写的一些扇区中写入数据
    发表于 07-12 08:13

    请问CYW20829能否通过Quad SPI连接固件、用户数据和Quad SPI SRAM?

    我计划在下图所示的配置中使用 CYW20829。 是否可以使用 Quad SPI 连接固件、用户数据和 Quad SPI SRAM?
    发表于 07-03 06:25

    中国移动4月用户数增173万 总数达9.97亿户

    中国移动4月用户数增173万 根据中国移动公布的2024年4月客户统计数据显示,在移动业务方面,中国移动目前客户总数约9.97亿户,中国移动在2024年4月份净增客户数173.7万户,在24年累计净增客
    的头像 发表于 05-21 16:10 793次阅读

    Avast因违规处理用户数据被处以罚款

    据最新报道,安全软件厂商阿瓦斯(Avast)因违规处理用户数据,遭受捷克个人数据保护部门罚款高达3.51亿捷克克朗(相当于约1.09亿元人民币)。该事件并不是阿瓦斯首次因用户数据处理问题受到监管部门惩罚。
    的头像 发表于 05-08 14:51 475次阅读

    YouTube Premium新功能“精彩部分跳转”上线,用户喜好预测跳转功能亮相

    这项服务基于AI技术和用户数据分析,能够准确预测用户可能感兴趣的视频片段,并直接跳转至最精彩的部分。自今年3月起,YouTube已开始进行此功能的测试,最初仅向美国的部分高级
    的头像 发表于 05-06 16:25 938次阅读

    Netflix利润创新高,付费用户数达2.696亿,季度报告公布

    Netflix在股东信中指出,未来将更注重收入及其他财务数据的披露,而非单纯关注用户数。同时,Netflix宣布自2025年Q1起,将不再披露订阅用户数数据,但在达到特定里程碑后仍会
    的头像 发表于 04-19 11:27 1150次阅读

    HarmonyOS开发实例:【分布式数据服务

    分布式数据服务(Distributed Data Service,DDS)为应用程序提供不同设备间数据分布式的能力。
    的头像 发表于 04-18 10:18 730次阅读
    HarmonyOS开发实例:【分布式<b class='flag-5'>数据服务</b>】