科技改变生活 · 科技引领未来

  • 首页
  • 资讯
  • 技术
  • 百科
  • 问答
  • 学习
  • 看看
  • 站长
  • 生活
  • 快讯

首页 > 百科 > 产品快讯

add一e多少钱(Thanos)

时间:2022-09-27 04:04 作者:李夕一

奇技指南随着Openstack集群规模越来越大,监控数据呈现指数级增长,给后期计算、存储资源扩容带来了极大的考验。如何稳定、永久存储监控数据、快速查询热数据与历史数据一直是大规模云计算集群存在的问题,当然Openstack社区的Ceilom

奇技指南

随着 Openstack 集群规模越来越大,监控数据呈现指数级增长,给后期计算、存储资源扩容带来了极大的考验。如何稳定、永久存储监控数据、快速查询热数据与历史数据一直是大规模云计算集群存在的问题,当然Openstack 社区的 Ceilometer 、Gnocchi、Aodh项目也未能很好解决我们目前存在的问题,在这里作者将介绍CNCF大杀器, Thanos + Prometheus TP组合(PS:并不是银弹)在Openstack与ceph集群中的概念和使用,将对以上问题作出有效的答复。

add一e多少钱(Thanos)

Thanos 是什么

英国游戏技术公司 Improbable 开源了他们的Prometheus 高可用解决方案。主页上简单易懂一段英文介绍如下:Open source, highly available Prometheus setup with long term storage capabilities。开源,高可用性的Prometheus 设置,并提供长期存储能力。

Thanos 有哪些特点

  1. 跨Prometheus 服务并提供统一的查询接口。
  2. 无限期的存储监控指标。目前支持S3、微软Azure、腾讯COS、Google GCP、Openstack Swift 等对象存储系统。
  3. 兼容现有的Prometheus API 接口 ,例如 Grafana 或者支持 Pormetheus Query API 等工具。
  4. 提供数据压缩功能和降准采样,提升查询速度。
  5. 重复数据删除和合并,并从Pormetheus HA 集群中收集指标。

Thanos 架构

Thanos 架构中的组件

Compact

Compac提供数据降准和压缩功能,主要负责针对S3存储中的对象进行压缩,可以将历史数据中的Block合并压缩成大文件对象。实际上降准压缩并未节省任何空间,而且会在原始的Block增加2个块,但是在查询历史数据时会提升查询速度。最后注意的是,由于进程运行时对中间数据进行处理,故本地需要足够的磁盘空间,随着数据增多空间需求越来越大,目前我们预留300GB 本地空间用作压缩中间数据的处理,并每三天进行一次压缩。

Querier

查询组件通过实现Pormetheus HTTP v1 API功能,组件接收到HTTP的PromSQL 查询请求后负责将数据查询和汇集。它是一个无状态的服务,支持水平扩展。

SideCar

此组件需要和Pormetheus 实例一起部署,它主要起到两个作用,第一代理Querier 组件对本地Prometheus数据读取;第二是将Prometheus 本地监控数据通过对象存储接口上传到对象存储中。最后sidecar 会监视Prometheus的本地存储,若发现有新的监控数据保存到磁盘,会将这些监控数据上传至对象存储。

Store

Store 主要提供查询历史数据功能,当Querier组件调用Stroe 接口,Stroe 再通过对象存储接口获取数据,并将存储数据转换成Querier所需的数据格式。

Bucket

用于检查对象存储中的数据命令,通常作为独立命令运行并帮助我们进行故障排查,支持通过Web UI 查看目前Buket的数量。

Check

通过Thanos check 可以检查和验证Pormetheus Rules 是否正确,实现函数如下。

//定义检查Rules函数 func checkRules(logger log.Logger, filename string) (int, errors.MultiError) {   //记录日志,返回检测的文件名称和详细的日志信息     level.Info(logger).Log("msg", "checking", "filename", filename)    checkErrors := errors.MultiError{}    b, err :=     //读取Rules文件      ioutil.ReadFile(filename)    if err != nil {             checkErrors.Add(err)      return 0, checkErrors  }   //由于rules 格式需要纯Yaml格式,需要验证Yaml 格式是否正确     var rgs ThanosRuleGroups   if err := yaml.UnmarshalStrict(b, &rgs); err != nil {      checkErrors.Add(err)        return 0, checkErrors    }   // We need to convert Thanos rules to Prometheus rules so we can use their validation.    promRgs := thanosRuleGroupsToPromRuleGroups(rgs)     if errs := promRgs.Validate(); errs != nil {         for _, e := range errs {             checkErrors.Add(e)       }         return 0, checkErrors   }        numRules := 0    for _, rg := range rgs.Groups {      numRules += len(rg.Rules)    }   //函数结尾返回检查的rules 数量和错误的数量及错误信息    return numRules, checkErrors }

Thanos 实践中我们遇到的问题

由于Thanos Store 启动时会加载可以访问的数据,他会在本地磁盘或者内存中加载少量的对象存储的块信息,随着时间的推移会造成本地磁盘和内存的爆满,导致集群异常,并引入如下多个问题。大量查询缓慢导致内存暴增并出现Store OOM。前期我们使用POD 方式部署Thanos集群,由于POD改变后IP发生变化,导致集群脑裂并崩溃,最后无法查询历史数据。考虑到Stroe组件比较消耗资源,我们将其转移到物理机上,Sidecar 和Pormetheus放入POD 当中。由于早期的版本性能比较差,我们将版本也进行了升级,并启用压缩功能。

启用压缩功能后:

9月28日至11月07日产生的监控数据量:

目前集成监控场景如下:

  1. Ceph / Cephfs 、Lvs、Openstack、Etcd、K8s 、Istio 、Openstack 虚机监控。
  2. 提供API 查询接口与StackStorm 联动处理指定事件信息。

总结

Thanos 方案本身对于Prometheus 没有任何强势侵入,并增强了Prometheus的短板。最后Thanos 依赖于对象存储系统,这部分的资源尽量要考虑。目前线上包含了约40+套 Openstack,70+ 套的Ceph集群,约10000 +的OSD 节点数量,每天约产生约50G 监控数据。

Thanos 帮忙解决了哪些问题

  1. 由于存储大小的限制,历史数据存储的时间的问题 First Blood。
  2. 集群数量越来越多,Prometheus 查询性能出现卡顿 double kill。
  3. Openstack 、ceph 集群数量比较多,无法通过统一的接口去查询数据和告警 triple kill。

关于360技术:360技术是360技术团队打造的技术分享公众号,每天推送技术干货内容,更多技术信息欢迎关注“360技术”微信公众号

相关话题

  • 惠比特犬多少钱一只(没错)
  • 转移因子胶囊多少钱一盒(刚刚)
  • 甲胎蛋白检查多少钱(甲胎蛋白偏高)
  • 转移因子胶囊多少钱一盒(重磅)
  • 铝塑板多少钱一平方(不了解主材)
  • 生殖科全面检查多少钱(裤子脱掉查一下)
  • 猫绝育手术多少钱(猫绝育手术)
  • 和烟多少钱一包图片(超市买到)
  • 胎儿做亲子鉴定多少钱(做一次)
  • 科目二多少钱(驾校考试这些收费你知道吗)
  • 一般大货车多少钱一辆(网友吐槽8)
  • 不锈钢回收价格多少钱一斤(废不锈钢回收价格2021年11月6日废不锈钢回收价格调整信息)
  • 不锈钢橱柜多少钱一米(橱柜台面)
  • 小狗狂犬疫苗多少钱(再次提醒)
  • 拉直头发多少钱(田静给婆婆买新衣服)
  • 拉直头发多少钱(拿不出50万彩礼女友被拖走)
  • 电动车多少钱(3款真正续航达100公里的电动车)
  • 蓝妹啤酒多少钱一瓶(百威没把雪花的)
  • 冠脉造影要多少钱(做冠脉造影后人活不久了吗)
  • 白糖多少钱一斤(蜂蜜低到6元1斤)

热门推荐

  • 即日起,淘宝88VIP用户能无限次退货包邮!
  • 华为Pura系列今日10:08分上架,现已买断货!
  • OpenAI:新GPT-4 Turbo模型现可付费ChatGPT用户使用!
  • 华为门店接受P70盲订?或在线上直接开卖!
  • 曝因OLED面板供应不足,iPad Pro 2024或将延期至5月份!
  • 苹果开发者大会定档端午节,知情人士透露或有AI 要素!
  • 阿里通义千问免费开放1000万字长文档处理功能!
  • 哈弗二代大狗 Hi4 版车型 3 月25 日发布!
  • 小米汽车28日见,上市即交付,价格仍是迷!
  • 支付宝近期将上线多语言翻译等服务,开启国家化交易!
  • 华为本月或将发布75英寸V5 智慧屏等新品!
  • 奇瑞iCAR 03硬派越野新车上市,售价10.98万起收获不少好评!
  • 华为全新小折叠旗舰HUAWEI Pocket 2正式发布,时尚、高端、有内涵!
  • 比亚迪秦 PLUS 荣耀版上市,预计售价7.98万元起!
  • 百度搜索推出AI拜年新功能,支持多种风格更有趣!
  • 华为全国都能开的高阶智驾来了!推送计划正在火热进行中......
  • 保时捷将正式发布第二个纯电动车系,配置值得期待!
  • 智能汽车被重新定义,比亚迪让智能汽车更智慧化!
  • 三星Galaxy S24系列发布:799美元起,AI赋能,四色可选!
  • CES2024:三星新一代十字门Flex冰箱为用户带来智慧厨房新体验!

李夕一

关注
免责声明:本文章由会员“李夕一”发布,如果文章侵权,请联系我们处理,本站仅提供信息存储空间服务 如因作品内容、版权和其他问题请于本站联系

关注排行榜

  1. 1即日起,淘宝88VIP用户能无限次退货包邮!
  2. 2华为Pura系列今日10:08分上架,现已买断货!
  3. 3OpenAI:新GPT-4 Turbo模型现可付费ChatGPT用户使用!
  4. 4华为门店接受P70盲订?或在线上直接开卖!
  5. 5曝因OLED面板供应不足,iPad Pro 2024或将延期至5月份!
  6. 6苹果开发者大会定档端午节,知情人士透露或有AI 要素!
  7. 7阿里通义千问免费开放1000万字长文档处理功能!
  8. 8哈弗二代大狗 Hi4 版车型 3 月25 日发布!
  9. 9小米汽车28日见,上市即交付,价格仍是迷!
  10. 10支付宝近期将上线多语言翻译等服务,开启国家化交易!

编辑精选

Copyright ©2009-2022 KeJiTian.Com, All Rights Reserved

版权所有 未经许可不得转载

增值电信业务经营许可证备案号:辽ICP备14006349号

网站介绍 商务合作 免责声明 - html - txt - xml