炼数成金 大数据运维
订阅

运维

一篇文章全面了解监控知识体系
一篇文章全面了解监控知识体系
监控是整个运维乃至整个产品生命周期中最重要的一环,事前及时预警发现故障,事后提供详实的数据用于追查定位问题。目前业界有很多不错的开源产品可供选择。选择一款开源的监控系统,是一个省时省力、效率最高的方案 ...
Netflix是怎样做系统监控的?
Netflix是怎样做系统监控的?
监控系统某个指标超过阈值,触发告警。大半夜里,你被紧急召唤。半睁着眼,你满脸疑惑:“系统真出问题了吗,还是仅仅需要调整下告警?上一次有人调整我们的告警阈值是在什么时候?有没有可能是上游或者下游的服务出 ...
30 个高可用 Prometheus 架构实践中的踩坑集锦
30 个高可用 Prometheus 架构实践中的踩坑集锦
监控是基础设施,目的是为了解决问题,不要只朝着大而全去做,尤其是不必要的指标采集,浪费人力和存储资源(To B商业产品例外)。需要处理的告警才发出来,发出来的告警必须得到处理。简单的架构就是最好的架构,业 ...
助力技术中台数字化转型,探索农行 DevOps 实践之路
助力技术中台数字化转型,探索农行 DevOps 实践之路
DevOps 持续交付通过组合运营和开发团队,促进研发运营一体化融合,缩短开发周期,频繁发布迅速交付,减少出错可能性,提高企业工程效率,降低成本。DevOps 建设工程是助力农业银行数字化转型的重点工作,通过规范建 ...
Prometheus 踩坑集锦
Prometheus 踩坑集锦
监控系统的历史悠久,是一个很成熟的方向,而 Prometheus 作为新生代的开源监控系统,慢慢成为了云原生体系的事实标准,也证明了其设计很受欢迎。本文主要分享在 Prometheus 实践中遇到的一些问题和思考,如果你对 K ...
Prometheus Metrics 设计的最佳实践和应用实例
Prometheus Metrics 设计的最佳实践和应用实例
Prometheus 是一个开源的监控解决方案,部署简单易使用,难点在于如何设计符合特定需求的 Metrics 去全面高效地反映系统实时状态,以助力故障问题的发现与定位。本文即基于最佳实践的 Metrics 设计方法,结合具体的 ...
手把手教你用 Gitlab 和 Jenkins 构建持续集成环境
手把手教你用 Gitlab 和 Jenkins 构建持续集成环境
最近用到持续集成顺便总结在这里,都是用的最新版。搭建过程中还有一个demo,提交代码到 gitlab 自动触发 jenkins 任务,自动编译代码和 docker 镜像并上传。gitlab 国内安装很麻烦,用官方的源装不了,因为在国外, ...
详解数据服务共享发布
详解数据服务共享发布
通过资源目录提供技术元数据、业务元数据、服务元数据视图,使资源更容易发现,提供分区、分节点的体系化资源目录管理,保护数据安全,快速查找数据。通过自动化采集与解析手段获取元数据信息,建立技术、业务、服务 ...
AIOps对数据中心意味着什么
AIOps对数据中心意味着什么
很多人希望了解AIOps能做些什么来帮助IT团队完成他们的任务。在当前的现代化时代,数据中心技术由云计算、内部部署技术、以及IT管理方法的组合组成,IT运营团队正在努力适应这一新的现实,并应对由此带来的日益增加 ...
NoOps:IT完全自动化运营之路
NoOps:IT完全自动化运营之路
自动化领域的IT领导者正在关注和探索无人值守运营环境的可能性。但是DevOps的这种演变实现起来绝非易事。自动化已经成为一种在简化IT运营中广泛使用的工具,Mindtree就是这样一个组织,它从基础设施中移除手动流程, ...
携程框架团队对于应用监控系统的探索与思考
携程框架团队对于应用监控系统的探索与思考
随着市场环境的变化以及国际化的进程,企业的各种对内、对外需求也日益增长。服务化的架构以及容器化的应用加速了各种功能、产品的迭代与更新。随之而来,我们也面临着一个不断膨胀,日渐复杂的系统。复杂度的成倍增 ...
备战618,京东如何保障系统稳定性?
备战618,京东如何保障系统稳定性?
每年 618 的大促都是一场技术团队大练兵的时候。作为技术研发人员,在这场战斗中,加深了对线上系统的敬畏之心,通过系统的备战,在技术上也得到了提升。大战在即,如何保障系统稳定,我们的备战思路是什么?首先确 ...
运维十年回顾:当前很多新技术的本质都是在解决运维问题
运维十年回顾:当前很多新技术的本质都是在解决运维问题
第一个阶段,人工作坊阶段,也就是我们遇到的所有运维问题,基本靠人工操作完成。这种情况下,系统规模不大,遇到的问题相对简单,大多集中在硬件、网络和系统层面,所以有一定操作系统或网络维护经验的人就可以搞定 ...
一文梳理 RedHat 和 CentOS 运维中的网络知识
一文梳理 RedHat 和 CentOS 运维中的网络知识
在很多公司,岗位职责都是很明确的,专职转岗,每人或者每组负责一块业务。系统运维岗基本上在IT架构上相对偏后一些,该岗位和网络管理岗基本上是平行的。因为今天咱们说的是系统运维方面网络方面的事情,或多或少都 ...
数据库智能运维探索与实践
数据库智能运维探索与实践
近些年,传统的数据库运维方式已经越来越难于满足业务方对数据库的稳定性、可用性、灵活性的要求。随着数据库规模急速扩大,各种NewSQL系统上线使用,运维逐渐跟不上业务发展,各种矛盾暴露的更加明显。在业务的驱动 ...
123下一页

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2020-9-28 20:31 , Processed in 0.146412 second(s), 16 queries .