炼数成金 大数据运维
订阅

运维

留给传统 DBA 的时间不多了?看饿了么如何构建数据库平台自动化
留给传统 DBA 的时间不多了?看饿了么如何构建数据库平台自动化
从时间轴上看我们每年会有一个比较大的前进,我们从人肉->工具化->平台化->自助化只用了两年半时间完成全部迭代,其中平台化&自助化+数据库多活改造我们一口气用了8个月的时间完成全部开发及改造工作。在完 ...
监控系统的前世今生
监控系统的前世今生
随着互联网的发展,监控系统也得到了发展。从最早期的网络监控、系统监控,发展到现在的业务监控、日志监控、性能监控、代码监控、全链路监控等,并在监控数据的基础上,逐步发展出了APM(应用性能管理)、AIOps(智 ...
阿里云故障「惊魂」1小时:难道我们是那0.1%?
阿里云故障「惊魂」1小时:难道我们是那0.1%?
6月27日晚,北京国贸写字楼2座灯火通明。林晓宇疾步往返于运维部与研发部的走廊上,表情有些凝重。  一场因阿里云故障引发的突发事件,导致他所在的互联网金融公司几近瘫痪。在运维部工作近一年,林晓宇首次受到公 ...
惊爆!一行正则表达式引发的 CPU 惨案
惊爆!一行正则表达式引发的 CPU 惨案
正则表达式是程序员经常使用的工具之一。本文作者通过一个正则表达式的陷阱,先深入剖析了出现问题的原因,后给出怎么处理这类问题的方法。最后还给出了一些检测常见正则表达式问题的工具,十分值得深入研究。前几天 ...
运维定位服务故障时,前5分钟都在忙啥?
运维定位服务故障时,前5分钟都在忙啥?
遇到服务器故障,问题出现的原因很少可以一下就想到。我们基本上都会从以下步骤入手,这些也是绝大多数运维工程师在定位故障时前几分钟的主要排查点:一、尽可能搞清楚问题的前因后果,不要一下子就扎到服务器前面, ...
AIOps在携程的践行
AIOps在携程的践行
随着人工智能时代的到来,携程生产环境运维进入了新的运维时代——AIOps。通过两年多时间的技术投入与实践,AIOps在效率提升、可用性保障、成本优化等运维场景取得了显著的成果。通常人工智能技术分为“弱人工智能” ...
一些小团队的自动化运维实践经验
一些小团队的自动化运维实践经验
应用系统的编译打包基本在程序员自己的电脑上。分支管理也清一色的 dev 分支开发,测试通过后,再合并到 master 分支。生产环境的应用配置要登录上具体的机器看才知道,更不用说配置中心及配置版本化了。对了,连基 ...
实践解析:大众点评账号业务高可用进阶之路
实践解析:大众点评账号业务高可用进阶之路
在任何一家互联网公司,不管其主营业务是什么,都会有一套自己的账号体系。账号既是公司所有业务发展留下的最宝贵资产,它可以用来衡量业务指标,例如日活、月活、留存等,同时也给不同业务线提供了大量潜在用户,业 ...
解密百度智能运维工程的架构建设
解密百度智能运维工程的架构建设
百度云智能运维团队在运维工具和平台研发方向历史悠久,支撑了全百度数十万规模服务器上的运维服务,所提供的服务包括服务管理、资源定位、监控、部署、分布式任务调度等等。最近几年,团队着力于发展智能化运维能力 ...
京东海量运维的演进
京东海量运维的演进
IT 技术的迅猛发展,给运维人员带来了越来越多的挑战。只负责安装、部署的传统型运维的发展空间已经受到越来越多的挤压:互联网的快速发展,使各种软件的部署、安装已经不再是技术问题,各种开源解决方案也让人怀疑 ...
百度在故障定位场景下的监控数据可视化探索
百度在故障定位场景下的监控数据可视化探索
在标准的故障处理流程中,故障定位一般可分为两个阶段:故障止损前:期望可以快速获得可用于止损决策的信息,做出相应的止损操作使得服务恢复。比如通过确定故障范围,调度流量绕过故障机房或摘除故障实例等。故障止 ...
智能运维实践:硬盘失效预测技术
智能运维实践:硬盘失效预测技术
硬盘是存储系统的最重要组件,其可靠性状况在很大程度上影响了存储系统的整体可靠性表现。虽然存储系统使用了多种技术来处理硬盘失效,确保一定程度的硬盘失效不影响数据可靠性。但在实际生产环境中,多种因素(如腐 ...
ZABBIX 3.4的新增功能,炫的眼花缭乱
ZABBIX 3.4的新增功能,炫的眼花缭乱
ZABBIX监控解决方案发布了一个稳定分支版本!ZABBIX 3.4版本发布了很多大家预期的惊艳功能,并保持一贯的简单性和灵活性。在3.4中,你会发现仪表板的改进令人印象深刻,多仪表盘支持配置所有权和共享,支持使用拖放 ...
如何实现多维智能监控?--AI运维的实践探索
如何实现多维智能监控?--AI运维的实践探索
监控的核心是对监控对象的指标采集、处理、检测和分析。传统监控的对象是一个单一的实体,例如服务器、路由器、交换机等。这些单一对象通过指标反映运行状态,例如服务器的状态指标有CPU使用率、内存使用大小、磁盘I ...
运维和开发是冤家么?
运维和开发是冤家么?
众所周知,一个网站或者一个项目要创建和运营,绝不是一个人可以完成的(个人玩玩那种不算)。至少需要产品、设计、程序开发(前端、后台)、测试、系统维护(部署、运营、维护)、平台运营等等若干职位。在团队的认 ...
12下一页

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2018-9-20 22:50 , Processed in 0.617090 second(s), 16 queries .