-
故障复盘 – 故障复盘哪三大关键问题?
这是很多企业/团队都要面对的问题,有着超10年系统稳定性保障经验的李道兵老师给我们分享了他的观点: 故障复盘的三大关键问题: 怎么有效降低故障的影响? 事故处理的流程和原则有哪些? 相关管理制度怎么设置比较合理? 故障复盘的四大注意项: 1.事故复盘不是给人定责的,要有系统思维将优化项实际落地才能推动系统优化; 2.事故报告的重点应该是事故提升项,监控、定位、根因、架构四个部分都必须涉及; 3.事…- 1
- 0
-
IT运维最佳实践 – 一线游戏运维心得(同行经验)
自2015年开始从事游戏行业一线运维工作,至今(2022)已经近7年。 网易游戏:2015.04 ~ 2021.04灵犀互娱:2021.04 至今 文章目录 Toggle 背景1、运维人员的定位运维叫什么?PE?SRE?什么是SRE?什么是可用率?可用率到底要达到几个9?不同人眼中的运维项目组对运维的核心诉求技术要专,还是广?运维SRE的段位2、做事方法新手常犯的错误或误区怎么推进事情落地?忙不过…- 1
- 0
-
可观测性(Observability)- 聚合度量
度量(Metrics)的目的是揭示系统的总体运行状态。相信大家应该见过这样的场景:舰船的驾驶舱或者卫星发射中心的控制室,在整个房间最显眼的位置,布满整面墙壁的巨型屏幕里显示着一个个指示器、仪表板与统计图表,沉稳端坐中央的指挥官看着屏幕上闪烁变化的指标,果断决策,下达命令……如果以上场景被改成指挥官双手在键盘上飞舞,双眼紧盯着日志或者追踪系统,试图判断出系统工作是否正常。这光想像一下,都能感觉到一股…- 4
- 0
-
运维工具 – Hadoop高可用的架构知识
hadoop 2.0 对于Hadoop高可用架构节点介绍 NN服务器会出现脑裂(brain-split)情况什么是脑裂在hadoop2.x版本中,如果存在两个NameNode节点同时服务,这种情况称之为“脑裂” 为什么会出现脑裂脑裂出现原因一般发生在主备NamoNode切换,由于网络延迟、设备故障等,备用的StandbyNameNode【备用节点】认为ActiveNameNode【主节点】失效,此…- 1
- 0
-
排查 K8S 问题的经验和技巧
最近更新:故障经验、Kubernetes架构、持久化存储、Helm、CICD、Ingress-nginx、监控告警、应用可观察性、服务治理等相关文章。 排查 Kubernetes 问题需要有一定的经验和技巧。在实际使用过程中,可以通过学习和实践来积累经验,并结合官方文档和社区资源进行学习和交流。同时,也可以考虑采用监控和日志系统等第三方工具来帮助进行排查和预警。这样可以更好地保障应用程序的稳定性和…- 1
- 0
-
经验教训 – 2018.12.24 一个800万的教训:运维怎样规避违规操作风险?
“郑大一附院系统瘫痪2小时,违规操作的运维被判5年半”的事件刷了屏。据目前公开资料显示,北京中科某某科技有限公司的夏某某在未经授权或许可的情况下,私自编写了“数据库性能观测程序”和锁表语句,并利用私自记录的账号密码将该程序私自连接郑大一附院“HIS数据库”,导致该锁表语句在“HIS数据库”运行并锁定,造成郑大一附院三个院区所有门诊、临床计算机业务受恶意语句攻击,多个门诊业务系统无法正常操作,所有门…- 10
- 0
-
系统稳定性保障 – 混沌工程 – 持续保障系统稳定性和高可用:腾讯游戏混沌工程实践
最近一两年,我们可以发现混沌工程这个技术变得十分火热,大家都知道它变成了一个新的风口。常说做事情要顺势而为,我们希望能够抓住这个机会,所以我最近一年的工作主要是将混沌工程这一技术在腾讯游戏落地。 文章目录 Toggle 一、什么是混沌工程1、混沌工程的定义2、混沌工程的作用1)故障预防2)故障发现3)故障响应4)故障定位5)故障恢复6)复盘改进二、混沌工程平台建设1、流程设计1)实验前2)实验中3…- 1
- 0
-
经验教训 – 软件工程没有银子弹,凡是可能出错的地方就一定会出错“24年了,终于有人发现curl的这个Bug了”
雷军每天都把卓越网的链接全部点击一遍,检查错误。作为软件工程师,雷军深知:软件工程没有银子弹,凡是可能出错的地方就一定会出错。 “24年了,终于有人发现curl的这个Bug了” 本文最初发布于 Daniel Stenberg 的个人博客。 curl 作者 Daniel Stenberg 近日在个人博客分享了一个存在 23.9 年的 curl 漏洞。curl 是常用的命令行工具,用来请求 Web 服…- 3
- 0
-
运维生产故障有哪些?运维常见问题最佳实践
运维生产故障是指在运维过程中出现的各种问题和故障,可能导致系统停机、服务中断或其他运维效率问题。运维生产故障可以根据不同的因素进行分类,下面是一些常见的运维生产故障分类和其常见类型: 1. 硬件故障硬件故障是指由于服务器、网络设备或其他硬件设备的故障或损坏导致的系统停机或服务中断的问题。常见的硬件故障类型包括:– 服务器故障:例如硬盘故障、内存故障等。– 网络设备故障:例如…- 7
- 0
-
故障治理 – 线上故障分析与故障治理指引
文章目录 Toggle 1 生产故障分级规范概要1.1 开篇1.2 事故等级定义1.2.1 故障等级定义1.2.2 故障报告模板示例1.2.3 故障响应处理机制1.2.4 思考2 生产故障原因和分类2.1 故障分类2.2 bug是可以完全避免的么?-了解2.3 经典故障示例-了解2.4 混沌工程简介3 生产故障定位和解决流程3.1 影响服务质量的因素3.1.1我们常常面对如下的业务场景3.1.2 …- 3
- 0
-
zabbix监控nginx(python脚本)
1 配置nginx的http_stub_status_module模块 编译nginx加上参数:–with-http_stub_status_module 配置nginx.conf: location /nginx-status { stub_status on; access_log off; allow 127.0.0.1; allow 10.24.xx.xx;#可以多个 deny all;#…- 19
- 0
-
apache bench+python脚本压测统计TPS和延迟
一、系统的瓶颈 压测的目的就是跑垮系统,达到系统承受最大值。本次压测考虑的方面: 1、CPU利用率、磁盘IO利用率 2、达到系统瓶颈后,再次增大并发和最大连接数吞吐量和延迟反而会下降 3、压测的机器选择,我是在服务器本机上跑的,这会使得压测程序占用一部分CPU,网络延迟几乎为0;而在笔记本上跑,网络延迟占很大部分。 二、python脚本 关于ab的参数分析在上一篇文章中介绍了,网上关于ab都是基于…- 33
- 0
-
Python 数据库备份脚本(邮件通知)
今天用Python写了一个数据库备份脚本,备份失败会用邮件的形式通知系统管理员,感觉还行,先凑和着用: #!/usr/bin/python #coding:utf-8 import subprocess import time import os import sys import sendEmail import getip mail_to_list = …- 15
- 0
-
IIS7配置PHP图解
IIS7配置PHP图解 IIS6整合PHP详解:http://zhidao.zgsj.com/article/8/2011118142648.shtml PHP5.2.17 官方下载: http://windows.php.net/downloads/releases/php-5.2.17-Win32-VC6-x86.zip PHP5.3.5 官方下载:http://windows.php.net…- 4
- 0
-
JavaScript—网络编程(4)-Date、Math、Global和自定义对象
本节博客进行Date对象、Math对象、Global对象和自定义对象的用法演示。 首先是一个out.js文件内容(输出到网页中的自定义输出方法): function println(parma){ document.write(parma+" "); } function print(parma){ document.write(parma); } Date 对象 启用基本存储…- 15
- 0
-
Rust语言开发基础(三)开发工具攻略
2019独角兽企业重金招聘Python工程师标准>>> 一、Subline Text 3 插件下载: Ctrl+Shift+P 调用命令面板,我们就会找到一些以“Package Control:”开头的命令,找到 Install Package (安装扩展),确定后出现命令行, 输入:Rust ,找到插件,确认安装 输入:RustAutoComplete,找到racer插件,确认…- 116
- 0
-
在 Web 服务中异步调用 Python 脚本
CGI 中需要调用一个 Python 脚本,脚本去更新执行 update 的 sql 语句,时间较长,超过了 Web 服务器的最大连接时间,因此需要使用异步调用脚本的方式。 同步方式 1char command[300] = "~/tools/read_emoji_text.py"; 2iRet = system(command); 3MMJsonOutput *pOutRes…- 20
- 0
-
一个强大的python模版脚本
#templates.py import fileinput, re field_pat = re.compile(r'[(.*?)]') scope = {} def replacement(match): code = match.group(1) try: return str(eval(code, scope)) except SyntaxError: exec cod…- 9
- 0
-
生成源码字典的python脚本
vim在编写C语言代码时,可以设置字典,以自动完成。:set dictionary=mydict 将其放到.vimrc中。 在编辑模式,Ctrl+x,Ctrl+k即可以根据字典自动完成输入。 将下面的脚本放到源码目录执行,即可生成mydict字典文件。 该脚本稍做修改即可用于对文本进行统计,生成统计数据。可用于搜索或者输入法,或者语音合成。 # !/bin/env python # file…- 6
- 0
-
python tab自动补全脚本
转自:linux系统运维 http://www.linuxyw.com/a/Shell/Python/2013/0412/27.html 自动安装方法: 脚本下载地址(linux下可用wget下载):http://www.linuxyw.com/scripts/python-tab.sh 执行完脚本后,需要断开SSH重新登陆才可自动补全。 手动修改方法: 1.进入用户 宿主目录,建立 .pyth…- 9
- 0
-
11个提问频率最高的PHP面试题
你是否正在准备寻找一份PHP开发的工作,并且也在寻找一些关于PHP的面试题及答案?本文为大家分享了一些被提问频率最高的11个PHP面试题,以及对应的常规回答,每个公司都有自己的面试标准,面试和问题是完全取决于你在工作中所扮演的角色,当然也和你的编程技能息息相关。 问题:请用最简单的语言告诉我PHP是什么? 回答:PHP全称:Hypertext Preprocessor,是一种用来开发动态网站的服务…- 5
- 0
-
JavaScript—网络编程(3)-Object、String、Array对象和prototype属性
本节学习JavaScript的对象和方法(函数)~ Object 对象 提供所有 JScript 对象通用的功能。 obj = new Object([value]) 参数 obj 必选项。要赋值为 Object 对象的变量名。 value 可选项。任意一种 JScript 基本数据类型。(Number、Boolean、或 String。)如果 value 为一个对象,返回不作改动的该对象。如果 …- 22
- 0
-
Rust: 如何交换Vec类型中数据的位置?
在脚本语言中,要把Vec<>中两两值进行对调,这个是太过于轻松的事情不过了。但是对于Rust而言,还是有些麻烦。 一、如何对Vec<&str>两两值进行对调? 输出结果: 有其它写法,比如简化一些?: 以下的写法可以运行,但结果是不对的,可以看看具体什么原因造成的。clone()? 二、标准库中的用法 在Rust中有swap函数,可以直接使用:- 14
- 0
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!