-
系统稳定性建设(12) – 线上监控指标全解(线上问题排查指南)
前言本文将从 基础设施(CPU、内存、网络、磁盘)、 服务内部(JVM、线程池、连接池等)、中间件(MySQL、Redis、MQ等)、服务治理(注册中心、熔断、分布式事务、服务间调用)、业务指标(支付成功率、转化漏斗)、用户体验(页面性能、用户反馈) 等全维度出发,讲解线上应用的全方面监控参数,大家设计线上服务监控的时候可以借鉴这些参数和思路。线上问题排查也可从这些角度出发。掌握这些将全方面提升你…- 1
- 0
-
2021.10.07 一行小错为何产生巨大破坏-Facebook史诗级故障大反思学习
Facebook大故障原因:一条写得很糟糕的命令、一款有缺陷的审核工具、一个阻碍成功恢复网络的DNS系统、以及严密的数据中心安全 Facebook故障是一系列不幸的事件酿成的! 一条写得很糟糕的命令、一款有缺陷的审核工具、一个阻碍成功恢复网络的DNS系统以及严密的数据中心安全,所有这些因素导致了Facebook长达 7 个小时的重大故障。 Facebook 表示,周一故障的根本原因是例行维护工作出…- 3
- 0
-
最佳实践 – 运维服务器故障排查与定位常用命令
整理总结了一些常用分析网站的命令方便大家快速定位故障所在排除故障,最小化的减少故障给业务带来的影响。 文章目录 Toggle 1. 背景2. 说明3. 分析问题的方法论4. cpu4.1 说明4.2 分析工具4.3 使用方式5. 内存5.1 说明5.2 分析工具5.3 使用方式6. 磁盘IO6.1 说明6.2 分析工具6.3 使用方式7. 网络7.1 说明7.2 分析工具7.3 使用方式8. 系统…- 6
- 0
-
经验教训 – 从10次宕机事件中,我学到重要的经验“不要心存侥幸,你担心的事情一定会发生”
今年的灾难事件有几点是比较深刻体会: 第 1 课:循环依赖会破坏你的运维工具流程工具与生产工具是结合一起,出问题往往是最不起眼功能环节,就是一棵螺丝钉 第 2 课:愚蠢的自动化强依赖于流程工具与自动化工具,应急时缺少了走火通道 第 3 课:现在是 2023年,数据库仍然很棘手灾难恢复后最耗时就是数据关系重建,数据完整性、一致性处理 第 4 课:分阶段慢慢部署变更需要遵循最小灰度原则 第 5 课:为…- 2
- 0
-
可观测性(Observability) – 监控和可观测性区别
文章目录 Toggle 监控定义如何使用监控监控的缺陷可观测性可观测性的背景可观测性的理解可观测性的意义使用场景可观测性的要求收集数据metriclogtraceprofile接入简单/无侵入式关联数据关联哪些数据关联数据的意义如何关联数据标准化/结构化数据(metric/log/trace等)空间上的关联时间上的关联设计模型仪表板展示场景覆盖全面可观测性构建的扩展观测性分析平台业务画像智能化、定…- 1
- 0
-
2024.1.8 wind万得P0级故障复盘
今日资本市场大事件当属WIND金融终端宕机事件。 万得旗下WIND金融终端今晨无法正常登录,出现全面故障。万得方面在今日开市前发公告称,登录故障系因“公司的主干网络线路故障,施工人员正在抢修”。这或是万得成立28年来第一次大面积宕机。 据财联社记者获悉,下午13时左右,WIND手机端的行情板块可以查看个股数据。下午16时左右,电脑终端已能成功登录进主界面,但相关功能查询仍存在较为明显的数据延迟现象…- 0
- 0
-
python zabbix批量添加主机 脚本
转载:https://www.cnblogs.com/momoshouhu/p/8053907.html 1.安装xlrd读取Excel文件 1.1. 下载setuptools-38.2.4.zip,上传至zabbix服务器解压安装,下载地址:https://pypi.python.org/packages/69/56/f0f52281b5175e3d9ca8623dadbc3b684e66350…- 146
- 0
-
python 一键添加 zabbix 监控脚本
由于时间关系没有在脚本里把创建主机组和模板的功能,只是单单实现了添加主机的功能 zabbix_tools.py #!/usr/bin/python #coding:utf-8 import json import urllib2 from urllib2 import URLError import sys class ZabbixTools: d…- 12
- 0
-
比特币全节点Go语言实现BTCD之网络连接过程
启动server: 1// Start begins accepting connections from peers. 2func (s *server) Start() { 3 .... 4 go s.peerHandler() 5 6 if !cfg.DisableRPC { 7 s.wg.Add(1) 8 9 go s.rebroadcastHandler() 10 11 s.rpcSer…- 17
- 0
-
一只简单的网络爬虫(基于linux C/C++)————Url处理以及使用libevent进行DNS解析
Url处理 爬虫里使用了两个数据结构来管理Url 下面的这个数据结构用来维护原始的Url,同时有一个原始Url的队列 1//维护url原始字符串 2typedef struct Surl { 3 char *url; 4 int level;//url抓取深度 5 int type;//抓取类型 6} Surl; 7 8 原始的Url队列static queue <Surl *> su…- 101
- 0
-
Java电商秒杀系统性能优化(二)——云端部署,性能压测【从本地调试到云端上线的必经之路】
云端部署,性能压测 云端部署流程 1、 云端部署硬件功能 2、云端部署java环境 3、云端部署MySQL数据库环境 4、云端部署应用服务研发环境 性能压测,发现并发容量问题 jmeter性能压测 发现容量问题 Tomcat性能优化 Tomcat的作用 Tomcat默认内嵌配置 Tomcat调优 发现容量问题 在云端的部署秒杀项目的方案及云端部署的意义,引入了jmeter压测工具完成了性能的摸底测…- 47
- 0
-
DHCP服务器的搭建
DHCP服务器的搭建 呵呵今天我来复习DHCP的搭建了,DHCP的搭建比我想象的要简单,不过估计深究的话也会有很多知识点的,就好像DNS一样,深究的话会扯出一串的知识点。好了言归正传我现在就开始撰写复习笔记 一. 什么是DHCP Dhcp就是动态主机配置协议,可以自动的去分配IP地址、子网掩码、网关以及DNS等tcp/ip信息。当局域网中电脑十分的多的时候,咱总不能一台一台的去主机旁设I…- 32
- 0
-
Openstack+Kubernetes+Docker微服务实践之路–Kubernetes
经过几番折腾终于搞定Kubernetes了,我们要在Openstack上部署Kubernetes集群,使用最新工具Kubeadm来安装,由于不能直接访问Kubernetes的源,我们需要一台可以穿墙的机器,可以是个人电脑,另外需要一台基于Docker快照的云主机,将下载后的所有资源放到这台机器中生成新的Kubernetes快照,用来做为以后Kubernetes集群的系统基础。 下载Kubernet…- 26
- 0
-
Docker网络详解
当 Docker 启动时,会自动在主机上创建一个 docker0 虚拟网桥,实际上是 Linux 的一个 bridge,可以理解为一个软件交换机。它会在挂载到它的网口之间进行转发。 同时,Docker 随机分配一个本地未占用的私有网段(在 RFC1918 中定义)中的一个地址给 docker0 接口。比如典型的 172.17.42.1 ,掩码为 255.255.0.0 。此后启…- 20
- 0
-
hadoop组件—面向列的开源数据库(八)–java使用phoenix查询hbase
我们在上篇文章中已经学习了 如果使用phoenix的shell命令行工具进行 增删改查,同时明确了 phoenix要查询hbase原生建立的表 需要创建映射表或者 映射视图。 hadoop组件—面向列的开源数据库(七)–phoenix查询hbase–映射和常用命令 本篇 记录 使用 java使用phoenix进行 增删改查。 java 使用Phoenix 加载jar包项目中 加载jar包方式一 使…- 185
- 0
-
HBase实战(1):使用Python连接Hbase数据库
使用Python连接Hbase数据库 1,Hbase下载。 下载地址:http://hbase.apache.org/downloads.html 2,本地Hbase安装 1root@master:/usr/local/setup_tools# tar -zxvf hbase-2.0.0-bin.tar.gz 2 1root@master:/usr/local/setup_tools# mv hb…- 13
- 0
-
Yahoo!网站性能最佳体验的34条黄金守则
1、尽量减少HTTP请求次数 终端用户响应的时间中,有80%用于下载各项内容。这部分时间包括下载页面中的图像、样式表、脚本、Flash等。通过减少页面中的元素可以减少HTTP请求的次数。这是提高网页速度的关键步骤。 减少页面组件的方法其实就是简化页面设计。那么有没有一种方法既能保持页面内容的丰富性又能达到加快响应时间的目的呢?这里有几条减少HTTP请求次数同时又可能保持页面内容丰富的技术。 合并文…- 1
- 0
-
大型高并发高负载网站的系统架构
转载请保留出处:俊麟 Michael’s blog (http://www.toplee.com/blog/?p=71) Trackback Url : http://www.toplee.com/blog/wp-trackback.php?p=71 我在CERNET做过拨号接入平台的搭建,而后在Yahoo&3721从事过搜索引擎前端开发,又在MOP处理过大型社区猫扑大杂烩的架构升级等工作…- 2
- 0
-
grpc(5):使用grpc+consul 开发服务调用
1,consul 服务发现 在使用了几次之后终于感受到了这个系统挺好的了。 在一个小的团队里面,要做服务发现,做的简单高效。 可以直接使用 consul 作为服务发现,服务检查的系统。 不用自己去开发了。真的很方便,只要部署下就可以了。 github 上放了代码,都是很简单的。 https://github.com/freewebsys/grpc-go-demo 2,重新研究consul启动 发现…- 24
- 0
-
Spring Cloud微服务技术栈(四):服务治理Spring Cloud Eureka部分源码分析
上一篇文章《Spring Cloud微服务技术栈(三):服务治理Spring Cloud Eureka核心元素分析》主要对Spring Cloud Eureka的三个核心元素(服务注册中心、服务提供者、服务消费者)进行了分析,熟悉了三者之间的通信关系,本篇文章将主要分析Spring Cloud Eureka的部分源码。 当我们搭建好Eureka Server服务注册中心并启动后,就可以继续启动服务…- 2
- 0
-
Openstack+Kubernetes+Docker微服务实践之路–服务发布
结合上文,我们的服务已经可以正常运行了,但它的访问方式只能通过服务器IP加上端口来访问,如何通过域名的方式来访问到我们服务,本来想使用Kubernetes的Ingress来做,折腾一天感觉比较麻烦,Ingress还得搭配Nginx使用,而且目前还是Beta版,就打算另辟蹊径,想到了之前用的Haproxy。 本文就结合OpenStack的负载和Haproxy来实现通过域名的方式访问K8s内部要发布的…- 19
- 0
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!