-
系统稳定性建设(12) – 线上监控指标全解(线上问题排查指南)
前言本文将从 基础设施(CPU、内存、网络、磁盘)、 服务内部(JVM、线程池、连接池等)、中间件(MySQL、Redis、MQ等)、服务治理(注册中心、熔断、分布式事务、服务间调用)、业务指标(支付成功率、转化漏斗)、用户体验(页面性能、用户反馈) 等全维度出发,讲解线上应用的全方面监控参数,大家设计线上服务监控的时候可以借鉴这些参数和思路。线上问题排查也可从这些角度出发。掌握这些将全方面提升你…- 1
- 0
-
2024年 互联网故障盘点,我们能从故障中学到什么?
2024年已过,让我们来盘点今年出现的故障。回顾这一年,我们经历了各种挑战和困难,但也从中学到了许多宝贵的经验。 在面对不确定性时,我们学会了更多灵活地调整策略,每一次解决问题的过程,都是对能力的一次历练。虽然路途不易,所幸我们在变化中成长,塑造更强大的自己,也对未来充满了信心和期待。 2024年发生的宕机事件 谁能想到,“崩”也成了一种上热搜的新姿势。回顾2024年,微软、腾讯云、支付宝、美团、…- 2
- 0
-
2024年复盘-互联网十大故障分析回顾
故障回顾随着2024年的圆满结束,今天,我有幸与各位一同回顾并深入探讨2024年中出现的一些具有代表性的故障案例。我们将分析这些案例,总结经验教训,并探讨如何在未来避免类似问题的发生。 1 2024年 1月11日腾讯游戏故障 故障描述:1月11日晚,多位网友表示包括《英雄联盟》《王者荣耀》《和平精英》在内的多款腾讯旗下游戏出现服务器崩溃、掉线的问题。“腾讯游戏全部断开”甚至登上热搜,今天凌晨0时许…- 5
- 0
-
2015.5·27支付宝大规模宕机事故反思学习
事故背景支付宝拥有超过4万亿年交易总额,是中国第一大第三方交易平台,约占中国整体社会消费金额的六分之一。2014年年11月,就有用户反映,支付宝钱包目前无法转账和提现,当用户使用这两项功能时会提示出现未知错误或创建交易失败,该问题在移动客户端以及电脑网页端均存在。 事故经过2015年5月27日下午4点半左右,陆续有多个地区网友反映,支付宝出现网络故障,账号无法登录或转账。打开余额宝后,不能显示余额…- 2
- 0
-
故障复盘 – 2023.11.12 阿里云的史诗级故障,从这故障中我们能学到什么
时隔一年阿里云又出大故障,并创造了云计算行业闻所未闻的新记录 —— 全球所有区域/所有服务同时异常。我们应当如何看待这一史诗级故障案例,以及,能从中学习到什么经验与教训? 文章目录 Toggle 事实是什么?原因是什么?影响是什么?评论与观点?能学到什么? 事实是什么? 11月12日,也就是双十一后的第一天,阿里云发生了一场史诗级大翻车。根据阿里云官方的服务状态页,全球范围内所有可用区 x 所有服…- 1
- 0
-
经验教训 – 3.29 #微信QQ出现功能异常#,冲上热搜,妥妥的第一
包括微信语音、账号登录、朋友圈,以及微信支付,都无法正常使用。 有网友表示,电脑版微信大概是在早上10:00左右恢复登录,和小雷登录的时间相吻合。 据腾讯的最新财报显示,微信及WECHAT月活数高达13.1亿,如此大用户量的产品出现故障无疑对大众生活工作带来了不少的影响。 不过有一说一,大厂们服务器故障,似乎每年都得上演那么几次。 轻微一些的,有像B站前阵子那样,视频短暂崩溃了半小时。 严重点的,…- 1
- 0
-
经验教训 – 2015.09.20 从Amazon最新云停机事故中学到的三个教训(亚马逊云宕机事件)
Amazon刚刚经历的云服务停机事故引发业界对云技术的又一番争论。 就在上周日上午时段,Amazon Web Services数据中心遭遇一起相当严重的意外事故。 美国东部时间清晨六点,该公司负责承载AWS东弗吉尼亚区域负载的名为DynamoDB的大规模NoSQL数据库发生使用率暴涨状况——顺带一提,东弗吉尼亚州区域为该公司历史最悠久、规模***的九个全球性区域之一。到当日上午七点五十二分,AWS…- 1
- 0
-
关于 Linux 内核本地提权漏洞的安全问题(CVE-2022-0847)影响
2022年03月07日,安全关注到关于 Linux 内核本地提权漏洞的安全问题(CVE-2022-0847),已于第一时间启动安全风险治理,目前经过安全专题确认,安全内部系统和专有云产品均不受影响,安全Alibaba Cloud Linux 3及部分容器服务实例受影响。安全会持续监控此问题的更新,保障与此漏洞相关的云产品及云服务的安全性,让广大用户放心使用。 安全强烈建议客户关注该漏…- 240
- 0
-
python(boto3) 脚本实现AWS实例的自起停
python(boto3) 脚本实现AWS实例的自起停 为AWS宁夏区开张送上迟到地祝福,上半年项目开发中用到了AWS云服务器,按时计费,为节省经费计划在上班期间开启,下班之后关闭。通过查看boto3文档,最终实现了这一小脚本。半年前的脚本,不知道在现在会不会过时,权当做个记录,如果能帮到网友自然更好 前置工作 目的 实现定时远程控制AWS中EC2和RDS实例的自启停 运行必要环境 python …- 59
- 0
-
Ubuntu下安装node.js
ubuntu对新手的友好性是毋庸置疑的。稳定性的话centos各有千秋吧。 如果是自己本地VM上运行的话,常用的ubuntu14.04推荐下载。前不久买了阿里的云服务器,Ubuntu只支持16.04,今天就来重新配一下环境。 首先连接到我们的服务器,这里我用的 finalShell终端连接,很方便,支持复制粘贴,可视化文件夹。 看一下软件效果图: (一)整理环境 1、我们先对工具包进行一次更新,…- 4
- 0
-
Springboot + mybatis + React+redux+React-router+antd+Typescript(三): 上线
前言: 当前后端搭建完成以后,就可以开始上线了; 我用的是百度云服务器,这里简单记录一下上线所用工具以及过程. 前端github地址: https://github.com/www2388258980/rty-web 后台github地址: https://github.com/www2388258980/rty-service 项目访问地址: http://106.13.6…- 12
- 0
-
关于 Log4j2漏洞(CVE-2021-44228)的影响
更新时间:2021年12月19日星期日 安全已关注到关于 Apache “Log4j2”的安全问题(CVE-2021-44228),并已第一时间启动安全风险的治理。安全会持续监控此问题的更新,保障与Log4j2相关的云产品及云服务的安全性,让广大用户放心使用。 安全强烈建议客户关注 Log4j2 相关应用和系统的更新,及时更新组件至最新版本,或使用相关应用、系统的自动更…- 142
- 0
-
kafka解决了什么问题?
Web应用:部署在云服务器上,为个人电脑或者移动用户提供的访问体验。 SQL数据库:为Web应用提供数据持久化以及数据查询。 这套架构简洁而高效,很快便能够部署到百度云等云计算平台,以便快速推向市场。互联网不就是讲究小步快跑嘛! 好景不长。随着用户的迅速增长,所有的访问都直接通过SQL数据库使得它不堪重负,不得不加上缓存服务以降低SQL数据库的荷载;为了理解用户行为,开始收集日志并保存到Hadoo…- 6
- 0
-
Hadoop实战(1)_阿里云搭建Hadoop2.x的伪分布式环境
环境:阿里云服务器 CentOS 7 x86_64 安装介质:jdk-7u75-linux-i586.tar.gz,hadoop-2.4.1.tar.gz 安装jdk 1tar -zxvf jdk-7u75-linux-i586.tar.gz 2 配置环境变量: 1# vi .bash_profile 2 3JAVA_HOME=/root/training/jdk1.7.0_75 4export …- 8
- 0
-
Elasticsearch Reindex性能提升10倍+实战
1、reindex的速率极慢,是否有办法改善? 问题1:reindex和snapshot的速率极慢,是否有办法改善? reindex和snapshot的速率比用filebeat或者kafka到es的写入速率慢好几个数量级(集群写入性能不存在瓶颈),reindex/snapshot的时候CPU还是IO使用率都很低,是不是集群受什么参数限制了reindex和snapshot的速率? reindex不管…- 9
- 0
-
在阿里云上搭建redis高可用集群
为什么要搭建redis集群 Redis是在内存中保存数据的,而我们的电脑一般内存都不大,这也就意味着Redis不适合存储大数据,适合存储大数据的是Hadoop生态系统的Hbase或者是MogoDB。Redis更适合处理高并发,一台设备的存储能力是很有限的,但是多台设备协同合作,就可以让内存增大很多倍,这就需要用到集群。 容错机制-投票 选举过程是集群中所有master参与,如果半数以上master…- 9
- 0
-
ASP.NET Core微服务之Exceptionless的生产环境部署步骤
Exceptionless 是一个开源的实时的日志收集框架,它将日志收集变得简单易用并且不需要了解太多的相关技术细节及配置。本篇基于我的上一篇《基于Exceptionless实现分布式日志》,最近在公司内部搭建日志平台,且部署到了基于阿里云的生产环境,因此做个记录,也希望能帮助到希望基于Exceptionless来做日志平台的朋友们。 一、本地部署前置条件 这里主要参考Exceptionless的…- 57
- 0
-
大型web项目构建之负载均衡
日常开发和学习中经常会听到或者会看到**“负载均衡”**这个词汇,但是对于很多初级每天只面对增删改代码的开发人员来说,这个词汇好像离我们很遥远又很接近,很多人多多少少都有点一知半解 我结合以前在开发中遇到的场景和通过查阅相关资料来简单了解一下词汇之一 ——“负载均衡” 负载均衡的基本理解以及基本概念: 简单理解:如果你是第一次听到这个词,那么你可以这样简单的去理解——负载均衡是什么…- 10
- 0
-
Docker安装nginx以及负载均衡
首先在linux系统中新建一个data文件夹进行nginx容器的创建--即为:mkdir data。 一:第一次 1 第一步: 使用 docker pull nginx将nginx的镜像从仓库下载下来。 2 第二步使用镜像文件创建nginx容器: 1docker run -p 80:80 --name mynginx -v $PWD/www:/www -v $PWD/conf/nginx.conf…- 12
- 0
-
DevOps基础-4.1-基础架构自动化:基础设施即代码
这篇开始学习第四章,第四章主要阐述基础架构自动化这个话题。 在IT系统管理领域,自动化技术并不是新的,但DevOps提升到了完全不同的自动化水平。我们将此称为基础设施即代码。 这是一种完全编程的基础架构方法,使我们能够利用我们系统的开发实践。 分裂Dev和Ops驱动器的一个影响是,一个团队的最佳实践确实没有传递到另一个团队。是的,一个简单的例子是使用源代码控制。 一个没…- 10
- 0
-
Kubernetes用户指南(一)–快速开始、使用k8s配置文件
一、快速开始 1、启动一个简单的容器。 一旦在container中打包好应用并将其commit为image之后,你就可以将其部署在k8s集群上。 一个简单的nginx服务器例子: 先决条件:你需要拥有的是一个部署完毕并可以正常运行的k8s集群。 在Master节点上使用kubectl命令来启动一个运行着nginx服务器的容器: $ kubectl run my-nginx --image=ngi…- 14
- 0
-
kafka解决了什么问题?
Web应用:部署在云服务器上,为个人电脑或者移动用户提供的访问体验。 SQL数据库:为Web应用提供数据持久化以及数据查询。 这套架构简洁而高效,很快便能够部署到百度云等云计算平台,以便快速推向市场。互联网不就是讲究小步快跑嘛! 好景不长。随着用户的迅速增长,所有的访问都直接通过SQL数据库使得它不堪重负,不得不加上缓存服务以降低SQL数据库的荷载;为了理解用户行为,开始收集日志并保存到Hadoo…- 4
- 0
-
ASP.NET Core微服务之Exceptionless的生产环境部署步骤
Exceptionless 是一个开源的实时的日志收集框架,它将日志收集变得简单易用并且不需要了解太多的相关技术细节及配置。本篇基于我的上一篇《基于Exceptionless实现分布式日志》,最近在公司内部搭建日志平台,且部署到了基于阿里云的生产环境,因此做个记录,也希望能帮助到希望基于Exceptionless来做日志平台的朋友们。 一、本地部署前置条件 这里主要参考Exceptionless的…- 23
- 0
-
Ubuntu Core 给物联网提供更多安全支持
文章转载开源中国 Canonical 是 Ubuntu 的一个桌面环境,该公司目前在云服务业务赚到了钱。因为 Ubuntu Core 为嵌入式设备带来了 Ubuntu 18.04 长期支持(LTS)代码库。Ubuntu Core 的镜像大小为 260MB,是迄今为止体积最小的 Ubuntu 版本。这使它成为物联网设备和云容器的理想选择。当然,要使操作系统适合物联网,需要的不仅仅是大小。Ubuntu…- 62
- 0
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!