-
ITIL 最佳实践中常出现的五个误区,领悟后有效提高生产质量管控
ITIL作为一种IT运维战略及最佳实践的方法,不仅仅能为IT部门自身的运维效率带来价值,更重要的是基于ITIL运维的IT服务体系能让整个企业的员工对IT服务的满意度得到提升。 但是,把ITIL想象成简单的工具实施是完全不足以达到ITIL运维体系所带来的效果。ITIL告诉大家对IT运维管理必须有一个深思熟虑的长久规划,尽可能的在实施过程中规避一些常见的误区,并且在整个过程中一定要不断地进行调整和改善…- 1
- 0
-
故障复盘 – 哈啰出行高质量故障复盘法
一、故障和复盘真的都是坏事吗?提到复盘,大多数人第一时间想到的是线上出了故障,这下又要有人背锅了;或者是为那个可怜的兄弟暗暗担心;也或者是因为跟自己无关,所以松了一口气。那么故障和复盘真的都是坏事吗?我们该如何理解它呢?我从以下三点讲一下我对故障和复盘的理解。 1.1 正视故障发生的必然性 – 有好也有坏在聊复盘之前,先聊下我对线上故障的看法,…- 1
- 0
-
Flink SQL 实践 – sql 基本手册
文章目录 Toggle Flink SQL 数据类型 # Flink SQL 本页面描述了 Flink 所支持的 SQL 语言,包括数据定义语言(Data Definition Language,DDL)、数据操纵语言(Data Manipulation Language,DML)以及查询语言。Flink 对 SQL 的支持基于实现了 SQL 标准的 Apache …- 1
- 0
-
运维工具 – python 日常数据分析 – excel工作簿与工作表处理技巧
代码文件:筛选一个工作簿中的所有工作表数据.py – 数据文件:采购表.xlsx 下图所示是按月份存放在不同工作表中的物品采购明细数据,如果要更改为按物品名称存放在不同工作表中,你会怎么做呢? 思路:先合并所有表,再按采购物品名称进行分表: import xlwings as xw import pandas as pd app=xw.App(visible=True,add_book…- 1
- 0
-
【运维工具】Flink SQL 实践11 去重不仅仅有 count distinct 还有强大的 deduplication
文章目录 Toggle 1.序篇2.背景及应用场景介绍3.来一个实战案例4.基于 Deduplication 的解决方案及原理解析4.1.sql 写法4.2.proctime 下 flink 生成的算子图及 sql 算子语义4.3.proctime 下 deduplication 原理解析5.总结与展望 1.序篇 源码公众号后台回复1.13.2 deduplication 的奇妙解析之路获取。 下…- 2
- 0
-
运维工具 – excel 日常数据分析 – 常用彻底清除格式处理经验
1、清除整个表格的格式。此方法适合清除整个工作表套用的格式。使用此方法将会把工作表套用的格式全部清除掉。首先打开一个已经套用了表格格式的电子表格。2、然后将套用了格式的表格全部选中,如下表中把A2:F8全部选中。这点非常重要,如果只选择了表格的一部分,清除格式操作将会失败。3、单击“开始”菜单标签,再单击工具栏“编辑“组中的”清除”按钮。4、单击“清除“按钮后,在弹出的下拉列表中选择“清除格式”命…- 1
- 0
-
【运维工具】Flink SQL 事件时间下数据乱序丢数踩坑
本文分为以下几个部分: 「1.本次踩坑的应用场景」 「2.应用场景中发生的丢数故障分析」 「3.待修复的故障点」 「4.丢数故障解决方案及原理」 「5.总结」 文章目录 Toggle 应用场景丢数故障分析待修复的故障点解决方案以及原理丢数故障解决方案解决方案原理输入数据样例输出数据样例总结学习资料flink 应用场景 应用场景如下: 「flink 任务 A」 以「处理时间」语义做过滤产出…- 2
- 0
-
经验教训 – 服务稳定性SLA-2015年阿里双十一惨痛的教训
文章目录 Toggle 618&&双11SLA服务等级协议单个服务稳定性集群稳定性专项测试稳定性建设小结 618&&双11 作为研发,尤其是后端研发,每年在618或者双11的时候压力特别大,他们祈求服务不要出故障,交易能正常进行,而且期望用户体验非常棒而不是卡顿404等。 但是有时候就是事与愿违,比如在2015年11月11日傍晚,大部分用户反馈购物失败的情况,负责双…- 5
- 0
-
PYTHON基础技能 – Python高手秘籍:17个字典推导式实战案例
今天我们要探索字典推导式的奥秘。别看它名字复杂,其实它就是一种让你的代码变得更加简洁、优雅的秘密武器。 文章目录 Toggle 第一站:基础岛案例1:简单转换第二站:映射大陆案例2:数值翻倍第三站:条件海域案例3:筛选偶数第四站:复合键值案例4:姓名与年龄第五站:嵌套冒险案例5:嵌套列表转字典第六站:集合挑战案例6:列表去重第七站:字符串乐园案例7:字符频率第八站:逻辑迷宫案例8:基于条件的映射第…- 0
- 0
-
混沌工程与SRE的结合(中国移动)
中国移动信息技术中心技术专家,中国移动磐基CMChaos平台负责人晁元宁分享了《混沌工程与SRE的结合》,他提到:随着企业数智化转型的浪潮,业务“上云”进度越来越快,团队对于技术栈的管理和系统维护难度不断增加。为了维护业务系统稳定,磐基引入SRE体系,在落地过程遇到管理、规划、质量把控等方面问题,在本次分享中重点介绍了以上问题如何规避、解决、优化,即如何结合混沌工程的方式来这些解决痛点。并认为:混…- 3
- 0
-
故障复盘 – 遇到P0级别故障如何做故障复盘?
其实现在的计算机系统是一个极其复杂,而且依赖很多的分布式系统,出现事故是在所难免的,关键是如何对待事故。是把它视为人为错误(Human Error)导致,找到那个事故负责人,然后对他进行处罚,希望达到不再犯错的目的,还是接受事故是不可避免的事实,进而从各种系统架构设计上/流程设计和执行上进行容错性处理,把每次事故当作一次学习和改进的机会。这是一个传统IT公司和高绩效公司的关键区别之一,看看以下案例…- 26
- 0
-
PYTHON基础技能 – 文本清洗和预处理的 15 项技术
文本清洗和预处理是自然语言处理(NLP)中的重要步骤。无论你是处理社交媒体数据、新闻文章还是用户评论,都需要先对文本进行清洗和预处理,以确保后续的分析或建模能够顺利进行。本文将详细介绍15项Python文本清洗和预处理技术,并通过实际代码示例来帮助你更好地理解和应用这些技术。 文章目录 Toggle 1. 去除空白字符2. 转换为小写3. 去除标点符号4. 分词5. 去除停用词6. 词干提取7. …- 5
- 0
-
数字化运营基础技能 – python学习路线图经典版
关于Python数据分析,其实网上能够找到的学习资源很多,主要分为两类:一类是提供各种资源的推荐,比如书单、教程、以及学习的先后顺序;另一类是提供具体的学习内容,知识点或实际案例。 但很多繁琐而又杂乱的内容,除了给初学者增加理解和认识的噪音外,真正能够起到明确的方向指引导的,确实不多。以至于很多人一开始没有明确的方向就一头扎进去,学了很久却不知道自己到底在学什么,或者自己学了很久不知道能够做什么。…- 3
- 0
-
系统稳定性保障 – 混沌工程 – 持续保障系统稳定性和高可用:腾讯游戏混沌工程实践
最近一两年,我们可以发现混沌工程这个技术变得十分火热,大家都知道它变成了一个新的风口。常说做事情要顺势而为,我们希望能够抓住这个机会,所以我最近一年的工作主要是将混沌工程这一技术在腾讯游戏落地。 文章目录 Toggle 一、什么是混沌工程1、混沌工程的定义2、混沌工程的作用1)故障预防2)故障发现3)故障响应4)故障定位5)故障恢复6)复盘改进二、混沌工程平台建设1、流程设计1)实验前2)实验中3…- 5
- 0
-
深入浅出,看资深专家如何解读ITIL4的四大价值维度
ITIL 4是AXELOS(ITIL版权所有方)组织全球范围内的顶级专家,历时两年多开发出来的。它将指导广大客户面对数字化时代IT服务管理所带来的挑战,并提供一个灵活、协调和集成的系统,以有效地治理和管理IT驱动(IT-enabled)的服务。 为了支持服务管理的整体方法, ITIL定义了四个维度, 这些维度对于以产品和服务的形式有效和高效地促进客户和其他利益相关者的价值至关重要。 下面请看,互联…- 4
- 0
-
运维工具 – Hadoop高可用的架构知识
hadoop 2.0 对于Hadoop高可用架构节点介绍 NN服务器会出现脑裂(brain-split)情况什么是脑裂在hadoop2.x版本中,如果存在两个NameNode节点同时服务,这种情况称之为“脑裂” 为什么会出现脑裂脑裂出现原因一般发生在主备NamoNode切换,由于网络延迟、设备故障等,备用的StandbyNameNode【备用节点】认为ActiveNameNode【主节点】失效,此…- 2
- 0
-
运维工具 – 异常数据分析实践,批量生成统计清单
pip install openpyxl==3.0.5 from openpyxl import load_workbook workbook = load_workbook('\统计表.xlsx') worksheet = workbook['Sheet1'] data = {} for row in range(2, worksheet.max…- 1
- 0
-
实践案例 – 腾讯织云智能监控实践
监控系统经历大数据转型后迎来 AI 浪潮。这个主题分享腾讯织云监控的演进过程和考量因素。结合实际案例场景展示织云从用户端到 IAAS 层的立体化监控理念和数据化 DevOps 理念。同时分享织云在 AIOps 领域的智能检测、根因分析和 ROOT 根源分析实践场景,展望未来监控转型方向。 听众受益 了解监控发展变化的背景和趋势;腾讯织云的海量监控架构;腾讯织云的智能化应用场景。 讲师介绍: 吴树生…- 3
- 0
-
思维认知 – 阿里巴巴“三板斧”管理到底是什么?
在商业组织结构的金字塔模型中,自上而下的分别是:目标、使命、价值观;战略与商务计划;培训与发展、组织结构、预算检查、绩效评估、奖惩制度等等。 化用孙子兵法中的“道、谋、断、人、阵、信”,来解释。最上面是“道”,包括使命、愿景、价值观;下面是“谋”和“断”,包括战略、战术;最后是“人”、“阵”、“信”,也就是就是组织能力。 员工管理的核心就在于“人性”二字。用分配解决人性的自私,用考核解决人性的懒惰…- 6
- 0
-
2023.11.27滴滴系统崩了 P0级故障?
昨天(11月26日)晚上,不少用户向潮新闻记者帮反映“滴滴系统崩了,还车还不了。” 今天(11月27日)早上,滴滴发布最新通告,致歉的同时表示,系统已修复。 原文如下: 经技术团队连夜修复,滴滴网约车等服务已恢复,用户可下载滴滴App使用打车服务。骑车等服务还在陆续修复中,所有可开锁或未关锁的青桔车辆均可免费骑行,希望能为缓解早高峰压力努力多做一点点。 11月27日晚间因系统故障导致App服务异常…- 22
- 0
-
故障复盘 – 2023.11.12 阿里云的史诗级故障,从这故障中我们能学到什么
时隔一年阿里云又出大故障,并创造了云计算行业闻所未闻的新记录 —— 全球所有区域/所有服务同时异常。我们应当如何看待这一史诗级故障案例,以及,能从中学习到什么经验与教训? 文章目录 Toggle 事实是什么?原因是什么?影响是什么?评论与观点?能学到什么? 事实是什么? 11月12日,也就是双十一后的第一天,阿里云发生了一场史诗级大翻车。根据阿里云官方的服务状态页,全球范围内所有可用区 x 所有服…- 3
- 0
-
Flink SQL – 网易云音乐flink实践与优化
文章目录 Toggle 一、背景简介二、云音乐的实时计算 Notebook 服务三、性能优化四、运维监控增强五、未来规划 一、背景简介 1.Flink in Music 先简单的介绍下云音乐的现状,目前音乐这边的客户端日志,服务端日志大概在每日大千亿条左右,维度表数据源像 Redis,MySQL 这些大概有上百个。而服务的实时计算任务开发的人员有上百名,其中不仅包扩数据开发工程师,分析师,也包括算…- 4
- 0
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!




















