-
【运维工具】Flink SQL 实践8 flink sql tumble window 的奇妙解析之路
文章目录 Toggle 1.序篇-本文结构2.目标篇-本文能帮助大家了解 flink sql tumble window 什么?2.1.回顾上节的 flink sql 适用场景的结论3.概念篇-先聊聊常见的窗口聚合3.1.窗口竟然拖慢数据产出?3.2.常用的窗口4.实战篇-简单的 tumble window 案例和运行原理4.1.先看一个 datastream 窗口案例4.2.flink sql …- 7
- 0
-
【运维工具】 – Top 12 IT服务管理(ITSM)工具
IT服务管理已发展成为维持企业运转的关键功能。下述平台可以帮助您跟踪和完善服务工作流程。 很久以前,运行一个IT服务台只需要几台备用台式机、一条电话线和一种糟糕的幽默感。现在,信息化成为企业的支柱,这份工作也随着责任的增加而发展变化。如果持续停电导致部分业务关闭,许多企业将遭受重大打击。当计算机负责处理每个工作流程的每一步时,没有计算机也就意味着无法完成任何工作。这也使得IT服务台成为维持企业运转…- 14
- 0
-
经验教训 – 运维工程师 不得不看的日常经验2,帮你远离故障
确保变更可以回滚佛说:“每次创伤都是一次成熟”。这是运维人员的真实写照。从某种意义上讲,运维是一份不断犯错、不断积累经验的工作。以前没有经历的东西,总是不定期的给你痛击。所以请保护好变更的现场,使得变更有回头的机会。 小心破坏性的操作什么是破坏性的操作?比如:对 Oracle 而言,有truncate table_name,delete table_name,drop table_name。这些语…- 1
- 0
-
经验教训 – 2018.06.27 阿里云回应访问故障:运维操作失误导致 将敬畏每一行代码
阿里云再次对6月27日下午发生的技术问题进行了回应和解释,称“运维上的一个操作失误,导致一些客户访问阿里云官网控制台和使用部分产品功能时出现问题,引发大量吐槽”。阿里云表示,“对于故障,没有借口。” 6月27日下午,有网友反映,登陆阿里云控制台时出现异常,部分服务无法正常使用。随后阿里云在官网发布公告称,阿里云的部分产品及账号登陆出现访问异常,截至当天下午17:30大部分受影响的业务已经恢…- 4
- 0
-
PYTHON基础技能 – 12个find()函数在Python中的创意实践
文章目录 Toggle 1. 基础探秘:找呀找,找到第一个!2. 不见不散:找不到也得说一声3. 多次邂逅:第一次不够,再来一次!4. 范围游戏:限定区域,精准打击5. 空白不是障碍:忽略前后空白6. 字符串中的数字侦探7. 切片小技巧:动态查找8. 分隔符的盛宴:找分隔符的间隔9. 替换前的侦查:统计出现次数10. 链接的智慧:多个条件串联查找11. 特殊字符也爱找:转义字符的使用12. 省略号…- 0
- 0
-
IT运维管理(活着)与IT运营管理(活得好)定义与区别
最近在一个项目中,用户提出“IT运维管理”感觉范围太窄了,我们应该做“IT运营管理”。但IT运维管理和IT运营管理的核心区别是什么呢?好像也没有一个特别明确的解释。今天我们就试图去讨论一下“IT运维管理”和“IT运营管理”。 文章目录 Toggle 一、运营及运营管理的相关定义“运营”的定义“运营管理”的定义运营管理的目标运营管理的任务运营管理的内容运营管理在企业管理中的位置运营管理所涉及的管理领…- 4
- 0
-
PYTHON基础技能 – Python文件与目录管理的15个技巧
今天我们将一起探索如何像专家一样管理你的文件和目录。无论是整理杂乱无章的文档,还是自动化备份过程,Python都提供了强大的工具。让我们从基础开始,逐步深入。 文章目录 Toggle 技巧1 查看当前目录技巧2 列出目录内容技巧3 创建新目录技巧4 删除目录技巧5 复制文件技巧6 移动或重命名文件技巧7 遍历目录树技巧8 读取文件内容技巧9 写入文件技巧10 分割路径组件技巧11 文件路径拼接技巧…- 1
- 0
-
系统稳定性保障 – 学习了大厂混沌工程故障演练思路就更清晰
近几年大家对于生产服务的稳定性越来越重视,无论是在技术大会还是企业的技术规划中,混沌工程越来越多的被提及到。上周末看了2个大厂落地混沌工程的视频案例,让我对混沌工程有了一些新的理解。这篇文章总结了阿里和字节在落地混沌工程方面的一些技术实践,还有我的一些理解和思考。 一、为什么需要混沌工程? 其实落地混沌工程的原因很简单,业务和技术的复杂性提升带来的不可控风险和成本越来越高。这些复杂性主要体现在这几…- 4
- 0
-
系统稳定性保障 – 微服务架构下如何做好故障演练
微服务架构场景中,应用系统复杂切分散。长期运行时,局部出现故障时不可避免的。如果发生故障时不能进行有效反应,系统的可用性将极大地降低。 文章目录 Toggle 什么是故障演练为什么需要故障演练故障演练的目标故障演练的基本流程云原生、微服务架构场景下故障模拟的挑战云原生、微服务场景下的故障演练工具如何进行故障演练演练前 | 确认演练对象与目标演练前 | 准备演练环境演练前 | 制定故障应对策略演练前…- 7
- 0
-
故障复盘 – 复盘工具 5Why法
发明者用五个以W开头的英语单词和两个以H开头的英语单词进行设问,发现解决问题的线索,寻找发明思路,进行设计构思,从而搞出新的发明项目,这就叫做5W2H法。(1)WHAT——是什么,目的是什么,做什么工作。(2)WHY——为什么要做,可不可以不做,有没有替代方案。(3)WHO——谁,由谁来做。(4)WHEN——何时,什么时间做,什么时机最适宜。(5)WHERE——何处,在哪里做。(6)HOW ——怎…- 5
- 0
-
故障复盘 – 复盘工具 Fishbone Diagram(鱼骨图法/因果分析图)
鱼骨图分析法,也称为因果图或Ishikawa图,是一种结构化的问题分析方法,用于识别问题的根本原因。它广泛应用于质量管理和其他领域,特别是在发现和解决问题的根本原因方面非常有效。鱼骨图通常包括以下几个方面:人(人员)、机(设备)、料(材料)、法(方法)、环(环境)。这些要素可以进一步细分为更小的部分,以揭示问题背后的复杂性。鱼骨图的绘制过程包括以下几个步骤:确定问题:选择要分析的问题,将其写…- 36
- 0
-
【运维工具】Flink SQL 实践6 flink sql 约会 calcite
文章目录 Toggle 1.序篇-本文结构2.背景篇-一条 flink sql 的执行过程2.1.先发挥自己的想象力2.2.看看 flink 的实现3.简介篇-calcite 在 flink sql 中的角色3.1.calcite 是啥?3.2.flink sql 为什么选择 calcite?4.案例篇-calcite 的能力、案例4.1.先用用 calcite4.2.关系代数4.2.1.常用关系…- 5
- 0
-
实践经验 – 琼尼 / 拉姆斯22条原则
设计原则是从大量设计实践中总结出来的相同规律,这些相同的规律来自于设计的实践,同时也是衡量设计的基本准则。设计前辈们将这些设计规律进行整合,传播最广的是麦德华·考夫曼·琼尼提出的“关于设计的12条原则”和当代设计大师迪特·拉姆斯提出的“好的设计有10个原则”。 无论是设计还是产品开发核心都是为了解决实际需要出发 琼尼12条原则 Qiongni 12tiao yuanze 拉姆斯10条原则 Lamu…- 0
- 0
-
IT服务治理 – 腾讯运维的 AI 实践思路指引
讲师简介 张戎 机器学习研究员社交网络运营部 我是一个做机器学习的人,目前接触运维的时间并不长,大约半年左右。 主要做社交网络的运维、监控和异常检测方面的工作。本文将按照下面四大块内容分享。 1. 时间序列异常检测 监控领域做运维,最基础的是时间序列的异常检测。如果是基于机器学习的智能运维,主要分三个场景: 第一步是发现问题,如果我们无法发现问题就无法定位问题、甚至解决问题。 既然提到发现问题,最…- 2
- 0
-
经验教训 – 2020.11.25 亚马逊云服务事故
source: https://www.reportdoor.com/aws-outage-has-taken-down-a-big-chunk-of-the-internet/ 今天,我们以亚马逊去年的一个事故报告(AWS PES#11201)为例子,聊一聊如何从事故报告中学习。 文章目录 Toggle 读前须知亚马逊云服务事故报告的简要介绍 读前须知 从外部的官方报告中学习,我们需要…- 2
- 0
-
经验教训 – 生产环境血的教训最佳实践
SWAT TEAM 每一条教训都是通过生产环境异常总结出来经验 教训1: 变更实施 – 变更要优先考虑灰度原则,有助于降低生产影响 教训2:变更实施 – 生产回滚异常要马上处理,保持服务器的生产服务状态 教训3:变更验证 – 灰度期间必须确认监控/告警后才能继续下一批,避免事件产生影响更大 教训4:变更验证 – 变更完成需从业务维度进行验收 教训5:…- 2
- 0
-
最佳实践 – 技术如何从小白到管理,怎么支撑业务快速发展?
一、背景 技术管理者(技术总监/经理/CTO)期望通过体系化的管理方式建设,能够在百人,千人以上的团队中有效的构建聚焦目标、自我成长、高效能的研发作战团队,快速拿出成果,支撑业务的快速发展。 二、痛点 从小团队人员快速扩张,团队文化稀释,人员效能下降,目标逐渐弱化。 各自团队管理方式及标准不统一,人员管理及协同逐渐混乱。 组织扩大后,难以有效关注个人,无法准确评判个人的成长,贡献等。 三、目标 通…- 2
- 0
-
运维工具 – 阿里超大规模 Flink 集群运维实践(实时监控必备工具之一)
一、演进历史和运维挑战 阿里的实时计算经历了近 10 年的快速发展,总体来说可以分成三大时代: 1.0 时代:2013 年到 2017 年,三大实时计算引擎并存。大家熟悉的 Jstorm 和 Blink 当时都还叫做流式计算。 2.0 时代:2017 年集团合并了三大实时计算引擎,Blink 凭借着出色的性能、高效的吞吐成为唯一的实时计算引擎,实现了大一统。在接下来的 4 年里,集团所有实时计算业…- 10
- 0
-
实践案例 – 故障治理 阿里电商故障治理和故障演练实践
大家好,今天来的人不少,可见对于故障耿耿于怀的人,不止我自己。今天分享的内容主要还是围绕故障治理有关。众所周知,故障治理本身就是一个比较大的话题,几乎涉及到运维、研发、故障运行管理的全部岗位,奇葩一点的故障还可能涉及到运营和产品经理。聊到故障的苦与泪,相信45分钟绝对连开头都没讲完。今天的分享,主要还是回归故障发生的本质,故障原因角度切入。看是否有一些方法论和通用性的手段可以沉淀出来。希望可以对大…- 1
- 0
-
Flink 作业问题分析和调优实践
简介: 本文主要分享 Flink 的 CheckPoint 机制、反压机制及 Flink 的内存模型。对这3部分内容的熟悉是调优的前提,文章主要从以下几个部分分享:原理剖析、性能定位、经典场景调优、内存调优。 摘要:本文主要分享 Flink 的 CheckPoint 机制、反压机制及 Flink 的内存模型。对这3部分内容的熟悉是调优的前提,文章主要从以下几个部分分享: 原理剖析 性能定…- 1
- 0
-
IT服务管理 – ITIL培训- ITIL是什么?为什么要学习ITIL
IT管理 层次与定位 面向服务管理: 我们的解决方案 IT服务管理 ITSM 核心思想 IT服务管理范围 像制造产品一样生产服务 如何实现IT服务管理 IT流程模型 IT发展趋势 ITIL目标 为什么学习ITIL? ITIL可以解决以下痛点 ITIL 应用范围 https://www.doc88.com/p-307881566406.html?s=rel&id=6 https://www.…- 0
- 0
-
IT服务管理 – ITIL培训- 服务台管理
服务台类型 服务台主要活动 – 运营管理 服务台主要活动 – 供应商联络 服务台主要活动 – 发布信息 服务台主要活动 – 响应呼叫 服务台主要活动 – 基架监控- 2
- 0
-
运维工具 – EXCEL 日常数据分析 – 透视表基本操作
一、基本操作1、创建数据透视表2、更改数据源3、转换为普通表格4、刷新所有数据透视表5、数据透视表排序6、数据透视表插入公式7、套用模板8、使用切片器9、恢复03经典数据透视表样式 1、创建数据透视表 2、更改数据源 3、数据透视表转换为普通表格 4、数据透视表刷新 5、数据透视表排序 6、数据透视表插入公式 7、套用设计模板 8、使用切片器 9、恢复经典数据透视表样式 07及以上版本制作的数据透…- 3
- 0
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!




















