全部标签

数据

Flink SQL 实践 – sql 基本手册

文章目录 Toggle Flink SQL 数据类型 # Flink SQL 本页面描述了 Flink 所支持的 SQL 语言，包括数据定义语言（Data Definition Language，DDL）、数据操纵语言（Data Manipulation Language，DML）以及查询语言。Flink 对 SQL 的支持基于实现了 SQL 标准的 Apache …
安全运维
- 1
- 0
aqzt24年12月21日
运维工具 – excel 日常数据分析 – 常用字符处理经验

从日志系统导出数据之后，我们需要对日志系统的数据进行截取，提取出我们需要的信息，需要用到字符串截取和查找函数，函数说明如下：字符串截取left函数语法：left(text,num_chars)，从左侧开始截取部分字符串 right函数语法：right(text,num_chars)，从右侧开始截取部分字符串其中：text表示要截取的字符串,num_chars表示要截取的字符数 mid函数语法：…
安全运维
- 0
- 0
aqzt24年12月21日
【运维工具】Flink SQL 实践6 flink sql 约会 calcite

文章目录 Toggle 1.序篇-本文结构2.背景篇-一条 flink sql 的执行过程2.1.先发挥自己的想象力2.2.看看 flink 的实现3.简介篇-calcite 在 flink sql 中的角色3.1.calcite 是啥？3.2.flink sql 为什么选择 calcite？4.案例篇-calcite 的能力、案例4.1.先用用 calcite4.2.关系代数4.2.1.常用关系…
安全运维
- 1
- 0
aqzt24年12月21日
【运维工具】Flink SQL 事件时间下数据乱序丢数踩坑

本文分为以下几个部分：「1.本次踩坑的应用场景」「2.应用场景中发生的丢数故障分析」「3.待修复的故障点」「4.丢数故障解决方案及原理」「5.总结」文章目录 Toggle 应用场景丢数故障分析待修复的故障点解决方案以及原理丢数故障解决方案解决方案原理输入数据样例输出数据样例总结学习资料flink 应用场景应用场景如下：「flink 任务 A」以「处理时间」语义做过滤产出…
安全运维
- 2
- 0
aqzt24年12月21日
经验教训 – 服务稳定性SLA-2015年阿里双十一惨痛的教训

文章目录 Toggle 618&&双11SLA服务等级协议单个服务稳定性集群稳定性专项测试稳定性建设小结 618&&双11 作为研发，尤其是后端研发，每年在618或者双11的时候压力特别大，他们祈求服务不要出故障，交易能正常进行，而且期望用户体验非常棒而不是卡顿404等。但是有时候就是事与愿违，比如在2015年11月11日傍晚，大部分用户反馈购物失败的情况，负责双…
安全运维
- 5
- 0
aqzt24年12月21日
PYTHON基础技能 – Python异常捕获全解析：从try-except到finally的22个关键要点

今天，我们就来聊聊Python中的“安全网”——异常处理机制，让你的代码健壮得像超人一样！文章目录 Toggle 1. 异常处理：编程的必备生存技能2. 多重捕获：一网打尽各种错误3. 捕获所有异常：使用Exception作为通配符4. finally：无论风雨，最后的温柔5. 没有异常的except：小心陷阱！6. 自定义异常：让错误个性化7. with语句与上下文管理器：优雅的资源管理8. …
安全运维
- 1
- 0
aqzt24年12月21日
PYTHON基础技能 – 数据可视化中Matplotlib的10个精美图表

文章目录 Toggle 引言1. 基础设置2. 条形图 – 显示不同类别的数量差异3. 折线图 – 展示随时间变化的趋势4. 散点图 – 探索变量间的关系5. 饼图 – 表示各部分占比6. 直方图 – 分析数据分布7. 箱形图 – 查看数据异常值8. 热力图 – 观察数据相关性9. 雷达图 – 比较多个…
安全运维
- 2
- 0
aqzt24年12月21日
PYTHON基础技能 – Python中提升文件操作速度的7个秘诀

文章目录 Toggle 引言1. 使用with语句安全地处理文件2. 批量处理文件3. 使用缓冲区提高读写速度4. 使用二进制模式处理大文件5. 利用多线程或进程加速文件处理6. 使用pickle模块进行高效序列化7. 使用csv模块高效处理CSV文件实战案例：日志文件分析总结引言在Python编程中，高效且安全地处理文件是一项重要技能。本文将探讨几种优化文件处理的方法，包括使用with语句、…
安全运维
- 10
- 0
aqzt24年12月21日
系统稳定性保障 – 字节跳动混沌工程故障演练实践总结

什么是混沌工程在生产环境中实际运行分布式系统，难免会有各种不可预料的突发事件发生。同时，云原生的发展，不断推进着微服务的进一步解耦，海量的数据与用户规模也带来了基础设施的大规模分布式演进。分布式系统天生有着各种相互依赖，可以出错的地方数不胜数，处理不好就会导致业务受损，或者是其他各种无法预期的异常行为。在复杂的分布式系统中，无法阻止这些故障的发生，我们应该致力于在这些异常行为被触发之前，尽可能…
安全运维
- 61
- 0
aqzt24年12月21日
可观测性(Observability) – 监控和可观测性区别

文章目录 Toggle 监控定义如何使用监控监控的缺陷可观测性可观测性的背景可观测性的理解可观测性的意义使用场景可观测性的要求收集数据metriclogtraceprofile接入简单/无侵入式关联数据关联哪些数据关联数据的意义如何关联数据标准化/结构化数据(metric/log/trace等)空间上的关联时间上的关联设计模型仪表板展示场景覆盖全面可观测性构建的扩展观测性分析平台业务画像智能化、定…
安全运维
- 6
- 0
aqzt24年12月21日
故障复盘 – 复盘工具 SCQA模型复盘法

SCQA模型法SCQA模型是源自芭芭拉·明托在《金字塔原理》中提出的一种结构化表达和分析问题的工具，它由四个元素组成： S（Situation）：情景 — 描述当前的背景、现状或已知的事实情况，通常是大家都熟悉的环境或事件。 C（Complication）：冲突或问题 — 描述当前情景中存在的问题、矛盾、挑战或困境，它是对现状的一种偏离或打破平衡的因素。 Q（Question）：提问 — 提…
安全运维
- 7
- 0
aqzt24年12月21日
入门同学对ITIL管理十大误解

一、ITIL是国外的管理最佳实践不适合中国国情ITIL是IT服务管理领域的最佳实践，是一种IT部门进行日常工作管理的方法论，既然他是一种管理方法就没有地域国情的限制，只要IT部门有管理的动作都可以参考ITIL的相关流程。产生这以误解多半是因为没有领会ITIL对IT管理的精髓，而是停留在简单的流程层面。同样说ITIL 只适合与大型IT组织或公司，适合于管理比较成熟的机构，也是类似的误解，ITIL是I…
安全运维
- 3
- 0
aqzt24年12月21日
运维工具 – Hadoop高可用的架构知识

hadoop 2.0 对于Hadoop高可用架构节点介绍 NN服务器会出现脑裂(brain-split)情况什么是脑裂在hadoop2.x版本中，如果存在两个NameNode节点同时服务，这种情况称之为“脑裂” 为什么会出现脑裂脑裂出现原因一般发生在主备NamoNode切换，由于网络延迟、设备故障等，备用的StandbyNameNode【备用节点】认为ActiveNameNode【主节点】失效，此…
安全运维
- 2
- 0
aqzt24年12月21日
IT服务管理:故障治理 – 运维故障排查处理思路

在讲解事件、故障处理思路前，先讲一个故障场景（以呼叫中心系统作为一例子）：业务人员反映呼叫中心系统运行缓慢，部份电话在自助语言环节系统处理超时，话务转人工座席，人工座席出现爆线情况。运维人员开始忙活了，查资源使用情况、查服务是否正常、查日志是否报错、查交易量还有没有……时间不知不觉的在敲键盘、敲键盘、敲键盘中过去，但是原因还未定位。经理过来了解情况：“系统恢复了吗？”、“故障影响是什么？”、…
安全运维
- 36
- 0
aqzt24年12月21日
经验教训 – 2021.07.13 B站宕机事故，我们是这样崩的

至暗时刻 2021年7月13日22:52，SRE收到大量服务和域名的接入层不可用报警，客服侧开始收到大量用户反馈B站无法使用，同时内部同学也反馈B站无法打开，甚至APP首页也无法打开。基于报警内容，SRE第一时间怀疑机房、网络、四层LB、七层SLB等基础设施出现问题，紧急发起语音会议，拉各团队相关人员开始紧急处理（为了方便理解，下述事故处理过程做了部分简化）。初因定位 22:55 远程…
安全运维
- 11
- 0
aqzt24年12月21日
经验教训 – 滴滴崩了滴滴官方公布P0级事故原因

11月29日，滴滴出行再就27日夜间系统故障致歉，提出了相应的补救措施和补偿方案。并公布了本次事故的初步调查结果：起因是底层系统软件发生故障，并非网传的“遭受攻击”。同时，滴滴表示，当前所有服务已全部恢复，后续将深入开展技术风险隐患排查和升级工作，全面保障服务稳定性，尽最大努力避免类似事故再发生。滴滴拥有庞大的业务线，其底层系统由复杂的软硬件构成，其中包括服务器、网络设备、数据库等等重要组成部…
安全运维
- 3
- 0
aqzt24年12月21日
运维工具 – 阿里超大规模 Flink 集群运维实践（实时监控必备工具之一）

一、演进历史和运维挑战阿里的实时计算经历了近 10 年的快速发展，总体来说可以分成三大时代： 1.0 时代：2013 年到 2017 年，三大实时计算引擎并存。大家熟悉的 Jstorm 和 Blink 当时都还叫做流式计算。 2.0 时代：2017 年集团合并了三大实时计算引擎，Blink 凭借着出色的性能、高效的吞吐成为唯一的实时计算引擎，实现了大一统。在接下来的 4 年里，集团所有实时计算业…
安全运维
- 10
- 0
aqzt24年12月21日
故障复盘 – 哈啰出行高质量故障复盘法

一、故障和复盘真的都是坏事吗？提到复盘，大多数人第一时间想到的是线上出了故障，这下又要有人背锅了；或者是为那个可怜的兄弟暗暗担心；也或者是因为跟自己无关，所以松了一口气。那么故障和复盘真的都是坏事吗？我们该如何理解它呢？我从以下三点讲一下我对故障和复盘的理解。 1.1 正视故障发生的必然性 – 有好也有坏在聊复盘之前，先聊下我对线上故障的看法，…
安全运维
- 1
- 0
aqzt24年12月21日
flinkSQL实践 – 如何实时统计最近 15 秒的商品销售额

想要了解如何使用 Flink 实时统计最近 15 秒的商品销售额吗？本实验将以阿里云实时计算 Flink 版为基础，使用 Flink 自带的 MySQL Connector 连接 RDS 云数据库实例，并以实时商品销售数据统计的例子，引导开发者上手 Connector 的数据捕获、数据写入等功能。完成本次实验后，您将掌握的知识有：使用 Flink 实时计算平台创建并提交作业的方法；编写基于 …
安全运维
- 8
- 0
aqzt24年12月21日
经验教训 – 网络安全十四条经验教训

2022年，是网络安全市场高速发展的一年，同时也是企业评估安全项目投资有效性，校准和优化安全防御战略和预算的关键时间节点。面对快速迭代的网络威胁，每位CISO都有自己的方法和视角来总结和反思即将过去的2022年，此类经验总结可为未来的战略规划提供宝贵的知识，正如Veracode首席信息安全官Sohail Iqbal所言：“如果企业不打算吸取这些教训并完善其安全实践，那么将面对更加严格的安全审计和第…
安全运维
- 2
- 0
aqzt24年12月21日
IT服务治理什么是关键时效 MOT

什么是关键时刻关键时刻（MOT)——Moments of truth，用户和公司之间发生了交互关系的瞬间。案例：在一年当中，每一个北欧航空的乘客平均每人接触五名员工，会对北欧航空公司产生五次印象，每一次十五秒钟，总共五千万次。而这五千万次的“关键时刻”决定了公司将来的成败。关键时刻的意义将组织结构翻转过来变成倒金字塔结构位于金字塔底端的蓝领和白领员工，他们都是真正在战场上作战的士兵，最了解…
安全运维
- 2
- 0
aqzt24年12月21日
【运维工具】flink sql 实践思路案例

文章目录 Toggle 短视频生产消费监控项目简介方案设计方案 1方案 2方案 3方案 4总结技术架构QuestionWHAT：实时 & 离线公共画像维表？概念区别离线公共画像维表实时公共画像维表WHY：为什么建设实时公共画像维表？直播间画像维表主播 & 观众用户画像维表HOW + WHO：怎样建设？用什么建设？直播间生命周期 & 数据流转直播间画像维表-实时直播间画像实时…
安全运维
- 3
- 0
aqzt24年12月21日
经验教训 – 2020.02.23 微盟花23亿买下一个惨痛教训

　　2月23日晚7点左右，微盟多个小程序显示出现未知错误，多次刷新仍未恢复正常。　　基于微盟的商家小程序也都随之宕机，一度无法打开。从23日晚间起，宕机超过24小时，线上生意基本停摆的商家不在少数。　　对此，官方一开始回应称设备物理故障，正在紧急抢修和修复。　　2月25日，微盟集团(2013.HK)发布关于系统故障的公告，称SaaS(软件即服务)业务数据遭到员工人为破坏，并表示已向上海警方报…
安全运维
- 2
- 0
aqzt24年12月21日
SRE工具链建设实践：一夜颠覆60%旧体系，腾讯的SRE运维转型实践

讲师介绍刘天斯，腾讯游戏营销SRE负责人，腾讯T12级技术专家，国家工程实验室兹聘专家（工业大数据应用技术）。曾荣获：华章最有价值作者、中国十大杰出IT博主、WOT十大优秀讲师、OpsWorld金牌讲师、TOP100优秀出品人、中国数据质量杰出专家奖、DAMA中国数据治理专家奖。个人著作：《python自动化运维：技术与实践》《循序渐进学Docker》《第一次使用Docker就上手》《破解数据治…
安全运维
- 11
- 0
aqzt24年12月21日