-
系统稳定性建设(12) – 线上监控指标全解(线上问题排查指南)
前言本文将从 基础设施(CPU、内存、网络、磁盘)、 服务内部(JVM、线程池、连接池等)、中间件(MySQL、Redis、MQ等)、服务治理(注册中心、熔断、分布式事务、服务间调用)、业务指标(支付成功率、转化漏斗)、用户体验(页面性能、用户反馈) 等全维度出发,讲解线上应用的全方面监控参数,大家设计线上服务监控的时候可以借鉴这些参数和思路。线上问题排查也可从这些角度出发。掌握这些将全方面提升你…- 1
- 0
-
系统稳定性建设(3) – 高可用稳定性建设实践指南
文章目录 Toggle 1.概述2. 良好的系统架构和实现2.1 架构设计2.1.1 消除单点2.1.2 数据一致性2.1.3 强弱依赖梳理和降级 2.1.4 热点 或 极限值处理2.1.5 资金交易类系统要仔细考虑资损的风险2.1.6 离线数据流2.1.7其他异常情况处理2.2 容量评估设计2.3 运维方案设计2.4 安全设计2.5 高质量的代码实现3.团队研发运维流程机制4. 技术同…- 2
- 0
-
flinkSQL实践 – 如何实时统计最近 15 秒的商品销售额
想要了解如何使用 Flink 实时统计最近 15 秒的商品销售额吗?本实验将以阿里云实时计算 Flink 版为基础,使用 Flink 自带的 MySQL Connector 连接 RDS 云数据库实例,并以实时商品销售数据统计的例子,引导开发者上手 Connector 的数据捕获、数据写入等功能。 完成本次实验后,您将掌握的知识有: 使用 Flink 实时计算平台创建并提交作业的方法; 编写基于 …- 0
- 0
-
【运维工具】Flink SQL 实践8 flink sql tumble window 的奇妙解析之路
文章目录 Toggle 1.序篇-本文结构2.目标篇-本文能帮助大家了解 flink sql tumble window 什么?2.1.回顾上节的 flink sql 适用场景的结论3.概念篇-先聊聊常见的窗口聚合3.1.窗口竟然拖慢数据产出?3.2.常用的窗口4.实战篇-简单的 tumble window 案例和运行原理4.1.先看一个 datastream 窗口案例4.2.flink sql …- 0
- 0
-
【运维工具】Flink SQL 实践7 不会连最适合 flink sql 的 ETL 和 group agg 场景都没见过吧?
文章目录 Toggle 1.序篇-本文结构2.背景篇-大家不了解 flink sql 什么?3.目标篇-本文能帮助大家了解 flink sql 什么?4.实战篇-简单的 query 案例和运行原理4.1.场景问题:有哪些场景适合 flink sql?4.2.语法\运行问题4.2.1.ETL4.2.2.去重场景4.2.3.group 聚合场景4.2.3.1.简单聚合场景4.2.3.2.去重聚合场景4…- 0
- 0
-
【运维工具】Flink SQL 实践2 – 自定义 redis 数据维表
文章目录 Toggle 1.Flink sql redis2.背景篇-为啥需要 redis 维表2.1.啥是维表?事实表?2.2.为啥需要 redis 维表?3.目标篇-做 redis 维表预期效果是什么4.难点剖析篇-目前有哪些实现5.维表实现篇-维表实现的过程5.1.flink 维表原理5.2.flink 维表实现方案5.2.1.复用 bahir connector5.2.2.复用 forma…- 0
- 0
-
【运维工具】Flink SQL 实践13 维表 join 的性能优化之路(上)附源码
文章目录 Toggle 1.序篇2.背景及应用场景介绍3.来一个实战案例4.flink sql lookup join4.1.lookup join 定义4.2.上述案例解决方案4.3.关于维表使用的一些注意事项4.4.再说说维表常见的性能问题及优化思路4.5.lookup join 的具体性能优化方案4.6.基于 redis connector 的批量访问机制优化5.总结与展望 1.序篇 源码公…- 0
- 0
-
运维工具 – 大众点评评论文本挖掘基础案例实践
文章目录 Toggle 一、爬虫整体思路网页爬取和解析数据存储反爬虫对抗二、探索性分析与文本数据预处理探索性分析数据预处理词云展示三、文本的情感分析文本特征提取(TF-IDF)机器学习建模样本数据不平衡模型评估测试1. 朴素贝叶斯相关的统计学知识 2. 朴素贝叶斯的模型3. 朴素贝叶斯的推断过程4. 朴素贝叶斯的参数估计5. 朴素贝叶斯算法过程6.&nbs…- 2
- 0
-
【运维工具】Flink SQL 基础实践 – SQL Client
https://cloud.video.taobao.com/play/u/null/p/1/e/6/t/1/d/ud/372169841042.mp4 文章目录 Toggle 前言如何使用场景示例准备数据安装Flink和依赖启动Flink SQL client执行SQL提交作业数据类型常见错误找不到Hadoop相关依赖SQL client 提交任务的时候连接拒绝补充内容 前言 Flink提供了S…- 0
- 0
-
【经典手册】常用SQL查询
sql是所有数据库查询的语言,sql由于本身结构化的特点,非常容易入手。针对不同的数据库,如hivesql、mysql、sqlserver、oracle等,sql语法会有所不同,但是总体上大同小异,只是细微处的差别。 SQL的学习方式非常多,在这里分享最捷径的一种:用7张图片搞定数据分析相关的SQL语句问题。 具体分了七类讲解: 基础查询 字符串\数字\日期时间 聚合数据查询 子查询 联接\组合查…- 0
- 0
-
【运维工具】Flink SQL 实践 – source\sink 原理
文章目录 Toggle 1.序篇-本文结构2.背景篇-关于 sql3.定义篇-sql source、sink4.实战篇-sql source、sink 的用法5.原理剖析篇-sql source、sink 是怎么跑起来的5.1.connector 怎样映射到具体算子?5.2.format 怎样映射到具体 serde?5.3.其他配置属性怎么加载?6.总结与展望篇 1.序篇-本文结构 本文从以下五个…- 0
- 0
-
最佳实践 – 运维服务器故障排查与定位常用命令
整理总结了一些常用分析网站的命令方便大家快速定位故障所在排除故障,最小化的减少故障给业务带来的影响。 文章目录 Toggle 1. 背景2. 说明3. 分析问题的方法论4. cpu4.1 说明4.2 分析工具4.3 使用方式5. 内存5.1 说明5.2 分析工具5.3 使用方式6. 磁盘IO6.1 说明6.2 分析工具6.3 使用方式7. 网络7.1 说明7.2 分析工具7.3 使用方式8. 系统…- 9
- 0
-
故障治理 – 从行业巨头重大事故,炼成系统稳定性治理最全方略(系统稳定性保障)
系统的稳定性,主要决定于整体的系统架构设计,然而也不可忽略编程的细节,正所谓“千里之堤,溃于蚁穴”,一旦考虑不周,看似无关紧要的代码片段可能会带来整体软件系统的崩溃。 稳定性的工作,一般都是水下的工作。就像冰山,真正强大的系统下,要有更加强大的底层支撑,水面下的问题才是真正需要解决的问题。当然不一样的工作内容,水下的工作是不同的,对于盖楼来说,可能就是地基的深度。对于我们写业务逻辑来说,水下的工作…- 1
- 0
-
运维工具 – i基于Centos7+Apache2.4+Mysql5.7+PHP7.3环境安装itop3
https://sourceforge.net/projects/itop/files/itop/3.0.1/ 文章目录 Toggle Centos7安装itop3.o1.关闭防火墙与SELinux2.安装php7.3卸载之前的php安装扩展源“安装php7.3启动php3.安装apache启动httpd4.安装mysql5.7安装扩展源安装mysql查看mysql默认password…- 2
- 0
-
【运维工具】flink sql 基础实践 – 常见的疑问点
文章目录 Toggle 1.前言2.状态原理2.1.状态、状态后端、Checkpoint 三者之间的区别及关系?2.2.把状态后端从 FileSystem 变为 RocksDB 后,Flink 任务状态存储会发生那些变化?2.3.什么样的业务场景你会选择 filesystem,什么样的业务场景你会选 rocksdb 状态后端?2.4.Flink SQL API State TTL 的过期机制是 o…- 0
- 0
-
监控工具 – zabbix ha 官方推荐高可用集群
#CentOS 安装#安装 epel-release 依赖:yum install epel-release #安装 DNF 包:yum install dnf —————-#Fedora 安装:dnf install dnf 2,初始化yum update -ysed -i ‘s/SELINUX=enforcing/SELINUX=di…- 0
- 0
-
经验教训 – 运维工程师 不得不看的日常经验,帮你远离故障
1. 测试使用 当初学习Linux的使用,从基础到服务到集群,都是在虚拟机做的,虽然老师告诉我们跟真机没有什么差别,可是对真实环境的渴望日渐上升,不过虚拟机的各种快照却让我们养成了各种手贱的习惯,以致于拿到服务器操作权限时候,就迫不及待的想去试试。 记得上班第一天,老大把root密码交给我,由于只能使用putty,我就想使用xshell,于是悄悄登录服务器尝试改为xshell+密钥登录,因为没有测…- 1
- 0
-
实践案例 – 预案管理 故障预案6板斧
故障处理trouble shooting是每个SRE要做的日常,特别是处在快速成长期的大型互联网系统,模块多、变更多、访问量大、用户环境复杂,不就是这坏就是那坏,SRE就像一个医师,需要在故障时协同研发动各种手术去修复系统,常用的修复的方法一般会提前梳理准备好,我们称作预案。 经过无数次的故障处理,发觉是有一些不变的套路的,每次故障处理基本都是围绕这几个套路在做排列组合,其中最常用的6个,我把他总…- 1
- 0
-
[经验分享]远离故障的十大原则
故障是运维人员永远的痛。相信每一个运维人员的KPI中都有一项:可用性。可用性高就是不出故障,各个公司对可用性和故障评级的标准都不相同,但是避免故障的方法却是殊途同归。我们怎么避免故障,沃趣科技简单列举了以下几条,与大家共勉!1、变更要有回滚,在同样的环境测试过2、对破坏性的操作谨慎小心3、设置好命令提示4、备份并验证备份有效性5、对生产环境存有敬畏之心6、交接和休假最容易出故障,变更请谨慎7、搭建…- 3
- 0
-
Flink SQL – 唯品会flink实践与优化
文章目录 Toggle 一 、发展概览二、Flink 容器化实践三、Flink SQL 平台化建设四、应用案例五、未来规划 一 、发展概览 平台支持公司内部所有部门的实时计算应用。主要的业务包括实时大屏、推荐、实验平台、实时监控和实时数据清洗等。 1.1 集群规模 平台现有异地双机房双集群,具有 2000 多的物理机节点,利用 k8s 的 namespaces,labels 和 taints 等,…- 1
- 0
-
数字化运营基础技能 – SQL 数据分析常用语句
01 基础查询 02 字符串\数字\日期时间 03 聚合数据查询 04 子查询 05 联接\组合查询 06 高级查询 07 更新数据 SQL函数大全,分类清晰,绝对值得收藏,想不起来用什么函数看它就没错了! 不多废话,直接上干货。 1、聚合函数 2、数字函数 3、字符串函数 4、日期函数 5、转换函数 6、系统函数 7、条件函数 8、加密函数 根据我的理解,SQL函数可以划分成上述的8个类别,接下…- 1
- 0
-
运维稳定性 – 虎牙APM可观测平台建设实践
随着虎牙业务量的大规模增长,分布式应用服务架构日益复杂,排障定位变得越来越困难,原有传统监控方式已无法跟上业务发展需要。虎牙新建设了一套APM平台,结合虎牙直播业务特性,也紧靠业界标准做了高度自研扩展,帮助研发和运维提高工作效率,保障线上应用服务稳定运行。 本次分享将通过以下几个部分来介绍整体思路和实践过程: 分享概要 一、项目背景 – 从当时痛点来思考关键切入点 二、方案实践 …- 1
- 0
-
数字化运营基础技能 – 会员数字化运营实践案例
导入库 import time # 时间库 import numpy as np # numpy库 import pandas as pd # pandas库 import pymysql # mysql连接库 from sklearn.ensemble import RandomForestClassifier # RF库 # from pyecharts import Bar3D # 老版本代…- 0
- 0
-
运维生产故障有哪些?运维常见问题最佳实践
运维生产故障是指在运维过程中出现的各种问题和故障,可能导致系统停机、服务中断或其他运维效率问题。运维生产故障可以根据不同的因素进行分类,下面是一些常见的运维生产故障分类和其常见类型: 1. 硬件故障硬件故障是指由于服务器、网络设备或其他硬件设备的故障或损坏导致的系统停机或服务中断的问题。常见的硬件故障类型包括:– 服务器故障:例如硬盘故障、内存故障等。– 网络设备故障:例如…- 2
- 0
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!