-
IT服务治理 之 发布管理 – 对于研发自测上线项目,测试同学可以做点啥?
在软件研发过程中,不可避免的存在由研发自测后上线的项目。在这种完全由研发同学独立完成开发、测试、发布上线的项目,测试同学可以提前为研发同学做点啥? 我们算法测试团队,提出了四步曲的设想。 第一步:定标准 定标准,即明确可研发自测上线的范围。业界对研发自测的标准非常多,我们建议遵循以下三个维度来制定: 1. 影响面 对核心链路有影响,则测试介入 对公司核心业务有影响,则测试介入 2. 复杂度 涉及复…- 38
- 0
-
PYTHON基础技能 – 构建Python机器学习模型的8个步骤
文章目录 Toggle 引言步骤一:定义问题步骤二:收集数据步骤三:数据预处理步骤四:特征工程步骤五:划分数据集步骤六:选择模型步骤七:训练模型步骤八:评估模型总结 引言 本文旨在系统地介绍构建机器学习模型的基本步骤,并通过一个具体的实战案例——股票价格预测,展示这些步骤的实际应用。通过遵循这些步骤,读者可以更好地理解和掌握机器学习模型构建的全过程。 步骤一:定义问题 首先,我们需要明确要解决的问…- 2
- 0
-
PYTHON基础技能 – Python中9个常见字典与异常处理错误与解决方案
文章目录 Toggle 第一部分:字典基础与常见错误1. 创建字典的误解2. 字典访问未初始化键3. 字典更新时的键冲突异常处理入门4. 不处理异常的危险5. 使用finally清理资源第二部分:高级技巧与实战案例6. 字典推导式的高级用法7. Python 3.5+:字典解构合并8. 异常链:提供更详细的错误信息9. 自定义异常实战案例:数据分析预处理 第一部分:字典基础与常见错误 1. 创建字…- 4
- 0
-
PYTHON基础技能 – 15个Python进阶操作系统交互高级命令
今天我们要来探索那些让程序与操作系统无缝对接的高级命令!让我们一起把Python变成操作系统的隐形指挥官吧! 文章目录 Toggle 1. 系统调用:os模块的魔法杖2. 目录间的舞蹈:os.path3. 文件的搬运工:shutil4. 文件的读写艺术家:open()5. 批处理文件名:glob6. 进程的交响乐:multiprocessing7. 定时任务:schedule8. 环境变量的探秘:…- 1
- 0
-
PYTHON基础技能 – Python中提升文件操作速度的7个秘诀
文章目录 Toggle 引言1. 使用with语句安全地处理文件2. 批量处理文件3. 使用缓冲区提高读写速度4. 使用二进制模式处理大文件5. 利用多线程或进程加速文件处理6. 使用pickle模块进行高效序列化7. 使用csv模块高效处理CSV文件实战案例:日志文件分析总结 引言 在Python编程中,高效且安全地处理文件是一项重要技能。本文将探讨几种优化文件处理的方法,包括使用with语句、…- 10
- 0
-
系统稳定性保障 – 字节跳动混沌工程故障演练实践总结
什么是混沌工程 在生产环境中实际运行分布式系统,难免会有各种不可预料的突发事件发生。同时,云原生的发展,不断推进着微服务的进一步解耦,海量的数据与用户规模也带来了基础设施的大规模分布式演进。分布式系统天生有着各种相互依赖,可以出错的地方数不胜数,处理不好就会导致业务受损,或者是其他各种无法预期的异常行为。 在复杂的分布式系统中,无法阻止这些故障的发生,我们应该致力于在这些异常行为被触发之前,尽可能…- 49
- 0
-
可观测性(Observability) – 监控和可观测性区别
文章目录 Toggle 监控定义如何使用监控监控的缺陷可观测性可观测性的背景可观测性的理解可观测性的意义使用场景可观测性的要求收集数据metriclogtraceprofile接入简单/无侵入式关联数据关联哪些数据关联数据的意义如何关联数据标准化/结构化数据(metric/log/trace等)空间上的关联时间上的关联设计模型仪表板展示场景覆盖全面可观测性构建的扩展观测性分析平台业务画像智能化、定…- 6
- 0
-
故障复盘 – 复盘优势与局限
复盘的优势主要包括: 经验提炼:复盘可以帮助个体或团队深入剖析过去的行为和决策过程,提取有效的方法论和经验教训,避免重复犯同样的错误,同时也巩固和传播成功的实践经验。 技能提升:对于股票交易或其他需要技能和判断力的活动而言,复盘是提升专业技能和盘感的有效手段,投资者可以通过复盘分析市场走势、个股表现以及自己买卖决策的合理性,从而提高投资水平。 风险控制:复盘有助于识别潜在的风险点和失误之处,通过提…- 2
- 0
-
2015.05.28 事件回顾,深入解析和反思携程宕机事件
携程网宕机事件还在持续,截止 28 号晚上 8 点,携程首页还是指向一个静态页面,所有动态网页都访问不了。关于事故根源,网上众说纷纭。作为互联网运维老兵,尝试分析原因,谈谈网友的看法 携程微博:5月29日1:30分,经携程技术排查,确认此次事件是由于员工错误操作导致。由于携程涉及的业务、应用及服务繁多,验证应用与服务之间的功能是否正常运行,花了较长时间。携程官方网站及APP已于28日23:29全面…- 6
- 0
-
IT服务治理 – 唯品会大数据建设思路与实践
诸超 | 唯品会云计算总监 文章目录 Toggle 唯品会大数据整体规划数据平台的建设大数据对于技术运营大数据在唯品会特卖模式的业务价值 唯品会大数据整体规划 大数据无非是数据的收集、计算和存储。整个数据的实时接入,包括各种各样的log,我们的系统把这些东西离线、实时地收集进来。 如何规划系统的资源,才能做到高效的调度和利用?这是一大改变期,有了这样一个平台以后,如何做各个数据的分析和计算?不能只…- 3
- 0
-
故障治理 – 运行无间:阿里巴巴运维保障体系的一种最佳实践
阿里巴巴全球运行指挥中心,GOC (Global Operations Center)保障阿里经济体的业务稳定运行的核心团队。我们负责了整个阿里巴巴全局生产系统的稳定性。就像业界经常提到谷歌的SRE,我们相当于阿里巴巴的SRE。 今天我的分享分为四个部分: 1、稳定性现状及挑战 2、运维…- 51
- 0
-
监控工具 – zabbix ha 官方推荐高可用集群
#CentOS 安装#安装 epel-release 依赖:yum install epel-release #安装 DNF 包:yum install dnf —————-#Fedora 安装:dnf install dnf 2,初始化yum update -ysed -i ‘s/SELINUX=enforcing/SELINUX=di…- 0
- 0
-
SRE实战手册 – 技能宝典
先聊一聊SRE的工作职责,聊一下我所理解的SRE的核心目标;初步看一下稳定性建设的工作范畴,看一看从宏观上如何划分我们的工作内容;然后我们由此进入今天的主题:故障管理,我将按照我的理解对故障管理进行拆解和分析;再后面,围绕故障管理,我们深入聊一下SRE的体系建设,如何通过体系建设来更好地做故障管理;最后我们再简单做下对未来的展望,共同畅想一下SRE工作的未来。 文章目录 Toggle 一、SRE的…- 13
- 0
-
故障处理最佳实践 – 滴滴是如何高效处理线上故障的?
故障处理是每个系统都要面对的现实问题,但随着系统越来越复杂,故障的发现、定位、处理难度也将随之增大。滴滴现在服务近 4 亿乘客、1700 多万司机、覆盖 400 多个城市,超过 10 个业务线提供服务,业务的高速增长对稳定性工作来说是个极大的挑战。为了了解滴滴在故障处理以及稳定性建设方面的工作,InfoQ 记者采访了滴滴资深运维工程师张云柳。另外,张云柳也将会在 9 月 10 日举行的 CNUTC…- 7
- 0
-
Hive Sql:工作中常用HSQL语句大全 一
文章目录 Toggle Hive Sql 大全hive的DDL语法对数据库的操作对数据表的操作对管理表(内部表)的操作对外部表操作对分区表的操作对分桶表操作修改表和删除表向hive表中加载数据hive表中数据导出hive的DQL查询语法单表查询Hive函数聚合函数关系运算数学运算逻辑运算数值运算条件函数日期函数字符串函数复合类型构建操作复杂类型访问操作复杂类型长度统计函数hive当中的latera…- 4
- 0
-
故障复盘 – 故障复盘哪三大关键问题?
这是很多企业/团队都要面对的问题,有着超10年系统稳定性保障经验的李道兵老师给我们分享了他的观点: 故障复盘的三大关键问题: 怎么有效降低故障的影响? 事故处理的流程和原则有哪些? 相关管理制度怎么设置比较合理? 故障复盘的四大注意项: 1.事故复盘不是给人定责的,要有系统思维将优化项实际落地才能推动系统优化; 2.事故报告的重点应该是事故提升项,监控、定位、根因、架构四个部分都必须涉及; 3.事…- 3
- 0
-
FLINK SQL 实践 – (十五):flink sql 开发企业级利器之 Dlink
发现有两款非常优秀的利器: Apache Zeppelin Dlink 为啥先介绍 Dlink 呢? 因为博主和其开发人员混的很熟了,所以就先拿 Dlink 来尝试尝试。 废话不多说,大家都想先看效果再看怎么部署。先看看最终效果。 文章目录 Toggle 2.Dlink 平台效果2.1.登录2.2.flink sql 开发界面3.安装部署篇3.1.Dlink 的 github3.2.部署环境准备3…- 1
- 0
-
AIGC到底是什么?利用人工智能来生成你所需要的内容,一起动手玩转AI
文章目录 Toggle AIGC( AI Generated Content)是利用人工智能来生成你所需要的内容,GC的意思是创作内容。与之相对应的概念中,比较熟知的还有PGC,是专业人员用来创作内容;UGC是用户自己创造内容,顾名思义AIGC是利用人工智能来创造内容。例如现在比较爆火的ChatGPT就是AIGC这个大赛道里下面的一个相对于很成功的产品,一经上线席卷全球,短短一个月突破1亿月活跃用…- 2
- 0
-
经验教训 – 网络安全十四条经验教训
2022年,是网络安全市场高速发展的一年,同时也是企业评估安全项目投资有效性,校准和优化安全防御战略和预算的关键时间节点。面对快速迭代的网络威胁,每位CISO都有自己的方法和视角来总结和反思即将过去的2022年,此类经验总结可为未来的战略规划提供宝贵的知识,正如Veracode首席信息安全官Sohail Iqbal所言:“如果企业不打算吸取这些教训并完善其安全实践,那么将面对更加严格的安全审计和第…- 2
- 0
-
经验教训 – 故障处理,教你30秒把问题说清楚
故障处理可参考麦肯锡30秒电梯法则思路,快速把问题陈述。 文章目录 Toggle 一 了解30秒电梯法则目标对象方法 一 了解30秒电梯法则 谈到“30秒电梯法则”不得不谈到麦肯锡:麦肯锡作为世界上最著名,最成功的战略咨询公司,已有近百年的历史,他在全球40多个国家设有80多家分公司,被称为世界第一战略、组织机构和业绩改善方面的咨询公司以及真正的全球性公司。 “…- 4
- 0
-
【运维工具】Flink SQL 天级别窗口中存在的时区问题
本文主要分为两部分: 第一部分(第 1 – 3 节)的分析主要针对 flink,分析了 flink 天级别窗口的中存在的时区问题以及解决方案。 第二部分(第 4 节)的分析可以作为所有时区问题的分析思路,主要以解决方案中的时区偏移量为什么是加 8 小时为案例做了通用的深度解析。 为了让读者能对本文探讨的问题有一个大致了解,本文先给出问题 sql,以及解决方案。后文给出详细的分析~ 文章…- 1
- 0
-
IT运维最佳实践 – 一线游戏运维心得(同行经验)
自2015年开始从事游戏行业一线运维工作,至今(2022)已经近7年。 网易游戏:2015.04 ~ 2021.04灵犀互娱:2021.04 至今 文章目录 Toggle 背景1、运维人员的定位运维叫什么?PE?SRE?什么是SRE?什么是可用率?可用率到底要达到几个9?不同人眼中的运维项目组对运维的核心诉求技术要专,还是广?运维SRE的段位2、做事方法新手常犯的错误或误区怎么推进事情落地?忙不过…- 5
- 0
-
PYTHON基础技能 – Python字典与集合的15个高级操作与优化建议
今天我们将一起探索Python中最强大且高效的两个数据结构——字典和集合,它们在数据处理中扮演着至关重要的角色。通过这15个高级操作和优化技巧,你们将学会如何像专家一样驾驭它们,让代码更加简洁高效。 文章目录 Toggle 1. 字典推导式(Dictionary Comprehensions)2. 合并字典(Using update())3. 集合的基本运算4. 字典的get()方法5. 集合推导…- 1
- 0
-
PYTHON基础技能 – Python条件控制技巧
文章目录 Toggle 一、引言二、基本的条件控制语句1. if 语句2. if-else 语句3. if-elif-else 语句三、进阶的条件控制技术1. 嵌套 if 语句2. 使用逻辑运算符3. 使用条件表达式4. 使用列表推导式和条件表达式五、实战案例:成绩管理系统 一、引言 在编程中,条件控制是实现逻辑判断的基础。Python 提供了多种方式来实现条件控制,包括 if 语句、elif 语…- 0
- 0
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!














