专场:大模型驱动的DevOps工具链
随着生成式AI技术进入规模化应用阶段,大语言模型正在引发DevOps领域的范式迁移,其与DevOps工具链的深度融合已从基础设施层延伸至平台和业务域。本次【大模型驱动的DevOps工具链】专场将邀请来自业界知名的DevOps工具链、AIOps和智能化研发领域的专家,围绕AI代码生成、自动排查定位、研发工具提效等核心场景展开深度分享和洞察。参会者将通过来自头部企业和高校的真实案例,获得来自产、学、研多角度的深入洞见,相信可以为参会者带来全新的思路和指引。
专场出品人:付求爱
华为智能化研发技术专家  华为云PaaS AIOps负责人
多年智能化研发领域从业经验,带领团队完成多项智能化运维关键能力构建和技术研究,并进行规模化落地和外溢,发表国家专利十余篇,在FSE、ICSE、ASE等行业顶级会议上发表多篇论文;多次在包括QECon、AiDD、MTSC等在内的技术峰会上发表主题演讲;在AI辅助研发和AIOps领域具有丰富管理和实践经验。
杨奕
华为云 HCC云服务产品部  技术规划专家
当前供职华为云HCC云服务产品部担任技术规划专家。其工作范围主要聚焦混合云智能监控运维,服务治理,等方面的前沿技术方向的规划和研发。其主要贡献包括:设计了华为云HCS全栈运维解决方案,大幅简化了政企客户在混合云全栈运维场景下的运维难度;其同时创立并主导CNCF 开源项目Sermant,推动混合云云原生技术向无代理(Proxyless)架构演进。在智算时代,主要负责探索打造混合云运维智能体,使能L5级别的混合云自主运维能力。
待定
待定
华为云Stack全栈运维智能体的准确率提升之路
在私有云场景领域,一个典型痛点是在运维人员数量和公有云差百倍的情况下,如何简化全栈云的运维难度,降低运维人员水平要求。运维智能体产品正好因能较好解决此类问题而兴起。本议题详细叙述华为云Stack在运维领域如何借助知识图谱、大小模型协同计算等相关技术,在知识问答、数据检索、故障诊断等领域,大幅提升智能体在各场景的准确度,并最终帮助用户提升全栈云的运维效率。

内容大纲
1. 阐述私有云和公有云在运维场景的差别,说明为什么运维智能体在私有云尤为重要
2. 说明私有云在运维领域的三个主要场景:知识问答,数据检索,故障诊断,以及场景下的运维智能体的技术挑战和解法
2.1 阐述知识问答的场景和其在传统RAG技术下的挑战
2.1.1 介绍团队采用Graph-RAG来解决的思路,以及相对业界Graph-RAG做法,团队采用的主要亮点技术
2.1.2 阐明最终效果:图谱构建效率比传统GraphRAG方法提升10倍,召回性能相比传统RAG提升3倍,且绝对准确率比传统RAG提升20%
2.2 阐述数据检索的场景主要是多源数据查询,以及其核心挑战
2.2.1 讲述如何通过模型自驱修复方法,快速修复元数据描述的方法
2.2.2 讲述如何面向不通数据源构建NL2ES、NL2SQL、NL2API原子查询能力
2.2.3 讲述如何通过元数据知识图谱,构建基于Graph-COT的多源数据查询思维链
2.2.4 展示最终实践结果,数据检索能有效满足各类运维、运营数据、和复杂关联数据的查询,且能满足一定的查询精度
2.3 阐述故障诊断的场景切入点:告警聚合和告警根因定界
2.3.1 说明如何通过全栈拓扑和告警映射,驱动大模型做根因定界
2.3.2 如果通过小模型的提前聚类,加速大模型的根因定界性能
2.3.3 展示最终实践结果,表明该方法有能有效解决大规模场景下的告警根因定界
3. 讲述未来工作,包括面向A2A的运维场景的探索,等
 
听众收益
1. 了解全栈云在基于大模型的AIOps领域的阶段性实现思路
2. 了解Graph-RAG的优化方法和实践
3. 了解如何面向多源数据检索的查询场景,构建元数据知识图谱,并解决复杂关联查询问题
4. 如何通过大小模型协同计算,解决面向全栈云的快速告警根因定界


赖洪水
中兴通讯 大型项目DevOps负责人
中兴通讯  大型项目基础设施团队负责人,负责项目效能平台建设,涵盖DevOps、工具、资源环境,为项目提供研发效能服务。从业20年,同时作为敏捷教练,为多个项目进行敏捷及DevOps赋能。
待定
待定
基于知识工程的流水线失败脚本AI智能分析实践
问题痛点:项目交付产品多,多分支并行开发,且大型项目(450+),横跨6地,流水线执行失败后,环境问题、版本问题、脚本问题定界定位链条长,涉及人员多,跨地区沟通协作成本高,自动化的反馈能力无法匹配项目快速判定版本/补丁是否可交付的诉求。

思考方向:基于代码价值流模型,从等待时间、运行时长、准确率识别业务流关键活动,结合能耗、风险确定AI应用的建设逻辑。借助大模型能力,构建AI应用,失败脚本智能分析,问题自动修复,环境问题一键提单,功能问题一键提故障单,促进问题快速闭环,助力研发提效。

内容大纲
1. 问题提出
    1.1 痛点识别及AI提效点分析: 基于项目痛点,通过DevOps代码价值流模型识别提效点
    1.2 改进目标
2. 解决思路
    2.1 整体方案:介绍失败脚本智能分析AI应用的整体方案
    2.2 能力建设:介绍知识工程、应用范式、工具支撑和质量提升四个维度介绍AI能力建设的整体思路
3. 实践落地
    3.1 知识体系建设:介绍流水线问题定界定位的知识分类和定义、知识图谱的构建,知识规范的制定和治理(如流水线标准化、环境标准化、日志规范化等)、知识工程流水线建设
    3.2 应用范式:介绍如何基于Prompt+RAG+Tools构建AI应用,包括提示词、语料收集、知识库建设、流程编排框架、触点设计
    3.3 工具能力建设:介绍构建AI应用使用到的工具,如日志采集及解析、脚本标签解析、报告聚合、邮件发送、环境巡检、一键提交环境运维工单、一键提交故障单等
    3.4 质量提升:介绍提升AI应用质量和效率的实践,如度量看板、知识评估、准确率提升专项改进、性能优化,问题自动修复等
4. 效果评价
    4.1 从分析准确率、分析及时度、质量、人员提效等几个维度介绍时间效果

听众收益
系统性:本实践知识工程、应用范式、工具支撑和质量提升四大维度,系统性的介绍了如何构建AI应用能力以及相关实践,整体思想可用用于各类AI智能体
可借鉴性:流水线基于Jenkins、测试框架RF框架,均是业界通用的工具,可借鉴性广
刘道伟
百度 资深研发测试工程师
百度资深研发测试工程师,百度MEG部门QA效能方向负责人,深耕效能方向多年,先后负责过搜索、商业等部门的DevOps建设和效能提升工作,目前主要负责大模型驱动下的业务交付模式转型和数字员工建设等工作。
待定
待定
数字员工AIQA的探索及实践
在软件交付的发展过程中,我们经历了由全面的手工测试到自动化测试及部分智能化的过程,随着新一代模型不断突破复杂推理的极限,一个更具颠覆性的命题正在浮现:如果Agent具备足够的交付领域知识和工具执行能力,是否可让数字员工AIQA来替代真人QA来满足交付过程中各类工作,通过全环节的AIQA参与,实现Agentic DevOps。

内容大纲
1.下一代交付模式的设想
2. 数字员工AIQA的设计
    2.1 整体设计思路
    2.2 产品设计
    2.3 技术设计
3. 数字员工的效果展示

听众收益
数字员工方向比较新,还处于探索阶段,对于大部分听众应该是启发和借鉴为主。
关注QECon公众号
议题投稿
lijie@qecon.net
商务合作
151-2264-3988  木子
票务联系
135-2067-8913  郭梦媛
媒体合作
135-1619-6409  皮皮
添加QECon小助手,获取
会议最新资讯
购票咨询
13520678913  郭梦媛
服务总线
400-183-9980