专场:质效度量: 从洞察到智能化 
近十年,各 IT 企业积极推进研发数字化,「质效度量」已成为研发基础设施建设的必要环节之一。随着近几年实践的深入,各企业纷纷开展从数据到有效洞察的研讨,却也面临相似难题:如何从多维度指标数据中有效洞察,让 “数据会说话”,穿透表象诊断根因,真正辅助质效提升决策,实现从 “度量数据” 到 “效能洞察” 的突破。在大模型时代,我们无疑有了新的助力。本专场将与各质效专家、企业质效负责人共同探索:如何引入 LLM 技术赋能效能度量,实现智能化诊断与辅助决策,并分享实战案例,携手推动质效度量领域的实践升级,逐步从度量走向洞察、再向智能化演进。
专场出品人:郑丽君
美团 高级技术专家
15年以上测试技术研究经历,10年以上质量技术管理经验。带领团队在测试数字化及工具化、测试效能与度量洞察、AI测试工具搭建与应用等方面持续探索新能力,在以上领域具有多个典型实践项目案例。
何磊
腾讯 专家开发工程师
腾讯广告团队专家开发工程师,目前在广告团队主要负责研效和SRE系统相关建设。曾打造广告分布式构建、测试环境管理等多个重要系统。目前专注于建设腾讯广告无人值守、一站式研发和AI CODE提效。毕业后曾就职于京东和创业公司,从事电商和短视频后台业务开发等工作。
待定
待定
AMS无人值守系统建设与效能提升
问题分析与解决思路
1. 核心痛点
    1.1 人力浪费:20%运维人力消耗在重复发布操作,人工观测指标效率低且易漏拦
    1.2 流程黑盒:非DO模块发布流程不规范,多模块一天两发需求无法满足
    1.3 质量风险:依赖人工经验判断指标,缺乏标准化拦截策略,故障修复滞后
    1.4 信息孤岛:MR合入到发布的流程不透明,跨角色协作成本高
2. 解决思路
    2.1 全流程自动化:从代码合入(MR)到发布全链路自动化,注入质量卡点
    2.2 智能拦截系统:通过多维度指标(模块/大盘/模调/基础)实现自动化发布拦截
    2.3 效能度量驱动:建立质量/效率看板,量化问题并持续优化

内容大纲
1. 关键技术选型
    1.1 自动化引擎:基于流水线编排(如Jenkins/Bamboo),标准化MR到发布流程
    1.2 智能发布拦截:结合历史数据(发布前1小时+7天同期数据)动态调整阈值,支持多维度监测
    1.3 AI辅助:编译阶段日志分析、Premerge异常自动归因、发布拦截误判降低
2. 核心挑战与解决方案
    2.1 挑战1:系统集成复杂
          方案:采用微服务架构,模块解耦,通过API网关统一管理。
    2.2 挑战2:误拦率控制
          方案:引入多级阈值策略(自动阈值+人工复核),误拦率≤5%。2.3 挑战3:数据治理难题
          方案:构建统一数仓(Hive/StarRocks),标准化指标口径,实现“一小时出数”
3. 工程实践亮点
    3.1 流水线设计:
          -  CI阶段:自动化测试(单元测试/冒烟测试)→ 代码扫描(SonarQube)→ 评审单自动审批
          - CD阶段:灰度发布→全量发布→自动回滚(特性开关+独立测试账号)
     3.2 可视化看板:
           实时展示MR进度、阻塞原因、测试覆盖率,沟通成本归零
    3.3 度量平台:
          - 质量看板:漏拦率、拦截率、误拦率;效率看板:MR流转时效、发布耗时
          -量化收益与成果
4. 量化收益与成果

听众收益
1. 效率革命:从“人力密集型”到“自动化流水线”,释放重复劳动时间,聚焦高价值创新;
2. 质量兜底:智能拦截系统替代人工观测,降低漏拦风险,故障修复从“被动响应”到“主动拦截”;
3. 决策赋能:实时数据看板+度量平台,实现研发效能可视化,支持数据驱动的持续优化;
4. 技术沉淀:标准化流程与AI能力复用,形成可扩展的无人值守技术体系,降低后续迭代成本;
5. 风险可控:全流程自动化门禁+多级回滚机制,保障发布安全,规避人为操作失误。
任晶磊
思码逸 CEO
清华大学计算机系博士,前微软亚洲研究院研究员,斯坦福大学、卡内基梅隆大学访问学者;多篇论文发表在 FSE、OSDI 等顶尖国际学术会议上。曾参与微软下一代服务器系统架构设计,获 4 项美国发明专利;《软件研发效能度量规范》标准核心起草专家,参编《软件研发效能权威指南》《软件研发效能提升实践》;研发大数据平台 Apache DevLake 等开源项目发起人。创办思码逸并担任CEO,致力于为企业提供专业的研发数字化、智能化解决方案。
待定
待定
从 AI 赋能到赋能 AI:“ICPC”时刻之后,你最应关注的转型指标
随着 OpenAI / Gemini 斩获 ICPC 2025 金牌,未来软件工程中,留给人类开发者唯一重要的工作只剩:定义软件,把 well-defined 问题交给 AI 完成。我们不再是被 AI 赋能,而是去赋能 AI,使其发挥出人类再无法追赶的代码生产力。当下不论个人还是团队,升级对软件工程本质的理解、开启角色和能力的转型刻不容缓。本演讲将系统论述我们对未来软件开发与当下转型的理解,分享如何通过工具和实践将与大模型的对话转变为开发资产,并通过新的数据指标驱动个人和团队真正行动起来,实现迫在眉睫的转型。

内容大纲
1.  软件开发本质的拐点
    1.1. “ICPC”时刻到底意味着什么
    1.2. 软件开发团队和个人的转型
2. 管理者如何推动转型
    2.1. 将大模型对话转化为开发资产
    2.2. Spec-Driven Software Development
    2.3. API 语义及验证的重要性
3. 研发效能的新度量指标
    3.1 微观代码生成指标不再重要
    3.2 大模型对话覆盖率
    3.3 智能测试覆盖率
    3.4 结果指标的微调

听众收益
1. 加深对软件开发变革的理解,规划未来发展路径
2. 及时开展个人和团队的角色和能力转型
3. 及时积累新的开发资产
4. 了解新的研发效能度量指标和方法
5. 借助工具和数据推动个人和团队的转型

王欢
东方证券 研发效能负责人
东方证券研发效能负责人、质控管理专家,FinEU发起人。10年+研发管理经验,精通PMO流程优化、质量控制体系搭建,作为国内最早一批(2019年)研发效能平台建设的领航人,有着丰富的效能平台建设经验,平台曾获得多次行业联盟协会奖项、优秀讲师等荣誉,并已在知名期刊发表多篇学术论文。作为核心专家参与金融人才协会联盟发起2025年《金融行业研发效能数智化白皮书》及后续撰写工作。曾就职于兴业银行、阿里系等公司,并作为DevOps Master、CISP、ISO26262、ISO9001内审等多个领域证持专家。
 
待定
待定
数据能对话,治理有AI:大模型破解效能度量深水区
近年来,在经济环境驱动下,提质增效的浪潮席卷各行各业,效能度量成为企业管理的 “必答题”,几乎所有团队都投入到度量工作中。然而,现实却不尽如人意 —— 真正能从效能度量中获得满意产出的案例少之又少。
当前效能度量面临三大核心痛点:一是领导关注度 “降温”,初期的重视逐渐淡化,精心搭建的效能平台数据鲜少被主动查看,仅在汇报时才被临时关注;二是副作用显现,度量指标反而导致团队氛围紧张,甚至出现 “为指标而工作” 的异化行为;三是度量与改进脱节,数据停留在统计层面,缺乏有效的跟踪机制和推动力量,难以转化为实际的效能提升。
面对这些困境,本次演讲将聚焦破局思路:如何通过强化可视化让数据 “主动说话”,如何联动 EPG 与质控力量推动持续改进。同时,还将分享如何借助大模型技术破解度量副作用,比如用大模型检测重复代码、推动代码治理,让效能度量真正实现从数据到价值的跨越。

内容大纲
1. 效能度量基石:科学指标设计与实战解析
    1.1 告别盲目Copy,设计贴合业务的指标
    1.2 关键方法论实战:价值流穿透、组合制衡、GQM法
    1.3 实战案例:指标如何驱动实际改进
2.  效能度量跃升:数据可视化驱动决策
    2.1 痛点突破:让领导“一眼看懂”现状与决策点
    2.2 策略:选对图表、聚焦结论、打造“决策点”
    2.3 目标:从数据堆砌到有效决策支撑
3. 闭环落地:度量-改进的最后一公里(EPG驱动)
    3.1 核心挑战:如何推动改进?解决人手不足?
    3.2 解决方案:报团取暖,EPG闭环机制 - 问题归口、跟踪协调、反馈验证
    3.3 成果:建立效能提升正循环
4. 技术赋能:AI驱动代码质量治理
    4.1 创新实践:大模型自动化代码重复度深度检测
    4.2 驱动改进:基于量化报告,精准治理技术债
    4.3 目标:构建代码质量持续改进动力
 
听众收益
1. 开箱即用的指标设计及实践
避免指标设计的盲目性。我将提供实用的指标设计工具和方法,例如如何进行指标制衡设计、如何运用GPQ法(目标-问题-指标法) 精准定义指标,以及如何避免盲目照搬大厂指标,确保您的指标体系贴合实际、有效可用。
2.从“给领导看数字”到“让领导一眼看到决策点”
告别枯燥的数据堆砌。将提供效能度量结果的可视化解决方案(包含数据、表格、图表),并提炼关键结论,让领导层能直观、快速地理解现状、识别问题核心,从而高效做出有数据支撑的决策。
3.打通“度量-改进”闭环,解决执行难题
度量发现问题只是起点,推动改进才是关键。我将分享一套利用EPG(工程过程组)推动持续改进的落地机制。这套机制能有效解决“人手不足”的痛点:度量发现的问题自动归口到EPG进行跟踪、反馈和闭环管理,确保改进措施有效执行,真正实现效能提升的“最后一公里”。
4.用AI驱动代码质量提升
我将介绍如何利用大模型自动化进行代码重复度检测,并基于客观、量化的检测结果,主动驱动项目组进行代码优化和重构,形成持续改进的技术驱动力。

田先桃
新浪微博 高级测试开发工程师
微博质量保证部高级测试开发工程师,拥有12年后端和大数据测试经验。现主要负责广告引擎的质量保障,以及微博研发效能度量平台事宜。在研发效能度量方面有多年经验,擅长度量指标建设和数据采集的框架设计,目前专注指标建设,从洞察到智能化,AI在微博研发效能度量方面的实践和可行性。
待定
待定
微博研发效能度量体系的演进与AI赋能实践
研发效能度量常面临指标与业务目标脱节、跨系统数据采集难、分析滞后且依赖人工、结果难以驱动改进等核心挑战。微博历经从单一业务质量度量到全公司效能体系的建设,沉淀出多维度指标与自动化采集方案。为提升分析效率与洞察深度,引入AI实现指标实时监控、智能报告生成,并推动人机协同,让AI处理重复工作,工程师聚焦高价值决策。未来将持续探索智能化度量新范式。

内容大纲
1. 研发效能度量面临的挑战
2. 研发效能度量平台建设实践
    2.1 度量演变过程
          2.1.1 讲解微博度量演变的几个重要时间节点,从广告的研发质量度量到微博全业务的效能度量。
    2.2 度量指标建设
          2.2.1 从交付效率、交付质量、交付能力等多维度设计指标,以及北极星指标的提炼。
    2.3 度量数据采集
          2.3.1 展示度量平台的多个数据源,以及采集方式。
3. AI赋能的效能度量
    3.1 度量指标分析(AI赋能分析)
          3.1.1 传统分析的痛点
          3.1.2 AI赋能的效能分析实践
                  ● 实时分析指标数据
                  ● 度量月报分析
    3.2 人机协同
          3.1 AI承担重复性工作,人类聚焦创新与决策,形成新型协作模式
4. 后续规划

听众收益
从指标建设、数据采集、数据分析等多方面讲解度量,给听众带来的收益是如何做有效的度量,以及AI赋能在研发效能度量方面的实践。
关注QECon公众号
关注QECon视频号
议题投稿
lijie@qecon.net
商务合作
151-2264-3988  木子
票务联系
186-4907-7637 胡利利 
媒体合作
135-1619-6409  皮皮
购票咨询
胡利利 18649077637
服务总线
400-183-9980  
电话咨询
联系电话:
胡利利 18649077637