大会主题-2026深圳_QECon全球软件质量效能大会-橙柚科技

Agent驱动的智能化测试

软件产品迭代提速、架构与业务复杂度攀升，传统测试已难以适配需求，AI Agent正推动测试从脚本自动化迈向自主决策的智能化新阶段，破解脚本维护难、缺陷定位滞后等痛点，也带来技术落地与能力升级的新命题。本次专场聚焦Agent驱动的智能化测试，探讨其如何重构质量保障流程，解析核心价值与实践路径，梳理测试人员转型方向，汇聚众多一线实践者在此交流经验、探索智能测试新范式。

评测驱动 AI 研发新范式

人工智能正经历从“技术概念”到“产业深耕”的关键跃迁，以大模型为核心的AI智能体已深度渗透至各行各业的核心领域，重塑行业服务范式。在新的技术浪潮下，评测不应仅仅是上线前的“质检员”，而应成为贯穿需求定义、算法选型到线上迭代全生命周期的“指挥棒”。

本专场深入解析“评测驱动开发（Evaluation-Driven Development, EDD）”新范式，覆盖智能体产研的全生命周期：从设计阶段的评测基准（Benchmark）设计与高质量评测数据合成，到评测自动化框架与模型训练的深度集成，以及通过User Simulator、线上实验等方案实现评测与用户体验的精准对齐等议题。我们将结合前沿方法论与行业实战案例，展示如何构建高置信度且实时反馈的评测数据飞轮，助力智能体业务实现高质量的规模化增长。

本论坛聚焦大模型与Agent技术在专项测试领域的深度实践。围绕性能分析、数据质量、故障排障等核心场景，展示LLM如何突破专项测试对专家经验的高度依赖，通过智能诊断与Agentic工作流重塑测试范式，推动从经验驱动向AI驱动的能力跃升。

LLM赋能专项测试新实践

随着LLM技术的突破性发展，各行业质量保障体系正加速向智能化演进。LLM赋能测试已从辅助工具升级为贯穿研发全生命周期的智能引擎，催生软件质量工程领域的新范式。本次「LLM赋能测试左移与右移实践」分论坛，将聚焦互联网及科技企业前沿实践，深度探讨LLM在左移阶段的需求缺陷智能预测、代码审查优化与AI代码质量分析，在右移阶段的生产环境风险感知、故障根因分析等话题，以及各公司LLM赋能测试左右移的落地方案。

LLM赋能测试左移与右移实践

AI为需求工程与设计带来了并正在进行着深刻的变革：
工作范式：AI正从效率工具升级为以需求工程与设计为核心的创新协作伙伴，重塑研发全流程、重构角色分工，形成全新范式；
工作重心：需求工作由传统的分析与定义，向价值工程、业务创新、产品创新、经营与运营等高价值方向快速演进；
在研发链路中的定位：在“从需求到代码”全链路AI化进程中，需求分析与设计建模正成为贯穿始终的核心枢纽环节。
本论坛将在上述背景下，集合业界最新的AI4RE和设计的新实践，共同分享并促进行业的发展演进。

AI驱动需求工程和设计新实践

在AI技术深度融入软件工程的新时代，研发模式正迎来全新变革，规范驱动（Spec-Driven）开发凭借其标准化、可落地的特性，成为提升开发效率、强化质量管控的核心路径，为研发全流程的标准化、自动化与智能化提供关键支撑。当前行业中，如何通过清晰的规格定义串联需求、设计、开发、测试全环节，如何结合AI技术让规范驱动开发落地提效，如何基于标准化规格搭建质量管控体系，成为企业研发升级的重要探索方向。本次「Spec-Driven模式下的开发效率和质量管控」分论坛，将聚焦规范驱动开发的前沿实践，汇聚行业技术专家，深入探讨Spec-Driven模式的落地方法论、全流程效能提升与自动化平台搭建、AI辅助编程/设计/架构/测试在规范驱动场景下的融合应用等核心话题，分享一线企业在该模式下实现开发提效、质量闭环的实战经验，为行业打造标准化、高质量、高效率的研发体系提供可借鉴的实践方案。

Spec-Driven模式下的开发效率和质量管控

软件开发正经历从“局部效率工具”向全自主自然语言编程的范式重构。当前，代码生成的边界已演进至多智能体协同（Multi-Agent Orchestration）驱动的深度工程实践：通过模型上下文协议（MCP）、 Skills 扩展实现跨工具能力的无缝集成，结合代码知识图谱与长期记忆（Long-term Memory）机制，AI 正在构建对超大规模工程的全局认知与上下文对齐能力。
这一演进正重新定义开发者的效能边界，助力个体进化为掌控全局的 10x 乃至 100x 工程师。本专场将聚焦如何驱动 Coding Agent 实现从需求意图到交付产物的全链路闭环，深入探讨在 Long-horizon任务中，如何解决目标偏移（Goal Drift）、保障任务完成度与高质量交付。

AI Coding编码效率与质量提升

AI 正在重塑软件研发的每一个环节，过去我们常常使用需求吞吐量、需求交付周期、缺陷逃逸率等结果指标以及一系列的研发活动过程指标来度量团队的研发效能，而随着行业的剧变，现在哪些指标已经过时？哪些指标还可以继续沿用？
当 AI 可以更轻松的输出大量代码，将人工编码时间进行极致压缩，我们应该如何衡量生产力的变化？当AI生成的代码大量涌入，如何评估产出的代码与软件质量？当人机交互方式不断演进，如何评估人与 Agent的协同的效率，进而指引范式的迭代升级？
带着这些疑问，本专场将汇集众多一线实践者的最新探索，聊聊 AIGC 时代度量体系到底该怎么进化。

AIGC时代质效度量新实践

AI 技术的深度渗透推动 RAG 应用与私域运营进入精细化阶段，上下文构建的精准度的核心价值愈发凸显。传统方式下，RAG 面临检索碎片化、幻觉率偏高的困境，私域则存在用户上下文割裂、业务知识复用难等问题，而知识图谱作为连接碎片化信息、挖掘语义关联的核心载体，已在智能 Code Review、RFC 协议测试等多场景验证了其在上下文构建中的价值。
本专场汇集一线实践者的最新探索，结合实战案例，拆解知识图谱在 RAG 上下文优化、私域上下文构建中的核心逻辑与落地技巧，探讨如何借助知识图谱打破信息孤岛，提升上下文构建效率与精准度，助力从业者实现技术落地与业务增长的双重突破。

知识图谱在RAG和私域上下文构建中的实践

在数字化系统规模持续扩张、业务复杂度不断攀升的当下，运维与 SRE 正从传统被动响应、人工值守，迈向自动化、智能化、可观测全域协同的全新阶段。以大模型、AIOps 为代表的 AI 技术深度渗透，正在重构故障排查、容量规划、告警治理、应急响应等核心工作流程，既带来了效率跃升、风险前置的全新机遇，也提出了技术融合、能力升级的全新挑战。

本次技术分享会，我们聚焦AI 如何重塑运维与 SRE 工作范式，从实际场景落地、工具实践应用、能力体系构建、未来发展趋势等多个维度，拆解 AI 在智能告警、根因分析、自动化运维、稳定性保障中的真实价值，探讨传统运维人向智能运维、可靠性工程师转型的关键路径。无论你是深耕一线的运维工程师、负责系统稳定性的 SRE，还是关注技术演进的研发与架构师，都能在这里碰撞思路、交流经验，共同探索 AI 赋能下，更高效、更可靠、更具前瞻性的运维新未来。

AI时代下的运维与SRE变革

AI Agent 正在成为研发效率工程的核心基础设施，推动工程能力从"工具叠加"走向"能力涌现"。当 Agent 架构真正进入 AGEE 研发的核心流程，自主规划、自主执行、自主验证的能力开始系统性重塑工程团队的生产力边界。小红书 AGEE 团队（Anti-Gravity Efficiency Engineering）以 AI Native 为理念，重塑架构风险分析、变更自动化、智能测试、代码知识化、性能体验测试等领域的工作流程，让工程团队从重复性摩擦中"失重"解放，将过去依赖大量人工协同、高度碎片化的复杂工程问题，逐一转化为可持续演进的智能化工程范式。这不只是对原有流程的局部优化，而是重新定义研发工程的底层逻辑。本专场将汇聚小红书 AGEE 团队的一线实践，深入分享 Agent 架构设计、关键技术突破与规模化落地路径，与行业共同探索 Agent 时代研发工程的下一个范式。

小红书专场：Agent驱动的研发效率工程探索与实践

当 Vibe Coding 让"口喷代码"成为日常，一场更深远的变革正在展开——Vibe Working 的时代已经到来。以 OpenClaw 为代表的开源 AI Agent 框架，正在将 AI 从对话助手进化为能常驻后台、连接消息平台、自主执行任务的"数字员工"。一个Agent在你休息时自动帮你砍价 4200美元、自动去 Google Cloud 配 OAuth、在 WhatsApp 群里协调家人日程——这些不再是 Demo，而是真实发生的故事。本专场聚焦 Agent Skill（技能）的设计、分发与Agent间的协作演进。我们将探讨：如何用 SKILL.md 这样的轻量格式定义一个可复用的 Agent 能力？当 OpenClaw 的 Skills Registry 已积累海量的技能，这个生态带来了哪些机遇与安全挑战？Agent的工作方式也逐渐摆脱单 Agent + subagent，越来越多的产品引入 Agent Team的协同范式，结合 A2A 协议，Agent们将如何重塑我们的工作方式，上演 Agent的社会化大协同？

从Vibe Coding到 Vibe Working，Agent技能进化图谱

本专场聚焦AI 驱动的技术债治理核心主题，深度契合“提质增效” 的核心内核，探索人工智能时代软件研发质量与长期效能平衡的全新路径。
直面行业普遍痛点，破解传统技术债治理中识别不精准、量化无标准、修复成本高、管控难闭环的核心困局。
深度拆解大模型与生成式 AI 技术如何重构技术债全生命周期管理，实现从被动事后治理到主动事前防控的范式升级。
为研发负责人、架构师、质量效能专家、技术管理者提供从理念到落地的全链路解决方案，破解技术债治理的长期难题。
我们期待与行业同仁一同探索 AI 时代技术债治理的最优解，助力企业筑牢研发质量根基，实现业务高质量可持续发展。

AI 驱动的技术债治理

在AI加速演进的背景下，平台工程正从以工具链与自动化为核心的支撑体系，迈向以智能化为驱动的新阶段。本专题以“平台工程进化论：AI驱动的下一次跃迁”为核心，聚焦AI如何深度融入研发基础设施，推动平台工程从效率优化走向范式重构。
专题将系统探讨AI在代码生成、问题定位、系统治理、跨端协同等关键场景中的落地路径，分享从Copilot到Agent的能力演进，以及背后的架构设计与工程方法论。同时，本专题也将讨论在AI原生语境下，平台能力如何重新抽象、研发流程如何被重塑，以及组织如何实现从“用AI提效”到“以AI为基础设施”的跨越。通过真实案例与体系化总结，旨在为构建下一代平台工程能力提供可落地的参考与启发。

AI+平台工程新实践

基于自然语言驱动的 Agent 智能测试实践

王一勃｜58同城 AI 应用工程师

ATC 阿里巴巴淘天全端智能质量平台，助力无人化业务交付

路昆｜淘天集团测试开发工程师

基于业务地图的轻量化 AI Agent 智能化测试实践

仲思宇｜58同城测试平台研发部负责人

LLM+具身智能驱动的智能零售全链路评测体系突破

余亮｜蚂蚁集团技术专家

/

AI 驱动的资损智能防控体系2.0建设

黄晓晴｜淘天集团高级测试开发工程师

生成率从8%到60%：快手智能测试用例生成系统的四阶进化

胡梦飞｜快手研发 Agent 专家

从0到1：基于多模态大模型与多Agent架构的移动端UI智能化测试平台实战

鲍红磊｜微博高级测试开发工程师

Giraffe-API：利用豆包&ML重新定义 API 场景用例生成

宋东辉｜字节跳动测试开发工程师

排障 Agentic 架构：快手主站复杂生态下的排障知识连接与 AI 提效实战

付文兰｜快手主站质量直播营收产品

方向负责人

AI赋能性能分析的实践探索

林梓标｜腾讯高级测试开发工程师

AI双擎驱动数据质量保障：SQL用例生成与智能DQC规则推荐的双引擎实践

杜瑶 / 赵思｜快手资深数据测试开发工程师

基于Langgraph的应用游戏智能化测试实战

李景华｜腾讯应用宝质效体系负责人

需求 Agent + SDD + Skill：三位一体构建 AI 驱动的需求工程新范式

王玉霞｜北京兴云数科

资深需求AI教练过程改进专家

基于企业 CoClaw+Skill：实现从想法到产品的快速落地

杨爱文｜北京兴云数科

产品架构规划师兼AI技术教练

大模型驱动的需求风险智能评估体系建设与实践

万方鹏｜快手测试开发专家

构建可落地的前端智能工具：从页面生成到联调部署闭环的工程实践

田彦博｜百度工程效能部

文心快码资深工程师

领域驱动的 Spec 技术平台实践

周默｜京东零售技术总监

Spec-Driven 在财付通（微信支付）的实践

何均健｜腾讯资深架构师

AI 时代的质效度量新实践

黄家朗｜平安人寿保险测试专家

TME AICoding研发提效实践之路

李娟｜腾讯音乐资深专家

编程智能体的可观测性与 AI 原生转型

任晶磊｜思码逸 CEO

私域破局实战：“图谱+向量”双引擎的上下文构建之道

何汉东｜中兴通讯

有线研究院 AI 算法工程师

从“自动化”迈向“认知智能”：知识图谱驱动的测试效能变革

魏兵｜岩山科技二三四五网科

资深测试开发工程师

智能 Code Review 工程实战：LLM Agent驱动的业务知识飞轮与上下文构建

王净｜百度地图测试开发工程师

破局RFC协议测试：基于RAG与Agent的标准测试生成实践

施倩倩｜腾讯 TEG云架构平台部

系统测试工程师

从告警到自愈：大模型驱动的大数据SRE智能运维体系实践

邹宇轩｜快手高级大数据SRE工程师

Multi-Agent协同驱动的配置变更AI智能校验平台实践：从"人防"到"智控"的质量范式升级

王晓桃｜淘天集团高级测试开发工程师

AI-Agent 重塑腾讯游戏质效提升的SRE实践

梁凤明｜腾讯 IEG 国内发行游戏SRE负责人 SRE技术专家

SRE Agent 探索与挑战

李国栋｜华为云

AIOPS/Agent算法工程师

AI-CR：构筑 AI Coding 时代的质量基石

刘洋｜去哪儿旅行

基础平台团队高级研发工程师

AI赋能的质量与效率平衡：智能代码评审的工程实践

易心宇｜阿里云云效产品技术专家

AI驱动的缺陷全自动修复：从触发到关闭的端到端实践

陈少滨｜阿里云 Qoder 技术专家

60万行巨石应用AI重构的质量保障实践

王之旭｜支付宝

数字就业与民生质量负责人

托管式 AI 开发平台的思考与实践

郑楚君｜腾讯全栈开发专家

意图驱动 + 契约左移 + AI 定位修复：一个 QA 在全员 AI 团队里跑通交付闭环的实战

贾澄臻｜记忆张量 MemTensor 测试负责人

多智能体协同智测：AI 重塑前端全链路质量防线

郑友韩｜腾讯音乐资深测试专家

AI Coding与AI Testing-重塑软件交付的组织管理

张鼎｜前阿里巴巴 Lazada 执行副总裁

AI原生研发范式在地图AI-QA值守系统中的实践与创新

肖林青｜百度地图测试开发工程师

可观测与评估工程驱动的 AI Agent 迭代优化飞轮

张磊｜阿里云可观测高级开发工程师

搜推算法的智能评测新范式：

从白盒可解释到智能决策

赵丽坤｜支付宝高级质量技术专家

保险垂域智能体评测实践

裴君君｜平安人寿质量管理团队 AI 及大数据高级测试工程师

构建确定性的量尺：大模型 Agent 能力评测体系与工程实践

陆建国｜中兴通讯 AI 算法资深专家

Agent 质量工程实践：构建 AI Agent 的可测试、可评估、可质检体系

马阳阳｜去哪儿旅行

基础架构部基础平台负责人

亿级Token知识库的Agentic生成：企业级Wiki工程实践

郝栩彬｜小红书 AI工程架构师

LLM驱动端到端测试体系

肖俊｜小红书 AI 工程架构师

AI 驱动的客户端性能体验全链路保障：从代码风险预判到用户感知度量

张雨｜小红书 AI 工程架构师

基于Multi-Agent的B/C数据链路变更自动化保障

李伟｜小红书 AI 工程架构师

大模型压测数据构造：质量跃迁之路——从能跑到真管用

陈圣｜小红书 AI 工程架构师

HiClaw —OpenClaw 超进化，兼顾企业安全与多 Agent 协同的终极底座

李颜良｜阿里云智能高级技术专家

从脚本到认知，从单点到全域：Planner-Skill-Worker 跨平台智能化测试

周顺｜岩山科技二三四五网科

高级测试工程师

当 Agent 学会用工具：研发全链路的技能进化

毕鸣一｜腾讯云

大前端可观测产品技术负责人

跨越鸿沟- 从本体论建模到AI原生应用构建

何明璐｜远行科技

副总经理兼总架构师腾讯云 TVP

AI代码审查：工具终将迭代，研效体系长青

李阳杰｜腾讯音乐高级测试开发工程师

AI时代遗留系统的维护与演进：用数字化模型化繁为简，让复杂系统变更有据可依

谭珊珊｜北京兴云数科资深需求分析工程师

Vibe Coding 时代的技术债与 AI 解法

张琦｜华为研发大模型团队

研发智能体技术专家

当 AI 接管测试全链路 —— 执行沉淀与自进化的平台工程实践

查斌｜淘天集团高级测试开发工程师

AI时代研发平台的能力跃迁——从面向文件开发到面向智能体开发

王一男｜华为技术专家

华为云智能化DevOps产品专家

基于 MCP 与人机协同的 D2C 演进与工程化落地

全力｜腾讯音乐前端技术专家

Agentic 企业数据落地实践：

构建统一的多源数据实时上下文

陈涛｜阿里云产品专家阿里云 EventBridge 及云原生 DataAI 领域产品负责人