专场:质效领域Agent实践
聚焦AI Agent在质量保障与效能提升中的创新应用。我们将深入探讨Agent在自动化测试、缺陷识别、代码审查、知识问答、流程协同等质量场景的实战案例,以及在开发、测试交付等效能场景中的落地实践。通过真实业务应用分享,展示智能Agent如何驱动质效双提升,助力企业实现研发智能化转型。
专场出品人:王胜 
百度 质量效能研发部 资深工程师
先后就职于腾讯和百度,专注质效工具的研发,在大数据领域,智能测试领域,白盒领域(代码理解,问题召回等)有较为丰富的工作经验。
唐辉
百度 资深工程师
百度 工程效能部资深工程师,目前主要负责百度内的大模型产品 Comate AI IDE。在百度内先后建设过40+产品,在前端组件库、工程化、性能优化、体验优化等多个方向均有深入实践。在团队内部,长期参与提效工具研发,提升团队交付效率。
待定
待定
多模态模型驱动前端研发变革
前端工程师在日常工作中,需与产品经理、交互设计师、视觉设计师、服务端工程师等多个角色紧密协作,最终完成图形化界面的开发。在传统研发流程中,跨角色协作往往伴随较高的沟通成本。从多轮的需求、交互与视觉评审,到技术方案调研、视觉还原、响应式布局实现、联调以及测试用例编写,每一个环节均需投入大量时间。如何以更少的时间完成高质量的需求交付,一直是前端工程师及其管理者面临的核心挑战。
我们在团队内全流程研发环节推进了大模型(包括多模态大模型)的落地。过程中虽经历了一些挑战,但也取得了显著成效。

内容大纲
1. 效率与质量的双重挑战
2. 多模态模型破局之道:推动前置环节产出高质需求、借助 Figma to Code 生成界面代码、通过预览工具实现精细调整、配置多种 Hook 组合 Agent 以自动化常规任务、应用多模态模型进行智能 UI 测试等
3. 落地推进策略
4. 总结与未来展望

听众收益
将大模型用于原型设计、界面开发,提升研发效率。
陈军
美团 技术专家
美团质效技术部技术专家,目前主要负责美团质效工具建设,对数据构造、精准测试方向有一定的落地实践,AI在质效领域的工程化应用方向上(智能体设计、知识图谱构建)也做了相关的研究与探索。16年加入美团,从事测试开发方向工作。
待定
待定
代码AI Agent在变更影响分析领域的探索与实践
传统测试范围评估的挑战:
1. 高度依赖人工经验(效率低、知识断层、专家资源瓶颈)
2. 复杂依赖难识别(跨服务接口、隐式配置依赖)
3. 测试覆盖盲区(用例设计不完善、多环境差异)
4. 过程资产难沉淀(缺乏可复用知识库)

AI时代的新风险:
1. AI生成代码的不可预知性(逻辑偏差、隐式依赖)
2. AI修改代码的回归测试危机(非目标模块被修改、新逻辑分支缺乏覆盖)
3. 研发评估准确度降低(代码风格多变,传统方式失效)

解决方向:
通过构建代码知识图谱和AI智能体,实现变更影响的自动化分析,结合工程编码与AI泛化能力,提升测试范围评估的精准性。


内容大纲
1. 背景与挑战
    1.1 线上问题分布数据(大量问题均由变更影响评估不到位导致)
    1.2 传统评估痛点 vs AI时代新风险
2. 代码知识图谱构建
    2.1 目标:精准代码关系 + 高效查询能力
    2.2 关键技术:代码解析、业务特征工程、图数据库优化
    2.3 业务知识挖掘:AI辅助特征清洗/总结/校验
3. 智能体构建与交互
    3.1 架构分层:数据层(MySQL/ES/Graph)、基础设施层(AST/链路算法)、应用层(意图识别/流程规划)
    3.2 核心能力:意图识别、多轮对话管理、动态工具编排
    3.3 交互流程:用户输入→意图识别→工具执行→结果聚合
4. 
阶段成果与演进方向
    4.1 拦截缺陷分布;
    4.2 未来优化:知识处理增强、多语言支持、需求-代码追踪矩阵

听众收益
1. 直接成效:
    1.1 降低测试逃逸率:通过精准影响范围分析,拦截变更相关问题(如配置遗漏、兼容性风险)
    1.2 提升效率:AI智能体实时生成测试建议,减少人工评估时间
2. 可复用的技术经验:
    2.1 业务特征工程:AI辅助打标业务属性(如接口含义、风险特征),增强图谱实用性
    2.2 智能体设计:分层Prompt管理、规则引擎消解模糊意图、动态工具编排(DAG优化)
    2.3 知识沉淀:将分析结论转化为数字资产,解决知识传承难题
3. 量化数据参考:
    3.1 拦截问题分布
    3.2 关键指标:意图识别准确率、召回率周级监控机制
4. 风险防控实践:
    4.1 覆盖AI生成代码的隐式依赖检测,解决“回归测试危机”
    4.2 通过图谱追踪数据流完整性,预防跨服务链路异常
齐佩之
华为 GTS业务体验领域测试专家
华为技术有限公司 GTS业务体验领域测试专家(首席),长期在测试技术和测试工程能力领域深耕,构建Web UI自动化测试框架,先后实现Web低码和无码自动化写作、LLM辅助自主探索测试、基于意图的自主测试Agent,在公司多个领域广泛使用。
待定
待定
基于模型的自主遍历测试Agent
Web类产品,界面变更快,页面功能组合多,传统基于xpath的UI界面自动化写作成本高且维护工作量大,传统基于算法的web界面探索测试没有测试意图,测试覆盖范围无法准确评估,如何让自主遍历和人的测试设计结合直接到测试执行实现跨越?

内容大纲
整体方案:
基于模型的自主测试能力,用户输入测试意图,Agent基于页面感知自动规划执行任务,基于执行任务自动输出具体的操作指令,自主进行页面的操作执行。

关键技术:
1. 构建Web操作指令集:一套支持浏览器操作相关的指令集,可操作页面各种元素,具备结构简单,执行稳定,可读性强的特点;
2. 基于意图的任务生成:用户输入意图,基于意图创建执行任务和步骤,实现任务规划;
3. 基于任务的步骤执行:基于任务步骤规划调用原子能力,进行步骤执行,每个任务执行可遍历所有步骤的数据组合,实现基于任务的自主遍历测试执行;
4. 基于预期结果和故障模式库的问题检测:根据意图结果和40+种故障模式库进行Web界面问题检测。

听众收益
Web界面测试自动化还需要写具体的用例吗,还需要写自动化脚本吗,或许可以尝试改变了。
张洁芳
中国工商银行 软件开发中心
金融科技经理
工商银行软件开发中心广州产品部测试数据工程负责人,专注于测试领域数字化转型实践。
待定
待定
基于数据服务生态的智能造数取数智能体建设实践
针对分布式架构多平台产品服务交易链路长,跨应用造数困难,数据种类不足导致测试遗漏引发生产安全隐患的痛点,建设基于数据服务生态的智能造数取数智能体,提升测试人员在跨应用长链路场景的测试数据准备能力。基于大模型整合造数知识库,建立数据需求、数据服务链路及报文的关联关系。以对话方式获取测试用数需求细节,结合知识库及大模型推理能力,精准推荐数据服务并智能生成造数上送报文,灵活生成多种类型数据;通过知识库加大模型推理能力,将用数需求转换成数据特征条件,自动查找满足测试要求的测试数据,实现对话式查数,提升测试覆盖广度及深度,减少对跨应用的依赖及供需双方沟通消耗,提高测试效能。

内容大纲
1. 现状和痛点
2. 数据服务生态体系
3. 数据智能体建设思路
    3.1 需求挖掘
    3.2 智能体核心架构
    3.3 知识库建设思路
    3.4 需求识别分类调优
    3.5 智能体运营提升
4. 效果与展望

听众收益
效能跃迁:如何用大模型重构传统测试数据工厂,获得跨系统造数效率提升300%+的落地方案(实测从小时级到分钟级)

关注QECon公众号
议题投稿
lijie@qecon.net
商务合作
151-2264-3988  木子
票务联系
135-2067-8913  郭梦媛
媒体合作
135-1619-6409  皮皮
添加QECon小助手,获取
会议最新资讯
购票咨询
13520678913  郭梦媛
服务总线
400-183-9980  
电话咨询
联系电话:
胡利利 18649077637