专场:GenAI在测试领域的创新实践
在软件开发的快速迭代时代,测试领域面临着前所未有的挑战和机遇。随着生成式AI(GenAI)的崛起,测试流程的智能化和基于智能化的自动化测试迎来了全新变革。本专场旨在探索GenAI如何革新软件测试实践,提升测试效率和质量。本专场将汇聚行业领先的专家和实践者,分享GenAI在测试分析与设计、测试用例和脚本生成、自动化测试执行和缺陷预测等方面的创新应用。通过深入的案例分析和前沿技术展示,参会者将了解到GenAI如何帮助企业降低测试成本、缩短交付周期,并提高产品的可靠性。专场还将探讨GenAI在测试领域的未来发展趋势,以及如何克服在实际应用中可能遇到的挑战。无论是测试工程师、软件质量人员,还是质量管理者,都将在此专场中获得新的洞见和实用策略,推动组织在数字化时代的成功。
专场出品人:茹炳晟
腾讯Tech Lead、腾讯研究院特约研究员
腾讯Tech Lead,腾讯研究院特约研究员,中国计算机学会(CCF)TF研发效能SIG主席,“软件研发效能度量规范“标准核心编写专家,中国商业联合会互联网应用技术委员会智库专家,中国通信标准化协会TC608云计算标准和开源推进委员会云上软件工程工作组副组长,腾讯云架构师技术同盟入会主席,年度IT图书最具影响力作者,多本技术畅销书作者,著作有《测试工程师全栈技术进阶与实践》《软件研发效能提升之美》《现代软件测试技术之美》《高效自动化测试平台:设计与开发实战》《软件研发效能提升实践》《软件研发效能权威指南》《现代软件测试技术权威指南》《多模态大模型技术原理与实战》《高质效交付》等,译作有《软件设计的哲学》《整洁架构之道》《持续架构实践》《现代软件工程》《DevOps实践指南(第2版)》《精益DevOps》《基础设施即代码-模型驱动的DevOps》等,国内外各大技术峰会的联席主席,出品人和Keynote演讲嘉宾。公众号“茹炳晟聊软件研发”主理人。
鲁四喜 / 陈玉
腾讯 支付与金融线 
大额支付质量负责人 / 高级测试工程师
鲁四喜:腾讯支付与金融线大额支付质量负责人,目前致力于通过先进的技术手段来保障金融产品质量及提升研发效率。从事软件研发、质量工程及技术团队管理多年,深刻理解软件测试理论及相关技术,擅长构建高效的软件研发质量保障体系。从事过多种不同的行业,包括网络安全,互联网家装,数字音乐,区块链,AI产品、金融科技等。多次在国内大型测试开发大会做过技术分享,作为第一作者申请的专利数超过20项。参与出版了图书:<<人工智能-计算机视觉算法测试与应用指南>>及<<现代软件测试技术权威指南>>。

陈玉:腾讯支付与金融线高级测试工程师,目前主要负责微企付业务的质量保证及研发效能工作,曾深度参与金融科技多个业务的质量体系建设和研发效能的技术演进,在复杂金融系统的自动化测试和研效提升上有丰富的经验。
待定
待定
基于混元大模型的场景自动化用例生成实践
业务痛点:场景自动化用例编写速度落后于业务。业务版本迭代快,业务调用链路长,大量接口字段、DB字段需校验,人工编写自动化用例成本较高。如何借助大模型提升场景自动化用例的编写效率和质量?
方案描述:
1. 解决思路:放弃基于文本用例生成自动化用例旧方案,将大问题转化成确定性的小命题,有效利用大模型优势。基于调用链/DB操作日志、接口/DB描述文档,采用分而治之的策略,依次生成每个接口的调用及测试断言代码,有效规避了当前大模型的多种局限性。
2. API接口文档/DB Schema描述文档内容规范, 每个接口独立自描述,大模型无需具备业务背景,规避了大模型欠缺领域知识的问题。
3. 基于调用链日志及接口/DB文档,借助大模型推理能力建立字段间的血缘关系,结合自定义的测试数据生成函数及日志中的测试数据,解决了测试数据构造难的问题。
4. 结果校验规则比较固定,校验返回值、校验DB字段等,通过分析日志建立字段间的验证关系。解决测试断言难的问题,同时断言覆盖更全面。
5. 场景用例代码流程相似,通过少量示例代码生成新场景代码,可有效利用大模型的泛化能力。

内容大纲
1. 业务背景及痛点分析
    痛点:微企付业务,新需求多,链路长、人工编写场景自动化用例成本高
2. 场景自动化用例生成方案选型
    2.1方案选型- 方案1:基于文本用例生成自动化用例的局限性
    2.2 方案选型- 方案2:基于调用链的场景自动化用例的自动生成,落地可行性高
3. 场景自动化用例生成方案详述
    3.1系统整体架构:基于混元的Multi-Agent应用
    3.2场景用例脚手架代码生成
    3.3 接口调用代码生成
    3.4 结果检查代码生成
4. 落地效果:在金融业务上落地应用,单场景生成用例代码300~900行,人工仅需修改10~20行左右代码,节省人力50%以上,同时业务检查点更全面
5. 总结及落地时遇到的典型问题
6. 后续规划
 
听众收益
1. 了解当前大模型应用到自动化用例生成时的挑战
2. 了解一种有效规避大模型局限性来生成场景自动化用例的新思路
3. 了解该方案实施中遇到的典型问题,为借鉴实施带来参考价值

李英俊
小米 AI测试专家
小米 测试部 AI算法测试专家,从事算法开发10余年,在人像抠图,SAM抠图大模型的小型化,AIGC(SD,FLUX,LoRa)生图等方面有比较丰富的研发经验。目前主要负责小米CV算法的测试体系构建,测试指标制定,AI搜索、动态壁纸、人像聚类等10数个算法的效果测试;在用AIGC构建测试数据集,数据集热构建以及AI搜索benchmark构建等方面有比较多的创新实践经验。
待定
待定
生成式AI在CV算法测试中的创新实践
AI算法正在变得越来越多,越来越复杂,特别是CV领域,不同的CV算法的测试数据集构建要求各有不同,AI相册搜索要求用一两个关键字,甚至一个整句来精确匹配出相应的照片;人像聚类要求同一个人不同配饰,不同姿势,不同场景的照片都能聚成一类。为了支持这些算法的测试,测试数据集的构建势必会变得复杂而缓慢,如何快速、精准的构建符合要求的数据集,成为CV算法测试的一大痛点。
近年来AIGC大行其道,可以利用扩散模型、FLUX等生成逼真的照片。我们采用AIGC(SD,FLUX,LoRa)生图,辅以数据集热构建的一些方法来解决了这个问题,最后形成了一个典型应用:AI相册搜索benchmark。

内容大纲
1. 构建AIGC(SD,FLUX,LoRa)生图能力
用扩散模型(SD,FLUX)及其微调模型(LoRa)来生成符合要求的图像数据,包括:根据提示词生成,保持人物一致性生成,系列图片生成等。
2. 数据集热构建
实时或者接近实时的给测试工程师生成或者搜索出符合要求的图像,包括语义内容(caption,分类,OCR)符合要求,属性(分辨率,时间戳,GPS信息)符合要求等,并进行相应处理,比如旋转,超分,模糊等。
3. 构建AI相册搜索benchmark
首先拆解搜索query的关键要素,然后根据要素构建单关键词、多关键词、整句的搜索query,再根据搜索query,采用1和2的方法构建AI相册搜索benchmark。


听众收益
听众可以直接在自己的测试项目中应用这里的思路和方法。

唐晓璇
蚂蚁集团 高级算法专家
就职于蚂蚁集团,专注于研发效能优化方向。自加入蚂蚁以来,持续深耕算法技术在效能提升领域的创新应用,目前担任MobileFlow高级算法专家,在VLM,LLM-based agent以及UI Agent方向有较多积累,深耕提效领域多年。曾带领团队从算法模型研发到工程化落地全流程建设,为复杂场景下的研发效率与质量提升提供技术驱动力。
待定
待定
MobileFlow-大模型驱动的终端自动化测试新范式
面对大模型与智能体技术的爆炸式发展,传统评测方法在应对复杂的多轮对话系统和大语言模型时,显露出静态化、标准化流程的局限性。相较之下,基于大模型的UI Agent展现出革命性优势:其创新性的动态页面解析能力,可实时追踪界面元素变化并智能生成交互策略;独有的断言机制突破了传统黑盒测试的局限,通过多维度逻辑验证实现精准问题定位。MobileFlow平台率先将大模型的潜力注入终端自动化领域,依托海量手机UI数据资产与自研的的标准化Totoro终端自动化语言体系,成功实现了CUI Agent可行性突破。这种智能化评测方案不仅完美适配动态复杂场景,更实现了测试效率与质量的双重跃升,为行业打开了智能研发体系的新想象空间。

内容大纲
1. 传统UI自动化测试的行业通用痛点
    1.1 传统测试背景
    1.2 目前行业痛点
2. 平台介绍
    2.1 算法API体验
    2.2 设备托管功能
3. 技术发展路线及技术创新
    3.1 数据驱动
    3.2 UI Agent构建
    3.3 动线智能纠偏
    3.4 记忆与探索增强
4.  平台应用落地
 
听众收益
1. 洞悉大模型驱动的智能测试技术发展路径
2. 全面了解MobileFlow平台的技术架构与实践价值
3. 获取智能研发体系落地的经验与实践方法论
关注QECon公众号
关注QECon视频号
议题投稿 
lijie@qecon.net  
票务联系 
159-0126-5561  小娟
 
媒体合作
135-1619-6409  皮皮
商务合作
151-2264-3988  木子
购票咨询
15901265561  小娟         
服务总线
400-183-9980