知识图谱在RAG和私域上下文构建中的实践-2026深圳站_QECon全球软件质量效能大会-橙柚科技

优惠倒计时

8折票抢购中

团购享更多优惠

北京站 · 10月16-17日

上海站 · 9月4-5日

深圳站 · 5月22-23日

专场：知识图谱在 RAG 和私域上下文构建中的实践

AI 技术的深度渗透推动 RAG 应用与私域运营进入精细化阶段，上下文构建的精准度的核心价值愈发凸显。传统方式下，RAG 面临检索碎片化、幻觉率偏高的困境，私域则存在用户上下文割裂、业务知识复用难等问题，而知识图谱作为连接碎片化信息、挖掘语义关联的核心载体，已在智能 Code Review、RFC 协议测试等多场景验证了其在上下文构建中的价值。本专场汇集一线实践者的最新探索，结合实战案例，拆解知识图谱在 RAG 上下文优化、私域上下文构建中的核心逻辑与落地技巧，探讨如何借助知识图谱打破信息孤岛，提升上下文构建效率与精准度，助力从业者实现技术落地与业务增长的双重突破。

专场出品人：茹炳晟

复旦大学CodeWisdom团队首席技术专家腾讯研究院特约研究员

中国计算机学会(CCF)TF研发效能SIG主席，“软件研发效能度量规范“标准核心编写专家，中国商业联合会互联网应用技术委员会智库专家，中国通信标准化协会TC608云计算标准和开源推进委员会云上软件工程工作组副组长，腾讯云架构师技术同盟入会主席，年度IT图书最具影响力作者，多本技术畅销书作者，著作有《软件研发效能提升之美》《现代软件测试技术之美》《测试工程师全栈技术进阶与实践》《多模态大模型技术原理与实战》《高效自动化测试平台:设计与开发实战》《软件研发效能提升实践》《软件研发效能权威指南》《现代软件测试技术权威指南》《高质效交付》《代码之外：软件工程师成长手记》等，译作有《软件设计的哲学》《整洁架构之道》《持续架构实践》《构建Agentic AI系统》《大模型驱动的软件测试：从理论到实践》《平台工程》《企业架构决策：战略框架与实施指南》《AI领导力》《现代软件工程》《计算机科学通识：计算思维培养与多学科问题解决实践》《DevOps实践指南（第2版）》《精益DevOps》《基础设施即代码-模型驱动的DevOps》等，国内外各大技术峰会的联席主席，出品人和Keynote演讲嘉宾。公众号“茹炳晟聊软件研发”主理人。

王净

百度地图测试开发工程师

百度地图测试开发工程师，目前主要负责百度地图服务端自动化测试、持续集成/持续交付（CI/CD）流水线的建设与优化，以及质量度量与效能分析平台的搭建，保障百度地图导航、搜索、定位、路线规划等核心功能的质量和稳定性，支撑百度地图在出行、物流、智能驾驶等场景下的高质量交付。

待定

智能 Code Review 工程实战：

LLM Agent驱动的业务知识飞轮与上下文构建

议题背景：
在业务高速迭代下，代码缺陷拦截面临两大核心技术挑战：一是散落在iCafe卡片、CR评论、线上事故中的业务经验无法被系统性利用；二是传统静态规则无法理解业务语义，导致高误报与漏报并存。我们构建了以LLM Agent为核心的业务知识飞轮体系，通过知识挖掘Agent自动从线上Bug、标注反馈等多源数据中萃取结构化规则，经语义向量+代码向量+BM25稀疏向量三路融合检索实现精准规则召回，并结合跨库静态分析构建代码语义图补全上下文断裂。整套体系形成"发现→结构化→入库→检索→复核→反馈"的自增长闭环，使检测能力随业务迭代持续进化，而非依赖人工维护规则。同时，我们已将完整的扫描SOP封装为Claude Code Skill，开发者在命令行中即可一键调用智能CR全流程能力，真正实现从技术方案到开发者日常工作流的无缝嵌入。

内容大纲：
1. 问题本质：为什么代码缺陷拦截需要"业务知识"
1.1 基础规则能覆盖的 vs 需要业务上下文才能判断的——两类缺陷的本质区别
1.2 业务知识散落在哪里：iCafe卡片、CR评论、代码库README、QA知识库、RD口头经验
1.3 核心矛盾：知识以非结构化形式存在，而LLM检测需要结构化规则输入
2. 线上历史问题的自动挖掘与结构化
2.1 多源数据采集体系设计
2.1.1 线上/线下Bug：定期从iCafe空间召回已闭环卡片，提取缺陷模式
2.1.2 代码库级规则：从模块代码库中提取RD编写的业务约束、CR评论中的隐性知识
2.1.3 标注系统数据：用户采纳/拒绝行为 + 代码前后diff对比的自动评测标注
2.2 LLM驱动的数据清洗流水线
2.2.1 初筛去冗→异值补全→格式统标→完整性验证的四步清洗
2.2.2 踩坑：如iCafe卡片描述高度口语化，LLM如何从"配置写错了导致崩了"中提取出精确的缺陷模式
2.2.3 规则预处理：从自然语言到可检索的结构化规则
2.2.4 LLM拆解非结构化规则为：规则描述、典型代码片段、变量标签、来源权重
2.2.5 缺陷聚类合并：如何检测矛盾规则并自动合并（如同一函数的不同边界条件规则）
3. 业务知识飞轮：让规则自己"长出来"
3.1 知识挖掘Agent的核心判定机制
3.1.1 正负样本分流：新数据按业务逻辑分为正向（有效缺陷）/负向（误报）
3.1.2 三层分级向量匹配：与现有规则库比对，命中则更新采纳/拒绝计数，未命中则触发新规则挖掘
3.1.3 临时豁免库设计：负向数据匹配已有规则时的处理策略，防止有效规则被误删
3.2 规则的向量化入库设计
3.2.1 三类向量并存：语义向量（规则标题+描述）、代码向量（代码切片+修复建议）、BM25稀疏向量（核心变量名

倒排索引）
3.2.2 踩坑：代码切片向量化时，函数签名 vs 函数体 vs 关键语句的粒度选择对召回效果的影响
3.3 双Agent检索架构
3.3.1 召回检索Agent：硬过滤（语言/产品线）→ 语义路（函数体向量+diff向量检索）+ 关键字路（BM25）→

归一化融合排序（RRF加权 + 采纳率权重 + 来源权重）
3.3.2 复核检索Agent：在召回基础上增加缺陷标题/描述/类型的语义向量检索维度，top-N规则注入复核prompt
3.4 闭环反馈机制
3.4.1 LLM自动评测标注：对比修改前后代码是否按建议修复，自动生成标注
3.4.2 规则权重的动态衰减与增强：长期未被命中的规则如何处理
4. 跨库代码语义图：补全上下文断裂
4.1 问题还原：单文件分析+LLM拼接导致跨库调用信息丢失
4.2 Semgrep选型的关键决策点：免编译 + 混合语言AST + 自定义规则三个硬约束
4.3 三级流水线：Semgrep符号表生成 → 近似调用图构建 → LLM语义推理补齐隐式调用
4.4 冗余调用过滤：日志打印、格式化字符串、简单赋值等噪声调用的识别与剔除
4.5 递归调用的exclude_patterns配置、跨多行函数体的multiline匹配
5. 多场景调度
5.1 Prompt-Agent分层：按缺陷类型（稳定性/配置/性能）和语言特性拆分专用prompt
5.2 LLM-Agent解耦：支持外部模型（Claude/Gemini）与内部模型（Ernie/Qwen/SFT）按业务密级切换
5.3 评测-Agent保障：标准化测试集 + 自动化跑测，每次prompt迭代的回归检测

听众收益：
1. 掌握一套LLM Agent驱动的知识飞轮构建方法论：从多源异构数据中自动萃取结构化规则的完整技术路径，包括数据清洗、规则预处理、三类向量化入库、双Agent检索架构的设计细节与踩坑经验，可迁移至需要"从历史经验中自动学习"的工程场景。
2. 获得LLM与静态分析工具协同的实战经验：跨库语义图构建的工程落地细节，包括选型决策依据、语法兼容性问题的处理、冗余调用过滤策略，以及LLM语义推理补齐隐式调用的具体做法，避免在类似场景中重复踩坑。
3. 理解业务知识工程从冷启动到自增长的完整闭环设计：如何从零构建"采集→清洗→向量化→检索→反馈→规则自进化"的闭环体系，特别是正负样本驱动的规则动态权重机制和用户反馈的结构化回流设计，适用于任何需要持续演进检测能力的质量保障场景

何汉东

中兴通讯有线研究院 AI 算法工程师

中兴通讯知识图谱与AI应用技术专家。致力于引领先进数据治理和知识工程理论在企业级复杂私域业务场景的创新实践。主导构建了有线院端到端运维知识体系建设与多源异构数据的智能化知识图谱挖掘，有力推动了上下文工程与生成式AI在故障诊断、装配工艺检索等私域场景的实战部署，为有线数据产品打造了高效可靠的智能化知识服务新范式。

待定

私域破局实战：“图谱+向量”双引擎的上下文构建之道

议题背景：
在企业大模型私域落地场景中，传统RAG模式在应对跨文档推理、深度业务关联的复杂挑战时，常面临逻辑断裂和幻觉频发的工程瓶颈。本次分享将聚焦基于知识图谱的上下文工程演进，剖析如何通过“图谱+向量”双引擎架构实现私域知识从离散存储到逻辑关联的深度重构。将系统性阐述如何利用知识图谱的结构严谨性构建具备因果推理能力的智能上下文，贯通数据与知识的固有壁垒，从而驱动生成式AI从“模糊搜索”向“确定性推理”的战略跃迁。

内容大纲：
1. 破局：私域RAG的上下文瓶颈与逻辑重构
1.1 痛点剖析：传统向量RAG的“语义匹配”局限性——跨文档关联断裂、幻觉溯源缺失的工程真相。
1.2 范式演进：架构重塑——从“离散片段检索”转向“拓扑结构导向的确定性推理”范式迁移。
2. 造物：私域知识的结构化生产与敏捷治理
2.1 知识流水线（Pipeline）：

基于大模型的信息抽取与实体对齐技术，实现从非结构化文本到结构化知识单元的自动化生产。
2.2 Schema-Adaptive 策略：

摒弃重型本体设计，采用“弱 Schema”演进模式，实现知识网络随业务场景的敏捷构建与动态扩展。
3. 协同：双引擎架构下的“上下文重构”方案
3.1 混合检索与动态路由：

意图驱动下的双引擎协同机制，如何平衡向量检索的覆盖广度与知识图谱的推理深度。
3.2 上下文逻辑重构：

基于知识子图与语义片段融合算法构建“语义+拓扑”双维度的增强型Prompt，实现推理链条的可解释性。
4. 实战：私域场景智能应用落地与成效
4.1 知识中台与私域Agent部署：

ZTE知行系统驱动下的私域场景应用落地与成效。
4.2 知识驱动的业务正反馈闭环：

“用户反馈 -> 知识图谱修正 -> AI 能力自进化”的闭环迭代体系，实现私域知识在业务应用中的动态价值沉淀。
5. 总结与展望

听众收益：
业务管理者：了解如何利用知识图谱提升私域AI的实用性，解决幻觉溯源缺失与逻辑断裂难题，提升业务决策确定性。
技术专家/工程师：掌握“图谱+向量”双引擎协同机制与知识自动化加工流程，提升复杂业务场景下的上下文构建质量与推理精度。

施倩倩

腾讯 TEG云架构平台部系统测试工程师

腾讯，云架构平台部接入类产品领域的高级系统测试工程师和测试负责人，目前主要负责腾讯云CDN、视频直播、微信C2C、腾讯会议等产品的质量保障工作，10年+后台测试经验和大规模系统架构测试体系建设经验。

待定

破局RFC协议测试：基于RAG与Agent的标准测试生成实践

议题背景：

接入类产品的底层服务中多协议兼容是刚需，协议实现与行业标准的不一致极易引发客诉。面对人工梳理耗时长、覆盖率低且业界无成熟工具的困境，我们引入 LLM 探索自动化生成。经历了大模型幻觉、场景遗漏等踩坑期后，我们摒弃简单 Prompt，自研深度定制的 RAG 与 Agent 架构。通过“结构+语义”双重检索与多层约束防幻觉，打通了“标准->场景->代码”的可溯源生成闭环。该方案已在 HTTP2/3、MP4 等核心标准落地，挖掘 200+ 兼容性缺陷，生成周期由“月级”降至“天级”，大幅提升评测效能。

内容大纲：
1. 业务痛点：被忽视的协议标准与高昂的测试成本
1.1 业务痛点剖析
1.2 传统测试的困境
1.3 行业工具局限性
2. 早期探索与踩坑实录：当 LLM 遇到严谨的 RFC 标准
2.1 黑盒测试困境
2.2 幻觉与噪声
2.3 上下文遗忘
3. 核心架构破局：深度定制 RAG 与 Agent 的落地实践
3.1 知识建模（标准文档->测试场景）：摒弃传统切片，构建基于“文档结构树 + 语义”的多索引知识库
3.2 防幻觉机制：构建多层 Prompt 约束与交叉验证逻辑，提升用例生成的信噪比
3.3 规模化生成（测试场景->用例代码）：基于 Agent 工作流，将宏大任务拆解，实现用例代码的自动化、批量化生成
3.4 人机协同闭环（测试验收）：建立“用例代码 -> 测试场景 -> RFC 原始段落”的精准溯源验收机制，解决 AI 产出物的

信任危机
4. 实践成果与效能跃迁
5. 总结与未来展望

听众收益：
【技术架构参考】：获得一套针对“高密度、强逻辑技术文档（如 RFC、API 标准）”的RAG 与 Agent 架构设计思路，解决通用大模型在垂直领域落地时的幻觉与遗漏难题。
【工程实践避坑】：了解LLM 生成测试代码时如何解决 AI 产出物不可解释、难以验收的工程痛点。
【大模型测试实践方向】：学习如何利用 AI 技术将高门槛的“协议标准兼容性测试”转化为常态化的工程能力，并以此构建竞品横向对比体系，提升 QA 团队在业务决策中的话语权。
【标准治理的 AI 落地范式】：洞察大模型在“行业标准评测”的创新落地。利用 AI 将极高门槛的协议测试转化为常态化工程能力，借此构建竞品对标基线。

魏兵

岩山科技二三四五网科

资深测试开发工程师

资深测试开发工程师，目前主攻TestAI及智能化测试方向，深耕测试基建、AI测试研究和落地，具备丰富的工程实践与内外部技术分享能力行业从业10年+。

主导AI测试创新实践，负责测试平台架构设计与相关开发，搭建TBS基础模型服务与AI质控小助手，支撑AI生图效果与合规自动化判定、模型调用、合规分析等能力，引入云真机Sonic技术的落地与二次开发，深入开展业务图谱、代码图谱构建等知识图谱研究，推动AI生成用例落地，全面提升测试效率与质量。

具备极强的内外部技术分享能力，受邀在MTSC2025等行业大会做外部分享，多次开展AI测试、LLM应用、AI Agent等内部技术培训；精准带教5名测试人员成长为测试开发骨干，强力赋能团队能力升级。

待定

从“自动化”迈向“认知智能”：知识图谱驱动的测试效能变革

议题背景：

当前 AI 赋能测试常因缺乏深度业务理解而沦为“指令执行手”，面临认知局限与伪智能困境。通用大模型在垂直领域往往因“广度受限”无法覆盖复杂业务流转，因“深度不足”难以理解隐性规则与代码依赖，导致生成的测试方案准确性低、维护成本高。本次分享将探讨如何通过构建“需求-业务-代码”三位一体的知识图谱，打破数据孤岛，为 AI 打造具备全域视角的“业务大脑”，推动质量体系从被动的“自动化验证”迈向主动的“认知智能决策”。

内容大纲：
1. 困局与思考：AI 测试的“智商”天花板
1.1 痛点剖析：AI 为何只是依赖人工指令的“执行手”而非懂业务的“设计师”？
1.2 核心矛盾：垂直领域知识的“广度不足 + 深度不够”导致伪智能。
2. 体系重构：构建“需求-业务-代码”三位一体的知识图谱
2.1 顶层设计：基于“图数据库”打通需求文档（真理源）、业务逻辑（黑盒层）与代码实现（白盒层）的数字孪生架构。
2.2 价值逻辑：利用知识图谱的“多跳推理”能力，解决跨层级关联分析难题。
3. 实践之路：从“理想化”到“工程化”的演进与踩坑
3.1 应用功能图谱：摒弃高成本的全自动探索，确立 “AI 预处理 + 人工确认” 的 Human-in-the-loop 模式。
3.2 全域代码图谱：基于 Tree-sitter AST + 自定义规则，攻克多语言解析与业务接口调用链（Call Graph）追踪难题。
3.3 需求文档图谱：告别生成式图谱的“幻觉”陷阱，回归更稳健的 PageIndex 结构化索引（RAG 2.0）。
4. 价值落地：图谱驱动的全生命周期赋能
4.1 智能测试：基于图谱拓扑的动态用例生成与“改哪里测哪里”的精准回归。
4.2 研发协同：IDE 端的变更风险实时预警与新人业务专家助手。
4.3 产品协同：需求冲突检测与资产复用。
5. 展望：构建质量中枢的数字孪生底座

听众收益：
1. 获得架构蓝图：带走一套可落地的、包含应用功能/代码结构/需求文档的全域知识图谱构建方案。
2. 避开落地深坑：通过我们的试错经验（如全自动探索的死循环、生成式图谱的幻觉），掌握在工程实践中如何权衡自动化率 vs 准确性、灵活性 vs 可控性。
3. 解锁效能新玩法：了解如何利用图谱技术实现精准回归分析、研发变更风险预警等跨角色场景，为企业效能提升提供新思路。