编程场景作为大模型落地和商业化最成功的场景之一,依赖于代码大模型或通用大模型优秀的代码能力。训练出好的代码模型,依赖于高质量数据和高效的训练算法。腾讯云AI代码助手团队在上述问题有深厚的技术积淀,本议题将会以代码补全为切入点,分享腾讯云AI代码助手团队在代码大模型领域的技术实践。代码补全作为大模型在代码领域最先落地、最高频的场景,在整个代码智能的生态中具有基础性的地位。与此同时,随着模型能力的提升,以agent为基础的代码智能产品将会在未来快速发展,在agent时代,模型将会与agent应用协同发展,双向促进,创造更大价值。
内容大纲
1. LLM方法论
1.1 Scaling Law
1.2 大模型训练范式
1.3 训练模型的挑战
2. 代码补全大模型的训练
2.1 补全模型的特点
2.2 补全模型的数据
2.3 补全模型的训练方法
2.4 补全模型的离线评估和线上指标
3. 代码大模型的未来
3.1 代码智能产品趋势
3.2 代码Agent的发展
3.3 应用和模型相互促进
听众收益
1. 大模型训练的基础知识
2. 代码领域常用的数据和处理数据的操作
3. 代码补全场景的挑战
4. 代码智能产品的发展趋势
5. 未来产品和模型共同演进的生态