《徐普航-从研发视角聊聊字节跳动的+AI+IDE+win .pdf》由会员分享,可在线阅读,更多相关《徐普航-从研发视角聊聊字节跳动的+AI+IDE+win .pdf(38页珍藏版)》请在三个皮匠报告上搜索。
1、 豆包 MarsCode=(Cloud+IDE)徐普航字节跳动豆包 MarsCode 开发工程师目前从事 IDE 后端服务开发以及 IDE 能力定制化场景落地徐普航与文本编辑器对比代码高亮与智能补全即时的代码分析与错误提示便捷的调试、编译与运行能力较高的生态环境集成度不足语言支持较为专一庞大的体积与离谱的系统占用难以移植的开发环境复杂的使用对用户心智的负担(Cloud+IDE)美观、直观轻量化、极速、随时随地、多场景、跨终端云端开发环境!颠覆性的人机交互形态?人人都有一个代码搭子研发提效,更快的完成编码辅助决策,提供高质量回答AI 辅助编程 AI 驱动编程?开发者体验AI 原生加持+豆包 Ma
2、rsCode国内:海外:优势美观轻量化、极速的云 IDE部署能力集成AI 辅助编程吃自己的狗粮前后端部署托管能力,一键部署GPTs 插件场景,一键部署跨终端,随时随地可用秒级启动的云端开发环境支持浏览器、本地 IDE、iPad.支持多种编程语言模版,开箱即用支持多种场景组件化+灵活可定制,如 CozeIDE UI 结耦,可自由组装IDE Server 支持多种部署方式本地远程容器高密度集群 for 轻量化场景基础能力Editor 代码编辑区LSP 代码提示AI Inline Chat 代码生成扩展能力极速代码片段执行能力Input&OutputAPI 接口测试国内版本:https:/,海外版本
3、:https:/国内版本:https:/,海外版本:https:/基础能力Editor 代码编辑区LSP 代码提示AI Inline Chat 代码生成扩展能力云函数托管能力Console 日志面板包依赖管理API 接口元数据管理API 接口测试优势能力完备隔离性高、环境一致性秒级极速启动复杂度高,具备一定的技术门槛Cloud IDE 场景是一对一方式,且需要持久化存储,即实时的有状态调度而 K8S 面向的是非实时的无状态服务调度关键点深度定制调度能力池化能力、休眠策略存储热挂载流量调度Nix资源开销成本高,需专项优化云成本的构成1.工作负载成本:实际工作成本2.按时计费成本:如 EC2 机器
4、资源3.按量计费成本:如带宽等4.闲置成本:申请但并未实际使用的空闲成本5.间接成本:运维人力以及其它成本关键点成本审计深度定制调度策略,碎片整理,提升资源利用率智能休眠策略,更快的回收和冷启镜像优化,池化合并能力Responses:35,978(55%)研发提效-更快地完成编码辅助决策-提供高质量回答项目理解多维度理解项目代码信息,针对项目进行问答搜索联网搜索接入搜索引擎,提供即时、准确的研发信息自动修复针对 Bug 进行分析和规划,自主完成修复代码推荐继续预测用户下一步编码动作,修改代码代码补全补全光标后下一段代码代码生成根据自然语言生成所需代码通过自然语言来生成需要的代码形态:Side
5、Chat/Inline Chat交互方式仍在持续摸索迭代中。交互形态先行者:GitHub Copilot下拉列表选择 Ghost Text 展示优势发挥模型在多行补全上的优势符合直觉的,不改变用户习惯,与代码融为一体爽快的 Tab、Tab、Tab 即可采纳,正反馈强烈关键点高性能低延迟的模型Prompt EngineeringPrompt EngineeringContext 上下文提取性能精准1.离线评测HumanEval 在我们的场景下并不好,它的题目不匹配真实项目的代码补全场景,更适合用来做模型选型。构建真实的评测集很重要,在真实场景中,基于文本匹配和基于执行结果两种方式进行评测。2.在
6、线评测通过 A/B 测试来进行参数和策略的调整不能只看 采纳率=采纳次数/推荐次数,容易被误导,无法指导后续优化使用更合理的指标:CPO(Character per Opportunity)https:/ token 数)x(token 平均字符长度)展示概率采纳率平均文本长度尝试率:反映了 AI 实际为用户提供补全建议的频率。譬如:用户敲击了 10 次按键,只有其中 6 次触发了 AI 补全流程,那么尝试率是 6/10影响因子及优化手段更多的曝光机会:除了用户敲击字符时,还可以在用户选择 LSP 下拉建议后尝试建议。前置操作延迟:获取 IDE 上下文 Context 的策略和性能CPO=(尝