1、Database Copilot 在数据库领域的应用李粒,PingCAP AI LabAgenda数据库运维领域的挑战LLM 带来的机遇PingCAP 的实践Database Copilot 的未来挑战数据库运维领域的挑战来自业务的挑战故障恢复数据规模增长更低的延迟在线分析来自业务的挑战数据规模增长更低的延迟来自业务的挑战数据规模增长更低的延迟最佳实践选用更合适的数据库设计库表结构索引优化并发控制内存管理HintBinding来自业务的挑战TiDB Cloud 文档:582TiDB 文档:1095数据规模增长更低的延迟来自业务的挑战在线分析来自业务的挑战在线分析HTAPPMFinanceOpe
2、rationMarketing不熟悉 SQL来自业务的挑战故障恢复来自业务的挑战故障恢复MetricsLogsQueriesProfilingTiDB1000+1000+/sSlow QueriesSQL StatementTopSQL1min来自业务的挑战故障恢复数据规模增长更低的延迟在线分析数据库是一个复杂系统,难以被用户完全掌握LLM 带来的机遇过去的方法(传统 AIOPS)Rule-Based/ML/DLhttps:/ 带来的新能力In-context Learning ReasoningCoding/SQLFunction CallRule-Based/DL/RL任务复杂度任务泛化能
3、力LLM Capability(Corpus+API+Code+Loop)一些概念概念-LLM 应用类型https:/ 作为路由器,参与到流程判断中,判断需要使用的工具、召回、逻辑路径等。人类的业务代码人类提供Agent(Loop)多次调用产出LLM 可以重复进行某些循环步骤,以确保流程能够持续进行,或确保结果满足人类最初的目标。人类提供基本逻辑和提示,LLM 根据人类逻辑进行优化和调整,自主完成流程。人类提供Autonomous Agent多次调用产出LLM 可以重复进行某些循环步骤,以确保流程能够持续进行,或确保结果满足人类最初的目标。LLM 自主完成所有行动流程的初始化、工具接入、流程执
4、行。人类提供Silicon-based Life多次调用产出LLM 可以重复进行某些循环步骤,以确保流程能够持续进行,或确保结果满足人类最初的目标。LLM 自主完成所有行动流程的初始化、工具接入、流程执行。基于反馈,LLM 自主发起和确认每一次行动的目标概念-什么是 Copilot?https:/ 的实践应用场景/已有工作/数据飞轮数据库常见的 LLM 应用场景ChatBotNL2SQL数据库诊断面向用户PingCAP AI Lab-LLM 技术逻辑框架PingCAP LLM 应用的业务架构Chatbot-来自业务的挑战数据规模增长更低的延迟TiDB Cloud 文档:582TiDB 文档:1
5、095Chatbot App-FlowChatbot App 的毒性检测毒性检测对齐使人工通用智能(AGI)与人类价值观保持一致,并遵循人类意图。引自 OpenAI,2022,Our approach to alignment research有害内容当代文本生成模型能够生成有害语言,包括仇恨言论、侮辱、亵渎和威胁。这些危害通常被归类为“有害内容”这一总称。引自 Deepmind,2021,Challenges in Detoxifying Language Models即插即用语言模型(PPLM)Chatbot App 的毒性检测Chatbot 的毒性检测Chatbot App 的毒性检测C
6、hatbot App 的语料增强 分类数量百分占比超出应答范围98.74%错误检索结果6058.25%没有相关文档2322.33%LLM 幻觉1110.68%总共103100%最初 300 个问题的反馈Chatbot App 的语料增强RAGHuman:Whats TiDB Cloud?RankChunkScore1TiKV is.0.912TiDB is.0.873TiFlash is.0.834PD is.0.815TiUP is.0.796TiDB Cloud is.0.77RetrieveChatbot App 的语料增强ReRankDocumentation CorporaAdjus