Skip to content

数据探索

数据探索是 MOI 平台提供的跨多模态文件智能检索与问答能力。该功能支持同时从多个文件(包括文档文件和表对象)中检索信息,并生成智能总结。数据探索旨在帮助用户在海量、多类型文件中高效定位信息、查阅内容、获取回答,甚至进行复杂数据分析。

智能检索与对话

进入工作区后,依次点击数据管理 > 数据探索,进入检索界面。点击右上角的选择文件/表来添加检索对象。一次检索可跨多个文件、多个模态,并支持多轮对话持续参考上下文。

Note

仅已完成嵌入的文件参与检索,禁用的分段不会进入召回范围。

若文件选择中包含表对象,输入问题会触发结构化查询(NL2SQL)。

NL2SQL 能力增强组件(可配置)

为了让模型准确理解用户的自然语言问题,并将其转换为正确的 SQL,需要为模型补充足够的 "业务知识上下文"。以下是相关的配置功能模块。

点击数据探索页面右上角的设置按钮,进入配置界面。

名词解释

用于定义业务术语及指标口径。为了帮助 MOI 更好地理解您在数据分析中的目标表达,您可以将常见表述中涉及到的专有名词、指标计算口径等信息在此录入。

示例:

  • GMV:已支付订单 price × quantity 之和
  • 有效订单:订单状态为(已支付、已发货、已完成)

同义词

用于绑定多个叫法到同一字段。为了帮助 MOI 更好地理解您在数据分析中的目标表达,您可以配置常见表述中涉及到的各名词及其同义词。每个标准词可绑定到具体表字段。

示例:

  • 销售额 ≈ 营收 / 流水 / GMV
  • 用户 ≈ 客户 / 会员

业务逻辑

用于描述复杂规则,可设置为系统智能判断和全局生效。您可以将业务口径的逻辑定义、专有名词、指标计算口径等信息在此录入,帮助 MOI 更好地理解自然语言问题中的业务知识。

示例:

  • "近期" = 最近 7 天
  • 全局排除 test_user_001、test_user_002

优化案例管理

优化案例管理提供通配符管理与案例库管理两项能力。通配符需与案例库配合使用,请先添加通配符,再添加案例库。

通配符将可变参数抽象化,提高案例复用率。

示例:

  • {城市} = 北京、上海、广州、深圳
  • {产品线} = 手机、电脑、穿戴设备

案例库添加问法与标准 SQL 的映射,用于直接指导模型生成 SQL。

示例:

  • 问法:查询 {城市} 的 {产品线} 销售额
  • SQL:
SELECT SUM(total_amount)
FROM sales_orders
WHERE city = '${城市}' AND product_line = '${产品线}';