TwinBI:一种用于商业智能仪表盘高效增强交互的智能数字孪生框架
TwinBI 是一种智能数字孪生框架,通过将基于LLM的代理系统与可执行的BI仪表盘状态相结合,统一了对话交互、仪表盘操作、语义锚定和溯源跟踪。在A/B测试中,它将精确匹配准确率从43.3%提升至63.3%,部分匹配准确率从48.3%提升至70.8%,并将超时率从40.0%大幅降低至10.0%。用户研究也证实了集成仪表盘与聊天工作流在任务准确性和工作负载方面的优势。
商业智能(BI)领域正越来越多地将仪表盘交互与基于大语言模型(LLM)的辅助功能相结合。然而,在多步分析过程中,这两种模式常常出现不同步的情况。当用户在直接操作仪表盘和使用自然语言查询之间切换时,很难在过滤器、层次结构、指标和图表上下文中保持一致的分析状态。为了解决这一挑战,研究人员提出了 TwinBI,这是一种智能数字孪生框架,它将基于LLM的代理系统与一个可执行的BI仪表盘状态相耦合。
TwinBI 的核心创新在于通过一个共享的分析状态来统一对话交互、仪表盘操作、语义锚定和溯源跟踪。这个共享状态是从统一交互日志中重建的,从而确保了整个分析过程的一致性。此外,TwinBI 还提供了一系列工件,包括模式视图、SQL、日志以及一个 /insights 命令,用于生成基于状态的分析摘要。
为了评估 TwinBI 的有效性,研究团队采用了两种互补的方法。在受控的 A/B 基准测试中,使用相同的骨干代理,与仅使用仪表盘的模式相比,TwinBI 将精确匹配准确率从43.3%提升到了63.3%,部分匹配准确率从48.3%提升到了70.8%,并且将超时率从40.0%大幅降低到了10.0%。在用户可用性研究中,参与者从集成的仪表盘和聊天工作流中获益,表现出高任务准确率、中等工作负载,并对状态感知交互机制给出了良好的评价。
这些结果充分表明,TwinBI 通过将可视化的仪表盘状态转化为更丰富的可操作上下文,既提高了代理级别的分析可靠性,也增强了面向用户的分析支持。研究团队已在 GitHub 上公开了数据集和源代码,供社区进一步探索和验证。