
你好!作为 SeekInsight 的“首席架构师”,我很乐意为你复盘这段极具启发性的开发历程。
我们共同构建的不只是一个代码编辑器,而是一个**“从原始数据到决策洞见”的全链路闭环工具**。以下是基于我们多次迭代后的深度总结:
第一部分:SeekInsight 历史设计与特性总结
1. 核心功能特性 (Feature Set)
-
多维数据空间 (Notebook Hub):采用类似 NotebookLLM 的架构,每个项目拥有独立的数据库沙箱,支持多 Notebook 管理与持久化。
-
异构数据接入 (Data Ingestion):
-
支持 CSV、Excel、TXT 格式上传。
-
TXT 结构化: 自动将纯文本按段落拆分,转换为 (id, content) 结构供 SQL 检索。
-
编码自适应: 内置 UTF-8 / GB18030 (GBK) 自动探测 waterfall 逻辑。
-
-
双引擎协同开发 (Dev Mode):
-
SQL 工作台: ANSI SQL 兼容,支持复杂的 CTE 语法,AI 辅助生成与纠错。
-
Python 工作台: 内置数据桥接逻辑(Bridge Code),支持 Pandas 处理及 Plotly 交互式绘图。
-
-
AI 洞察枢纽 (Insight Hub):
-
主动式启发: 根据表结构自动“脑暴”出 SQL 和 Python 分析建议。
-
语义推理: 自动为上传的模糊字段名生成中文语义备注。
-
-
数据发布系统 (Publish Panel):
-
智能图表推荐: AI 自动分析结果集,决定使用柱状、折线、饼图或面积图。
-
executive 分析报告: 自动生成 Markdown 格式的业务摘要。
-
2. 交互细节设计 (UX/UI Details)
-
Unicode 宽容设计: 表名清理逻辑支持 \p{L} (Unicode 字母),完美兼容中文文件名。
-
编辑器深度增强: 实现基于 PrismJS 的语法高亮、行号显示、Tab 缩进处理。
-
响应式布局: 结果面板支持拖拽缩放(Resize Handle),适应不同屏幕。
-
可视化反馈:
-
上传大文件时的微进度条。
-
AI 生成时的“Reverting AI Change”撤销机制。
-
Insight Hub 的“新建议”红点通知。
-
-
部署态模拟: 模拟 Serverless 发布流程,增强“数据开发平台”的沉浸感。
第二部分:SeekInsight 终极 Prompt 系统说明书
如果我们需要让 AI 一次性高水平复刻 SeekInsight,你应该使用以下这份**“架构级指令”**。
提示词说明:如何构建 SeekInsight 2.0
**【角色设定】**你现在是一名资深全栈工程师与数据产品专家。你的目标是构建一个名为 SeekInsight 的数据分析平台,其核心价值是“让非专业人士通过 AI 驾驭数据库”。
【技术栈规范】
-
Frontend: React (ESM), Tailwind CSS, Lucide Icons.
-
Backend: Node.js Express Gateway, MySQL (OceanBase) 物理存储。
-
Core Logic: sql.js (可选本地模拟), xlsx (文件处理), TextDecoder (多编码).
-
AI Logic: Gemini / Aliyun Qwen 接口,负责 Code Gen, Metadata Infer, Suggestions.
【模块化需求说明】
-
数据接入层 (The Gatekeeper):
- 实现一个支持多格式上传的 Sidebar。对于 TXT 文件,必须包含编码探测逻辑(尝试 UTF-8 失败后回退至 GB18030),并将其按空行切分为段落表。表名需经过 Unicode 正则清理,允许中文。
-
双模编辑器 (Dual-Engine Workspace):
-
SQL 模块: 必须具备 AI Prompt 输入框、代码高亮编辑器、Undo AI 按钮。
-
Python 模块: 注入一段 Bridge Code。这段代码必须预定义 sql(query) 函数返回 Pandas DataFrame,并预定义 forge_plotly(fig) 拦截绘图输出并打印 JSON 标记位,以便前端 Plotly 渲染。
-
-
结果处理层 (The Lab):
-
结果展示面板必须支持 Table、Console、Plot (Plotly) 三种视图切换。
-
面板高度需支持鼠标拖拽动态缩放。
-
-
AI 智能层 (The Intelligence):
-
Insight Hub: 开发一个主动建议系统。AI 需读取当前所有表的 Schema,生成 4 个 SQL 建议和 4 个 Python 建议。
-
Publish Panel: 结果生成后,异步调用 AI 生成一份 Markdown 业务报告,并根据结果集
-


281

被折叠的 条评论
为什么被折叠?



