IBM Planning Analytics的稀疏优化-CSDN博客

IBM Planning Analytics（其核心是TM1）的稀疏优化，是其能以内存数据库架构处理海量数据的根本原因。它主要包含两大支柱：稀疏内存管理与稀疏聚合算法。

🧠 稀疏内存管理：只存储有数据的单元格

这是TM1高效利用内存的基础。TM1使用稀疏内存管理方案，在存储多维数据集时，只会为有数据（非零）的单元格分配内存。

效果：由于业务数据通常非常稀疏（有数据的单元格占比很低），这种机制能用远少于传统关系型数据库的空间，在服务器的RAM中容纳超大规模的数据集。

⚡️ 稀疏聚合算法：“拉”模式与`SKIPCHECK`

当需要查看汇总数据时，TM1采用“拉”（Pull）模式。也就是说，它不会预先计算并存储所有可能的汇总结果，而是只在用户查询时才进行计算。

默认行为与问题：对于没有规则（Rules）的普通立方体，TM1默认使用稀疏聚合算法，能快速跳过空单元格完成计算。但一旦为立方体定义了规则（比如“销售额 = 单价 * 数量”），为了确保计算出的数据不被遗漏，TM1会关闭这个优化算法。这会导致它在聚合时检查每一个单元格，即使是海量空单元格也要遍历一遍，性能会急剧下降。
解决方案：SKIPCHECK：要恢复高性能，需要在规则文件开头加入 SKIPCHECK; 声明。这行命令告诉TM1：“重新启用稀疏聚合优化，跳过空单元格”。

🔗 规则计算的“地图”：`FEEDERS`（ feeders ）

但是，启用SKIPCHECK后，TM1为了速度会“无视”所有空单元格，包括那些由规则计算出来的单元格。如果这些单元格被跳过，汇总结果就会出错。

FEEDERS就是解决这个矛盾的关键。它像一张“地图”，提前告诉TM1的聚合引擎：“这些由规则计算出的单元格，在未来可能会有值，请不要跳过它们”。

FEEDERS的工作原理是在规则文件中用FEEDERS;声明，并定义从“源”到“目标”的指向。

一个简单的规则与Feeder示例

规则定义了计算逻辑：

text
['Revenue'] = N: ['Price'] * ['Quantity'];
而Feeder则指明了计算的发生地：

text
FEEDERS;
['Price'] => ['Revenue'];
['Quantity'] => ['Revenue'];
它的意思是：“只要Price或Quantity中任何一个有值，就去Revenue对应的单元格做一个标记，告诉TM1聚合时别忘了它。”

🚀 其他性能优化手段

安全优化：对于权限控制立方体（Security Cube），可在Tm1s.cfg配置文件中启用PrivilegeGenerationOptimization=T参数。这能让TM1在加载时只读取安全立方体中有数据的单元格，显著缩短数据库的加载时间。
多线程查询 (MTQ)：通过在Tm1s.cfg中配置MTQ参数，可以让TM1利用服务器的多核CPU来并行处理查询，从而大幅提升复杂查询的响应速度。