48次复乘重构计算极限：AlphaEvolve终结56年矩阵乘法优化史

最新推荐文章于 2026-06-20 13:31:49 发布

原创最新推荐文章于 2026-06-20 13:31:49 发布 · 1.3k 阅读

本内容遵循CC 4.0 BY-SA版权协议

标签

#重构 #矩阵 #线性代数 #人工智能 #机器学习

385 篇文章

订阅专栏

352 篇文章

订阅专栏

90 篇文章

订阅专栏

本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！

Strassen算法的里程碑（1969）
Strassen首次将4×4矩阵乘法的标量乘法次数从64次降至49次，核心是通过分块递归策略（将矩阵拆分为2×2子矩阵，递归应用7次乘法代替8次），复杂度降至 $O(n^{\log_2 7}) \approx O(n^{2.81})$ 。该记录保持56年未被突破。
AlphaEvolve的突破（2025）
谷歌DeepMind的AlphaEvolve通过自主进化搜索框架，发现仅需48次复乘的4×4矩阵乘法算法，打破数学界长期僵局。其意义不仅在于效率提升，更证明AI在纯数学领域可超越人类直觉局限。

往期文章推荐:

将矩阵乘法抽象为三阶张量 $T$ 的分解问题： $C_{ij} = \sum_k T_{ijk} A_{ik} B_{kj}$
目标是将 $T$ 分解为秩 $R = 48$ 的张量和（ $\sum_{r=1}^{48} u_r \otimes v_r \otimes w_r$ ），从而减少乘法次数。
复数域创新：利用复数运算的非交换性质（如虚部正交性）构造线性组合，例如：
$M_1 = (a_{11} + i a_{22})(b_{11} - b_{22})$ ，通过复数乘法整合实部与虚部，减少独立乘法需求。

进化搜索+LLM引导：
- Gemini Pro生成候选算法变体，通过复数运算自由组合（如非对称分块策略）。
- 进化算法筛选乘法更少的分块路径，突破Strassen的对称分块限制。
避免“对称性陷阱”：
传统方法依赖固定分块规则（如2×2），而AlphaEvolve无预设结构，探索非常规组合（如3×3与1×1混合分块），发现更优解。

graph LR
A[输入4×4复矩阵A, B] --> B[张量分解为48个秩1项]
B --> C[构造复数线性组合]
C --> D[计算48个中间积P<sub>k</sub>]
D --> E[重组得结果矩阵C]

示例中间积：
$P_1 = (A_{11} + A_{22}) \times (B_{11} + i B_{22})$ ，实部与虚部分离后参与后续加法。

通过代码实现三种算法对比：

算法	乘法次数	加法次数	误差范围
标准方法	64	48	无
Strassen (1969)	49	147	$10^{-12}$
AlphaEvolve	48	183	$10^{-16}$ （机器精度）

争议与挑战
- 实数场景效率：48次复乘等效144次实乘，高于Strassen的147次，实际需权衡复数转换开销。
- 工程落地：需重构BLAS库底层，且缓存局部性可能劣于传统方法。
未来演进
- 扩展至更大矩阵：AlphaEvolve在5×5/6×6矩阵尚未突破（搜索空间爆炸）。
- 人机协作优化：数学家定义高层约束（如对称性），AI搜索底层实现。