论文笔记 -- Tangram: Optimized Coarse-Grained Dataﬂow for Scalable NN Accelerators

最新推荐文章于 2025-09-12 12:29:45 发布

原创

最新推荐文章于 2025-09-12 12:29:45 发布 · 1.1k 阅读

·

2

·

目录

Tangram: Optimized Coarse-Grained Dataﬂow for Scalable NN Accelerators

Tangram: Optimized Coarse-Grained Dataﬂow for Scalable NN Accelerators

@(论文笔记)

1.Abstract

针对层内并行性提出了buffer sharing dataflow。可以将分布式buffer组织为一种共享的buffer，避免了数据的复制与访存。
针对层间的pipline,设计了一种alternate layer loop ordering的方法，可以将暂存的数据以一种更加粗粒化的方式进行传播，减小了buffer的需求和pipline延迟。
针对复杂的有向无环结构（google net）做了优化。

2.Introduction

提出了两个问题：

Parallelizing a single NN layer (intra-layer parallelism) leads to signifcant data duplication 层内的卷积并行化导致了很多数据的复制（从一个buffer复制到另一个buffer）
pipeliningthe processing of multipl

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

love小酒窝 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。