OpenMP入门

这篇博客提供了OpenMP的学习资源,包括GitHub上的LaTeX示例和官方指南。介绍了OpenMP的offload模式,特别是关于21.2.8 OMP_TARGET_OFFLOAD的部分,并提到了SIMD指令在并行计算中的应用。此外,还讨论了GNU编译器的优化选项,如-O3、-mavx等,以及与循环展开相关的参数。

GitHub - OpenMP/Examples: LaTeX Examples Document Source

学习的话,可以看这些例子。

应该是基础的例子。

2)Home - OpenMP

官网的内容应该是最全的。

各种指南:

Specifications - OpenMP

测试基准:

OpenMP Benchmarks - OpenMP

3)offload模式,好像4.5还是5.0就有

21.2.8 OMP_TARGET_OFFLOAD . . . . . . . . . . . . . . . . . . . . . . . . . . 610

28 SIMD instruction A single machine instruction that can operate on multiple data elements. 29 SIMD lane A software or hardware mechanism capable of processing one data element from a 30 SIMD instruction. 31 SIMD chunk A set of iterations executed concurrently, each by a SIMD lane, by a single thread by 32 means of SIMD instructions.

不知道SIMD效果怎么样

4)GNU编译优化选项

“-O3 -mavx -flto -ffast-math -funroll-loops -fomit-frame-pointer -fprefetch-loop-arrays

与GCC 循环完全展开相关的参数有3 个:参数max-completely-peeled-insns
用来设置循环完全展开后指令数量的上限;参数max-completely-peel-times 用来设
置循环完全展开适用的目标循环的循环次数上限;参数max-completely-peel-loopnest-
depth 用来设置完全展开的循环嵌套深度。编译器为这些参数设置了缺省值,
可以通过命令行选项“--param name=value”修改这些参数的取值。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值