RWKV社区五月动态:RWKV-7 G1g模型发布,10篇论文

欢迎大家收看《RWKV 社区最新动态》,本期内容收录了 RWKV 社区 2026 年 5 月的最新动态。

5 月动态省流版(TL;DR)

  1. RWKV 模型新闻动态

    • RWKV-7 G1g 系列模型发布,各项能力持续提升
  2. RWKV 学术研究动态

    • PLM-NIDS: A Protocol-Language Model for Network Intrusion Detection from Raw Packet Sequences Using RWKV State-Space Models(网络入侵检测协议语言模型,发表于中科院一区 TOP 期刊 TCSVT)
    • SCRWKV: Ultra-Compact Structure-Calibrated Vision-RWKV for Topological Crack Segmentation(超紧凑结构校准裂缝分割网络,发表于 CCF A 类会议 ICML 2026)
    • C2F-VRWKV: A Lightweight Clustering-Aware and Cross-Frequency-Enhanced Vision-RWKV Network for Ship Detection in Remote Sensing Scenarios(遥感图像船舶检测网络,发表于中科院一区 TOP 期刊 IEEE TGRS)
    • TemLo: Temporal-Local Synergy Enhanced RWKV for Audio-Visual Segmentation(音视频分割框架,发表于 JCR Q1 期刊 IEEE TMM)
    • DCAF: Dynamic Affective Consistency-Aware Fusion with Disentangled Modality Representations for Multimodal Sentiment Analysis(多模态情感分析融合框架,发表于 JCR Q1 期刊 Neurocomputing)
    • PHMRNet: Persistent Homology Based Mamba-RWKV Network for LiDAR Place Recognition(LiDAR 场景识别网络,发表于 JCR Q1 期刊 IEEE RA-L)
    • SANet: Structure-Aware Deep Unfolding Network for Face Super-Resolution with Global-Local Modeling(人脸超分辨网络)
    • FRWKV+: Adaptive Periodic-Position Branch Interaction for Frequency-Space Linear Time Series Forecasting(增强型频域时序预测模型)
    • Wavelet-Decoupled Spatiotemporal Network for Stock Return Prediction(股票收益预测小波解耦时空网络)
    • Rapid and High-Accuracy Three-Dimensional Airborne Transient Electromagnetic Forward Modeling Based on Machine Learning(3D 航空瞬变电磁正演建模方法)
  3. RWKV 社区项目动态

    • rwkv-metal(在 ios 上训练和微调 RWKV 的框架)
    • RWKV-ECRA(RWKV 长文本分析)

RWKV 模型新闻动态

2026 年 5 月, RWKV-7 G1g 系列推理模型开源发布,目前已发布 G1g 13.3B/7.2B/2.9B/1.5B 模型,7.2B 大小就能完成很多代码任务,13.3B 效果显著更好,同时在 uncheatable eval 的成绩随时间持续提升。

实战效果展示

web

uncheatable eval

uncheatable-13B

uncheatable-7B

uncheatable-3B

uncheatable-1B5

RWKV 学术研究动态

PLM-NIDS

  • 论文名称:PLM-NIDS: A Protocol-Language Model for Network Intrusion Detection from Raw Packet Sequences Using RWKV State-Space Models
  • 论文链接:https://arxiv.org/abs/2606.00155
  • 发布日期:2026-05-29

提出PLM-NIDS协议语言模型用于无需深度包检测的网络入侵检测,将网络流量视为由L3/L4包元数据(长度、到达间隔、TTL、TCP标志等)构成的语言并使用RWKV-4状态空间模型学习良性流量语法结构,通过逐流困惑度分数在零攻击标签下区分正常与攻击流量达到PR-AUC=0.93,RWKV的O(T)推理复杂度支持逐包流式线速处理且天然兼容TLS1.3/QUIC等加密协议。

实现逐包流式线速处理网络入侵检测,天然兼容加密协议,发表于中科院一区 TOP 期刊 TCSVT。

20260529-PLM-NIDS

SCRWKV

  • 论文名称:SCRWKV: Ultra-Compact Structure-Calibrated Vision-RWKV for Topological Crack Segmentation
  • 论文链接:https://arxiv.org/abs/2605.14926
  • 发布日期:2026-05-14

提出SCRWKV超紧凑结构校准Vision-RWKV裂缝分割网络,Structure-Field Encoder骨干集成自适应多尺度级联调制器增强纹理表示,结构校准洞察单元通过几何引导双向结构变换捕获拓扑相关性,仅1.22M参数在TUT数据集上达到F1=0.8428。

以超低参数量(1.22M)实现高效裂缝拓扑分割,发表于 CCF A 类会议 ICML 2026。

20260514-SCRWKV

C2F-VRWKV

  • 论文名称:C2F-VRWKV: A Lightweight Clustering-Aware and Cross-Frequency-Enhanced Vision-RWKV Network for Ship Detection in Remote Sensing Scenarios
  • 论文链接:https://ieeexplore.ieee.org/abstract/document/11520379
  • 发布日期:2026-05-14

提出C2F-VRWKV轻量级聚类感知跨频率增强Vision-RWKV网络用于遥感图像船舶检测,C2-VRWKV骨干集成上下文聚类机制在线性复杂度扫描范式中聚合局部细粒度形态特征,跨频率融合模块采用频率引导交叉注意力策略解耦并强调船舶轮廓纹理同时抑制环境噪声,双流多频率注意力模块利用先验引导机制分离前景船舶特征与背景杂波,仅0.53M参数在Airbus-Ship数据集达到78.23% mAP。

仅用 0.53M 参数即可在复杂遥感场景中实现高精度船舶检测,发表于中科院一区 TOP 期刊 IEEE TGRS。

20260514-C2F-VRWKV

TemLo

  • 论文名称:TemLo: Temporal-Local Synergy Enhanced RWKV for Audio-Visual Segmentation
  • 论文链接:https://ieeexplore.ieee.org/abstract/document/11523565
  • 发布日期:2026-05-18

提出TemLo时序局部协同增强RWKV框架用于音视频分割,引入模态特定RWKV编码器捕获各流内的显著时空动态以降低模态内噪声和歧义,设计声学调制金字塔促进多尺度时空结构化音视觉交互丰富音频感知语义表示,提出视觉引导模态注入器确保时间一致且语义对齐推理,在AVS基准测试中建立新SOTA且使用PVT-v2骨干时在MS3数据集上MJ和MF分别提升10.28%和3.66%。

显著降低模态内噪声,在音视频分割基准测试中建立新 SOTA,发表于 JCR Q1 期刊 IEEE TMM。

20260518-TemLo

DCAF

  • 论文名称:DCAF: Dynamic Affective Consistency-Aware Fusion with Disentangled Modality Representations for Multimodal Sentiment Analysis
  • 论文链接:https://www.sciencedirect.com/science/article/abs/pii/S0925231226010520
  • 发布日期:2026-04-20

提出DCAF动态情感一致性感知融合框架处理多模态情感分析中的模态差距和情感冲突问题,采用跨模态正交解耦学习(CODL)通过三模态交叉注意力机制和监督对比目标桥接模态差距,设计一致性引导单模态标签推导(CULD)在双平面几何约束下缓解样本内情感冲突,利用RWKV实现线性效率并在三个基准测试达到SOTA结果。

有效解决多模态情感分析中的模态差距与情感冲突问题并达到 SOTA,发表于 JCR Q1 期刊 Neurocomputing。

20260420-DCAF

PHMRNet

  • 论文名称:PHMRNet: Persistent Homology Based Mamba-RWKV Network for LiDAR Place Recognition
  • 论文链接:https://ieeexplore.ieee.org/abstract/document/11480752
  • 发布日期:2026-04-13

提出PHMRNet持久同调Mamba-RWKV网络用于LiDAR场景识别,将持久同调提取的拓扑信息作为拓扑感知采样通道补偿2D范围视图投影丢失的几何细节,引入时空融合模块链接跨帧拓扑与范围视图特征提升时空一致性,在公开数据集上显著提升描述符鲁棒性。

利用拓扑感知补偿几何细节丢失,显著提升 LiDAR 场景识别的鲁棒性,发表于 JCR Q1 期刊 IEEE RA-L。

20260413-PHMRNet

SANet

  • 论文名称:SANet: Structure-Aware Deep Unfolding Network for Face Super-Resolution with Global-Local Modeling
  • 论文链接:https://ieeexplore.ieee.org/abstract/document/11536060
  • 发布日期:2026-05-27

提出SANet结构感知深度展开网络用于人脸超分辨,将人脸重建任务建模为显式优化问题并迭代展开为可解释深度神经网络,在近端算子中嵌入结构感知RWKV模块利用线性复杂度架构实现高效全局上下文建模,设计结构感知可变形偏移机制根据面部结构动态调整空间聚合模式以保留细粒度面部几何细节,在基准数据集的定量指标和视觉质量上均超越现有SOTA方法。

20260527-SANet

FRWKV+

  • 论文名称:FRWKV+: Adaptive Periodic-Position Branch Interaction for Frequency-Space Linear Time Series Forecasting
  • 论文链接:https://arxiv.org/abs/2605.15690
  • 发布日期:2026-05-15

提出FRWKV+增强型频域时序预测模型,基于RWKV架构引入跨分支门控交换实部虚部频率流上下文,采用自适应相位门机制提供信任控制的有符号周期位置校正,在匹配种子评估中实现FRWKV家族最大MSE胜出覆盖率。

20260515-FRWKV+

WaveDSTN

  • 论文名称:Wavelet-Decoupled Spatiotemporal Network for Stock Return Prediction
  • 论文链接:https://www.mdpi.com/1099-4300/28/5/548
  • 发布日期:2026-05-07

提出WaveDSTN小波解耦时空网络用于股票收益预测,利用小波变换将股票收益分解为高频短期波动和低频长期趋势分量,设计双路径时空编码器捕获动态时序依赖和跨股票信息传播,在保持时间序列因果一致性的同时显著提升预测准确率。

20260507-WaveDSTN

3D Airborne TEM Forward Modeling

  • 论文名称:Rapid and High-Accuracy Three-Dimensional Airborne Transient Electromagnetic Forward Modeling Based on Machine Learning
  • 论文链接:https://agupubs.onlinelibrary.wiley.com/doi/full/10.1029/2025JH001181
  • 发布日期:2026-04-29

提出基于RWKV的3D航空瞬变电磁正演建模深度学习方法,采用双向加权键值(Bi-WKV)机制以线性复杂度捕获三维地电结构几何关系与连续性,引入收发高度调制机制适应飞行高度变化,在包含断层和褶皱的大规模数据集上实现1秒内高精度正演计算。

20260429-3D Airborne TEM Forward Modeling

RWKV 社区项目动态

rwkv-metal

基于 MLX 在苹果自研芯片(M 系列)上训练和微调 RWKV-7。手写的 Metal 内核实现 WKV-7 的循环结构,并采用带检查点的反向传播,训练速度快,且能适配统一内存。

rwkv-metal

项目链接:https://github.com/RafaelUI/rwkv-metal

RWKV-ECRA

基于 RWKV 的端云协同长文本分析 Agent,使用任意大模型来规划,然后由 RWKV 总结/压缩长文本,同时由 RWKV 来查找细节和事实性内容,最终由大模型形成报告,在减少约 90% 大模型 token 消耗的情况下,达到全程由大模型执行相同的效果。

RWKV-ECRA

项目链接:https://github.com/ehooon/RWKV-ECRA

加入 RWKV 社区

欢迎大家加入 RWKV 社区,可以从 RWKV 中文官网了解 RWKV 模型,也可以加入 RWKV 论坛、QQ 频道和 QQ 群聊,一起探讨 RWKV 模型。

  • 📖 RWKV 中文文档:https://www.rwkv.cn
  • 💬 RWKV 论坛:https://community.rwkv.cn/
  • 🐧 QQ 频道:https://pd.qq.com/s/9n21eravc | QQ 交流群:224287095
  • 📺 BiliBili 视频教程:https://space.bilibili.com/3546689096910933
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值