LWC528476501
码龄15年
求更新 关注
提问 私信
  • 博客:10,686
    社区:71
    10,757
    总访问量
  • 11
    原创
  • 66
    粉丝
  • 25
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
加入CSDN时间: 2011-09-08

个人简介:AI算法工程师

博客简介:

LWC528476501的专栏

博客描述:
我的大学
查看详细资料
个人成就
  • 获得202次点赞
  • 内容获得1次评论
  • 获得205次收藏
  • 博客总排名153,843名
  • 原力等级
    原力等级
    2
    原力分
    115
    本月获得
    0
创作历程
  • 6篇
    2025年
  • 5篇
    2024年
成就勋章
TA的专栏
  • 论文阅读
    4篇
  • 部署
    1篇

TA关注的专栏 5

TA关注的收藏夹 0

TA关注的社区 4

TA参与的活动 0

兴趣领域 设置
  • 人工智能
    计算机视觉目标检测深度学习神经网络自然语言处理cnntensorflowkeras生成对抗网络pytorchtransformerbert视觉检测nlp分类stable diffusionchatgpt
创作活动更多

「谁说嵌入式只是调包和焊板子?」—— 2026嵌入式全栈技术征锋令

谁说嵌入式只会“Ctrl+C 调包”和“拿电烙铁焊板子”?2026嵌入式全栈技术征锋令正式启幕! 本次活动专为硬核硬件/软件开发者打造,无论你是刚玩转裸机外设的萌新,还是精通RTOS调度、死磕底层驱动的行业老手,亦或是执掌系统架构的大神,这里都是你证明实力的舞台! 拒绝表面功夫,每一行代码,都有撬动硬件的力量!晒出你的硬核工程实战,为嵌入式开发者的全栈硬实力正名!

210人参与 去参加
  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

Baichuan-M2论文精读(下)- 数据与训练、评估、推理与优化、结论、限制与未来工作

Baichuan-M2论文精读(下)- 数据与训练、评估、推理与优化、结论、限制与未来工作
原创
博文更新于 2025.10.14 ·
1902 阅读 ·
39 点赞 ·
0 评论 ·
36 收藏

Baichuan-M2论文精读(上)-摘要、验证系统

本文提出Baichuan-M2医疗大模型系统,通过创新的动态验证框架解决了医学LLM在静态基准测试与实际临床应用的性能差距问题。该系统包含两大核心组件:基于去标识化病历的高保真患者模拟器,能生成逼真临床场景;以及临床评分标准生成器,可动态构建多维评估指标。在此基础上开发的320亿参数模型采用改进的GRPO算法进行多阶段强化学习训练,在HealthBench基准测试中超越多数开源和闭源模型,仅次于GPT-5。研究表明,这种强调动态交互的验证系统对提升模型临床适用性具有关键作用,为医疗AI发展提供了新范式。
原创
博文更新于 2025.10.11 ·
980 阅读 ·
7 点赞 ·
0 评论 ·
29 收藏

DeepSeek-R1论文总结与翻译

DeepSeek-R1论文总结与翻译
原创
博文更新于 2025.10.10 ·
1078 阅读 ·
26 点赞 ·
0 评论 ·
10 收藏

Baichuan-M2 论文总结

Baichuan-M2研究摘要:论文提出新型动态验证框架,构建320亿参数医疗增强推理模型。核心创新包括:1)患者模拟器与临床评分标准生成器组成的交互式强化学习系统;2)三阶段训练流程(中期训练、SFT、RL),采用医疗/通用/数学语料混合训练;3)基于GRPO算法的多阶段RL优化。评测显示,该模型在医疗领域表现优于主流闭源模型,在困难任务中提升显著,同时保持通用能力。不足在于边缘场景的响应稳定性及工具调用能力待优化。研究为医疗AI提供了可扩展的验证框架和训练范式。
原创
博文更新于 2025.10.10 ·
840 阅读 ·
29 点赞 ·
0 评论 ·
11 收藏

Qwen3 技术报告

Qwen3技术报告,包含创新点、训练流程、训练数据和评测结果
原创
博文更新于 2025.07.01 ·
1125 阅读 ·
19 点赞 ·
0 评论 ·
28 收藏

DeepSeek-R1部署

DeepSeek-R1部署
原创
博文更新于 2025.03.20 ·
796 阅读 ·
9 点赞 ·
0 评论 ·
30 收藏

ModuleNotFoundError: No module named ‘train.tuner‘

错误:ModuleNotFoundError: No module named 'train.tuner';原因:py文件名称和文件夹名称重名(有一个文件名叫train.py,还有一个文件名叫train)修改:修改文件名及其引用(或修改文件夹名称及其引用)
原创
博文更新于 2024.10.28 ·
274 阅读 ·
3 点赞 ·
0 评论 ·
0 收藏

服务器上使用jupyter notebook时,不显示虚拟环境

【代码】服务器上使用jupyter notebook时,不显示虚拟环境。
原创
博文更新于 2024.09.04 ·
259 阅读 ·
3 点赞 ·
0 评论 ·
0 收藏

json的load/loads/dump/dumps

转换数据格式以finetuning glm时,发现对json的load、loads、dump、dumps不太熟悉,特此记录。json.load() 传入文件路径,用于将整个文件内容转换为python对象。json.loads()需传入字符串,用于将字符串转换为python对象。json.dumps()将python对象保存为json字符串。json.dump()将python对象一次写入json文件。
原创
博文更新于 2024.07.18 ·
604 阅读 ·
11 点赞 ·
0 评论 ·
11 收藏

pip和conda下载包到本地并安装

pip download -d 保存路径 nvidia-tensorflow[horovod]==1.15.2 -i https://pypi.tuna.tsinghua.edu.cn/simple。pip download -d 保存路径 nvidia-pyindex==1.0.9 -i https://pypi.tuna.tsinghua.edu.cn/simple。pip install --no-index --find-links=存储包的文件夹 -r requirements.txt。
原创
博文更新于 2024.06.26 ·
1307 阅读 ·
10 点赞 ·
0 评论 ·
12 收藏

YOLOv10: Real-Time End-to-End Object Detection

它能当作高效的基础构建块,例如,嵌入在ELAN结构(图3(b)).然后,我们提倡采用一种秩导向的块分配策略,以在保持竞争能力的同时达到最佳效率。Yolos 对非最大抑制(NMS)的依赖阻碍了端到端部署,并对推理延迟产生了不利影响,此外,YOLOs 中各组件的设计缺乏全面、彻底的检查,导致了明显的计算冗余,限制了模型的能力。然而,它显示出较高的计算复杂度和内存占用。为了验证改进的监督对齐,训练后统计了一对多结果的前1/5/10与一对一匹结果匹配的数量,如图2(b)所示,在一致性匹配度量下,对齐有了提升。
原创
博文更新于 2024.06.25 ·
1522 阅读 ·
46 点赞 ·
1 评论 ·
38 收藏

模拟飞机追击问题

发布资源 2012.05.08 ·
cpp