志豪Jeremy
码龄6年
求更新 关注
提问 私信
  • 博客:123,403
    123,403
    总访问量
  • 71
    原创
  • 32
    粉丝
  • 128
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:浙江省
加入CSDN时间: 2020-04-07
博客简介:

zhihao8013的博客

查看详细资料
个人成就
  • 获得189次点赞
  • 内容获得21次评论
  • 获得358次收藏
  • 博客总排名49,341名
  • 原力等级
    原力等级
    3
    原力分
    388
    本月获得
    0
创作历程
  • 4篇
    2026年
  • 11篇
    2025年
  • 16篇
    2022年
  • 40篇
    2021年
成就勋章
TA的专栏
  • LLM
    13篇
  • 强化学习
    12篇
  • 日常开发
    2篇
  • 深度学习
    1篇
  • ROS和PX4软件在环仿真
    18篇
  • 论文
    2篇
  • 无人机集群路径规划及避障
    4篇

TA关注的专栏 21

TA关注的收藏夹 0

TA关注的社区 4

TA参与的活动 1

创作活动更多

「谁说嵌入式只是调包和焊板子?」—— 2026嵌入式全栈技术征锋令

谁说嵌入式只会“Ctrl+C 调包”和“拿电烙铁焊板子”?2026嵌入式全栈技术征锋令正式启幕! 本次活动专为硬核硬件/软件开发者打造,无论你是刚玩转裸机外设的萌新,还是精通RTOS调度、死磕底层驱动的行业老手,亦或是执掌系统架构的大神,这里都是你证明实力的舞台! 拒绝表面功夫,每一行代码,都有撬动硬件的力量!晒出你的硬核工程实战,为嵌入式开发者的全栈硬实力正名!

212人参与 去参加
  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

LlamaFactory微调Qwen3-0.6B大模型实验整理——调一个人物领域专属的模型

这些问题可以来自公开资料、专业文献、论坛、教材等。:只加垂类数据集看看效果。:构造人物领域问题集。
原创
博文更新于 2026.01.23 ·
243 阅读 ·
5 点赞 ·
0 评论 ·
5 收藏

LlamaFactory微调Qwen3-0.6B大模型踩坑实验整理——调一个xx领域专属的人物模型

补充自我认知数据、人物数据对Qwen3-0.6B进行垂类微调。无法回答自我认知问题,training_loss=1.97。回答错误,training_loss=1.86。可能的原因:epoch少了。可能的原因:学习率高了。无法回答自我认知问题。
原创
博文更新于 2026.01.23 ·
1075 阅读 ·
22 点赞 ·
0 评论 ·
17 收藏

LlamaFactory微调Qwen3-4B大模型实验整理——调一个舰船领域专属的模型

用 DeepSeek-32B 在军事舰船领域“当老师”,生成带推理的问答数据,然后“教” Qwen3-4B 学会这个领域的专业知识和推理方式,从而得到一个轻量、专业、会思考的垂域小模型。
原创
博文更新于 2026.01.23 ·
721 阅读 ·
12 点赞 ·
2 评论 ·
13 收藏

bert-base-chinese-ner微调总结——针对“领域实体微调”及“增量实体微调”任务

如果你未显式提供标签映射,但训练数据中包含完整的 BIO 标签(如 “B-PER”, “I-LOC” 等),训练脚本Hugging Face Transformers 的 Trainer通常会在数据预处理阶段自动收集所有唯一标签,按字典序或出现顺序排序后生成 label2id 和 id2label,并更新到模型配置中。:新的数据集必须包含之前的PER/LOC/ORG/FAC/EVENT的数据,并且模型应该加载之前的checkpoint(即已经微调过5类的那个模型)目标都是按照9:1切分,并且能包含6类别;
原创
博文更新于 2026.01.16 ·
624 阅读 ·
24 点赞 ·
0 评论 ·
15 收藏

模型训练心得

举个直观的例子:如果大 batch 还用小学习率,就相当于“拿着精准地图却一步挪一毫米”,明明能快速到终点,却硬生生拖慢训练节奏。batch size 增大, learning rate 也要增大,batch size 变小, learning rate 也要减小。举个直观的例子:你要走到山谷最低点(最优解),步长太小会走得慢,大batch 的梯度更稳定,能支撑更大的学习率步长;但步长太大直接就跨到对面山坡上了,离最低点反而更远。举个直观的例子:把训练数据集看作一本练习册,
原创
博文更新于 2026.01.16 ·
235 阅读 ·
4 点赞 ·
0 评论 ·
0 收藏

LlamaFactory微调Qwen3-0.6B大模型步骤

(注:localhost:8103 指的是程序启动机器自身的8103端口,云上的用户可能无法通过本地的笔记本电脑直接访问,需要找云厂商获取域名和端口号的一些配置关系进行配置)4、加载自定义数据集,符合alpaca格式,并在dataset_info.json中进行注册。2、下载LLaMA-Factory-man项目。创建qwen3_0.6B.yaml,里面填入。1、下载Qwen3-0.6B大模型。6、验证微调后的模型效果。3、验证模型推理的效果。
原创
博文更新于 2026.01.15 ·
588 阅读 ·
6 点赞 ·
0 评论 ·
9 收藏

强化学习之美

介绍了强化学习的起源以及发展背景。
原创
博文更新于 2026.01.06 ·
358 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

使用Minimind从0~1进行大模型预训练、SFT、RLHF

资源:Tesla v100 32GBx8。
原创
博文更新于 2026.01.05 ·
931 阅读 ·
22 点赞 ·
0 评论 ·
7 收藏

对多智能体强化学习算法MADDPG的理解

介绍了本人对MADDPG算法的理解
原创
博文更新于 2026.01.01 ·
5792 阅读 ·
6 点赞 ·
3 评论 ·
14 收藏

从 PPO、DPO 到 GRPO:万字长文详解大模型训练中的三大关键算法

写的太好了!!
原创
博文更新于 2025.12.26 ·
362 阅读 ·
3 点赞 ·
0 评论 ·
0 收藏

大模型服务由N卡适配曙光K100卡

N卡适配——>曙光K100曙光K100 是由中国中科曙光(Sugon)推出的一款高性能计算(HPC)或人工智能(AI)加速卡,主要用于数据中心、科学计算、AI训练与推理等场景。
原创
博文更新于 2025.12.06 ·
1145 阅读 ·
8 点赞 ·
0 评论 ·
5 收藏

记录一下windows系统安装wsl的步骤

*WSL(Windows Subsystem for Linux)**是微软开发的一项功能,允许你在 Windows 系统内部直接运行 Linux 环境,无需安装虚拟机或双系统。支持 GUI 应用(WSLg):从 WSL2 开始,配合 WSLg,还能运行 Linux 图形界面程序(比如 GIMP、VS Code 等)。WSL2:基于轻量级虚拟机,运行真实的 Linux 内核,性能更强,支持完整系统调用,推荐用于开发、训练模型等任务。
原创
博文更新于 2025.12.02 ·
388 阅读 ·
5 点赞 ·
0 评论 ·
7 收藏

上传本地代码至github

🎯 本地代码上传 GitHub 完整流程第 1 步:本地 Git 初始化(如果项目还未 Git 化)bash。
原创
博文更新于 2025.11.29 ·
422 阅读 ·
5 点赞 ·
0 评论 ·
5 收藏

Git和github使用简洁教程

Git 相关命令进入要管理的目录git init 初始化 让git 帮助我们管理当前文件夹git status 检测当前目录下的文件状态三种状态的变化*红色:新增的文件 /修该了原来的老文件 -> git add 文件名 变成绿色*绿色: git 已经管理起来 -> git commit -m ‘版本号’*生成版本个人信息配置:用户名、邮箱git log 查看版本记录git reset --hard (commit 版本号) 切当前版本为历史
原创
博文更新于 2025.11.28 ·
271 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

LLM和智能体的区别

大模型与AI Agent的关系,本质是AI技术从感知智能(理解语言)向认知智能(自主决策)与行动智能(落地执行)的进化。前者解决了“AI能听懂人话”的问题,后者突破了“AI能自己做事”的瓶颈。对于企业而言,理解二者的差异与协同逻辑,不仅是选择技术方案的前提,更是把握AI时代机遇的关键。
原创
博文更新于 2025.10.28 ·
165 阅读 ·
3 点赞 ·
0 评论 ·
0 收藏

Agentic AI 与 AI Agent的核心区别

一文读懂Agentic AI 与 AI Agent的核心区别
原创
博文更新于 2025.10.28 ·
267 阅读 ·
3 点赞 ·
1 评论 ·
0 收藏

使用MS-SWIF框架对大模型进行SFT微调

报错:ValueError: Bfloat16 is only supported on GPUs with compute capability of at least 8.0. Your Tesla V100S-PCIE-32GB GPU has compute capability 7.0. You can use float16 instead by explicitly setting the。
原创
博文更新于 2025.09.05 ·
1032 阅读 ·
9 点赞 ·
0 评论 ·
12 收藏

【配置 PyCharm 连接远程服务器进行开发和调试的完整流程】

1.PyCharm Professional(社区版不支持远程解释器)2、然后Add New_interpreter,选择on ssh;2.代码在本地目录里面,可以同步上传远程服务器。1、在本地使用PyCharm打开工程代码;3.宿主机上安装了conda 环境。3、然后即可进行debug;
原创
博文更新于 2025.08.27 ·
354 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

RL论文数据图绘制

记录RL论文数据图的绘制方法
原创
博文更新于 2022.10.12 ·
477 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

导出TensorBoard中的所有数据并平滑处理

将tensorboard生成的数据平滑处理
原创
博文更新于 2022.10.10 ·
1299 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏
加载更多