志豪Jeremy-CSDN博客

志豪Jeremy

码龄6年

123,403

总访问量
71

原创
32

粉丝
128

关注

IP 属地：浙江省

加入CSDN时间： 2020-04-07

查看详细资料

个人成就

获得189次点赞
内容获得21次评论
获得358次收藏
博客总排名49,341名
原力等级

原力等级

3

原力分

388

本月获得

0

TA的专栏

TA关注的专栏 21

TA关注的收藏夹 0

TA关注的社区 4

TA参与的活动 1

创作活动更多

「谁说嵌入式只是调包和焊板子？」—— 2026嵌入式全栈技术征锋令

谁说嵌入式只会“Ctrl+C 调包”和“拿电烙铁焊板子”？2026嵌入式全栈技术征锋令正式启幕！本次活动专为硬核硬件/软件开发者打造，无论你是刚玩转裸机外设的萌新，还是精通RTOS调度、死磕底层驱动的行业老手，亦或是执掌系统架构的大神，这里都是你证明实力的舞台！拒绝表面功夫，每一行代码，都有撬动硬件的力量！晒出你的硬核工程实战，为嵌入式开发者的全栈硬实力正名！

212人参与去参加

更多

LlamaFactory微调Qwen3-0.6B大模型实验整理——调一个人物领域专属的模型

这些问题可以来自公开资料、专业文献、论坛、教材等。：只加垂类数据集看看效果。：构造人物领域问题集。

博文更新于 2026.01.23 ·

LlamaFactory微调Qwen3-0.6B大模型踩坑实验整理——调一个xx领域专属的人物模型

补充自我认知数据、人物数据对Qwen3-0.6B进行垂类微调。无法回答自我认知问题，training_loss=1.97。回答错误，training_loss=1.86。可能的原因：epoch少了。可能的原因：学习率高了。无法回答自我认知问题。

博文更新于 2026.01.23 ·

LlamaFactory微调Qwen3-4B大模型实验整理——调一个舰船领域专属的模型

用 DeepSeek-32B 在军事舰船领域“当老师”，生成带推理的问答数据，然后“教” Qwen3-4B 学会这个领域的专业知识和推理方式，从而得到一个轻量、专业、会思考的垂域小模型。

博文更新于 2026.01.23 ·

bert-base-chinese-ner微调总结——针对“领域实体微调”及“增量实体微调”任务

如果你未显式提供标签映射，但训练数据中包含完整的 BIO 标签（如 “B-PER”, “I-LOC” 等），训练脚本Hugging Face Transformers 的 Trainer通常会在数据预处理阶段自动收集所有唯一标签，按字典序或出现顺序排序后生成 label2id 和 id2label，并更新到模型配置中。：新的数据集必须包含之前的PER/LOC/ORG/FAC/EVENT的数据，并且模型应该加载之前的checkpoint（即已经微调过5类的那个模型）目标都是按照9:1切分，并且能包含6类别；

博文更新于 2026.01.16 ·

模型训练心得

举个直观的例子：如果大 batch 还用小学习率，就相当于“拿着精准地图却一步挪一毫米”，明明能快速到终点，却硬生生拖慢训练节奏。batch size 增大， learning rate 也要增大，batch size 变小， learning rate 也要减小。举个直观的例子：你要走到山谷最低点（最优解），步长太小会走得慢，大batch 的梯度更稳定，能支撑更大的学习率步长；但步长太大直接就跨到对面山坡上了，离最低点反而更远。举个直观的例子：把训练数据集看作一本练习册，

博文更新于 2026.01.16 ·

LlamaFactory微调Qwen3-0.6B大模型步骤

（注：localhost:8103 指的是程序启动机器自身的8103端口，云上的用户可能无法通过本地的笔记本电脑直接访问，需要找云厂商获取域名和端口号的一些配置关系进行配置）4、加载自定义数据集，符合alpaca格式，并在dataset_info.json中进行注册。2、下载LLaMA-Factory-man项目。创建qwen3_0.6B.yaml，里面填入。1、下载Qwen3-0.6B大模型。6、验证微调后的模型效果。3、验证模型推理的效果。

博文更新于 2026.01.15 ·

强化学习之美

介绍了强化学习的起源以及发展背景。

博文更新于 2026.01.06 ·

使用Minimind从0~1进行大模型预训练、SFT、RLHF

资源：Tesla v100 32GBx8。

博文更新于 2026.01.05 ·

对多智能体强化学习算法MADDPG的理解

介绍了本人对MADDPG算法的理解

博文更新于 2026.01.01 ·

从 PPO、DPO 到 GRPO：万字长文详解大模型训练中的三大关键算法

写的太好了！！

博文更新于 2025.12.26 ·

大模型服务由N卡适配曙光K100卡

N卡适配——>曙光K100曙光K100 是由中国中科曙光（Sugon）推出的一款高性能计算（HPC）或人工智能（AI）加速卡，主要用于数据中心、科学计算、AI训练与推理等场景。

博文更新于 2025.12.06 ·

记录一下windows系统安装wsl的步骤

*WSL（Windows Subsystem for Linux）**是微软开发的一项功能，允许你在 Windows 系统内部直接运行 Linux 环境，无需安装虚拟机或双系统。支持 GUI 应用（WSLg）：从 WSL2 开始，配合 WSLg，还能运行 Linux 图形界面程序（比如 GIMP、VS Code 等）。WSL2：基于轻量级虚拟机，运行真实的 Linux 内核，性能更强，支持完整系统调用，推荐用于开发、训练模型等任务。

博文更新于 2025.12.02 ·

上传本地代码至github

🎯 本地代码上传 GitHub 完整流程第 1 步：本地 Git 初始化（如果项目还未 Git 化）bash。

博文更新于 2025.11.29 ·

Git和github使用简洁教程

Git 相关命令进入要管理的目录git init 初始化让git 帮助我们管理当前文件夹git status 检测当前目录下的文件状态三种状态的变化*红色：新增的文件 /修该了原来的老文件 -> git add 文件名变成绿色*绿色： git 已经管理起来 -> git commit -m ‘版本号’*生成版本个人信息配置：用户名、邮箱git log 查看版本记录git reset --hard (commit 版本号) 切当前版本为历史

博文更新于 2025.11.28 ·

LLM和智能体的区别

大模型与AI Agent的关系，本质是AI技术从感知智能（理解语言）向认知智能（自主决策）与行动智能（落地执行）的进化。前者解决了“AI能听懂人话”的问题，后者突破了“AI能自己做事”的瓶颈。对于企业而言，理解二者的差异与协同逻辑，不仅是选择技术方案的前提，更是把握AI时代机遇的关键。

博文更新于 2025.10.28 ·

Agentic AI 与 AI Agent的核心区别

一文读懂Agentic AI 与 AI Agent的核心区别

博文更新于 2025.10.28 ·

使用MS-SWIF框架对大模型进行SFT微调

报错：ValueError: Bfloat16 is only supported on GPUs with compute capability of at least 8.0. Your Tesla V100S-PCIE-32GB GPU has compute capability 7.0. You can use float16 instead by explicitly setting the。

博文更新于 2025.09.05 ·

【配置 PyCharm 连接远程服务器进行开发和调试的完整流程】

1.PyCharm Professional（社区版不支持远程解释器）2、然后Add New_interpreter，选择on ssh；2.代码在本地目录里面，可以同步上传远程服务器。1、在本地使用PyCharm打开工程代码；3.宿主机上安装了conda 环境。3、然后即可进行debug；

博文更新于 2025.08.27 ·

RL论文数据图绘制

记录RL论文数据图的绘制方法

博文更新于 2022.10.12 ·

导出TensorBoard中的所有数据并平滑处理

将tensorboard生成的数据平滑处理

博文更新于 2022.10.10 ·