magic_road-CSDN博客

magic_road

码龄5年

39,389

总访问量
11

原创
218

粉丝
50

关注

IP 属地：浙江省

加入CSDN时间： 2021-09-29

个人简介：土豪的生活你无法理解

查看详细资料

个人成就

获得41次点赞
内容获得14次评论
获得80次收藏
代码片获得1,743次分享
博客总排名245,670名

TA的专栏

TA关注的专栏 0

TA关注的收藏夹 0

TA关注的社区 3

TA参与的活动 0

创作活动更多

「谁说嵌入式只是调包和焊板子？」—— 2026嵌入式全栈技术征锋令

谁说嵌入式只会“Ctrl+C 调包”和“拿电烙铁焊板子”？2026嵌入式全栈技术征锋令正式启幕！本次活动专为硬核硬件/软件开发者打造，无论你是刚玩转裸机外设的萌新，还是精通RTOS调度、死磕底层驱动的行业老手，亦或是执掌系统架构的大神，这里都是你证明实力的舞台！拒绝表面功夫，每一行代码，都有撬动硬件的力量！晒出你的硬核工程实战，为嵌入式开发者的全栈硬实力正名！

213人参与去参加

更多

qwen1.5-7B hf部署运行方法以及vllm推理框架部署方法

qwen1.5 模型的问答生成方式发生了变化，不再支持 mode.chat()，但整体来看， 1.5版本的问答效果确实有了很大提升。qwen-7B 大语言模型的加载方式如下。

博文更新于 2024.05.16 ·

python 中如果对参数的取值范围进行自动触发验证

来设置 split_scale 参数值时，会自动触发验证逻辑，并在超出范围时引发错误。方法中，如果属性名与参数名不匹配，验证逻辑不会被触发。split_scale 变量，可以通过 split_scale 属性进行访问。要解决这个问题，需要将属性名和参数名保持一致。如果你希望在类对象实例化时自动触发验证，你可以使用装饰器。方法中，由于属性名与参数名不匹配，验证逻辑不会被触发。如何在类中自定义参数变量类型，并设定参数变量的值范围.方法中，不需要返回任何值。来定义类的属性，并在这个属性的。

博文更新于 2024.05.07 ·

于稀疏检索与稠密检索的混合搜索

基本方法：检索与用户查询相关的上下文，然后将其与内存缓冲区中的聊天历史记录一起发送给LLM, 让LLM在生成下一个答案时了解先前上下文。，由于用户query存在部分口语化的词，如停用词等，直接抽取用户中的关键词做召回是一个有效的方式。优点：它同时考虑了查询与存储文档之间的语义相似性和关键字匹配度；- 1. 通过将检索到的上下文逐块发送到LLM来迭代地细化答案。- 3. 同的上下文块生成多个答案，然后将它们连接或总结。- 2. 总结检索到的上下文以适应提示。：聊天历史记录和最后一条消息都。

博文更新于 2024.05.06 ·

Ubantu 报错：System has not been booted with systemd as init system (PID 1). Can‘t operate.

系统中，初始化系统是启动系统时第一个启动的进程，负责启动和管理系统中的各种服务。我在使用sytetmctl 查服务状态时中出现了这个问题。

博文更新于 2024.03.04 ·

24451 阅读 ·

hugging face 上模型文件自动下载方法札记

好了，就到这了，有新的感悟再续写，哈哈。repo_id 是什么？

博文更新于 2023.10.30 ·

mysql：Illegal mix of collations (utf8mb4_general_ci,IMPLICIT) and (utf8mb4_unicode_ci,IMPLICIT)

之前执行了上面的第二条指令，发现控制台还是报字符编码冲突错误，后来才明白是mysql数据库创建时指定的编码与创建表时默认的编码不一致 (如下图)，才出现上述错误问题；

博文更新于 2023.10.27 ·

LangChain Few-shot prompt 用法示例总结

最近有一个工作问题需要花费太多的人工时间，就考虑是否可以用LangChain Prompt进行解决。经过对LangChain 里的几种 prompt 模板对比分析，觉得 Few-shot prompt 最符合需求，然后就着手开始搭建。因为网上对于Few-shot prompt的用法资料不多，或讲解不完整，故此在这里做一下记录；

博文更新于 2023.09.20 ·

分布式训练框架FSDP的大模型训练流程详解

FSDP是pytorch官方推出的分布式训练框架，它可以进行数据并行和模型并行的分布式训练框架。

博文更新于 2023.04.20 ·

Multi-label classification 遇到文本张量不一致问题

在文本多分类模型测试过程报如下错误： RuntimeError: stack expects each tensor to be equal size, but got [512] at entry 0 and [863] at entry 7.之前模型代码写的是 truncation='only_second', 如果文本数据长度差异太大，就必须 truncation设置为True. 改好后就没有上面报错。

博文更新于 2023.03.29 ·

NER任务中BERT-CRF 模型的英文数据padding与aligning

最近因为需要用BERT-CRF模型做一个英文数据的实体抽取模型训练，因为github上BERT-CRF大多是对中文数据做NER，这里特此记录一下处理过程中的解决方法与思路，废话不多说直接上代码，这里的代码模版参考的是 CLUENER2020项目下的BERT-CRF模型代码, 主要修改部分在 collate_fn 部分的 batch数据的 padding与aligning处理。

博文更新于 2023.03.29 ·

模型运行报 RuntimeError: CUDA out of memory. Tried to allocate 384.00 MiB (GPU 0； 31.75 GiB

后来发现原因是没有指定GPU，但是有时明明指定了GPU还是无法运行，后来才知道，如果你指定的GPU被占用时，它会报默认0号GPU被占用无法分配运行内存。最近在做一个多分类模型时，遇到一个下面bug，明明服务器多块GPU上有空闲GPU，却无法运行模型。

博文更新于 2023.03.29 ·