大模型
文章平均质量分 78
哥本哈士奇
专注BI, 大模型。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
RAG向量检索核心详解:Cosine、Dot、Euclidean
目前主流向量数据库(FAISS、Milvus、Chroma、Pinecone)全部支持三种核心度量方式:Cosine余弦相似度、Dot Product点积、Euclidean欧氏距离。很多新手做RAG踩坑的核心原因:选错相似度算法,导致语义匹配完全失真、检索结果错乱。本文用通俗逻辑、标准公式、直观案例,一次性讲透三者的原理、区别与RAG最优选型方案。原创 2026-06-01 17:35:09 · 333 阅读 · 0 评论 -
看完《低智商犯罪》,学习Cypher构建知识图谱
《低智商犯罪》都看了吧,是否现在还在回味剧情里每一个人物的刻画,以及每一个案件的编排。看完后咱们就来简单的学习一下,如何把剧集里的人,事件以及各种关系,构建成一个简单的知识图谱。原创 2026-05-27 13:59:37 · 383 阅读 · 0 评论 -
LangChain DeepAgents 学习笔记
LangChain的DeepAgents已经发布有段时间了,最近的几个版本基本覆盖了大多数智能体都应该有的功能。本笔记基于 LangChain 的 DeepAgents 框架,演示如何构建了一个具有角色扮演能力的 AI 助手,并集成了自定义技能系统。以此方便后续的knowledge review以及vibe coding的reference。原创 2026-05-19 14:08:49 · 466 阅读 · 0 评论 -
LangChain Deepagent 版本0.6.1中间件一个bug
目前不清楚这个问题是从哪个版本开始的。所以我把版本回退到了2026年4月1日的版本,因为我看视频教程,教程是在4月8日发布的,所以查看了下github的release记录,4月1日的版本是0.5.1,回退到这个版本,问题解决。本文撰写时间是2026年5月18日,目前langchain deepagent的版本为0.6.1。所以使用pip直接install deepagents的默认版本,大概率会遇到我所说的问题。以下代码演示如何卸载当前版本然后安装指定版本的deepagents。以下是我测试的完整代码。原创 2026-05-19 01:21:38 · 438 阅读 · 0 评论 -
Neo4j笔记(五):查询的处理流程
上一篇讲述了一篇文章如何通过LLM转换成Cypher,然后在Neo4J里运行,形成知识图谱。此篇接着上篇,继续梳理一个用户查询,如何通过图数据库以及大模型去汇总查询结果。原创 2026-05-10 00:20:11 · 486 阅读 · 0 评论 -
提升 Text2SQL 准确率
随着大语言模型的爆发,Text2SQL(自然语言转SQL)技术正在重塑我们与数据库的交互方式。本文将系统性地梳理提升 Text2SQL 准确率的核心方法,涵盖提示工程、模型微调、推理增强三大维度。**所有示例基于微软 AdventureWorksDW2016 数据仓库**。原创 2026-05-08 00:50:16 · 355 阅读 · 0 评论 -
SQLServer Management Studio(SSMS) 22 Copilot 最佳实践学习笔记
在最新的SSMS 22版本中,加入了微软官方的AI工具GitHub Copilot。此篇结合微软官方的文档,汇总了我们作为机长,应该如何跟这位副驾磨合。原创 2026-05-07 00:11:36 · 355 阅读 · 0 评论 -
SQLServer RAG笔记4:从服务层到前端交互
在之前的文章中,我们完成了 SQLServer 2025 向量数据库的搭建和基本配置。本文将深入介绍服务层和前端部分的三个核心模块:**Embedding 生成**、**数据入库流程**以及**前端交互关键代码**,完成一个基于SQLServer 2025的向量数据库的RAG系统流程。原创 2026-05-07 00:08:26 · 246 阅读 · 0 评论 -
SQLServer RAG笔记5:为SQLServer 2025配置Ollama
在第三篇笔记中,我们结合Python代码,通过Ollama的嵌入模型,实现了为SQLServer 2025向量数据库生成向量值。从SQLServer 2025开始,是支持直接把大模型作为EXTERNAL MODEL的。此篇将介绍如何配置Ollama里的嵌入模型作为SQLServer 2025的EXTERNAL MODEL。原创 2026-05-06 14:53:36 · 292 阅读 · 0 评论 -
SQL Server RAG 笔记3:SQLServer2025 向量数据库
在大模型RAG应用中,提起向量数据库大家想到的更多的是Chroma和FAISS,微软也紧跟时代的步伐,并且在2025年底发布的 SQLServer 2025 也提供了原生向量支持,此篇将介绍如何在SQLServer 2025里搭建向量数据库环境。原创 2026-05-06 00:19:50 · 313 阅读 · 0 评论 -
详解传统RAG、Text2SQL、Graph RAG:适用场景与问题示例汇总
在AI问答与数据查询领域,传统RAG、Text2SQL、Graph RAG是三种核心的技术路径,它们各自有明确的定位、独特的特点,适配不同类型的查询需求。很多开发者在实际项目中会混淆三者的适用场景,本文将详细拆解每个系统的核心特点,明确其适合回答的问题类型,并搭配10个具体示例,帮助大家快速区分、精准选型。原创 2026-05-05 22:57:24 · 271 阅读 · 0 评论 -
OpenClaw 核心八大 MD 文件
简单介绍OpenClaw核心八大 MD 文件,soul.md, identity.md, user.md, memory.md, agents.md, bootstrap.md, skill.md, heartbeat.md。原创 2026-04-24 15:16:46 · 237 阅读 · 0 评论 -
Microsoft Agent Framework 智能体调用工具
继续上篇,此篇使用Microsoft Agent Framework 创建了一个简单的智能体,会根据用户的提问去调用相应的工具。此篇不依赖Azure资源,仍使用可以本地安装和部署的资源。原创 2026-04-22 00:32:00 · 388 阅读 · 0 评论 -
LangChain RAG索引与查询 - 学习笔记
此篇的学习笔记来自于B站强哥学编程,记录了关键的代码片段和知识整理,方便后续对相应知识点的复习,这一篇是RAG的关键LangChain代码。RAG是一种结合了检索和生成的AI技术,通过从外部知识库检索相关信息,增强大语言模型的生成能力,从而提供更准确、更相关的回答。此篇使用的LangChain版本是1.x,于2026年4月。原创 2026-04-19 21:51:15 · 212 阅读 · 0 评论 -
用SKILL实现请假流程信息收集
本文介绍了利用SKILL功能实现企业请假流程自动化的方法。通过对话机器人,员工可以直接在OC系统中用自然语言提交请假申请,系统自动提取请假类型、起止时间等信息,若信息不全则会智能追问确认。相比传统HR系统操作更便捷高效,支持"我想在后天请一天年假"等自然表达,并能处理不完整信息(如"我想休天假")。文章展示了SKILL的具体实现代码和测试案例,证明该方案能完美替代传统请假流程,只需后续对接HR系统接口即可完成全自动化处理。原创 2026-04-01 22:18:00 · 89 阅读 · 0 评论 -
使用Gradio构建AI前端 - RAG召回测试
构建AI应用的前端方案有很多,这里介绍一个开源前端库---Gradio,通过它可以使用简短的代码就可以快速的实现简单的AI应用前端。这里我们选择的场景为做RAG召回测试,通过调用先前封装好的LangChain代码,来快速的搭建这个前端页面。原创 2025-12-26 21:32:05 · 997 阅读 · 0 评论 -
利用AI Agent,辅助销售团队制定培训和考试内容
前段时间有朋友问,是否能利用AI技术来辅助销售团队进行培训。这里我就用LangChain来构建一个简单的模型,构建一个AI Agent,来简单演示下实现的思路。AI Agent也就是我们所说的智能体,相比大模型,它可以让大模型的手伸出来,来进行信息获取甚至一些实质的操作。通过此篇你可以观察到,通过AI Agent,你给它一堆工具之后,它是否能正确的依次使用每一个工具,并且是否跟我们人工的思考方式是一样的。原创 2025-11-19 15:01:39 · 441 阅读 · 0 评论 -
Python访问大模型的几种方式
Python访问大模型很方便,也让大家构建复杂的系统更加的灵活。访问的方式也比较灵活,主要有http api,package api的方式。这里简单汇总了常用的三种方式,包括ollama的,http api的,openAI的以及dashscope的。原创 2025-07-23 12:38:42 · 412 阅读 · 0 评论
分享