不喜欢就不用，但要说出来——一次搜索实验的完整记录

原创于 2026-04-11 11:21:31 发布 · 330 阅读

4 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#随想

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏，讲透 AI 如何接管脏活累活

一键订阅

2020411

本文对比了不同搜索引擎和大模型对CSDN新发布文章的检索效果。实验显示，必应能快速收录新文章，而百度因商业考量未优先展示；大模型中，DeepSeek和千问依赖传统搜索摘要易出错，Kimi通过深度抓取网页内容表现更优。作者指出技术差异源于索引机制和抓取深度，强调用事实替代情绪化批评，通过选择优质工具表达态度。最后提出以观察代替对抗，保持对百度改进可能性的关注，体现了理性批判与工具选择的平衡。

一、实验背景

昨晚我在CSDN发布了一篇文章：《关闭F2的Bark功能》。

今天早上，我做了一次简单的搜索实验。

二、传统搜索引擎的表现

必应：已经可以搜到。点赞。
百度：搜不到。

不是技术上的“做不到”。百度的爬虫抓取CSDN这种高权重网站，技术上几小时内完成毫无压力。它有能力，只是选择了不把我的文章排到前面。

为什么？因为搜索结果页是百度的“产品”。百度会把好位置留给自家的百科、百家号、知道，留给有商业价值的内容。一个普通用户刚发布的个人技术文章，对百度搜索页的用户留存和收入贡献都很低。

不给你看，那是它的权利——就像超市有权把利润低的商品放在货架最底层。

三、大模型联网搜索的表现

我又测试了几个大模型的联网搜索功能，结果很有意思：

大模型	能否搜到文章	回答正确性	特点分析
DeepSeek	搜不到	错误	依赖主流索引，对新增内容反应慢
千问	搜不到	错误	与DeepSeek类似，摘要判断机制导致偏差
Kimi	搜不到原文	正确	找到了某个网页角落里的一句话提及

技术分析：

这里面的差异，本质上是搜索机制的不同：

传统搜索摘要模式（DeepSeek、千问为代表）：
- 流程：搜索词 → 调用搜索API → 返回标题+摘要 → 模型根据摘要判断
- 弱点：如果搜索引擎的索引没更新，或者摘要没抓到关键信息，模型就会“看走眼”，给出错误答案
深度抓取模式（Kimi为代表）：
- 流程：搜索词 → 获取搜索结果 → 进一步抓取完整网页内容 → 在全文里找线索
- 优势：即使标题和摘要没有，只要网页角落里有一句话，Kimi也能翻出来
索引层的问题：
- 大模型自己不爬网页，依赖第三方搜索引擎的索引
- 百度系的索引对新内容本身就慢，导致DeepSeek和千问“巧妇难为无米之炊”
- Kimi可能在搜索引擎选择和内容抓取深度上做了不同配置