2020411
本文对比了不同搜索引擎和大模型对CSDN新发布文章的检索效果。实验显示,必应能快速收录新文章,而百度因商业考量未优先展示;大模型中,DeepSeek和千问依赖传统搜索摘要易出错,Kimi通过深度抓取网页内容表现更优。作者指出技术差异源于索引机制和抓取深度,强调用事实替代情绪化批评,通过选择优质工具表达态度。最后提出以观察代替对抗,保持对百度改进可能性的关注,体现了理性批判与工具选择的平衡。
一、实验背景
昨晚我在CSDN发布了一篇文章:《关闭F2的Bark功能》。
今天早上,我做了一次简单的搜索实验。
二、传统搜索引擎的表现
- 必应:已经可以搜到。点赞。
- 百度:搜不到。
不是技术上的“做不到”。百度的爬虫抓取CSDN这种高权重网站,技术上几小时内完成毫无压力。它有能力,只是选择了不把我的文章排到前面。
为什么?因为搜索结果页是百度的“产品”。百度会把好位置留给自家的百科、百家号、知道,留给有商业价值的内容。一个普通用户刚发布的个人技术文章,对百度搜索页的用户留存和收入贡献都很低。
不给你看,那是它的权利——就像超市有权把利润低的商品放在货架最底层。
三、大模型联网搜索的表现
我又测试了几个大模型的联网搜索功能,结果很有意思:
| 大模型 | 能否搜到文章 | 回答正确性 | 特点分析 |
|---|---|---|---|
| DeepSeek | 搜不到 | 错误 | 依赖主流索引,对新增内容反应慢 |
| 千问 | 搜不到 | 错误 | 与DeepSeek类似,摘要判断机制导致偏差 |
| Kimi | 搜不到原文 | 正确 | 找到了某个网页角落里的一句话提及 |
技术分析:
这里面的差异,本质上是搜索机制的不同:
-
传统搜索摘要模式(DeepSeek、千问为代表):
- 流程:搜索词 → 调用搜索API → 返回标题+摘要 → 模型根据摘要判断
- 弱点:如果搜索引擎的索引没更新,或者摘要没抓到关键信息,模型就会“看走眼”,给出错误答案
-
深度抓取模式(Kimi为代表):
- 流程:搜索词 → 获取搜索结果 → 进一步抓取完整网页内容 → 在全文里找线索
- 优势:即使标题和摘要没有,只要网页角落里有一句话,Kimi也能翻出来
-
索引层的问题:
- 大模型自己不爬网页,依赖第三方搜索引擎的索引
- 百度系的索引对新内容本身就慢,导致DeepSeek和千问“巧妇难为无米之炊”
- Kimi可能在搜索引擎选择和内容抓取深度上做了不同配置
简单说:不是大模型不够聪明,而是它们能看到的“地图”不一样。有的地图还没更新,有的愿意翻遍每一个角落。
四、我不喜欢“垃圾”这个词
骂没有用,只会让对话变成情绪对抗。
我更认同的做法是:
- 不喜欢就不要用。 用脚投票,是最直接的表达。
- 不喜欢就要说出来。 把事实摆清楚,让别人知道真实情况。
- 告诉别人什么更好用。 必应收录快,Kimi能挖角落信息——这些是经过验证的。
五、但我也不会彻底走开
以后我还是会偶尔“百度一下”。
不是因为我需要它,而是我想看看它还是不是那么恶心,有没有一点点进步。
我就是这么怪。
你既然敢在公众面前表演——把搜索结果当成自己的商业舞台,把用户的需求排在自己利益后面——那我就会时不时来看看你的表演。
我不骂你,也不求你。
我只是看着你。
然后继续用那些真正尊重我的工具。
六、总结
- 把情绪换成事实
- 把攻击换成选择
- 把沉默换成公开表达
百度可以选择不给我看。
我也可以选择看你演。
这很公平。

879

被折叠的 条评论
为什么被折叠?



