不喜欢就不用,但要说出来——一次搜索实验的完整记录

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏 ,讲透 AI 如何接管脏活累活

2020411

本文对比了不同搜索引擎和大模型对CSDN新发布文章的检索效果。实验显示,必应能快速收录新文章,而百度因商业考量未优先展示;大模型中,DeepSeek和千问依赖传统搜索摘要易出错,Kimi通过深度抓取网页内容表现更优。作者指出技术差异源于索引机制和抓取深度,强调用事实替代情绪化批评,通过选择优质工具表达态度。最后提出以观察代替对抗,保持对百度改进可能性的关注,体现了理性批判与工具选择的平衡。

一、实验背景

昨晚我在CSDN发布了一篇文章:《关闭F2的Bark功能》。

今天早上,我做了一次简单的搜索实验。

二、传统搜索引擎的表现

  • 必应:已经可以搜到。点赞。
  • 百度:搜不到。

不是技术上的“做不到”。百度的爬虫抓取CSDN这种高权重网站,技术上几小时内完成毫无压力。它有能力,只是选择了不把我的文章排到前面。

为什么?因为搜索结果页是百度的“产品”。百度会把好位置留给自家的百科、百家号、知道,留给有商业价值的内容。一个普通用户刚发布的个人技术文章,对百度搜索页的用户留存和收入贡献都很低。

不给你看,那是它的权利——就像超市有权把利润低的商品放在货架最底层。

三、大模型联网搜索的表现

我又测试了几个大模型的联网搜索功能,结果很有意思:

大模型能否搜到文章回答正确性特点分析
DeepSeek搜不到错误依赖主流索引,对新增内容反应慢
千问搜不到错误与DeepSeek类似,摘要判断机制导致偏差
Kimi搜不到原文正确找到了某个网页角落里的一句话提及

技术分析

这里面的差异,本质上是搜索机制的不同:

  1. 传统搜索摘要模式(DeepSeek、千问为代表)

    • 流程:搜索词 → 调用搜索API → 返回标题+摘要 → 模型根据摘要判断
    • 弱点:如果搜索引擎的索引没更新,或者摘要没抓到关键信息,模型就会“看走眼”,给出错误答案
  2. 深度抓取模式(Kimi为代表)

    • 流程:搜索词 → 获取搜索结果 → 进一步抓取完整网页内容 → 在全文里找线索
    • 优势:即使标题和摘要没有,只要网页角落里有一句话,Kimi也能翻出来
  3. 索引层的问题

    • 大模型自己不爬网页,依赖第三方搜索引擎的索引
    • 百度系的索引对新内容本身就慢,导致DeepSeek和千问“巧妇难为无米之炊”
    • Kimi可能在搜索引擎选择和内容抓取深度上做了不同配置

简单说:不是大模型不够聪明,而是它们能看到的“地图”不一样。有的地图还没更新,有的愿意翻遍每一个角落。

四、我不喜欢“垃圾”这个词

骂没有用,只会让对话变成情绪对抗。

我更认同的做法是:

  1. 不喜欢就不要用。 用脚投票,是最直接的表达。
  2. 不喜欢就要说出来。 把事实摆清楚,让别人知道真实情况。
  3. 告诉别人什么更好用。 必应收录快,Kimi能挖角落信息——这些是经过验证的。

五、但我也不会彻底走开

以后我还是会偶尔“百度一下”。

不是因为我需要它,而是我想看看它还是不是那么恶心,有没有一点点进步

我就是这么怪。

你既然敢在公众面前表演——把搜索结果当成自己的商业舞台,把用户的需求排在自己利益后面——那我就会时不时来看看你的表演。

我不骂你,也不求你。
我只是看着你。
然后继续用那些真正尊重我的工具。

六、总结

  • 把情绪换成事实
  • 把攻击换成选择
  • 把沉默换成公开表达

百度可以选择不给我看。
我也可以选择看你演。
这很公平。

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏 ,讲透 AI 如何接管脏活累活

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值