Mongodb采用$in方式提升操作效率

最新推荐文章于 2026-06-23 16:28:40 发布

转载最新推荐文章于 2026-06-23 16:28:40 发布 · 833 阅读

标签

#mongodb #blogs #blog #php #优化

MONGODB 专栏收录该内容

15 篇文章

订阅专栏

本文对比了Mongodb中使用PHP循环操作与$in批量操作的效率差异，通过具体实例展示了在查询与更新操作中$in方式的优势。

Mongodb操作里许多人喜欢采用PHP的循环操作，这种方式效率非常低下，可以优化。
1、查询：
有两种方式，在PHP里循环查询和使用$in的方式。做一个查询1000条数据的示例如下：

 
   view plain
  
 // 循环查询  
 for($i = 0; $i < count($array); $i++) {  
          $item = $collection -> findOne(array("_id" => new MongoId($array[$i])));  
          echo $item["profile"]["name"] . "<br />";  
 }  

运行时间：0.52035784721375秒

 
   view plain
  
 // 采用$in的方式  
 $mongoIds = array();  
 for($i = 0; $i < count($array); $i++) {  
          $mongoIds[] = new MongoId($array[$i]);  
 }  
 $cursor = $collection -> find(array("_id" => array('$in' => $mongoIds)));  
 while($item = $cursor-> getNext()){  
          echo $item["profile"]["name"] . "<br />";  
 }  

运行时间： 0.15661716461182秒
结果采用循环方式的运行时间为$in方式的 3倍以上。
2、更新：
还是两种方式，在PHP里循环更新和使用$in的方式。做一个查询1321条数据的示例如下：

 
   view plain
  
 // 循环更新（目前删除blog时采用的方式）  
 foreach ($fans as $fan)  
 {  
          $feed = $db -> command(array("findAndModify" => $MONGO_DB_FEED,  
                    "query" => array('_id' => new MongoId($fan)),  
                    "update" => array('$pull' => array("blogs"=>array("bid" => $blog_id)), '$inc' => array("count"=>-1)),  
                    "new" => true  
                    )  
          );  
 }  

运行时间： 28.02441906929秒

 
   view plain
  
 // 采用$in的方式  
 $mongoIds = array();  
 foreach ($fans as $fan) {  
          $mongoIds[] = new MongoId($fan);  
 }  
 $feed -> update(array('_id' => array('$in' => $mongoIds)), array('$pull' => array("blogs"=>array("bid" => $blog_id)), '$inc' => array("count" => -1)), array('multiple' => true));  

运行时间： 0.011945962905884秒
结果采用循环方式的运行时间为$in方式的 2335倍！
第一种方式非常容易出现运行的超时的情况造成操作不成功，而第二种方式在提高效率的同时避免了这种问题的出现。
造成这样问题的原因是1、循环里的网络请求时间消耗太多时间2、$in操作可以进行查询优化，也不需要多次编译。