当前位置 : 主页 > 网页制作 > Nodejs >

node.js – 为什么MongoDB upsert会比插入(使用唯一索引)慢得多?

来源:互联网 收集:自由互联 发布时间:2021-06-16
我一直在测试MongoDB的限制,看看它是否适用于即将推出的项目,我注意到与插入相比,upserts相当慢. 当然,我希望它们更慢,但不会(几乎)慢一个数量级(7400 vs 55000 ops / sec).这是我使用的(node
我一直在测试MongoDB的限制,看看它是否适用于即将推出的项目,我注意到与插入相比,upserts相当慢.

当然,我希望它们更慢,但不会(几乎)慢一个数量级(7400 vs 55000 ops / sec).这是我使用的(nodejs本机驱动程序)基准测试代码:

(async function() {

  let db = await require('mongodb').MongoClient.connect('mongodb://localhost:27017/mongo-benchmark-8764824692947');
  db.collection('text').createIndex({text:1},{unique:true})

  let batch = db.collection('text').initializeOrderedBulkOp();
  let totalOpCount = 0;
  let batchOpCount = 0;
  let start = Date.now();
  while(1) {

    totalOpCount++;
    batchOpCount++;
    if(batchOpCount === 1000) { // batch 1000 ops at a time
      await batch.execute();
      batch = db.collection('text').initializeOrderedBulkOp();
      batchOpCount = 0;
      let secondsElapsed = (Date.now() - start)/1000;
      console.log(`(${Math.round(totalOpCount/secondsElapsed)} ops per sec) (${totalOpCount} total ops)`)
    }

    /////////  INSERT TEST  ///////// (~55000 ops/sec)
    // batch.insert({text:totalOpCount});

    /////////  UPSERT TEST  ///////// (~7400 ops/sec)
    let text = Math.floor(Math.random()*1000000);
    batch.find({text}).upsert().updateOne({$setOnInsert:{text}});

    if(totalOpCount > 500000) {
      console.log("<< finished >>");
      await db.dropCollection('text');
      db.close();
      break;
    }

  }

})();

您可以通过将其粘贴到index.js,运行npm init -y和npm install –save mongodb然后运行节点来轻松运行它.

当我们插入文档时,mongo引擎必须检查是否存在与之匹配的现有文档.这可能解释了一些减速,但是对于唯一索引的insert命令是否需要相同的冲突检查?谢谢!

编辑:结果需要$setOnInsert,否则我们会得到重复的键错误.

我通过将if(batchOpCount === 1000)更改为if(batchOpCount === 50000)使得每个批处理更大,并且插入时获得~90000 ops / sec,而upsert获得~35000 ops / sec.我不确定为什么批量大小会产生相对差异.有意义的是,较小的批次会导致较少的操作/秒(通信开销),但我不确定为什么upserts比插入更多,尽管这可能是一个单独问题的主题.

这个(大约)3倍的速度差异肯定更接近于我期望的两个操作之间的性能差异,但是看起来似乎插件比它们应该慢一点,因为插入也必须检查碰撞(由于独特的索引).这真的只是一个半答案,所以我打开这个问题,希望mongo pro会出现并提供更完整的答案.

网友评论