最近遇到一个线上bug,访问某特定接口会偶发异常。排查日志发现是在操作mongodb时报错,错误信息如下:
error message: command failed with error 251 (nosuchtransaction): 'given transaction number 115 does not match any in-progress transactions. the active transaction number is 114' on server xx.xx.xx.xx:xxxx. the full response is {"errorlabels": ["transienttransactionerror"], "ok": 0.0, "errmsg": "given transaction number 115 does not match any in-progress transactions. the active transaction number is 114", "code": 251, "codename": "nosuchtransaction"}
通过检索和排查,定位到问题是由于处理mongodb操作时,同一事务中的两个请求被同时发送至db,有概率产生如下情况:
- 请求1和请求2同时发送至mongo并开始执行
- 请求1尚在执行中,请求2已完成
- 由于此时请求1尚未完成,该事务在db层面并未真正开始,所以请求2无法正常结束(也就是为什么报错指出找不到transaction id 115,因为这条事务在db中还未注册),导致事务回滚并抛出异常
- 请求1执行完成,但此时事务已回滚,操作无效
回顾代码,发现两个请求被同时发送至db的原因是使用了zipwith()方法进行数据合并。此方法的特性是会同时向数据库请求待合并的两个数据,在操作mongo时就会触发前述问题。
解决办法也非常简单,使用zipwhen()方法来替代即可,zipwhen会阻塞并等待请求的第一个数据到达后再请求第二个数据,完美规避了这个问题。