今天上午,开发人员小毛又找到我,要我协助将这个问题根治一下,拖太久用户难保不投诉。
简单分析了一下,每次 Reload 一下就能解决无法登录的情况,自然而然就想到是不是 session 有问题呢?于是到 Tomcat 的 manager 界面看了下,发现并没有出现 session 粘滞暴涨的情况。
本来可以打开 jconsole 看看的,正好想起了之前用过的 Tomcat 检测工具:probe,于是直接从其他机器上 scp 了一个 probe.war,丢到了 webapps 下面自动部署。
部署完之后,打开了 probe 网页管理后台发现 smc 项目的实时数据库连接数很高,而且只增不减!这个系统的数据池大小设置为 200,此时已经是 100+了,而且一直只升不降。好吧,当数据连接数达到 200 时,问题肯定会再次出现的。
于是我将这个问题告诉了小毛,要他自己去修改连接池释放机制(这里用的是项目单独设定的参数)。他说试过了,没有用,问下我有没有办法。
我这人记性一直欠佳,也很少去记忆一些参数设置,问我么?还我也只能问 BD、GG 了。。。
最终在强大的搜索引擎的帮助下,找到了相关参数说明,通过参考修改后成功解决了问题!
Tomcat 连接池无法释放的解决方法:
编辑项目的连接池配置文件:context.xml,参考下面的【数据库连接设置】参数说明,按照实际情况调整好各项数值,尤其是 Maxidle 和 maxActive。并记得加上 removeAbandoned=true 相关释放参数即可,我们这最终设置好的 context.xml 如下所示:
1 2 3 4 5 6 7 8 9 10 11 12 | <Resource name=“jdbc/smc” type=“javax.sql.DataSource” username=“user” password=“password” driverClassName=“oracle.jdbc.driver.OracleDriver” maxIdle=“50” maxWait=“2000” removeAbandoned=“true” removeAbandonedTimeout=“180” validationQuery=“select * from dual “ url=“jdbc:oracle:thin:@192.168.7.98:1521:dw” maxActive=“200”/> |
数据库连接设置参考:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 | #数据库连接设置 jdbc.driverClassName=oracle.jdbc.driver.OracleDriver jdbcjdbc.url=jdbc:oracle:thin:@127.0.0.1:1521:DBSERVER jdbc.username=user jdbc.password=pass #<!– 初始化连接 –> dataSource.initialSize=10 #<!– 最大空闲连接 –> dataSource.maxIdle=20 #<!– 最小空闲连接 –> dataSource.minIdle=5 #最大连接数量 dataSource.maxActive=50 #是否在自动回收超时连接的时候打印连接的超时错误 dataSource.logAbandoned=true #是否自动回收超时连接 dataSource.removeAbandoned=true #超时时间(以秒数为单位) dataSource.removeAbandonedTimeout=180 #<!– 超时等待时间以毫秒为单位 –> dataSource.maxWait=1000 |
附上作者的原文说明:
在配置 DBCP 连接池时,主要难以理解的主要有:removeAbandoned 、logAbandoned、removeAbandonedTimeout、maxWait 这四个参数,设置了 rmoveAbandoned=true 那么在 getNumActive()快要到 getMaxActive()的时候,系统会进行无效的 Connection 的回收,回收的 Connection 为 removeAbandonedTimeout(默认 300 秒)中设置的秒数后没有使用的 Connection,激活回收机制好像是 getNumActive()=getMaxActive()-2。
如果开启”removeAbandoned“,那么连接在被认为泄露时可能被池回收. 这个机制在(getNumIdle() < 2) and (getNumActive() > getMaxActive() – 3)时被触发.
举例:当 maxActive=20, 活动连接为 18,空闲连接为 1 时可以触发”removeAbandoned“.但是活动连接只有在没有被使用的时间超过”removeAbandonedTimeout”时才被删除,默认 300 秒.在 resultset 中游历不被计算为被使用.
logAbandoned=true 的话,将会在回收事件后,在 log 中打印出回收 Connection 的错误信息,包括在哪个地方用了 Connection 却忘记关闭了,在调试的时候很有用。
在这里私人建议 maxWait 的时间不要设得太长,maxWait 如果设置太长那么客户端会等待很久才激发回收事件。