我有一个Web服务Java程序,它将数据库中的13,000,000个日期(如'08 -23-2016 12:54:44')作为字符串读取。我的开发环境是Java 8,MySQL 5.7和tomcat 8.我已经声明了一个字符串数组String []数据来存储它。我使用Guice将数据数组的初始值注入空。但是,内存使用量仍然很大。这是我的代码:
String[] data;//size is 1,000,000
void generateDataWrapper(String params) {
//read over 13000000 dates string
ResultSet rs = mySQLCon.readData(params);
clearData(data);//set to empty string
int index = 0;
while(rs.next()) {
data[index++] = rs.getString("date");
if (index == (size - 1)) {//calculate every 1,000,000 total 13 times
//calculate statistics
...
//reset all to empty string
clearData(data);
index = 0;
}
}
}
//mySQLCon. readData function
ResultSet readData(String params) {
try {
String query = generateQuery(params);
Statement postStmt = connection.createStatement();
ResultSet rs = postStmt.executeQuery(query);
return rs;
} catch (Exception e) {
}
return null;
}
如果我调用此函数一次,内存达到12G,如果我再次调用它,内存将转到20G,第三次内存将转到25G并抛出'java.lang.OutOfMemoryError:GC开销限制超出了com.mysql.jdbc.MysqlIO.nextRowFast(MysqlIO.java:2174)中的错误
这是错误消息的一部分:
java.lang.OutOfMemoryError: GC overhead limit exceeded
com.mysql.jdbc.MysqlIO.nextRowFast(MysqlIO.java:2174)
com.mysql.jdbc.MysqlIO.nextRow(MysqlIO.java:1964)
com.mysql.jdbc.MysqlIO.readSingleRowSet(MysqlIO.java:3316)
com.mysql.jdbc.MysqlIO.getResultSet(MysqlIO.java:463)
com.mysql.jdbc.MysqlIO.readResultsForQueryOrUpdate(MysqlIO.java:3040)
com.mysql.jdbc.MysqlIO.readAllResults(MysqlIO.java:2288)
com.mysql.jdbc.MysqlIO.sqlQueryDirect(MysqlIO.java:2681)
com.mysql.jdbc.ConnectionImpl.execSQL(ConnectionImpl.java:2547)
com.mysql.jdbc.ConnectionImpl.execSQL(ConnectionImpl.java:2505)
com.mysql.jdbc.StatementImpl.executeQuery(StatementImpl.java:1370)
sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
sun.reflect.NativeMethodAccessorImpl.invoke(Unknown Source)
sun.reflect.DelegatingMethodAccessorImpl.invoke(Unknown Source)
java.lang.reflect.Method.invoke(Unknown Source)
我已将垃圾收集算法更改为: -XX:+ UseConcMarkSweepGC -XX:+ CMSIncrementalMode 但它没有帮助。 我试过将数据更改为静态变量,仍然会有这个问题。 目前JVM堆是8g,tomcat内存是24g,但是,我不认为增加内存会解决问题。
我不明白为什么每次调用此功能时我的记忆力仍在增加,有人可以给我一些建议吗?
答案 0 :(得分:3)
必须关闭像ResultSet
这样的已使用资源才能释放底层系统资源。这可以像try (ResultSet resultSet =...)
一样自动完成declaring the resources in a try-block。
您可以在ResultSet
请求fetch only a limited number of rows from database而不是所有这些请求时尝试creating a heap dump。
当对象不再被引用时,它们有资格进行垃圾回收。因此,只要引用了数组对象的整个大小,它就会保留在内存中。如果它不再被引用并且VM内存不足,它将能够处理数组对象,可能避免出现OutOfMemoryError。
exploring it in the tool jvisualvm of the JDK和Bindings.select
可以分析意外的高内存使用量。
答案 1 :(得分:1)
此外,您可以将字符串数组更改为长数组,因为字符串会消耗大量内存。在您的情况下,日期字符串的大小是38个字节(19个字符* 2个字节),而一个长度只需要8个字节的内存。
long[] data;//size is 1,000,000
void generateDataWrapper(String params) {
//read over 13000000 dates string
ResultSet rs = mySQLCon.readData(params);
clearData(data);//set to empty string
int index = 0;
SimpleDateFormat formater = new SimpleDateFormat("MM-dd-YYYY HH:mm:ss");
while(rs.next()) {
try{
Date date = formater.parse(rs.getString("date"));
data[index++] = date.getTime();
}catch(ParseException pe) {
pe.printStackTrace();
}
if (index == (size - 1)) {//calculate every 1,000,000 total 13 times
//calculate statistics
...
//reset all to empty string
clearData(data);
index = 0;
}
}
}
只要你需要你的字符串,你就可以用以下
来解析它SimpleDateFormat formater = new SimpleDateFormat("MM-dd-YYYY HH:mm:ss");
Date date = new Date(data[i]);
String dateString = formater.format(date);
答案 2 :(得分:0)
首先,感谢您的所有建议。我已经从mm759中读到了这一点,并意识到在我读完之后我忘了关闭ResultSet。在我添加rs.close()之后,每次都需要相同的时间才能完成,尽管内存将达到我设置的最大内存。