我们目前在JakartaEE应用程序中使用带有eclipselink的wildfly作为JPA实现。应用程序本身是具有REST,Service和DAO层的RESTful Web服务器。 DAO是唯一使用EntityManager的层。我们总是出于各种原因而分离实体。
但是,通过使用这种方法,我们注意到内存使用量激增,在某些情况下会导致OutOfMemory
错误。
使用VisualVM,我们已经指出了问题,即内存中有大量实体实例。
这是我们遇到的(一些历史数据的迁移)问题的代码示例
LinkedList<SomeEntity> entities; //Here is loaded set of entities to process
while(!entities.isEmpty()) {
SomeEntity entity = entities.removeFirst(); //We are iterating in quee fashion to allow GC to remove already processed items from memory
if (entity.getItems().isEmpty()) {
//this call is transactional
entityService.delete(entity.getId());
} else if (entity.getItems().stream().anyMatch(item -> item.getQuantity() > 0.0)){
//DO SOME CHANGES ON ENTITY
//this call is transactional
entityService.update(operation);
}
entity = null;
}
entities = null;
relationshipSourceObject in org.eclipse.persistence.internal.indirection.UnitOfWorkQueryValueHolder#90312
owner in org.eclipse.persistence.internal.descriptors.changetracking.AttributeChangeListener#26713
,...)这些都没有帮助:
据我所知,WEAK应该足以防止eclipselink将引用存储太长时间并防止GC。但是无论如何它都存储在某个地方,并且由于可以从GC根访问引用,因此将其更新。谁能解释这种行为或为我指出去哪里寻找方向?
发表评论和克里斯回答。有关我们如何使用EM和交易的更多信息。
我们正在使用EntityManager.detach方法进行分离,并且引用(@OneToMany
,@ManyToMany
等)已应用Cascade.DETACH。在分离之前先完成必要的延迟加载引用的加载。
我同意有关重新获取实体的部分。我不介意在同一时间在内存中拥有同一实体的多个实例。我的问题是为什么它没有被垃圾收集。
示例代码中的实体列表在后续数据库UPDATE或DELETE中的一个事务中加载(这也将某些位提取到内存中以创建更多实例)是每个实体的另一个事务。我可能希望在初始调用期间使用大部分堆,然后慢慢清除或保持大致相同。
关于使用EntityManager
我们将Wildfly用作JakartaEE容器。默认情况下,它是作为JPA提供程序与hibernate一起提供的,但是我们在eclipselink中添加了模块,并在persistence.xml中配置了提供程序
根据documentation容器管理的EntityManager根据需要创建实例。
答案 0 :(得分:0)
您是否在缓存实体?清除还不足以让您有效地进行缓存,好像您要尝试的那样可能与您当前的问题有关。从EntityManager加载的所有内容都引用了该EntityManager,因此我猜您正在读取部分被提取并缓存它们的大量实体,然后使用EntityManager.clear()尝试分离它们。
这些实体不再被“管理”,但仍引用EntityManager。一旦您获取了某些内容(例如您已在代码中显示过的entity.getItems()调用),并假设这是一个标准的OneToMany,其后向指针默认为延迟加载,这将强制将所有“项目”提取到内存中。由于它们具有向后引用,而EntityManager未引用“此”实体,因此Item必须重新获取该实体。因此,您现在在内存Entity1'-> Item1-> Entity1中具有同一实体的两个实例。
这可以通过更复杂的对象图和重复的清除调用轻松建立。
这可以解决,但是可以通过减少在EntityManager中的操作范围来减少开销,以便可以将其重新用于与该对象图相关的标识目的,并可以收集垃圾(并由GC清除)当用于读取的对象也被GC清除时。