我有一个spark应用程序,该应用程序读取快照压缩的镶木地板文件,然后对它执行大约30个不同的请求,然后将结果聚合到一个csv文件中。
这样做,我有错误:
Container is running beyond physical memory limits. Current usage: 1.5 GB of 1.5 GB physical memory used; 3.5 GB of 3.1 GB virtual memory used
我知道这是一个常见问题,但是我不知道这是由于我的应用程序(我应该对其进行优化吗?)还是由于群集配置引起的。有人说,快速的解压缩也会使用堆外内存,因此应该将其放大。
所以我无法弄清楚该错误的真正原因,物理解释是什么?