我想存储近2000台机器'度量标准,每台机器有70个指标, 和scrape-interval = 10s
那么我的Prometheus服务器至少需要什么样的配置或性能?
并且在这种情况下,我该如何进行配置?
像这样:-storage.local.retention=2160h
-storage.local.memory-chunks=5242880
-storage.local.max-chunks-to-persist=3097152
-storage.local.num-fingerprint-mutexes=10240
-storage.local.series-file-shrink-ratio=0.2
-storage.local.checkpoint-interval=5m
期待您的建议。
最好的关注!
答案 0 :(得分:1)
您还可以查看Prometheus 2.0。它目前处于测试阶段,在下一个测试版中有一个文件格式更改(因此您可能最终必须至少删除一些历史数据一次),但其存储容量无比更好,并且没有任何内容可供配置。
它应该能够处理你的预期负荷而不会出汗(着名的遗言,我知道)。
答案 1 :(得分:0)
你是否遇到了prometheus跟上当前负荷的麻烦?我强烈建议您阅读此https://prometheus.io/docs/operating/storage/#persistence-urgency-and-rushed-mode,然后回答这个更具体的问题。此外,您的保留时间几乎肯定会导致您的问题。 Prometheus不适合长期存储,可能会导致您进入rushmode并且永远不会离开它导致公制摄取停止。
答案 2 :(得分:0)
Prometheus本地存储不适合大型保留。它具有默认(建议)保留时间-15天。使用remote storage solutions来存储长期数据。