scalability - 不同的访问者指标如何相关？

时间：2009-10-13 02:35:45

标签： scalability analytics metrics

假设有人说，有人告诉你，由于成功的营销活动，每天可以期待X（如100,000或者其他）的独立访客数量。

这如何转化为峰值请求/秒？峰值同步请求？

显然，这取决于许多因素，例如每个用户会话请求的典型页数或典型页面的加载时间，或许多其他因素。这些是其他变量Y，Z，V等。

我正在寻找某种功能，甚至只是一种比率来估算这些指标。显然是为了规划生产环境的可扩展性策略。

这可能发生在我正在努力的生产网站上。任何有助于估算这些的帮助都是有用的。

答案 0 :(得分：4)

答案 1 :(得分：2)

我首先假设“每天”意味着“在8小时工作日”，因为这是一个更糟糕的情况，可能没有不必要的最坏情况。

因此，如果你在8小时内获得平均100,000，并且每个人到达的时间是随机的（独立于其他人），那么在几秒钟内你会得到更多，在几秒钟内你就会得到更多越来越少。细节是一个名为“queueing theory”的知识分支。

假设Pollaczek-Khinchine formula适用，那么因为您的服务时间（即每个请求的CPU时间）非常小（可能不到一秒），因此您可以承受相当高的费用（即大于50％）服务器利用率。

总之，假设每个请求的时间很短，您需要的容量比服务平均需求所需的容量更高（但这里的好消息：并不高得多）。

坏消息是，如果您的容量低于平均需求，那么平均排队延迟是无限的（或者更现实地，一些请求将在服务之前被放弃）。

另一个坏消息是，当您的服务时间很短时，您对平均需求的暂时波动很敏感，例如......

......那么你的能力需要足以满足那些短期的高峰需求。 OTOH你可能会认为你有可能失去盈余：不值得设计高峰容量（例如在午餐时间雇用额外的呼叫中心工作人员）以及你可以负担一定比例的被遗弃电话。

答案 2 :(得分：1)

这将取决于营销活动。例如，电视广告将同时带来大量流量，对于报纸广告而言，它将在一天内展开更多。

我对营销类型的体验是，他们只是从太阳不发光的地方拉出一个数字，通常比现实高出至少一个数量级