不同的访问者指标如何相关?

时间:2009-10-13 02:35:45

标签: scalability analytics metrics

假设有人说,有人告诉你,由于成功的营销活动,每天可以期待X(如100,000或者其他)的独立访客数量。

这如何转化为峰值请求/秒?峰值同步请求?

显然,这取决于许多因素,例如每个用户会话请求的典型页数或典型页面的加载时间,或许多其他因素。这些是其他变量Y,Z,V等。

我正在寻找某种功能,甚至只是一种比率来估算这些指标。显然是为了规划生产环境的可扩展性策略。

这可能发生在我正在努力的生产网站上。任何有助于估算这些的帮助都是有用的。

3 个答案:

答案 0 :(得分:4)

答案 1 :(得分:2)

我首先假设“每天”意味着“在8小时工作日”,因为这是一个更糟糕的情况,可能没有不必要的最坏情况。

因此,如果你在8小时内获得平均100,000,并且每个人到达的时间是随机的(独立于其他人),那么在几秒钟内你会得到更多,在几秒钟内你就会得到更多越来越少。细节是一个名为“queueing theory”的知识分支。

假设Pollaczek-Khinchine formula适用,那么因为您的服务时间(即每个请求的CPU时间)非常小(可能不到一秒),因此您可以承受相当高的费用(即大于50%)服务器利用率。

总之,假设每个请求的时间很短,您需要的容量比服务平均需求所需的容量更高(但这里的好消息:并不高得多)。

坏消息是,如果您的容量低于平均需求,那么平均排队延迟是无限的(或者更现实地,一些请求将在服务之前被放弃)。

另一个坏消息是,当您的服务时间很短时,您对平均需求的暂时波动很敏感,例如......

  • 如果需求在午餐时间达到峰值(即与其他时间的平均需求不同),或者即使由于某种原因它在5分钟内达到峰值(在电视广告时间期间,例如)

  • 如果您无法让客户排队等候这段时间(例如排队整个午餐时间,或整个五分钟的商业广告时间)

......那么你的能力需要足以满足那些短期的高峰需求。 OTOH你可能会认为你有可能失去盈余:不值得设计高峰容量(例如在午餐时间雇用额外的呼叫中心工作人员)以及你可以负担一定比例的被遗弃电话。

答案 2 :(得分:1)

这将取决于营销活动。例如,电视广告将同时带来大量流量,对于报纸广告而言,它将在一天内展开更多。

我对营销类型的体验是,他们只是从太阳不发光的地方拉出一个数字,通常比现实高出至少一个数量级

相关问题