大型网站(Google,Facebook等)如何实时向所有服务器传播信息?

时间:2010-06-30 14:30:34

标签: replication

我正在寻找一些研究技术。我很惊讶你可以进入[在这里插入大型网站]的界面,更新一个设置,并在几秒钟之内将其推出,这样它就可以全面实现。一个很好的例子就是adwords。如果您使用adwords并更改广告系列,则这些设置会以唯一ID存储在服务器上。广告代码使用该ID调用服务器,并立即提取信息(大小,颜色等)以显示广告。谷歌如何能够如此迅速地将其推向数十万台服务器?他们使用什么类型的数据库系统?

4 个答案:

答案 0 :(得分:6)

Google已发布其Google File System(或曾经知道的“BigFiles”)和BigTable的研究论文,两者都在其服务中广泛使用。那些可能会很好地阅读,因为它们可能引用现有技术。

答案 1 :(得分:1)

您可能想了解Oracle如何构建RAC以跨多个数据库传播数据:http://download.oracle.com/docs/cd/B14117_01/server.101/b10727/ha_strea.htm

答案 2 :(得分:0)

我知道Facebook使用点对点推送服务器上的更新。

第一台服务器获得更新,然后将其发送给其他做同样事情的人......直到更新到他们所有服务器上为止!

答案 3 :(得分:0)

我一直在研究类似的信息。

寻找“结构化数据”。​​

细节:MojoDB,CouchDB。 寻找mojodb网站的比较。

Facebook已经使Cassandra(分布式数据库)成为开源软件。我认为他们和其他许多人现在都在使用它。

还要关注Hadoop框架和Map / Reduce。