从上百幅架构图中学大型网站建设经验（上）

编者注：本文为历史博文归档；涉及 JDK、框架与工具链版本请以当前官方文档为准。引用外链图片可能失效，阅读时请注意时效性。

从上百幅架构图中学大型网站建设经验（上）

引言

近段时间以来，通过接触有关海量数据处理和搜索引擎的诸多技术，常常见识到不少精妙绝伦的架构图。除了每每感叹于每幅图表面绘制的精细之外，更为架构图背后所隐藏的设计思想所叹服。

个人这两天一直在搜集各大型网站的架构设计图，一为了一饱眼福，领略各类大型网站架构设计的精彩之处；二来也可供闲时反复琢磨体会，何乐而不为呢？特此，总结整理了诸如国外 Wikipedia、Facebook、Yahoo!、YouTube、MySpace、Twitter，国内如 优酷网 等大型网站的技术架构（本文重点分析优酷网的技术架构），以飨读者。

本文着重凸显每一幅图的精彩之处与其背后含义，而图的说明性文字则从简从略。好好享受此番架构盛宴吧。当然，若有任何建议或问题，欢迎不吝指正。

1. WikiPedia 技术架构

WikiPedia 技术架构图，Copy @Mark Bergsma

数据规模：来自 Wikipedia 的数据显示，峰值每秒钟 3 万个 HTTP 请求，每秒钟 3G bit 流量，近乎 375MB，涉及 350 台 PC 服务器。
GeoDNS：40-line patch for BIND to add geographical filters support to the existent views in BIND。其作用是把用户带到最近的服务器。GeoDNS 在 WikiPedia 架构中担当重任，当然是由 WikiPedia 的内容性质决定的——面向各个国家、各个地域。
负载均衡：采用 LVS，请看下图：

2. Facebook 架构

Facebook 搜索功能的架构示意图

细心的读者一定能发现，上幅架构图之前出现在此文之中：《从几幅架构图中偷得半点海量数据处理经验》。本文与前文最大的不同是，前文只有几幅，此文系列将有上百幅架构图，任您尽情观赏。

3. Yahoo! Mail 架构

Yahoo! Mail 架构

Yahoo! Mail 架构部署了 Oracle RAC，用来存储 Mail 服务相关的 Meta 数据。

4. Twitter 技术架构

Twitter 的整体架构设计图

Twitter 平台大致由 twitter.com、手机以及第三方应用构成，如下图所示（其中流量主要以手机和第三方为主要来源）：

缓存在大型 Web 项目中起到了举足轻重的作用，毕竟数据越靠近 CPU 存取速度越快。下图是 Twitter 的缓存架构图：

关于缓存系统，还可以看看下幅图：

5. Google App Engine 技术架构

GAE 的架构图

简单而言，上述 GAE 的架构分为如图所示的三个部分：前端、Datastore 和服务群。

前端：包括 4 个模块：Front End，Static Files，App Server，App Master。
Datastore：是基于 BigTable 技术的分布式数据库。虽然其也可以被理解成为一个服务，但是由于其是整个 App Engine 唯一存储持久化数据的地方，所以其是 App Engine 中一个非常核心的模块。其具体细节将在下篇和大家讨论。
服务群：整个服务群包括很多服务供 App Server 调用，比如 Memcache、图形、用户、URL 抓取和任务队列等。

6. Amazon 技术架构

Amazon 的 Dynamo Key-Value 存储架构图

可能有读者并不熟悉 Amazon，它现在已经是全球商品品种最多的网上零售商和全球第 2 大互联网公司，而之前它仅仅是一个小小的网上书店。下面，咱们来见识下它的架构。

Dynamo 是亚马逊的 Key-Value 模式的存储平台，可用性和扩展性都很好，性能也不错：读写访问中 99.9% 的响应时间都在 300ms 内。按分布式系统常用的哈希算法切分数据，分放在不同的 Node 上。Read 操作时，也是根据 Key 的哈希值寻找对应的 Node。Dynamo 使用了 Consistent Hashing 算法，Node 对应的不再是一个确定的 Hash 值，而是一个 Hash 值范围。Key 的 Hash 值落在这个范围内，则顺时针沿 Ring 找，碰到的第一个 Node 即为所需。

Dynamo 对 Consistent Hashing 算法的改进在于：它放在环上作为一个 Node 的是一组机器（而不是 Memcached 把一台机器作为 Node），这一组机器是通过同步机制保证数据一致的。

下图是分布式存储系统的示意图，读者可观摩之：

Amazon 的云架构图如下：

Amazon 的云架构图

7. 优酷网的技术架构

从一开始，优酷网就自建了一套 CMS 来解决前端的页面显示，各个模块之间分离得比较恰当，前端可扩展性很好。UI 的分离，让开发与维护变得十分简单和灵活。下图是优酷前端的模块调用关系：

这样，就根据 module、method 及 params 来确定调用相对独立的模块，显得非常简洁。下图是优酷的前端局部架构图：

优酷的数据库架构也是经历了许多波折，从一开始的单台 MySQL 服务器（Just Running）到简单的 MySQL 主从复制、SSD 优化、垂直分库、水平 Sharding 分库。

7.1 简单的 MySQL 主从复制

MySQL 的主从复制解决了数据库的读写分离，并很好地提升了读的性能，其原图如下：

其主从复制的过程如下图所示：

但是，主从复制也带来其他一系列性能瓶颈问题：

写入无法扩展
写入无法缓存
复制延时
锁表率上升
表变大，缓存率下降

问题产生总得解决，这就产生了下面的优化方案。

7.2 MySQL 垂直分区

如果把业务切割得足够独立，那把不同业务的数据放到不同的数据库服务器将是一个不错的方案。而且万一其中一个业务崩溃了也不会影响其他业务的正常进行，并且也起到了负载分流的作用，大大提升了数据库的吞吐能力。经过垂直分区后的数据库架构图如下：

然而，尽管业务之间已经足够独立了，但是有些业务之间或多或少总会有点联系，如用户，基本上都会和每个业务相关联。况且这种分区方式，也不能解决单张表数据量暴涨的问题，因此为何不试试水平 Sharding 呢？

7.3 MySQL 水平分片（Sharding）

这是一个非常好的思路，将用户按一定规则（按 id 哈希）分组，并把该组用户的数据存储到一个数据库分片中，即一个 Sharding。这样随着用户数量的增加，只要简单地配置一台服务器即可，原理图如下：

如何来确定某个用户所在的 Shard 呢？可以建一张用户和 Shard 对应的数据表，每次请求先从这张表找用户的 Shard ID，再从对应 Shard 中查询相关数据，如下图所示：

但是，优酷是如何解决跨 Shard 的查询呢？这是个难点。据介绍优酷是尽量不跨 Shard 查询，实在不行通过多维分片索引、分布式搜索引擎，下策是分布式数据库查询（这个非常麻烦而且耗性能）。

7.4 缓存策略

貌似大的系统都对“缓存”情有独钟，从 HTTP 缓存到 Memcached 内存数据缓存，但优酷表示没有用内存缓存，理由如下：

避免内存拷贝，避免内存锁。
如接到老大哥通知要把某个视频撤下来，如果在缓存里是比较麻烦的。

而且 Squid 的 write() 用户进程空间有消耗，Lighttpd 1.5 的 AIO(异步 I/O) 读取文件到用户内存导致效率也比较低下。

但为何我们访问优酷会如此流畅，与土豆相比优酷的视频加载速度略胜一筹？这个要归功于优酷建立的比较完善的内容分发网络（CDN）。它通过多种方式保证分布在全国各地的用户进行就近访问——用户点击视频请求后，优酷网将根据用户所处地区位置，将离用户最近、服务状况最好的视频服务器地址传送给用户，从而保证用户可以得到快速的视频体验。这就是 CDN 带来的优势：就近访问。

附注：
此段优酷网的技术架构整理于此处：http://www.itivy.com/ivy/archive/2011/8/13/the-architecture-of-youku.html
同时推荐一个非常好的站点：http://www.dbanotes.net/

从上百幅架构图中学得半点大型网站建设经验（上），完。

后记

此篇文章终于写完了。从昨日有整理此文的动机后，到今日上午找电脑上网而不得，再到此刻在网吧完成此文，着实也体味了一把什么叫做为技术狂热的感觉。大型网站架构是一个实战性很强的东西，而你我或许现在暂时还只是一个在外看热闹的门外汉而已。不过，没关系，小鱼小虾照样能畅游汪汪大洋，更何况日后亦能成长为大鱼大鲨。

欢迎关注《从上百幅架构图中学得半点大型网站建设经验（下）》。有任何问题或错误，欢迎不吝指正。谢谢大家。本文完。

说明

时效性提示：本文整理归档自 2011 年左右的历史博文，文中涉及的架构方案（如 Lighttpd 1.5、早期 Twitter/Facebook 架构等）及数据规模仅代表当时的技术背景。实际生产环境中，相关技术栈与架构模式可能已发生显著演进，请以各官方最新文档与实践为准。

本文地址：https://1diff.fun/archives/cong-shang-bai-fu-jia-gou-tu-zhong-xue-da-xing-wang-zhan-jian-she-jing-yan--shang.html

如果对本文有什么问题或疑问都可以在评论区留言，我看到后会尽量解答。

从上百幅架构图中学大型网站建设经验（上）