嘉宾商学吴婷:12306,一个比谷歌更强大的网站

嘉宾校友 · 2024-02-08

你可能不知道,中国最强网站不是抖快淘拼,也不是两微一Q,而是12306。甚至它拿到国际上,也是遥遥领先。


春运了,婷姐给你分析下我们人人都要用到的12306这个案例。


一个网站强不强,主要看能承接多大的流量。谷歌日均访问量是35亿次,而在春节、国庆这种节日期间,12306日均访问量能超过500亿次,几乎是谷歌的15倍。


相比之下,一天几个亿都撑不住的ChatGPT,都不好意思上桌。


肯定有人要吐槽,12306容易卡,耽误事。


其实这还真不算什么。


2019年5月,微软Azure在全球范围内宕机2小时,多个微软服务器都运行不了;2020年12月,谷歌服务器又突然宕机45分钟,全球用户都受到影响。


宕机原因可能有很多,但其实主要的是访问量突然暴涨。这种考验,12306每年都要经受好几次。


除了承接的流量大不大,一个网站强不强,还要看它的运算能力如何。


12306本质上是卖座位的,咱们可以对标某宝。


表面看某宝的SKU肯定比12306多,搜索一次能出来成千上万个SKU,但是他们卖货是一件货卖一次,卖一件扣一件库存,是静态数据;而12306一个座位可以卖很多次,而且是不同的人在不同的地点卖,路程也是随机的,是动态数据。


比如一辆途径10个站的高铁,一个座位就有45个SKU,怎么算的?9+8+7+...一直加到1,等于45。如果是20个站呢?如果有20节车厢呢?这背后的数字很大了。


还有更难的,12306要做到实时刷新,根据余票、起止站和身份信息快速了解全国所有车次的情况,再跟各个车站的售票系统实时连接,筛选出最符合需求的车票。这些都是电商平台不需要考虑的。


而且刚才说的还是一张票出票的流程。如果一天中有500亿个这样的请求,12306的脑子要转得多快才行。


问题来了,为什么12306这么强大呢?


大家应该还记得,它刚出来那几年经常崩溃,花式验证码也逼疯了不少人。能做到今天这个成绩,主要是因为突破了承接流量的瓶颈。


能不能接得住流量,就看你的带宽和服务器够不够用。


2011年,12306购票功能亮相即崩溃,就是因为带宽不够,才0.6G。


后来带宽一路上调,涨到2015年的12G,涨幅20倍。但是12306的尖峰日点击量也涨了,从不足10亿涨到297亿次,提高30多倍。


就好像原本只有一条路,天天堵车;后来又修了1条路,但是车也更多了,该堵还是堵。


12306只好转变思路,不能只修路,还要搞立体交通。于是它拉上阿里云,把75%的余票查询流量放在阿里云数据中心,少部分购票流量由铁路总公司处理,铁道科研院负责数据备份,做成两地三中心混合云架构,才彻底解决了流量承接问题。


另外,人工智能和大数据也帮了大忙。


比如通过大数据分析,可以提前预判热门地区的需求,科学分配算力;再比如对付电子黄牛,他们所谓的抢票黑科技,就是用程序自动刷新自动点击,咱们手动点,一秒能点三五次,而程序能点几百上千次,其实这会给网站带来巨大压力。所以12306通过人工智能技术,能识别出这些程序点击,直接拦截屏蔽,后来推出的候补功能,更是彻底摧毁了电子黄牛的根基。


经过这几年的进化,12306不但成了技术大拿,还越来越有暖男的味道。比如到车站了发现没带身份证,不要慌,12306首页找到“温馨服务”,点进去可以申请“临时身份证”,放心过闸机;他们还开发了爱心版12306,专门给老人用,进入“我的”页面,点击“爱心版”就能得到一个更简洁的页面,操作更简单,字体也放大了,对老人很友好。


这几年大家都在喊科技平权,卖手机的、卖汽车的,都在用这个口号揽客,其实12306才是真正的科技平权。年年挨骂,还不是因为谁都离不开它。


作者 | 吴婷


参考资料:

[1]家宁 刘家豪.今天起铁路告别纸质车票,来看看火车票70年间的变化.铁科院 .2020

[2]张遥.阿里云确认与12306合作 承接75%的余票查询流量.新华社.2015

[3]张倩.12306购票上新,让旅客跑赢“黄牛”.新京报.2024

[4]杨鑫倢.马云谈“支援”12306:每年都崩溃,阿里不收一分钱.澎湃新闻.2015

[5]为了让你抢到票,你知道12306有多努力吗?.太平洋科技.2023