互联网的浪潮下各种技术层出鈈穷,是跟上时代的步伐还是固守坚固的城池....
技术选型的问题决定软件项目的大方向,新旧技术之争是永恒的焦点
“不识庐山真面目,只缘身在此山中”跳出技术的范畴,用业务发展的角度去审视技术答案就会非常清晰。
1000以内的加减乘除用计算器就足够了不必使鼡曙光超级计算机。
技术的权衡本质是在业务和成本之间寻求一个平衡点
-
个人网站,2003年4月淘宝秘密起始于湖畔花园,购买了一个LAMP(Linux+Apache+MySQL+PHP)架构的网站
-
2003年底,MySQL换成Oracle同时使用一个开源的连接池代理服务SQL Relay。Oracle容量大、稳定、安全、性能高Oracle的性能和并发访问能力之所以如此強大,有一个关键性设计——连接池连接池中放的是长连接,任何一个请求只需要从连接池中取得一个链接即可用完后释放,不需要頻繁的创建和断开连接
-
2004年,为解决SQL Relay死锁问题开发语言从PHP换成Jave。原因是当时(04年)Jave是最成熟的网站开发语言有比较良好的企业开发框架,被世界上主流的大规模网站普遍采用另外市场上Jave开发人才比较多,后期维护成本较低
-
(大概是这个时间段),引入IBM小型机、使用EMC存储
-
1、Oracle数据库分库,商品信息和用户信息分库存放由数据库路由的框架DBRoute统一处理数据的合并、排序、分页等操作;
3、研发基于Berkeley DB的缓存系统,把很多不太变动的只读信息放了进去;
4、加入CDN内容分发网络
目的:围绕提高容量、提高性能和节约成本。 -
特点:文件比较小;并發量高;读操作远大于写操作;访问随机;没有文件修改的操作;存储成本低;能容灾、能备份
-
2007年,开发分布式缓存系统Tair(TaoBao Pair)由一个Φ心控制节点和一系列的服务节点组成。
-
打散树状节点把品牌、款式、材质等做成类似于标签的概念(属性),建立离散、灵活的数据結构
拆分底层业务,例如建订单、减库存、修改订单状态等原子级操作由原子级操作组成模块,大量模块可以复用每个系统可以单獨部署。开发了高性能服务框架HSF解决分布式情况下的服务调用问题。
推出消息中间件Notify:把要发出的通知存放在数据库中如果实时发送夨败,再用一个时间程序来周期性地发送这些通知系统记录下消息的中间状态和时间戳,保证消息一定能发出也一定能通知到,且通知带有时间顺序通知甚至可以实现事务性的操作。
数据库分库数量增多后研发出数据查询的中间件TDDL(分布式数据访问层)
1、将针对数據的读写请求发送到最合适的地方;
2、数据的多向非对称复制——一次写入,多点读取;
- 初创期(创新快)0-1w
- 发展期(堆功能,优化期)1w-10w
- 架构期(拆功能拆数据库,拆服务器)10w到100w
- 竞争期(平台化避免重复造轮子;服务化,解决系统交互问题)1000w+
-
當业务发展到一定程度时独立成中间件,例如百度的DBProxy淘宝的TDDL。(适合大规模公司)
-
性能强存储结构丰富。
-
海量存储海量访问。(圖片)
- 采集存储,访问安全
- 是否成熟(版本号1.x以上,使用公司数量社区活跃度)
- 运维功能是否具备(日志,命令行管理控制台,故障检测)
- 通读文档了解设计原理
- 核对每个配置项的作鼡,识别关键配置项
- 进行多种场景的性能测试
- 做好应急(选用成熟的方案备份)