图吧大神求科普,CPU的浮点运算有什么cpu性价比高作用

10年前我们觉得65nm工艺是极限,因为到了65nm节点二氧化硅绝缘层漏电已经不可容忍。所以工业界搞出了HKMG,用high-k介质取代了二氧化硅,传统的多晶硅-二氧化硅-单晶硅结构变成了金属-highK-单晶硅结构。&br&5年前我们觉得22nm工艺是极限,因为到了22nm沟道关断漏电已经不可容忍。所以工业界搞出了finfet和FD-SOI,前者用立体结构取代平面器件来加强栅极的控制能力,后者用氧化埋层来减小漏电。&br&现在我们觉得7nm工艺是极限,因为到了7nm节点即使是finfet也不足以在保证性能的同时抑制漏电。所以工业界用砷化铟镓取代了单晶硅沟道来提高器件性能。&br&&br&当我们说工艺到了极限的时候,我们其实是在说在现有的结构、材料和设备下到了极限。然而每次遇到瓶颈的时候,工业界都会引入新的材料或结构来克服传统工艺的局限性。&br&当然这里面的代价也是惊人的,每一代工艺的复杂性和成本都在上升,现在还能够支持最先进工艺制造的厂商已经只剩下三家半了。&br&&br&&br&我还是写一下吧……&br&三家半指Intel、台积电、三星和GlobalFoundries。Global Foundries 10nm至少要落后两年,所以算半家。&br&AMD 在2009年拆分了制造部门,成立了Global Foundries。IBM 在2014年将整个半导体部门卖(应该说是送……)给了Global Foundries。所以现在AMD 和IBM 都没有制造部门了。
10年前我们觉得65nm工艺是极限,因为到了65nm节点二氧化硅绝缘层漏电已经不可容忍。所以工业界搞出了HKMG,用high-k介质取代了二氧化硅,传统的多晶硅-二氧化硅-单晶硅结构变成了金属-highK-单晶硅结构。 5年前我们觉得22nm工艺是极限,因为到了22nm沟道关…
圣诞节单身狗寂寞,说一个大力出悲剧的产品吧:Intel的&b&奔腾4和背后的NetBurst&/b&架构。&br&这是&b&Intel历史上最大的失败&/b&。&br&这个失败直接导致了:&br&CPU市场变成了Intel和AMD的二人转,&br&AMD出现了一大堆粉丝,&br&Intel间接放弃了Pentium这个品牌,&br&&b&图拉丁吧的诞生&/b&。&br&故事有一点长,我们慢慢讲,反正单身狗有空。&br&&br&很久很久以前,CPU市场还不是现在这样的格局。当时,PC业方兴,CPU设计制造入行门槛不算高,单单一个486,就有七八家公司在制造。如同现在漫山遍野的黄焖鸡米饭,说不清谁是正宗谁是山寨。&br&当然,这里面领先的企业一直是Intel。&br&&br&转眼到了90年代末,随着行业发展,竞争激烈,一些公司相继退出了CPU制造业,当时,还在运作的相关企业大概还剩四家:&br&&b&Intel、AMD、Cyrix、IDT&/b&。&br&其中,Cyrix和IDT明显就是要挂,最终也确实挂了,被来自台湾的威盛电子(VIA)收购,最后,VIA基本上也挂了。&br&这时候,如果AMD再撑不住,那Intel就会成为这个行业的垄断者,千秋万代一统江湖。&br&当时,AMD情况并不好,其拳头产品K6-2只能勉强和Intel的低端产品Celeron(赛扬)打平,尚不足以对Pentium II造成威胁,同时,在Pentium II的基础上,推出了&b&性能更好的Pentium III&/b&。&br&intel的春秋大梦,看起来就不远处。&br&&br&这个时候,悬崖边上的AMD推出了一款里程碑式的产品:&b&基于K7架构的Athlon(速龙)&/b&。&br&得益于表现优异的K7架构,Athlon和Pentium III的性能基本相同,互有胜负。但是对Intel来讲比较要命的的是,Athlon的价钱只有Pentium III的一半到2/3。&br&不按常理出牌的AMD立刻就得到了市场的认同。&br&(利益相关:我的第一颗CPU是Athlon 750)。&br&更要命的是,日,&b&AMD率先发布了1G主频的Athlon。这是CPU历史上第一次突破1G大关。&/b&&br&而1G的Pentium III,则恰好晚了两天。&br&自4004开始,相继开发出、286、386、486,一直到Pentium、Pentium II、Pentium III的CPU业王者Intel,居然让AMD拿了一血,这绝对是Intel的奇耻大辱。&br&更何况,AMD已经开始侵蚀Intel的市场占有率了。&br&Intel必须反击。&br&&br&需要说明的是,那个时候,AMD和Intel的竞争是非常激烈的,远不是现在挤牙膏局面。1999年2月发布的Pentium III,速度只有500 MHz,而到了2000年3月,intel就把Pentium III翻倍提高到了1 GHz。&br&这个时间段内,在AMD的重压之下,Intel至少出了三个&b&大力出悲剧&/b&的事故,其中每一个事故都可以在这个问题下构成一个单独的答案:&br&1,为了使用更快速的Rambus公司的内存,Intel开发了i820芯片组,该芯片组出现错误,被迫召回。&br&2,为了追求更高频率,Intel强行推出了1.13 GHz的Pentium III,该CPU出现错误,被迫召回。&br&3,为了更高速度,Intel选择了更高速的Rambus内存,而不是更便宜的DDR内存作为新一代内存方案,昂贵的Rambus被AMD等支持的DDR打得满地找牙,Intel被迫花巨资买断了和Rambus的合同,重回DDR阵营。&br&顺便说一句,Rambus绝对是坑Intel专业户……&br&&br&忍无可忍,Intel终于憋出了大招:采用&b&NetBurst架构的奔腾4&/b&。&br&Pentium 4的登场是震撼的。当时,AMD和intel还在1GHz左右奋战,最高也就是1.1G这个样子,而Pentium 4出场就是1.4G和1.5G,一下子就把AMD拉开了一大截。&br&但是很快大家就发现不对,Pentium 4为什么这么慢呢?&br&倒不是说Pentium 4真的就比Pentium III慢,而是说,按照跑分情况测算,Pentium 4的1.5G大概只有Pentium III 1.2-1.3G的水平,到不了1.5G。&br&而之前,AMD和Intel都是耿直boy,相同频率的AMD和Intel,其速度基本相同,比如说,我的Athlon 750 MHz大概就和Pentium III 733 MHz相当。而这一次,Intel打破了这个常规,Pentium 4简而言之就是四个字:&b&高频低效&/b&。&br&为什么?奥秘就在这个&b&NetBurst架构。&/b&&br&&br&&br&NetBurst架构的Pentium 4采用了20级流水线技术,而之前的Athlon和Pentium III都是10级。&br&&br&简而言之,&b&长流水线的好处是容易把频率做高,但是代价就是效率低&/b&。&br&然而,Intel非常看好NetBurst架构。虽然有效率损失,但是,因为频率能做高,总的来说还是划算的。Intel认为,NetBurst架构最终可以将CPU频率提高到惊人的10Ghz,而Intel还有很多手段来降低长流水线的效率损失。&br&于是,Intel正式将&b&NetBurst架构作为公司的长期战略执行&/b&。&br&&br&作为历史悠久的行业领军者,Intel在市场营销方面一直是强项,Intel inside、给电脑一颗奔腾的心,以及那个著名的等、登登灯邓的旋律一直在轰炸洗脑。再加上Pentium 4确实速度还可以,虽然有种种吐槽,但是总算推广开了。&br&另一边,AMD被逼无奈,耍了个滑头,除了多番指出Intel的高频低效缺点之外,干脆玩了个文字游戏,强行把1.67G的CPU标成2000+,意思是可以媲美Pentium 4的2G。&br&上有政策,下有对策,古人诚不我欺。&br&&br&可是,这个时候,一个神奇的产品登场了:&b&图拉丁(Tualatin)&/b&。&br&图拉丁是最新一代使用130nm技术生产的Pentium III。相比于250nm和180nm的前两代产品,第三代的图拉丁性能更高,频率也更高,发热也更低,简直就是完美的CPU。&br&然而,这对Intel来说,并不是好消息:大家惊讶的发现,&b&图拉丁的性能,比第一代采用180nm技术生产的&/b&&b&Pentium 4更好&/b&。&br&这就很尴尬了。&br&对Intel来说,如果主推图拉丁,那之前针对Pentium 4的宣传就变成了妥妥的打脸。而现在,Intel的战略方向是NetBurst架构,这个架构目前虽然有问题,但是这是先进技术的发展方向,而图拉丁,则毫无疑问会被扔进历史的垃圾堆。&br&&b&Intel最终痛下杀手,将图拉丁核心的奔腾3,将政治不正确的图拉丁,砍掉了。&/b&&br&但是,图拉丁还是有利用价值的啊,虽然不能挑战高端的Pentium 4,但是,还是可以阉割成赛扬,在低端和AMD的Duron战斗嘛。&br&于是,低价高效的图拉丁赛扬,成了一代经典。&br&当然,还有一批服务器用户,坚定的认为,CPU只要最好不要最潮,这些人是内行,Intel得罪不起,于是做了一批特供版的图拉丁奔三,增加了二级缓存,专供服务器市场使用。&br&而这种服务器使用的Pentium III-S,就成了广大图拉丁粉丝心中的极品。&br&(利益相关:我有一片P3-S 1.266 G。)&br&&br&当然,现在图拉丁只是一个插曲,主线还是NetBurst大战AMD。&br&公平的说,Intel的眼光也不是很差,NetBurst并不是一个一无是处的架构。很快,Intel将130nm技术用在了第二代Pentium 4上,这一代的Pentium 4代号Northwood(北木)。北木核心总算能发扬出NetBurst的优点了,这一代奔腾4获得了成功。&br&另一方面,AMD也将新的130nm技术用在了新的Athlon XP上,同时完善了吹牛系统,将所有的CPU标称xx00+,对应相应的Pentium 4,也获得了巨大的成功。&br&当时的电脑圈,就像现在的手机圈一样,充满了争论。有支持性能略好但是价格更高的Pentium 4的,也有支持价格亲民性能不差的Athlon XP的,如同现在的苹果Vs安卓,华为Vs小米。&br&热闹得很。&br&&br&激战正酣之际,AMD又出了一个大招:&b&支持64位计算的K8核心&/b&。&br&PC终于进入了64位时代。&br&而在这个时候,Intel是如何应对的呢?&br&新一代使用31级流水线的Pentium 4。&br&丧心病狂。&br&20级的老一代Pentium 4效率已经够低了,更何况31级。&br&于是大家惊喜的发现,新一代Pentium 4,效率没什么长进,频率倒是刷得飞起。&br&而且,因为高频率,发热量也巨大。新一代3.8 GHz的Pentium 4,满载功率高达130瓦。&br&从Pentium时代的十几瓦,到Pentium 3时代的30瓦,再到130瓦,CPU能耗出现了大跃进,那几年,卖电源和散热器的厂家,可没少发财。&br&Intel终于意识到&b&,追求大力出奇迹的&/b&&b&NetBurst,错了&/b&。&br&Intel放弃了开发4 GHz Pentium 4的计划,投身双核事业。为此,Intel的CEO在某个娱乐节目上,下跪道歉。&br&&figure&&img src=&https://pic4.zhimg.com/50/v2-b37d714fc79a743b50c5_b.jpg& data-rawwidth=&300& data-rawheight=&225& class=&content_image& width=&300&&&/figure&&br&&br&AMD方面来说,得益于新一代Pentium 4的弱势,K8,不但获得了商业上的成功,甚至挤进了服务器和高性能计算市场。&br&紧接着,AMD再接再厉,推出了双核的K8处理器。&br&Intel那边则有些乱了阵脚。NetBurst已经被证明不是一个好架构,但是覆水难收,炒糊了的菜含泪也要吃完。Intel没有办法,直接把两个Pentium 4核心放着了一个CPU里面,叫Pentium D,被戏称为“胶水双核”。&br&一个Pentium 4的发热已经很可观了,两个放一起简直是画美不看。&br&主打性价比的AMD,居然看到了自己的CPU卖得比Intel贵的那一天。&br&那几年是AMD的黄金岁月。Intel在NetBurst上犯的致命错误给了AMD一个追赶乃至反超Intel的战略机遇期。&br&AMD赚了一大笔钱,用这笔钱,AMD收购了ATI,获得了显卡芯片设计制造能力,完成了对AMD来说至关重要的布局。&br&&br&AMD好像要赢了?&br&不,Intel翻盘了。&br&怎么翻盘的?&br&还记得图拉丁吗?&br&&br&当年,Intel虽说把桌面版的图拉丁砍了,但是,在笔记本市场上,高效率低能耗的图拉丁核心的Pentium III大受欢迎。&br&而移动版Pentium 4的耗电量完全不适合用在笔记本上。&br&于是,一个以色列的小组在接下来的日子里继续在图拉丁的基础上改进Pentium III,先后出了Pentium M、Core solo、Core Duo系列。如果说桌面市场Intel和AMD还能打得来来回回,笔记本市场则完全成了图拉丁子子孙孙的天下,AMD半点机会都没。毕竟他家东西的发热其实也不低。&br&图拉丁的子孙们有多高效呢?跑分结果表明,Pentium M 1.6G的性能足可以和2.4G的移动版Pentium 4抗衡。&br&一直有人在猜,如果把移动版的CPU请回来,Intel是不是就能战胜AMD呢?&br&&br&在Pentium D看上去就要输的时候,Intel终于痛下决心,放弃NetBurst。Intel解散了NetBurst小组,部分人员离职,实际上彻底承认NetBurst失败。同时,在Core Duo的基础上开发了新一代的Core 2(酷睿)系列,其桌面版型号代号Conroe,俗称扣肉。&br&&br&&b&扣肉一出,游戏结束&/b&。&br&自此,AMD再也没有过过一天安生日子。&br&再后来,就是i5秒全家,i7轰成渣了。&br&AMD后面的几代CPU,一蟹不如一蟹,最终堕落成农企。&br&而Intel也贯彻了敌不动我不动的精神,挤牙膏的提升性能。我现在在用的四年半之前的E-1230V2,完全不觉得比现在主流电脑差。&br&那个一年从500M飙升到1G的激动人心的年代,结束了。&br&&br&NetBurst可以说是Intel历史上最大的战略错误。在技术方面,Intel具有无与伦比的优势,但是因为在战略上走了一段弯路,给了AMD关键的5年喘息时机,如果从一开始Intel就坚持图拉丁路线,以Intel的资源,AMD即使活下来,现在也不可能混得很好,几乎没机会收购ATI。&br&而如果AMD不收购ATI,显卡市场也不是今天的格局。&br&同时,为了推进改善形象,Intel推出了酷睿,作为高端品牌,替代了Pentium。奔腾成了Intel旗下的中低端品牌。奔腾这样一个信达雅程度堪比奔驰宝马可口可乐的译名,和“给电脑一颗奔腾的芯”这种绝妙的广告词,辉煌不再。&br&而图拉丁,作为一个逆袭的传奇,成为了一种精神的象征。这种精神是:&br&&b&最潮的,最商业化的技术,不一定是最好的技术。&/b&&br&&b&最好的技术,才是最好的技术。&/b&
圣诞节单身狗寂寞,说一个大力出悲剧的产品吧:Intel的奔腾4和背后的NetBurst架构。 这是Intel历史上最大的失败。 这个失败直接导致了: CPU市场变成了Intel和AMD的二人转, AMD出现了一大堆粉丝, Intel间接放弃了Pentium这个品牌, 图拉丁吧的诞生。 故事…
&p&这个问题从高中就开始疑惑,计算机究竟是如何理解人类思维,如何进行计算?
我很想知道最最基本的工作原理,但是大学里好多课程,数字逻辑,计算机组成原理,只是从不同层次上解释了计算机的工作原理,很可惜的是,我并没有把知识穿起来。看了很多人的回答,大家也只是解释了一部分问题,没有完整的把计算机整个的抽象层次说清楚。在大学里我看到了 Charles Petzold的《编码
隐匿在计算机软硬件背后的语言》,这部永不退色的计算机经典著作,为了讲明白了这件事儿,今天我决定用自己简略的话,回顾一下作者写作的思路,用我的理解为大家讲述计算机的工作原理。希望我能够完成。&/p&&p&今天的计算机已经变得相当复杂,是有史以来人类创造的最复杂最精密的仪器,没有之一,是二十世纪技术领域的“登峰造极之作”,计算机与生俱来的层次化体系结构,掩盖了技术背后最本质的东西,现在已经很少有人去关心计算机最本质的工作原理,我希望能剖析计算机一层层‘“抽象”面纱,展现最本质的“计算”过程。基本的知识基础是高中物理,高中数学。&/p&&br&&p&第一节 计算器&/p&&p&下面回到高中课堂,我依稀记得在电磁学那一部分,讲到了电磁继电器,当时老师说,继电器是很重要的发明,我打开物理课本,“什么破东西嘛”,太简单了,那时候觉得像继电器这样的发明没什么用。高中数学中也讲到,布尔代数,简单老说就是,与、或、非,而且教科书上说,布尔代数意义重大云云。下面问题来了,我只用继电器能不是实现简单的计算器?注意是“计算器”,而不是计算机,答案是肯定的,来,那就看看,如何用继电器打造出一个”计算器“,进而打造出一台”计算机“&/p&&figure&&img src=&https://pic4.zhimg.com/50/1fcd5eebb66_b.jpg& data-rawwidth=&991& data-rawheight=&422& class=&origin_image zh-lightbox-thumb& width=&991& data-original=&https://pic4.zhimg.com/50/1fcd5eebb66_r.jpg&&&/figure&&p&两个继电器串联,点亮一盏灯,这算不算实现了“与”的操作呢?两“真”为”真“&/p&&figure&&img src=&https://pic1.zhimg.com/50/5d53b4b54c655ee27b1e8c_b.jpg& data-rawwidth=&1018& data-rawheight=&490& class=&origin_image zh-lightbox-thumb& width=&1018& data-original=&https://pic1.zhimg.com/50/5d53b4b54c655ee27b1e8c_r.jpg&&&/figure&&p&两个继电器并联,点亮一盏灯,是不是实现了”或“的操作?一真为真&/p&&figure&&img src=&https://pic3.zhimg.com/50/0c6a6c0b33ad91d0c399d55fd662da97_b.jpg& data-rawwidth=&1081& data-rawheight=&413& class=&origin_image zh-lightbox-thumb& width=&1081& data-original=&https://pic3.zhimg.com/50/0c6a6c0b33ad91d0c399d55fd662da97_r.jpg&&&/figure&&p&一个继电器本身就可以实现”非“的操作&/p&&p&这样一来,物理上的继电器,和布尔代数,完美的融合起来,我把与或非门继电器实现称作”物理层“,每张图右边的符号表示,称作”布尔逻辑层“,从”物理层“到”布尔逻辑层“是我们的第一层抽象,很简单吧?(当然现代计算器从物理实现到逻辑实现,已经不再使用继电器,而是在硅芯片上雕刻一个个的晶体管,但晶体管的数量绝对不会减少,这一点@丁旭 已经说得很明白) &/p&&p&接下来可能有人问,你整这些小儿科的东西,有什么用呢?别急,看我慢慢展开!&/p&&p&我们知道,布尔代数是一种数学,既然是在一种数学,那么存在数学运算啊,数学运算能用继电器实现吗,of course&/p&&figure&&img src=&https://pic4.zhimg.com/50/df0c9b68c81acddbc64bae_b.jpg& data-rawwidth=&1245& data-rawheight=&582& class=&origin_image zh-lightbox-thumb& width=&1245& data-original=&https://pic4.zhimg.com/50/df0c9b68c81acddbc64bae_r.jpg&&&/figure&&p&一个或门,一个与非门,一个与门,按照图示连在一起形成了一个最常见的运算,异或运算,”相同为假,不同为真“,那物理实现上怎么做呢?请在大脑中想想怎么连线,一共七个继电器就可以实现,有了异或运算,我们就可以实现更复杂的运算,下面就和我们实现一台”计算器“直接相关了&/p&&figure&&img src=&https://pic1.zhimg.com/50/f895be5fdc8725ffc9f188eac4beef38_b.jpg& data-rawwidth=&976& data-rawheight=&564& class=&origin_image zh-lightbox-thumb& width=&976& data-original=&https://pic1.zhimg.com/50/f895be5fdc8725ffc9f188eac4beef38_r.jpg&&&/figure&&p&一个异或门和一个与门,形成一个”半加器“,图示下边的符号表示一个半加器,这里是新一层的抽象,从布尔逻辑运算到”计算器件“的抽象&/p&&figure&&img src=&https://pic2.zhimg.com/50/698a1aae7a4e46bab7f75b_b.jpg& data-rawwidth=&1202& data-rawheight=&577& class=&origin_image zh-lightbox-thumb& width=&1202& data-original=&https://pic2.zhimg.com/50/698a1aae7a4e46bab7f75b_r.jpg&&&/figure&&p&有一个半加器,距离我们实现手工打造一个”计算机“还很远,然而两个半加器,一个或门,可以实现一个”全加器“,为什么叫全加器呢?因为我们使用它可以实现一位加法的计算!(这里是二进制,问题的题目,为什么计算机能读懂”0“和”1“,看到这里是不是心头一喜呢?)&/p&&figure&&img src=&https://pic4.zhimg.com/50/b0e15c8c39ec1_b.jpg& data-rawwidth=&1097& data-rawheight=&601& class=&origin_image zh-lightbox-thumb& width=&1097& data-original=&https://pic4.zhimg.com/50/b0e15c8c39ec1_r.jpg&&&/figure&&p&有了一位”全加器“,我们实现8位加法的计算还远吗?当然不远,8个全加器,按图示相连,就可以实现8位加法计算(和我们在纸上进行加法运算很像,进位的操作很显然。当然,这里都是进行二进制加法),右下方是8位加法器的表示方式。&/p&&p&要是这会儿在19世纪,在电力革命的年代,我一定要亲手打造一个计算器!&/p&&figure&&img src=&https://pic2.zhimg.com/50/abcfb25ca278b6e76fd1be5_b.jpg& data-rawwidth=&1164& data-rawheight=&555& class=&origin_image zh-lightbox-thumb& width=&1164& data-original=&https://pic2.zhimg.com/50/abcfb25ca278b6e76fd1be5_r.jpg&&&/figure&&p&画的比较简陋,见过卡车上的按钮吗?上下拨动的那种,这是我穿越回19世纪站在专利局门口,阐述我”伟大”的发明,“我发明的计算器,有两排输入按钮,每个按钮上下拨动表示输入的是0或者1,最下排是9个灯泡,灯泡的亮与灭,指示这一位是0,还是1,我的发明是划时代的,可以把人类从繁杂的计算过程中解救出来...”&/p&&p&“什么?就因为我的计算器不能实现减法运算儿拒绝我的专利申请,减法运算?减法运算,怎样实现计算机的减法运算呢?”&/p&&p&计算机发展过程中,最重要的思想是“抽象”,一层层的抽象封装了实现的细节,使的计算机开发人员更关注与逻辑的实现,相信有了我上面的表述,读者应该能看懂下边的抽象思想:&/p&&figure&&img src=&https://pic4.zhimg.com/50/c48d5ad5b23a47402bddfd269bd073a4_b.jpg& data-rawwidth=&700& data-rawheight=&236& class=&origin_image zh-lightbox-thumb& width=&700& data-original=&https://pic4.zhimg.com/50/c48d5ad5b23a47402bddfd269bd073a4_r.jpg&&&/figure&&p&这个电路实现了把输入的数据取反(0-&1,1-&0)&/p&&figure&&img src=&https://pic1.zhimg.com/50/efa7a48ff632c3bbdc403_b.jpg& data-rawwidth=&546& data-rawheight=&228& class=&origin_image zh-lightbox-thumb& width=&546& data-original=&https://pic1.zhimg.com/50/efa7a48ff632c3bbdc403_r.jpg&&&/figure&&p&这是求补器的“抽象”&/p&&p&减法的逻辑实现我直接给出,相信读者也应该能看明白&/p&&figure&&img src=&https://pic4.zhimg.com/50/4bda23f057aa9c2306872_b.jpg& data-rawwidth=&669& data-rawheight=&442& class=&origin_image zh-lightbox-thumb& width=&669& data-original=&https://pic4.zhimg.com/50/4bda23f057aa9c2306872_r.jpg&&&/figure&&p&我还清楚的记得,在计算机组成这门课上,老师讲述,原码和补码概念,“在计算机内部,正数的补码是它本身,负数的补码,记得取反加1“,为什么取反加1呢?看看上边的实现,计算机内部如何实现减法?有个取反操作,还有个进位操作,这不正是”取反加1“吗?&/p&&p&下面从逻辑实现层,回到物理层,思考下,需要多少继电器才能实现这样的 ”小发明“,算了,吓一跳吧?然而我们的计算机先驱康拉德·楚泽花费了十年心学,3000多个继电器才早出一个计算机原型,所以,,,本着向先哲致敬的精神,让我们在大脑中”打造出“一台计算机&/p&&figure&&img src=&https://pic1.zhimg.com/50/deb93fdac708c_b.jpg& data-rawwidth=&686& data-rawheight=&283& class=&origin_image zh-lightbox-thumb& width=&686& data-original=&https://pic1.zhimg.com/50/deb93fdac708c_r.jpg&&&/figure&&p&”我的专利不仅仅能实现加法操作,也能实现减法操作,计算具有普遍性,具有划时代的意义,可以把人类从复杂的计算中解救而出来...“&/p&&p&至此,我们实现了一个简单的计算器实现,不难吧?然而这才只是万里长征的第一步。&/p&&p&接下来我来说说,计算机是如何存储信息的,这真是个费力活儿,在不太遥远的过去,二十年前,计算机的存储量还非常有限,我记得初中那会儿还没有MP3,用磁带听歌,直到最近,存储技术才有了长足的进步,当然这是后话。&/p&&p&第二节,计数器&/p&&p&人类的感官,听觉,触觉,味觉,视觉,感官器官接受外界的刺激,在大脑中留下神经信号,进而形成对“外部世界”的认识,那抽象的事物怎么去认识呢?&/p&&p&电灯通电点亮灯泡,高中的物理知识解释,足够了。电可以让物体运动,这个道理人人都懂。坐在回家的高铁上,让我想想一下高速列车是如何运动的:驾驶员按下通电按钮,带动电车引擎,电车引擎通过传动装置把牵引力传给电车车轮,列车得以启动。高速列车的动力系统也相当复杂,我不了解每一个实现的细节,但是我可以想想出电车引擎的工作原理,为什么?因为这些都是实实在在的实物,看得见摸得着。那我想想出计算机的工作原理吗?答案是不能,为什么?因为计算机一层层的“抽象”,一个小小的物理器件上集成了上亿的基本元器件,使计算机真正的工作原理是我们越来越遥远。&/p&&p&下面还让我们回到19世纪末,二十世纪初,那个激荡人心的电力革命的年代,让我们去还原真实的技术实现过程。回到高中物理课堂&/p&&p&我们已经讲解了如何去制造一个一台简易的“计算器”,不知不觉下课了,这时我听到一阵刺耳的下课铃声。电铃和计算机有关系吗?我直接上图吧&/p&&figure&&img src=&https://pic4.zhimg.com/50/ccab_b.jpg& data-rawwidth=&500& data-rawheight=&500& class=&origin_image zh-lightbox-thumb& width=&500& data-original=&https://pic4.zhimg.com/50/ccab_r.jpg&&&/figure&&br&&p&注意看旁边的那个金属小锤子&/p&&figure&&img src=&https://pic1.zhimg.com/50/efbc42bb94d00e4ae80eb5_b.jpg& data-rawwidth=&570& data-rawheight=&324& class=&origin_image zh-lightbox-thumb& width=&570& data-original=&https://pic1.zhimg.com/50/efbc42bb94d00e4ae80eb5_r.jpg&&&/figure&&p&电铃的工作原理如上图所示,大家想象下,电铃的小锤子震荡起来敲打金属盖发出声音的情形,duang,duang,daung,形象吧?(这种电路叫做震荡器)&/p&&figure&&img src=&https://pic1.zhimg.com/50/a324e541ffe65a6faf82b2_b.jpg& data-rawwidth=&513& data-rawheight=&168& class=&origin_image zh-lightbox-thumb& width=&513& data-original=&https://pic1.zhimg.com/50/a324e541ffe65a6faf82b2_r.jpg&&&/figure&&p&振荡器是不是可以实现计数功能呢?交替的输出0和1,哈哈,感叹造物的神奇吧!&/p&&p&下面我们再来看一些神奇的电路,当初的先驱们是怎么想到这些复杂而精致的设计&/p&&figure&&img src=&https://pic4.zhimg.com/50/b6e75df9b37dbd5afaa343_b.jpg& data-rawwidth=&614& data-rawheight=&216& class=&origin_image zh-lightbox-thumb& width=&614& data-original=&https://pic4.zhimg.com/50/b6e75df9b37dbd5afaa343_r.jpg&&&/figure&&p&闭上上方的电路,灯亮了&/p&&figure&&img src=&https://pic3.zhimg.com/50/0d6a50c628f05d316bf3c_b.jpg& data-rawwidth=&582& data-rawheight=&225& class=&origin_image zh-lightbox-thumb& width=&582& data-original=&https://pic3.zhimg.com/50/0d6a50c628f05d316bf3c_r.jpg&&&/figure&&p&断开上方的电路,灯依然在亮&/p&&figure&&img src=&https://pic1.zhimg.com/50/35e969d3c178a380f62b5cb8f6375270_b.jpg& data-rawwidth=&499& data-rawheight=&199& class=&origin_image zh-lightbox-thumb& width=&499& data-original=&https://pic1.zhimg.com/50/35e969d3c178a380f62b5cb8f6375270_r.jpg&&&/figure&&p&闭合下方电路,灯灭了&/p&&figure&&img src=&https://pic2.zhimg.com/50/92b6eaf9db307a7_b.jpg& data-rawwidth=&488& data-rawheight=&187& class=&origin_image zh-lightbox-thumb& width=&488& data-original=&https://pic2.zhimg.com/50/92b6eaf9db307a7_r.jpg&&&/figure&&p&断开下方的电路,灯依然不亮&/p&&p&电路的奇特之处在于:同样是在开关都断开的状态下,灯泡有时候亮,有时候不亮,当开关都断开时,电路有两个稳定状态,这类电路叫做“ 触发器”。(英国物理学家1918在工作中发现的)&/p&&p&触发器电路可以保持信息,确切的说,可以“记忆”某些信息,他可以“记忆”那个开关先闭合。触发器是一个大家族,大家要是有兴趣可以去看相关资料。请记住一点!触发器是用来“记忆”信息的,我再给出两类常用的触发器&/p&&figure&&img src=&https://pic4.zhimg.com/50/8f1fa6ecea31_b.jpg& data-rawwidth=&517& data-rawheight=&247& class=&origin_image zh-lightbox-thumb& width=&517& data-original=&https://pic4.zhimg.com/50/8f1fa6ecea31_r.jpg&&&/figure&&p&这个叫做“D型触发器”,具体实现如上图,我们的表示一直都停留在很“底层”,一直都很关注实现的细节,随着细节实现越来越多,我们需要上升到高一层的层次,更加关注功能的实现,而不是陷于细节实现的泥潭!(想一想,为什么说,计算机具有与生俱来的层次结构)&/p&&p&数据端简写为D,时钟端简写为Clk,功能表如下:&/p&&figure&&img src=&https://pic3.zhimg.com/50/eb33d69de15ff30fcda3b0d_b.jpg& data-rawwidth=&248& data-rawheight=&194& class=&content_image& width=&248&&&/figure&&p&脑袋里想象下,触发器是一个很听话的孩子,当clk端通电时,相当于告诉孩子,“孩子啊,你要记住我传给的信息”,clk断电时,孩子在自由自在的玩耍,完全不接受任何传过来的指令,很形象,不是吗?&/p&&p&在D型触发器的基础上实现了更复杂的功能,“ 边缘触发的D型触发器”&/p&&figure&&img src=&https://pic1.zhimg.com/50/c935dbb047ae91a8ddd145011eeb7dee_b.jpg& data-rawwidth=&587& data-rawheight=&242& class=&origin_image zh-lightbox-thumb& width=&587& data-original=&https://pic1.zhimg.com/50/c935dbb047ae91a8ddd145011eeb7dee_r.jpg&&&/figure&&p&“抽象”图&/p&&figure&&img src=&https://pic4.zhimg.com/50/e81dfaf7af19_b.jpg& data-rawwidth=&156& data-rawheight=&91& class=&content_image& width=&156&&&/figure&&p&again,抽象的思想,使我们脱离的细节实现(上图),更加关注功能&/p&&figure&&img src=&https://pic2.zhimg.com/50/6f72ffb9fce_b.jpg& data-rawwidth=&220& data-rawheight=&145& class=&content_image& width=&220&&&/figure&&p&向上的箭头,表示电信号从0到1变化的那一瞬间有效,再次在脑袋里想象下,触发器是一个很听话的孩子,当clk从0-&1变化时,相当于告诉孩子,“孩子啊,赶紧接住我给你的球,球在这里指信息”,其他状态下,孩子在自由自在的玩耍,完全不接受任何传过来的指令。&/p&&p&有人问,说了这么多,到底想干什么?好的,告诉你,用这些可以实现一个计数器,记得小孩子学数数吗?我们要做的的就是要用机器来从0开始数数,真的吗?恩,离这一步已经很近了,不信看下边&/p&&figure&&img src=&https://pic2.zhimg.com/50/fd8fa89f2ff60fbff7ba9f_b.jpg& data-rawwidth=&369& data-rawheight=&156& class=&content_image& width=&369&&&/figure&&br&&p&简单的,把振荡器和触发器相连&/p&&figure&&img src=&https://pic3.zhimg.com/50/232f79df6e2e612d67f3bc2bd779dafc_b.jpg& data-rawwidth=&518& data-rawheight=&188& class=&origin_image zh-lightbox-thumb& width=&518& data-original=&https://pic3.zhimg.com/50/232f79df6e2e612d67f3bc2bd779dafc_r.jpg&&&/figure&&br&&p&电平信号的变化&/p&&p&稍微扩展一下,实现更复杂的功能,应该能看明白吧&/p&&figure&&img src=&https://pic2.zhimg.com/50/65c84dbb7a2ad9ca691aff_b.jpg& data-rawwidth=&528& data-rawheight=&179& class=&origin_image zh-lightbox-thumb& width=&528& data-original=&https://pic2.zhimg.com/50/65c84dbb7a2ad9ca691aff_r.jpg&&&/figure&&p&电平信号的变化(标上0和1)&/p&&figure&&img src=&https://pic4.zhimg.com/50/cb7db76c286e_b.jpg& data-rawwidth=&594& data-rawheight=&253& class=&origin_image zh-lightbox-thumb& width=&594& data-original=&https://pic4.zhimg.com/50/cb7db76c286e_r.jpg&&&/figure&&p&嗨嗨,清醒下,我们得到了什么?把上图顺时针旋转90度,你发现了吗&/p&&figure&&img src=&https://pic3.zhimg.com/50/ae382b0ce95c316b8eeb4e2_b.jpg& data-rawwidth=&354& data-rawheight=&461& class=&content_image& width=&354&&&/figure&&p&这不就是在计数吗?用二进制的方式计数!&/p&&p&把8个触发器连接在一起,然后放入一个盒子里,构成了一个8位计数器,能从0数数到2^8-1,(0-255),这个计数器称为“8位行波计数器”&/p&&figure&&img src=&https://pic3.zhimg.com/50/dc95beb4ba_b.jpg& data-rawwidth=&477& data-rawheight=&167& class=&origin_image zh-lightbox-thumb& width=&477& data-original=&https://pic3.zhimg.com/50/dc95beb4ba_r.jpg&&&/figure&&p&现在,我们已经懂得如何继电器来做加法、减法、计数了,这一件很有成就感的事儿,使用的技术也是100多年前就存在的技术。&/p&&p&第三节 存储器&/p&&p&我想用继电器打造一个存储量为64K x 8的存储阵列,我能实现吗?这会儿可是在二十世纪初!如果我穿越回那个年代,一定会再次为我的“发明”申请专利,如果真是这样,那计算机的发展史上会留下我的名字(呵呵,意淫一下),下面就看看我是如何实现我的“发明”吧&/p&&p&上节,我已经提到,触发器可以“记忆”1位的信息&/p&&figure&&img src=&https://pic1.zhimg.com/50/aa16bb2ce862a99723af1bb_b.jpg& data-rawwidth=&563& data-rawheight=&244& class=&origin_image zh-lightbox-thumb& width=&563& data-original=&https://pic1.zhimg.com/50/aa16bb2ce862a99723af1bb_r.jpg&&&/figure&&p&就是上图这个样子,我们把它抽象成:&/p&&figure&&img src=&https://pic3.zhimg.com/50/77b631ab0_b.jpg& data-rawwidth=&227& data-rawheight=&137& class=&content_image& width=&227&&&/figure&&p&我们把上图称作“1位锁存器”,想一想,两个输入线和一个输出线都是什么意思,我上节已经解释过,来、来、来,想一想那个淘气的小朋友。&/p&&p&有了“1”,那么距离“100000”还会远吗?无非就是如何组织n个“1”,“抽象”的量级提升的过程&/p&&figure&&img src=&https://pic4.zhimg.com/50/fdb0e7f337c_b.jpg& data-rawwidth=&736& data-rawheight=&337& class=&origin_image zh-lightbox-thumb& width=&736& data-original=&https://pic4.zhimg.com/50/fdb0e7f337c_r.jpg&&&/figure&&p&这是8位锁存器&/p&&figure&&img src=&https://pic2.zhimg.com/50/e6001e7cee4fee19efb3f0e93b29c4bf_b.jpg& data-rawwidth=&490& data-rawheight=&153& class=&origin_image zh-lightbox-thumb& width=&490& data-original=&https://pic2.zhimg.com/50/e6001e7cee4fee19efb3f0e93b29c4bf_r.jpg&&&/figure&&p&简写成这种形式&/p&&p&再来看两个神奇的发明,或许你也会为发明者神奇的构思所折服&/p&&figure&&img src=&https://pic3.zhimg.com/50/a1b5b1067aff3bb66f5e7c4e44e41664_b.jpg& data-rawwidth=&590& data-rawheight=&253& class=&origin_image zh-lightbox-thumb& width=&590& data-original=&https://pic3.zhimg.com/50/a1b5b1067aff3bb66f5e7c4e44e41664_r.jpg&&&/figure&&p&我想制作出这么一个元器件,他要实现这些功能。想想一下,某一天,你成了一个名人,每天前来拜访的人络绎不绝,今天呢,来了八个人,但是你时间有限,只能见一个人,那就让5号来吧(把拜访者编号,0-7),5号拜访者带来了自己的礼物(0或者1的信息)。看图,左边的三根线表示拜访者的地址(当然是二进制编码),000,001,010,011,100,101,110,111,5号就是101,这时候呢,我只需要把S0和S2通电,那么5号拜访者就进来了,献上自己的礼物(1位的信息)。&/p&&p&怎么实现这个功能呢?有兴趣的自己去研究下面实现,请记住,我们现在讨论的内容抽象的层次已经不是最最底层的实现了,而是更加关注于逻辑器件实现的功能&/p&&figure&&img src=&https://pic1.zhimg.com/50/5ce1334ec94cbd23fe8d2d239c75b87f_b.jpg& data-rawwidth=&578& data-rawheight=&463& class=&origin_image zh-lightbox-thumb& width=&578& data-original=&https://pic1.zhimg.com/50/5ce1334ec94cbd23fe8d2d239c75b87f_r.jpg&&&/figure&&p&这叫“8-1选择器”&/p&&p&反过来,我有一封信需要送出去,这封信的内容是0或者1,现在我也有8个快递小哥可以选择,编号分别是000,001,010,011,100,101,110,111,我让谁去给我送信呢?那就还是5号吧,于是我把地址分别设置为101,5号小哥就去给我送信了,给出具体实现,有兴趣的自己去看吧&/p&&figure&&img src=&https://pic1.zhimg.com/50/c415fae875bae2918b3bddb7f29ffef7_b.jpg& data-rawwidth=&437& data-rawheight=&504& class=&origin_image zh-lightbox-thumb& width=&437& data-original=&https://pic1.zhimg.com/50/c415fae875bae2918b3bddb7f29ffef7_r.jpg&&&/figure&&p&这个电路名儿叫做“3-8译码器”&/p&&p&有了8-1选择器和3-8译码器,就可以制作出一个8位存储器了&/p&&figure&&img src=&https://pic1.zhimg.com/50/f62f1d4cbbe509c9c738fd1d5425468d_b.jpg& data-rawwidth=&674& data-rawheight=&488& class=&origin_image zh-lightbox-thumb& width=&674& data-original=&https://pic1.zhimg.com/50/f62f1d4cbbe509c9c738fd1d5425468d_r.jpg&&&/figure&&p&again,把复杂的电路实现,抽象成简单的符号表示&/p&&figure&&img src=&https://pic3.zhimg.com/50/fdb7fd3c8fab7_b.jpg& data-rawwidth=&430& data-rawheight=&171& class=&origin_image zh-lightbox-thumb& width=&430& data-original=&https://pic3.zhimg.com/50/fdb7fd3c8fab7_r.jpg&&&/figure&&p&读/写存储器,通常叫做随机访问存储器或者叫RAM,RAM可存储8个单独的1位数据&/p&&p&如何得到16 X 1的RAM呢?相信大家都能想到,用2个 8 X 1的RAM,我仿佛回到了《计算机组成》的课堂,让我再来做一次作业吧&/p&&figure&&img src=&https://pic2.zhimg.com/50/bfb5aecfeee07b5be62ee_b.jpg& data-rawwidth=&530& data-rawheight=&357& class=&origin_image zh-lightbox-thumb& width=&530& data-original=&https://pic2.zhimg.com/50/bfb5aecfeee07b5be62ee_r.jpg&&&/figure&&p&简写如下:&/p&&figure&&img src=&https://pic2.zhimg.com/50/733d785f5ce80d346472d_b.jpg& data-rawwidth=&446& data-rawheight=&196& class=&origin_image zh-lightbox-thumb& width=&446& data-original=&https://pic2.zhimg.com/50/733d785f5ce80d346472d_r.jpg&&&/figure&&p&这种方式或许正确,但是使用了三根地址线,两根数据线,能不能使用4根地址线1根数据线呢?&/p&&p&加一个2-1选择器不就行了吗?(设计一个2-1选择器,这会儿应该不算什么难事儿)&/p&&figure&&img src=&https://pic4.zhimg.com/50/5bbad23c2d954426ffaa_b.jpg& data-rawwidth=&557& data-rawheight=&539& class=&origin_image zh-lightbox-thumb& width=&557& data-original=&https://pic4.zhimg.com/50/5bbad23c2d954426ffaa_r.jpg&&&/figure&&p&再次用符号简写:&/p&&figure&&img src=&https://pic4.zhimg.com/50/15f7d75b93ab9fd1a53b56f_b.jpg& data-rawwidth=&461& data-rawheight=&198& class=&origin_image zh-lightbox-thumb& width=&461& data-original=&https://pic4.zhimg.com/50/15f7d75b93ab9fd1a53b56f_r.jpg&&&/figure&&br&&p&回到我们的出发点,怎么得到64K X 8的存储阵列呢?&/p&&p&无非就是努力提高8位锁存器的集成程度嘛,我可以想象,读者看到这里,脑子里全是密密麻麻的的连线,或许你还一时想象不到连线的方式,但是看到这里,64K X 8的存储阵列一定能用某种方式实现,对吧?虽然没有实现其电路图,但我也可以说,我理解了存储器工作原理,(你懂了吗?)。&/p&&figure&&img src=&https://pic1.zhimg.com/50/1b19ffdc0c3d5fa8bfef0230_b.jpg& data-rawwidth=&544& data-rawheight=&188& class=&origin_image zh-lightbox-thumb& width=&544& data-original=&https://pic1.zhimg.com/50/1b19ffdc0c3d5fa8bfef0230_r.jpg&&&/figure&&p&1024 X 8RAM的符号表示,2的16次方,即64K,地址线有16根,数据线有8根&/p&&p&为了申请我的专利,我需要做出一个机器的外部壳子,和第一节中的“计算器”一样,把这个机器的壳子把我所有实现的过程封装起来,形成一个“黑盒”,只保留几个外部的接口(也就是那几根数据线,一定要记得他们的功能),我要做成的外部盒子是这个样子&/p&&figure&&img src=&https://pic4.zhimg.com/50/490b43bd0d0_b.jpg& data-rawwidth=&626& data-rawheight=&260& class=&origin_image zh-lightbox-thumb& width=&626& data-original=&https://pic4.zhimg.com/50/490b43bd0d0_r.jpg&&&/figure&&p&上一排的对应16根数据线,下一排有8根数据线,这个不用解释,相信把上文看完的都能明白什么意思,takeover这个按钮表示是否使得当前控制面板处于“激活状态”,也就是说,这个开关的作用是确定由控制面板还是又外部所连接的其他电路(从来没说过,没有连接外部其他电路,或者想象下,我这个机器壳子外面有一排的针孔,外部电路可以接进去,想想电脑机箱后边的针孔,就是这个意思,Soga)来控制。如果有其他电路相连。这时候takeover为 0(图示状态),此时存储器由其他电路接管,控制面板上的其他开关不起作用,当takeover为1 时,控制面板将重新获得对存储器的控制能力。&/p&&p&最后还是给出电路实现&/p&&figure&&img src=&https://pic4.zhimg.com/50/ffd325ac9a32d0f0dc9e642_b.jpg& data-rawwidth=&655& data-rawheight=&471& class=&origin_image zh-lightbox-thumb& width=&655& data-original=&https://pic4.zhimg.com/50/ffd325ac9a32d0f0dc9e642_r.jpg&&&/figure&&p&想一下,机器壳子后面的针孔连那里,控制面板的开关又连接哪里?&/p&&figure&&img src=&https://pic2.zhimg.com/50/b1c58ea11ed73b09e92017_b.jpg& data-rawwidth=&600& data-rawheight=&372& class=&origin_image zh-lightbox-thumb& width=&600& data-original=&https://pic2.zhimg.com/50/b1c58ea11ed73b09e92017_r.jpg&&&/figure&&p&简化的图示,是不是又用到“抽象”的思想呢?&/p&&p&一个辛辛苦苦装满65,536字节(8位为一个字节,字节编码请去参考ASCII编码)珍贵数据的64K X 8的RAM阵列,如果断电,会发生什么事情?首先电磁铁会因为失去电流失去磁性,随着“梆”的一声,金属片讲弹回原位,RAM中的所有数据将如风中残烛一般消失在黑暗之中,所以,RAM也成为“易失性”存储器。&/p&&p&那我一手打造的64K X 8的存储阵列,需要多少继电器呢?答案是是500W左右,是不是惊讶到恐怖呢?谁会没事儿造出这么个恐怖的怪兽?(100年后的今天,用二极管,三极管,集成这么多元器件的芯片,连指甲盖的大小都不到,感叹人类技术的进步吧)。&/p&&p&我穿越回二十世纪初,再次站在专利局的门口,为我这项“伟大的发明”申请专利,瑞士专利局的爱因斯坦会因此吓尿吗?世界上最聪明的大脑,能理解“黑箱”背后发生了什么吗?&/p&&p&第四节
自动操作&/p&&p&说了这么多电子线路的知识,我相信的我的讲述方式,大家都是能看懂的,前面所写的,其实只是为大家讲述一件事儿,“把电子元器件内部实现展开”,现有的一个个电子元器件,现在就是一个个小工具(把内部实现封装起来,保留外部接口,外部接口,就是那一根根地址线,数据线,和其他开关)、原材料。那我们现在看一看现在都有那些原材料呢?&/p&&p&计算器:一个会算数的小朋友,每次你把要进行计算的两个数给他,拍一下小朋友的头,小朋友帮我算一下吧,他会把计算的结果给你,没有一点误差,计算速度很快,并且乐此不疲。&/p&&p&计数器:一个一直在数数的小朋友&/p&&p&存储器:辛辛苦苦装满了64K 字节的箱子&/p&&p&译码器:《唐伯虎点秋香》中有个代号,9527,一个数字,你说它什么意思呢?如果,我“规定”9527指的是唐伯虎,让译码器来做这件事,译码器你把9527给我带过来(地址线用2进制表示的二进制是多少呢?),这时候译码器“很听话”的把唐伯虎叫过来。(在这里,机器“理解了”人类的语言吗?)&/p&&p&有了这些原材料,我们就可以着手打造一台computer了,我们的工作才刚刚开始,请读者保持耐心,我们最终要实现的是一台通用计算机,这台“先进的”机器可以使加减法的过程自动化,is that unbelievable?这台机器可以解决所有能有加、减法处理的问题,而事实上现实中的许多问题确实可以用加法与减法来解决。&/p&&p&让我来回顾一下自己的教育经历。从咿呀学语之后,幼儿园开始,我们就要开始一生的学习了,小学的数学课现在还叫不叫“算数”?刚开始,我们扳着自己的手指数数“1,2,3,4,5,上山打老虎...”,学会数数之后呢?老师先教我们加法与减法,那么乘法和除法呢?我依稀记得,是用加法和减法来实现的,对吗?&/p&&p&加法与减法,可以从底而上,构建更加复杂的算数系统,以至于,微积分也是建立的基本的算数系统之上,我还清楚的记得泰勒公式带给我的震撼,记得第一次见到牛顿迭代法时的情景。&/p&&figure&&img src=&https://pic1.zhimg.com/50/41bbe01adc4e96f1c24cfcb_b.jpg& data-rawwidth=&719& data-rawheight=&103& class=&origin_image zh-lightbox-thumb& width=&719& data-original=&https://pic1.zhimg.com/50/41bbe01adc4e96f1c24cfcb_r.jpg&&&/figure&&p&最美的数学公式之一,不解释为什么了,参考大学微积分&/p&&p&假如,假如我们已经实现一台可编程的最原始的执行加减法运算的“计算机”,如何计算出e的值呢?&/p&&p&想明白这一切,就需要我们了解“自动操作”的过程,了解程序的本质什么?编写程序的过程就像堆多米诺骨牌,辛辛苦苦,小心翼翼堆了半天,只为了那一下推到骨牌的快感!下面这一部分内容较难,请读者一定保持耐心,我会试着按我自己的理解讲清楚,如果我有理解不对之处,欢迎大家指出来,讨论改正&/p&&p&&b&新纪元&/b&-能接受“指令”的计算器&/p&&p&有人问我,真的可以用上述提供的那些原材料(计算器、计数器、存储器、译码器)造出一个计算机吗?就像维克多·弗兰肯斯坦组装怪物一样,当一切都已经就绪,看着我们一手打造出的庞大的怪物,小心翼翼的通上电,“醒来吧,孩子”,就像给他赋予生命一般,这些破铜烂铁奇迹般的苏醒过来,按照我给他的指令,完成我想要的工作,真的,人世间没有比这样的工作更让人神往了,你能理解《模拟游戏》中Turing对克里斯托弗的一往情深吗?至少他打动了我的心。&/p&&p&扯多了,我可以很明确的告诉你,只用那些原材料确实可以打造出一台计算机,并且历史上确实有人实现了!是谁?冯诺依曼?图灵?很遗憾地告诉你,no。主人公的名字,我前边已经提到了,他叫康拉德·楚泽,1935年还是一个工科学生的他,在位于柏林的家中打造出一个可编程的计算机,一共花了3000多个继电器。&/p&&p&接下来让我们穿越回到1935左右,让我们跟随“主人公”的思路,尝试打造出一台“计算机”。&/p&&p&还记得上小学时,你学完数数,学完加减法之后,大人们常常考考你的题目是什么?“你给我算一下从1一直加到100吧”,问题是,我能用机器代替我来算数吗?哦哦,简单,我的原材料里不是有“加法器”了吗?,稍作修改就行,好,看看我的设计&/p&&figure&&img src=&https://pic4.zhimg.com/50/8415ede484dafc24df26_b.jpg& data-rawwidth=&506& data-rawheight=&377& class=&origin_image zh-lightbox-thumb& width=&506& data-original=&https://pic4.zhimg.com/50/8415ede484dafc24df26_r.jpg&&&/figure&&br&&p&拿一个8位的加法器和一个8位的锁存器,按上述方式相连,每次我们可以通过加法器的开关输入我们要算的数(当然要输入的数是0-255之间,计算的结果也是0-255之间,在这里可以先计算1-10的和),我们小心翼翼的拨动开关,最后下方的一排指示灯显示计算的结果。简单吧(这个器件称作累加器)可是我一不小心输错了一个数怎么办?只有重新来算,完全再来一遍,好麻烦啊,有没有可以改进的方式呢?我突然想到,不是有存储器嘛,可不可以把我要计算的数据先存入存储器,再通过读取存储器的内容,把数据传送到加法器,执行运算,最后显示结果。&/p&&p&good idea!具体该怎么做呢,我给出一种实现方案&/p&&figure&&img src=&https://pic3.zhimg.com/50/c84dcad0e5edd0b85ed1a_b.jpg& data-rawwidth=&633& data-rawheight=&513& class=&origin_image zh-lightbox-thumb& width=&633& data-original=&https://pic3.zhimg.com/50/c84dcad0e5edd0b85ed1a_r.jpg&&&/figure&&p&一个振荡器(想想duang,duang,duang的电铃),16位计数器(我们的存储器容量不是64K X 8么,需要16根地址线),一个64K X 8的RAM(RAM连接控制面板,控制面板可以输入数据,还记得控制面板的takeover按钮是做什么用的么?),一个8位加法器和一个8位锁存器。&/p&&p&让我们闭上眼睛,来想一想,这是怎么工作的。首先,请清零开关,然后闭合控制面板上的takeover按钮,这时候控制面板接管了存储器,如果要算的有100个数,我们一次调整存储器的地址线和数据线,把数据存入h的地址空间(这一部分你明白了吗,该怎么操作控制面板呢?上述地址空间用16进制表示)。数据输入完了,我们断开控制按钮(takeover键),这时候控制面板失去对存储器的控制,断开清零开关,这时候,计数器开始工作,0000h,电信号传入存储器的地址线,存储器呢,是一个忠实的仓库保管员,来,我看看你要取什么东西,他接过传来的地址,哦原来要0000h盒子内的东西啊,好,你拿走吧,(0000h“盒子”内的东西就是刚才输入的第一个数),第一个数据传入到加法器,加法器小朋友一看,好了,你和自身相加,这不还是你自己吗?他把计算结果给了锁存器,锁气器把计算的结果放入一个临时的盒子内。经过一点时间(很短)计数器变成0001h,还是和刚才一样,计数器小朋友把自己的数给存储器管理大叔,大叔根据传过来的数,把取出的数据传给加法器小朋友,加法器小朋友执行加法运算,把得到的结果给锁存器。他们是如此的兢兢业业,乐此不疲,“机械式”的完成自己的任务,没有一点儿怨言。&/p&&p&哎,计算的结果是什么?我怎么看到指示灯在闪烁,计算的结果哪里去了?哦哦哦,计数器小朋友实在是太敬业了,根本没有办法让他停止工作,当他数到FFFFh之后又从0000h开始数数了。&/p&&p&还有这样的计算也太机械了,功能也实在是太有限了,要是我想把100个数,分成50组,计算每一组的和,这又该怎么做到呢?聪明的读者你也动动脑袋想一想,怎么做到呢?&/p&&p&楚泽看到这里也许和咱们一样皱紧眉头,怎么做呢,怎么做呢?该怎样解决这个问题呢?这时候或许突然迸发出“革命性”的想法,把运算的结果存回到RAM阵列中不行吗?这样一来,就可以在适当的时候用RAM阵列 的控制面板来检查运算结果(按下takeover),为了实现这个目的,在控制面板上加一排显示灯。eureka!&/p&&p&改变之后的连线图&/p&&figure&&img src=&https://pic2.zhimg.com/50/8c1058d66dbedc7bbd67d_b.jpg& data-rawwidth=&574& data-rawheight=&476& class=&origin_image zh-lightbox-thumb& width=&574& data-original=&https://pic2.zhimg.com/50/8c1058d66dbedc7bbd67d_r.jpg&&&/figure&&p&这里略去了一部分,包括振荡器和清零开关。这样做是很好,但是问题来了,怎样控制RAM写入信号呢(何时存入RAM,把结果存在什么位置?)&/p&&p&假如我有一个这样的计算任务要完成:首先对三个数进行求和,然后对两个数进行求和,最后再对三个数进行求和,图示如下&/p&&figure&&img src=&https://pic3.zhimg.com/50/533ffcfdeb6fc903e82744_b.jpg& data-rawwidth=&425& data-rawheight=&343& class=&origin_image zh-lightbox-thumb& width=&425& data-original=&https://pic3.zhimg.com/50/533ffcfdeb6fc903e82744_r.jpg&&&/figure&&p&图中用一小段连续的纸条(标记上连续的格子)表示一小段存储器,格子内表示存的内容。怎样使自动加法器为我们完成这项任务呢?我们不能期待向RAM阵列中输入一组数,然后自动加法器自动完成任务,自动加法器怎样“理解”我们交给它的任务,它怎么“知道”我们要他们干什么?&/p&&p&为了完成这个任务,我们需要用一些数字代码来标示加法器需要完成的每一项工作:加载(Load)、相加(Add)、保存(Save)、终止(Halt)&/p&&p&有了上述的指令,我们就可以命令计算器来工作了(暂时不去了解如何实现),对于上述的任务,可以表示如下:
(1)把0000h地址处的内容加载到累加器
(2)把0001h地址处的内容加到累加器
(3)把0002h地址处的内容加到累加器
(4)把累加器中的内容存储到0003h地址处
(5)把0004h地址处的内容加载到累加器
(6)把0005h地址处的内容加到累加器
(7)把累加器中的内容存储到0006h地址处
(8)把0007h地址处的内容加载到累加器
(9)把0008h地址处的内容加到累加器
(10)把0009h地址处的内容加到累加器
(11)把累加器中的内容存储到000Ah地址处
(12)命令自动加法器停止工作&/p&&p&有了这些指令代码,那么这些指令代码存放在哪里呢?得了,不去想了,简单粗暴的解决方式就是在加一个RAM,一个RAM存放数据,另一个RAM存放数据对应位置的操作符(也就是上文指定的那些代码),再次对我们的机器进行改造,改造后的结果如下&/p&&figure&&img src=&https://pic4.zhimg.com/50/4c87b392ea539c41eed286cb_b.jpg& data-rawwidth=&580& data-rawheight=&464& class=&origin_image zh-lightbox-thumb& width=&580& data-original=&https://pic4.zhimg.com/50/4c87b392ea539c41eed286cb_r.jpg&&&/figure&&p&观察要仔细啊,数据的RAM即可以通过Control Panel控制面板进行输入,也可以接受外部的数据,而存储代码RAM只能通过控制面板写入!&/p&&p&那么往存储代码的RAM里写入什么内容吧?机器又不认识load、store、add、halt这些单词。既然机器不认识,我就让他们认识!解决方式,就是编码,其实两位信息编码足够
操作码,代码
Load(加载),10h
Store(保存),11h
Add(加法),20h
Halt(停止),FFh&/p&&p&这样一来,存储代码的那个RAM里边要存的内容就一目了然了&/p&&figure&&img src=&https://pic4.zhimg.com/50/1f7b442f1eac20bb008f4f575ec32254_b.jpg& data-rawwidth=&332& data-rawheight=&363& class=&content_image& width=&332&&&/figure&&p&看到这里,读者有疑问吗?还是我最早提出的那个问题,机器是如何“理解”人类的语言的,我虽然把要操作的指令用0和1进行编码,但你把编码之后的内容拿给我们一手打造的这台机器,他还是“不明白”什么意思,去进行何种操作啊!我们转来转去又转回最初的起点,你让冷冰冰的机器去“理解”人类的指令,无异于天方夜谭,机器就是机器,永远也不可能具有思维,当初,我在这里也是困扰好久,哦,原来如此!&/p&&p&我已经把答案告诉你了,机器就是机器,永远也不可能具有思维&/p&&p&我不管你有没有思维,你必须完成我给你的任务,你把上述的任务算个结果出来,这一点儿或许能办到,嘻嘻&/p&&figure&&img src=&https://pic4.zhimg.com/50/e7c77b645be_b.jpg& data-rawwidth=&613& data-rawheight=&650& class=&origin_image zh-lightbox-thumb& width=&613& data-original=&https://pic4.zhimg.com/50/e7c77b645be_r.jpg&&&/figure&&br&&p&为了体现Load和Add命令,我的机器内部又进行了部分改变,你看出差别来了吗?&/p&&p&其实上述有一小部分没有连线。again,闭上眼睛,跟我来想想机器执行的过程,可爱的小朋友们和敬业的大叔们又来了。计数小朋友把数据给两个RAM的仓库管理员,一个取出数据,一个取出指令。数据传给累加器和2-1选择器(这是个什么鬼)?数据到了2-1选择器小朋友的面前,发现了一道门,门上写着,“此山是我栽,此树是我开,要想从此过,留下买路财”,小朋友,让我过去吧,叔叔给你糖吃,2-1选择器小朋友说,“我只有一条路,你们两个人,我让谁通过呢?”(图中,2-1选择器接收了两组数据),就在这时候,2-1选择器小朋友,收到了一条指令,这条指令来自哪里呢?哦哦,刚才管代码的RAM大叔,取出指令(10h或者,11h或者20h或者FFh),他把指令交给“指令解析器”(图中没有画)指令解析器负责把信送给2-1选择器、RAM、计数器的指令接收端(也就是2-1选择器的S,RAM的W等,在这里称为控制信号,控制信号决定机器中某些部件是否工作或者决定某些期间如何工作。例如,如果代码RAM阵列输出是load指令,2-1选择器S端收到0,如果代码RAM阵列输出是Add,2-1选择器S端收到1,操作码是指令Store时,数据RAM阵列的W收到1。实现“指令解析器”很困难吗?想一想第二节中是如何送信的,3-8译码器,译码器实现只是一种方式,当然也可以用逻辑门来实现、你明白了吗?),2-1选择器小朋友收到了0,也就是要执行Load操作,8位锁存器把临时信息保存起来。然后计数器小朋友又开始数到了0001h,这些勤劳的小朋友和勤劳的大叔又继续工作了...&/p&&p&用这种方式,我终于实现了我的想法,这真是一件值得高兴的事儿,我要好好休息下,等等,休息之前,顺便扩展一下我们的机器,让它也能运算减法。好简单,增加一条指令不就行了?Subtract(减)&/p&&figure&&img src=&https://pic1.zhimg.com/50/aa008dade8ed6fe728a7b082c9c3c6a3_b.jpg& data-rawwidth=&312& data-rawheight=&183& class=&content_image& width=&312&&&/figure&&p&相应的,机器内部实现再改造下,增加一个取反器&/p&&figure&&img src=&https://pic3.zhimg.com/50/baeebc0c93dcf23f0d6b1_b.jpg& data-rawwidth=&670& data-rawheight=&674& class=&origin_image zh-lightbox-thumb& width=&670& data-original=&https://pic3.zhimg.com/50/baeebc0c93dcf23f0d6b1_r.jpg&&&/figure&&p&布置一道作业题,取反器的那根控制信号线接在哪里?&/p&&p&&b&数据“流水”&/b&&/p&&p&我们从继电器打造出门电路,进而实现加法器,计数器,存储器,都是为了向我们的那个终极目标一步步前进。这就像点亮科技树的过程,一步步提高,直到实现我们的终极目标--一台可编程的通用计算机,那现在来看看,我们的科技树点亮到哪一步了,现在我们亲手打造的“能读懂人类指令的计算器”,离我们的目标还有多远?&/p&&p&来看看我们这台机器能不能完成我们想要完成的任务。假设现在要把56h和2A相加,然后再从中减去38h,结果是多少呢?不是有指令了吗?来,设置指令,让机器去完成&/p&&figure&&img src=&https://pic3.zhimg.com/50/232af880f3e6dcbeb0533_b.jpg& data-rawwidth=&526& data-rawheight=&238& class=&origin_image zh-lightbox-thumb& width=&526& data-original=&https://pic3.zhimg.com/50/232af880f3e6dcbeb0533_r.jpg&&&/figure&&br&&p&由于指令和数据是分开存储的,我们分别通过控制面板在RAM中输入数据,启动机器,机器就“神奇”的计算出结果,可以用个控制面板来查看计算的结果。&/p&&p&如果我的计算任务扩大一些,算一算1W个数的和吧?啊?10000个数,这时候我可以想象,站在台机器前面的“主人公”满脸苦逼的表情,我们小心翼翼的输入这指令,Load ...,Add ...,Add ...,Add ...,......Store ...。然后我们再输入数据,这真是个体力活儿啊!当我们终于把这一切都完成之后,启动机器,Come on,baby!计算吧&/p&&p&让我们再次闭上眼睛,想象机器工作的情形,计数器多么像一颗跳动的“心脏”,过一段时间发出一次“心跳”,存储器收到心跳的脉冲,从此中取出数据,数据被传送到累加器“加工厂”等待处理,要通过一道道的“门”(2-1选择器),最后会传到存储器。每每想到这里,我不禁想起在欢乐谷水上漂流的过程,穿过一道道门,经过一间间屋子,每经过一道关卡,都可能被水淋到(数据被加工),最后转了一圈回到起点,机器内部执行的过程,就是数据坐在船上“流水”的过程,不是吗?&/p&&p&让我们来看看机器算出来的结果,这可真是一个激动的时刻,辛辛苦苦拨了半天开关,现在要见证奇迹了。“咦”?怎么结果不对,这数值也太小了!&/p&&p&哦,原来如此,我的累加器只能算8位的数据,让我去安静的哭一会儿去。&/p&&p&你可能想到,把两个8位的加法器连在一起构成一个16位的设备,这是一种解决方案,但是,还有代价更小的解决办法。&/p&&p&比如要计算76ABh+232Ch,最终结果是99D7h&/p&&figure&&img src=&https://pic2.zhimg.com/50/87f0ddf5aca348e4d20f19_b.jpg& data-rawwidth=&123& data-rawheight=&82& class=&content_image& width=&123&&&/figure&&p&我们可以把高低位分开来算&/p&&figure&&img src=&https://pic3.zhimg.com/50/9c5acf7260d0dae4cdfba7b_b.jpg& data-rawwidth=&159& data-rawheight=&114& class=&content_image& width=&159&&&/figure&&p&低位加法&/p&&figure&&img src=&https://pic2.zhimg.com/50/94b774c728adf104ff28d0b647acee25_b.jpg& data-rawwidth=&137& data-rawheight=&99& class=&content_image& width=&137&&&/figure&&p&高位加法&/p&&p&最后把计算的结果写回存储器&/p&&figure&&img src=&https://pic2.zhimg.com/50/76fe75c916ebeda8fd6464a_b.jpg& data-rawwidth=&629& data-rawheight=&301& class=&origin_image zh-lightbox-thumb& width=&629& data-original=&https://pic2.zhimg.com/50/76fe75c916ebeda8fd6464a_r.jpg&&&/figure&&p&D7h被写入地址0002h处,99h被写入地址0005h处&/p&&p&这是很理想的状况,因为,在上述的例子中把高低位分开计算,低位计算恰巧不存在进位的情况。如果要把76ABh和236Ch这两个16位的数相加该怎么做?ABh+6Ch=117h;1h+76h+23h=9Ah。计算的结果为9A17h,怎么解决这个问题呢?可能有读者已经想到了,加一个进位锁存器(存储进位)不就行了?那我再问一句,“那我们的指令码是不是需要扩展一下呢?怎么使得译码器来触发读取进位的信号呢?”读到这里,读者也应该和我一样,我们现在不关心具体实现细节,一定会有某种逻辑门的组合来实现,对吧?下边我给出扩展的指令码(也叫作操作码)&/p&&figure&&img src=&https://pic2.zhimg.com/50/290ff25fd0055fab5ad2_b.jpg& data-rawwidth=&502& data-rawheight=&251& class=&origin_image zh-lightbox-thumb& width=&502& data-original=&https://pic2.zhimg.com/50/290ff25fd0055fab5ad2_r.jpg&&&/figure&&p&上述指令中,增加了一个“进位加”(Add with Carry)和“借位减”(Subtract with Borrow)有了他们,就可以极大的扩展加法器的功能,而不仅仅局限于8位数据的运算了,可以对16位,24位,32位,40位数进行加、减法操作了!比如对两个32位数7A892BCDh和65A872FFh进行加法运算。仅仅需要1条Add指令和3条Add with Carry指令&/p&&figure&&img src=&https://pic3.zhimg.com/50/fcb0b3fcf56a33eb9c0160a_b.jpg& data-rawwidth=&590& data-rawheight=&492& class=&origin_image zh-lightbox-thumb& width=&590& data-original=&https://pic3.zhimg.com/50/fcb0b3fcf56a33eb9c0160a_r.jpg&&&/figure&&p&我们通过增加操作码指令扩展的我们的“计算器”,在通往终极目标的路上又迈出了坚实的一步,“数据流水”的方式也确实也可按照我们的意愿实现一些计算任务,但是,对于计算1W个数相加之类的任务,总不能期待一条条的输入指令吧?&/p&&p&让我们看看问题出在哪里。第一,对于上图来说,保存计算结果的存储单元地址不连续。第二。当前设计的自动加法器不允许在随后的计算中重复使用的前面的中间结果,一旦我们把计算的结果写回存储器,我们就无法再次读取它的值了。&/p&&p&产生上述情况的原因就在于,我们构造的自动加法器,代码的存储和数据的存储是同步的、顺序的,并且只能从0000h开始顺序寻址,直至停机。&/p&&p&要解决这个问题,需要对我们设计的加法器做一个根本性且程度极大的改变。我想几十年前第一代的计算机的设计者康拉德·楚泽,Turing等人一定会为这个问题寝食难安,因为解决了这个问题,才可以实现真正意义上的“自动操作”,这个问题也是&b&计算器&/b&与&b&计算机&/b&最根本的区别。&/p&&p&没想到会有这么多人点赞,谢谢你们的鼓励,我们的万里长征已经看到胜利的曙光了,马上就要迎来激动人心的时刻了,请保持最后的耐心。&/p&&p&&b&数据“转圈圈”&/b&
再次看一下我们设计的机器,代码的存储和数据的存储是同步的、顺序的,并且只能从0000h开始顺序寻址(计数器小朋友在一次计数,告诉存储器管理员大叔从哪个抽屉里取数据),直至停机。但是,如果我的数据是连续存储的,并且在任意地址保存数据(也就是说,存储器存放数据的抽屉式随意的,我们只知道抽屉的编号),该怎样去取数据进行计算,并且存储计算结果啊?这时候我突然听到一声,“你傻啊,你把要取数和存数的抽屉编号告诉我不就行了?”,管理员大叔一语惊醒梦中人,是啊,有了存储器的地址不就行了?可以把数据的地址与数据的内容分开存!这可真是石破天惊&/p&&p&那就再次改变我们的设计吧,&/p&&figure&&img src=&https://pic2.zhimg.com/50/890bf8df8a86df61453ff3_b.jpg& data-rawwidth=&786& data-rawheight=&462& class=&origin_image zh-lightbox-thumb& width=&786& data-original=&https://pic2.zhimg.com/50/890bf8df8a86df61453ff3_r.jpg&&&/figure&&p&这次,我们把指令(代码和数据的地址称为一条指令,先得到数据的地址,在根据地址取数据)放在一个RAM中,把数据存在另一个RAM中,并加了3个8位锁存器(临时存放8位数据),示意图只画出了改变的部分,其余部分与原来保持一致(累加器和代码解析器还有相应的控制信号)。指令占1个字节,16位的数据地址占2个字节,一条指令共占用3个字节,每次从RAM中取出1个字节,所以每次取出一条完整指令需要3次计数,数据地址再次传给存储器(这里多加了一个RAM),RAM取出数据传给加法器,而代码的解析与数据传输到加法器进行计算操作也需要1次计数,这必然需要更加复杂的控制信号。&/p&&p&从存储器中取出一条完整指令的过程叫做取指令,机器响应指令码的一系列操作的过程叫做执行指令,虽然机器可以自动取出指令,并执行指令,你能说它是一种“有生命”的东西吗?&/p&&p&看到这里有人可能要问,我们现在不是假设在1935左右吗?RAM是很奢侈的(500W个继电器),能不能想法舍弃掉一个RAM?把指令(代码和数据地址)与数据存在一起就可以了,这简单,还记得2-1选择器小朋友吗?(存储器部分提到了)&/p&&figure&&img src=&https://pic3.zhimg.com/50/c8dce29efce26d279d676e3_b.jpg& data-rawwidth=&734& data-rawheight=&529& class=&origin_image zh-lightbox-thumb& width=&734& data-original=&https://pic3.zhimg.com/50/c8dce29efce26d279d676e3_r.jpg&&&/figure&&p&很简单,得到数据地址之后,把地址回传给存储器(此时计数器小朋友的计数无效),再次根据地址取出数据。
来看一个小例子吧,计算45h+A9h-8Eh=?,假设45h,A9h,8Eh分别存在地址0010h,0011h,0012h处,计算的结果存于0013h处。我们应该给机器这样的指令:
把0010h地址处的字节装入累加器,
把0011h地址处的字节装入累加器,
从累加器中减去0012h地址处的地址,
把累加器中的内容保存到0013h地址处,
停机,&/p&&p&数据的存储可以是任意的,我们只需要知道其相应的地址,那么指令呢?指令还是机械的顺序的往下执行,会不会出现这种情况,顺序执行指令,可是数据和指令地址冲突(要存指令的地址处已经有了重要的数据,需要跳过),指令能否跳过某一段区域,继续执行呢?&/p&&p&这涉及到指令寻址方式的改变(耐心听下去,我们万里长征,最终的一步来了,跨过他,前方就是一马平川),怎样跳过某一段儿区域,继续执行指令呢?那就jump啊,对,扩充一条跳转指令(Jump)&/p&&figure&&img src=&https://pic4.zhimg.com/50/3d661c746d390d611881dae08e3aef84_b.jpg& data-rawwidth=&491& data-rawheight=&242& class=&origin_image zh-lightbox-thumb& width=&491& data-original=&https://pic4.zhimg.com/50/3d661c746d390d611881dae08e3aef84_r.jpg&&&/figure&&p&相应的机器内部实现也要改变&/p&&figure&&img src=&https://pic3.zhimg.com/50/ddaa2c668c1fc02b53a776cab39c0ffc_b.jpg& data-rawwidth=&800& data-rawheight=&598& class=&origin_image zh-lightbox-thumb& width=&800& data-original=&https://pic3.zhimg.com/50/ddaa2c668c1fc02b53a776cab39c0ffc_r.jpg&&&/figure&&p&在上一步基础之上,增加了一条到计数器的数据通路,相当于告诉计数器小朋友,“小朋友,你下次从我告诉你的那个数开始计数,叔叔给你糖吃,乖~”&/p&&p&让我们回到电子线路中,计数器的实现,振荡器和D触发器串联方式(16个D触发器),我们稍作修改一下边缘型触发的D型触发器&/p&&figure&&img src=&https://pic3.zhimg.com/50/870faa339e7aea32c885f27_b.jpg& data-rawwidth=&385& data-rawheight=&259& class=&content_image& width=&385&&&/figure&&br&&p&可以不用了解上图的实现,请注意我们现在重点不在于具体实现,而在于实现某一功能,我们需要为16位计数器的每一位都设置一个这样的触发器。一旦加载了某个特定的值,计数器就开始从该值开始计数(是不是用糖果把计数器小朋友收买了,呵呵)&/p&&p&Jump(跳转)指令确实很有用,但是一个有条件的跳转更有用(“我是个有原则的人,除非满足我的条件才jump”),比如要计算A7h与1Ch(十进制的28)相乘的结果,和28个A7h相加的结果相同,计算过程涉及到大量的重复操作&/p&&p&假设乘数和被乘数以及计算结果保存在一下地址:&/p&&p&1000h:00h,A7h,(16位乘数保存在此处)&/p&&p&Ch,(16位被乘数保存在此处)&/p&&p&h,(16位乘积保存在这两个连续的地址空间)&/p&&figure&&img src=&https://pic4.zhimg.com/50/eab1c5e3fc0ccd4fece4c16_b.jpg& data-rawwidth=&728& data-rawheight=&467& class=&origin_image zh-lightbox-thumb& width=&728& data-original=&https://pic4.zhimg.com/50/eab1c5e3fc0ccd4fece4c16_r.jpg&&&/figure&&p&当这六条指令执行完毕之后,存储器1004h和1005h地址保存的16位数与A7h乘以1的结果相同。还要把这6条指令反复执行27次才能达到乘法的目的,如果在地址0012h处置放一条Jump指令会怎样?&/p&&p&这个过程不会停止下来,它会一直反复执行下去!&/p&&p&我们需要这样一种Jump指令,它只让这个过程重复执行所需要的的次数,这种指令就是条件跳转指令,怎么实现它呢?我给出一种实现方式,简单看看就好&/p&&figure&&img src=&https://pic4.zhimg.com/50/91bc8bd72f19bb5b52109b0ecd2dea33_b.jpg& data-rawwidth=&645& data-rawheight=&271& class=&origin_image zh-lightbox-thumb& width=&645& data-original=&https://pic4.zhimg.com/50/91bc8bd72f19bb5b52109b0ecd2dea33_r.jpg&&&/figure&&p&这种锁存器叫零锁存器,当8位加法器输出为零时他锁存的值才是1。有了进位锁存器和零锁存器以后,可以为指令表新增4条指令&/p&&figure&&img src=&https://pic3.zhimg.com/50/56f6ac745bdac4_b.jpg& data-rawwidth=&495& data-rawheight=&400& class=&origin_image zh-lightbox-thumb& width=&495& data-original=&https://pic3.zhimg.com/50/56f6ac745bdac4_r.jpg&&&/figure&&br&&p&非零跳转指令只有在零锁存器输出为0时才会跳转到指定的地址,如果上一步的加法、减法、进位加法或者借位减法运算结果为0时,将不会发生跳转。只需要在常规的跳转命令的控制信号之上再加一个控制信号&/p&&p&那么继续刚才提出的问题,0012h地址之后的的指令为&/p&&figure&&img src=&https://pic3.zhimg.com/50/1defccdeb670c342d75b87_b.jpg& data-rawwidth=&648& data-rawheight=&473& class=&origin_image zh-lightbox-thumb& width=&648& data-original=&https://pic3.zhimg.com/50/1defccdeb670c342d75b87_r.jpg&&&/figure&&p&Store指令不会影响零标志位的值,只有Add、Subtract、Add with Carry、Subtract with borrow这些指令才能影响零标志位的值,当执行到地28次循环时,1004h和1005h地址保存的16位数等于A7和1Ch的乘积。1003h地址保存的值为1,他和FFh相加的结果为0.零标志位被置位!Jump If Not Zero指令不会再跳转回到0000h地址处,程序执行完成。&/p&&p&现在可以说,我们这台不断完善的机器真的可以称得上是一台真正意义上的computer了!条件跳转指令将计算器和计算机真正区分开来。&/p&&p&那么,你现在明白了吗,为什么计算机能读懂0和1?计算机和程序到底是什么?&/p&&p&数据被附在电流上不断地转圈圈(循环的过程),当满足某一条件之后,得到最终结果。&/p&&p&&b&汇编语言&/b&&/p&&p&把上述机器码表示成助记符的形式&/p&&figure&&img src=&https://pic4.zhimg.com/50/fffebb97f03eb04beb04a_b.jpg& data-rawwidth=&679& data-rawheight=&389& class=&origin_image zh-lightbox-thumb& width=&679& data-original=&https://pic4.zhimg.com/50/fffebb97f03eb04beb04a_r.jpg&&&/figure&&p&那么这个乘法的程序可以写成这种形式&/p&&figure&&img src=&https://pic1.zhimg.com/50/f4fce2ed9c5f8ab0a6028_b.jpg& data-rawwidth=&351& data-rawheight=&487& class=&content_image& width=&351&&&/figure&&p&编码时最好不使用实际地址,用label来指代存储器中的地址空间,所以上述程序可以改写为&/p&&figure&&img src=&https://pic1.zhimg.com/50/50add86b354e02d208ca72a_b.jpg& data-rawwidth=&744& data-rawheight=&484& class=&origin_image zh-lightbox-thumb& width=&744& data-original=&https://pic1.zhimg.com/50/50add86b354e02d208ca72a_r.jpg&&&/figure&&p&终于在春节到来之前写完了,算是圆了自己的一份小小的心愿。&/p&&p&写的不好,欢迎大家批评改正。&/p&
这个问题从高中就开始疑惑,计算机究竟是如何理解人类思维,如何进行计算?
我很想知道最最基本的工作原理,但是大学里好多课程,数字逻辑,计算机组成原理,只是从不同层次上解释了计算机的工作原理,很可惜的是,我并没有把知识穿起来。看了很多人的回答…
已整理完毕. 禁止转载.&br&(本回答不涉及GPU, GPU评比请参看notebookcheck提供的GPU天梯: &a href=&//link.zhihu.com/?target=http%3A//www.notebookcheck.net/Intel-HD-Graphics-.0.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&notebookcheck.net/Intel&/span&&span class=&invisible&&-HD-Graphics-.0.html&/span&&span class=&ellipsis&&&/span&&/a&)&br&&br&以下为Intel提供性能提升数字:&br&(2013)Hawell相对于Ivy Bridge, 8%矢量处理性能提升, 6%单线程性能提升, 6%多线程性能提升, &b&3%总体性能提升.&/b&&br&(2012)Ivy Bridge相对于Sandy Bridge, &b&3-6%同频性能提升.&/b&&br&(2011)Sandy Bridge相对于Westmere, &b&11.3%同频性能提升.&/b&&br&(2010)Westmere相对于Nehalem, 因为Westmere本就是Nehalem-C, 所以同频性能相同.&br&(2008)Nahelm相对于Penryn, 10-25%单线程性能提升, 20-100%多线程性能提升, &b&15-20%同频性能提升&/b&&br&&br&可以看到从第一代Core商标(Nehalem架构)到第四代Core商标(Haswell架构), Intel处理器的性能提升越来越小. 但是Intel其实重点提升了处理器的多线程计算能力. 下面是我整理的Intel近几代处理器性能对比, 是从Spec2006官网海量数据里挑选出来的. (引用: &a href=&//link.zhihu.com/?target=http%3A//www.spec.org/cpu2006/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&SPEC CPU2006&/a&) &br&&figure&&img src=&https://pic2.zhimg.com/50/c5ba92b48e56eaa88f8a45cc_b.jpg& data-rawwidth=&617& data-rawheight=&391& class=&origin_image zh-lightbox-thumb& width=&617& data-original=&https://pic2.zhimg.com/50/c5ba92b48e56eaa88f8a45cc_r.jpg&&&/figure&(注: 这里使用了Intel桌面Extreme版处理器做测试对象, 它代表了桌面处理器的最高性能)&br&(注: rate测试分数有改动, 原因是手边没有SB, IB, Haswell的I7-EE版CPU数据, 直接使用了普通版I7做了等效)&br&&br&从上往下:&br&绿色:整形多线程分数 (Rate)&br&紫色:浮点多线程分数 (Rate)&br&蓝色:整形单线程分数 (Base)&br&紫色:浮点单线程分数 (Base)&br&&br&图中横坐标:&br&&ul&&li&Core, Penryn属于Core架构, 产品名称:Intel Core Solo/Due 或 Intel Core2.&br&&/li&&li&Nehalem, Westmere属于Nehalem架构, 第一代Intel Core i3/i5/i7.&br&&/li&&li&SandyBridge, IvyBridge属于SandyBridge架构, 第二,三代Intel Core i3/i5/i7.&br&&/li&&li&Haswell, 最新架构, 第四代Intel Core i3/i5/i7.&/li&&/ul&(&b&请注意这里有Core架构和Core商标的区别.&/b&)&br&&br&从图中可以看到, Intel处理器的多线程运算能力一直在稳定上升, 上升幅度超过单线程幅度. &br&单线程Spec2006项目每代上升幅度在15%左右, 多线程上升幅度在30%左右. 如今, &b&多线程运算能力真正代表处理器的性能. &/b&&br&&br&下面来分析这30%多线程性能的上升:&br&多线程提升要依次考虑到这4个方面: 1. 线程数, 2. 主频, 3. 编译器, 4. 核心架构.&br&这里可以看出, Core系列处理器架构的改进并不是最重要的, 工艺才是对处理器性能提升最重要的关键因素. 因为工艺决定了处理器的核心数量, 主频, 甚至包括架构细节.&br&&br&参与分析的CPU具体参数如下:&br&&figure&&img src=&https://pic1.zhimg.com/50/1d340b17198cfee1aad821f1bdd583fc_b.jpg& data-rawwidth=&393& data-rawheight=&318& class=&content_image& width=&393&&&/figure&(注, SB, IB, Haswell三项在作图时已经等效为6C/12T处理器分数)&br&&br&以下分别从之前提到的4个方面来描述历代处理器的区别:&br&&br&1. 线程&br&在Core架构时代(最多4线程)到Westmere(最多12线程), 而这段时间Spec2006 Rate项分数变在4倍以上. 从Westermere开始, Intel维持了12线程的数目, 之后的3代产品中, rate分数仅上升了1倍. 可以看出CPU支持的线程数量是最影响处理器性能的因素.&br&性能的飞跃是从Intel在桌面处理器上使用了Hyper Threading(超线程)技术开始的, Intel认为&单物理核心, 双线程&这样的技术等效为1.4个物理核心的性能. 这个技术最早用在了Netburst架构(Pentium4)上, 但是并没有在Core架构上使用, 直到Nehalem架构上, Intel又重拾HT, 使得Nehalem这一代处理器的性能远远超出上一代Penryn产品. Intel也是在这个时候开始使用酷睿(core)i3/i5/i7这个系列名称的.&br&&br&2. 主频&br&在Core架构时代, 由于刚刚走出Netburst(Pentium4)的阴霾, 采用新的架构, Intel并没有急于提升主频, 即便是Extreme版桌面处理器QX6850, 主频也仅3G.&br&在Nehalem架构上, Intel开始提升处理器主频, 直到Sandy Bridge架构时, 主频已经可以达到3.5G. 这对于Sandy Bridge这样仅有14级流水线的架构来说是非常惊人的! (对比Pentium4, 虽然P4早就到过4G以上的主频, 但是有近30级的流水线.)&br&此外, 在Nehalem架构上, Intel采用了Turbo技术, 结合处理器负载量, 处理器温度等信息, 动态调整处理器主频, 最高主频达到了3.9G, 非常夸张, 这需要架构和制程的共同配合才能做到.&br&&br&3. 编译器&br&Intel C++ Compiler (ICC说明: &a href=&//link.zhihu.com/?target=http%3A//en.wikipedia.org/wiki/Intel_C%252B%252B_Compiler& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Intel C++ Compiler&/a&)&br&伴随着自家处理器的更新换代, Intel总会及时更新ICC编译器, 以方便软件针对Intel不同的处理器进行优化. ICC会使用CPUID这个指令, 它可以返回处理器支持的指令集种类, 方便ICC根据具体CPU型号, 输出优化后汇编指令. (新版的指令集需要配合新版的ICC编译使用.) &br&举个栗子: Nehalem架构处理器使用不同版本的ICC得分:&br&&figure&&img src=&https://pic3.zhimg.com/50/c55db3035c07efbb34a994e583fcb0b0_b.jpg& data-rawwidth=&252& data-rawheight=&58& class=&content_image& width=&252&&&/figure&可以看到, ICC不同版本对Spec2006成绩有很大影响. 这是因为使用ICC11编译的程序无法使用较新指令集. (如SSE4.2) &br&&br&下面列举了Intel历代产品所添加的新指令/指令集, 这些指令均可被当时最新的ICC支持:&br&&figure&&img src=&https://pic4.zhimg.com/50/eb681ee4e4ed6_b.jpg& data-rawwidth=&633& data-rawheight=&183& class=&origin_image zh-lightbox-thumb& width=&633& data-original=&https://pic4.zhimg.com/50/eb681ee4e4ed6_r.jpg&&&/figure&这里简单分成两类, &b&加粗&/b&的指令集可以加快CPU计算速度. 未加粗的为CPU功能拓展, 转换, 辅助类.&br&这里也解释了为什么有时Intel官方宣传性能上升~8%, 但是Spec2006的分数却上升接近15%. 原因就是ICC针对了最新的处理器/指令集做过优化, 像Spec2006这样的重要测试是需要重点优化的.&br&&br&4. 架构&br&为了能直观的比较架构差别, 这里先把Spec2006单线程测试(Base)针对主频做了归一化. 结果如下:&br&&figure&&img src=&https://pic2.zhimg.com/50/ab71a7c2360152abfcf38_b.jpg& data-rawwidth=&630& data-rawheight=&373& class=&origin_image zh-lightbox-thumb& width=&630& data-original=&https://pic2.zhimg.com/50/ab71a7c2360152abfcf38_r.jpg&&&/figure&&br&对比结果如下: (第二, 三列为: 针对上一代产品, 新架构的提升百分比. 第二列为整型测试, 第三列为浮点型测试)&br&&figure&&img src=&https://pic3.zhimg.com/50/3bf109bd0f2bac07c65d7a_b.jpg& data-rawwidth=&399& data-rawheight=&153& class=&content_image& width=&399&&&/figure&(注: 提升百分比包含ICC编译器升级带来的变化)&br&下面列出架构间的变化, 方便大家对比查看.&br&&br&4.1 Nehalem&br&
Core的x86解码能力是每周期4个, Nehalem相同.&br&
Core的Loop Cache是18层, Nehalem应有增加, 数量未知.&br&
Core有16层返回栈缓存, Nehalem相同.&br&
Core的分支预测机制能提前32Byte进行预测, Nehalem相同, 而且增强了预测算法, 并加快了预测错后重新取指速度.&br&
Core有6个执行单元, Nehalem相同.&br&
Core的保留站有32层, Nehalem增加至36层.&br&
Core的乱序执行窗口长96层, Nehalem增加至128层.&br&
Core每周期可以进行128bit读和128bit写, Nehalem相同.&br&
Core的读缓存24层(猜测), Nehalem增加至48层.&br&
Core的写缓存20层, Nehalem增加至32层.&br&
Core的L1I 32k(4-way), L1D 3

我要回帖

更多关于 处理器比较 的文章

 

随机推荐