呵呵,amd多核cpu优化补丁关闭核心会降低功耗么

手机重拾平衡 解析联发科CorePilot技术
经过这几年的努力,联发科迅速崛起,技术、芯片、平台方案越来越完备,在智能手机领域一路高歌猛进,旗下芯片产品深受手机厂商的青睐。可是,每当提起联发科,脑海中总会第一时间把它与千元机联系在一起,一直以来联发科为打造高端处理器而不断努力,但造化弄人,定位高端的处理器总被用在“中低端机”上,低端似乎成为萦绕在联发科上方挥之不去的梦魇。
手机重拾平衡 解析联发科CorePilot技术
在2013年,联发科全球首创CorePilot异构计算技术,CorePilot是联发科为旗下多核心产品量身定制的一项新技术,CorePilot异构计算技术可以简单的看做ARM Big.LITTLE,是一种大核心+小核心的架构技术,如今已经进化到了3.0版本,不仅可以支持大小核异构计算,还能够灵活的控制CPU与GPU之间的协同工作,使用场景不同智能调配,让它们能发挥出最优性能和最佳功耗,让采用联发科芯片的终端产品更加节能省电。
联发科首创CorePilot异构计算技术
联发科CTO周渔君曾表示:“现在影响手机的体验并非手机处理器的性能,而是电池的使用时间,我们的CorePilot技术可以分配不同任务让不同的核心处理,这就让功耗与性能得到了完美的统一”
举列来说,当智能手机运行一个流媒体应用时,需要占用CPU的资源,在屏幕上需要对应的显示,所以会占用屏幕的资源,还需消耗处理器当中多媒体模块的资源,如果这个流媒体从网络过来,则还要使用到modem的资源。在上述这个过程当中,所使用到的电路都会影响到发热,而对于用户来说,体验就是上述所有过程的一个结果,CorePilot技术在这个过程中,对处理器作出调整,让不同的模块都作出相应的变化,从而手机体验更优、用户感觉最好。
CorePilot 1.0:合理调用CPU核心
2013年7月,联发科推出第一款搭载CorePilot异构计算技术的移动处理芯片——MT8135,用于Android平板电脑,在使用时最大限度提高性能并且降低功耗。
big.LITTLE核心调用演示(图片引自联发科官网)
CorePilot 1.0是专为对称和非对称多核CPU的高效管理实现负载均衡和更好性能。因使用场景不同智能调配,让它们能发挥出最优性能和最佳功耗,相比之前,日常使用任务可以降低70%的功耗,让采用MTK芯片的终端产品更加节能省电。
CorePilot 1.0包含三个方面的技术。第一,最新的异构调度算法,能够更有效的平衡每颗CPU核心的工作负荷从而提高系统工作效率。第二,自调式温控技术,可根据温度的变化来打开或者关闭CPU核心,在特定范围内进行动态调节功耗预算,进而获得更好的性能提升。第三,动态功耗管理技术,可通过动态电压、频率调节模块来检测正在进行的进程和任务负荷量,从而进行自动调节CPU的频率、电压,最终决定开启或者关闭某些CPU核心,以便更有效的降低闲置CPU核心所带来的热量和能耗。
CorePilot 2.0:合理使用CPU/GPU核心
程序运算调用过程(图片引自联发科官网)
2015年,联发科推出CorePilot 2.0,CorePilot 2.0增加了非对称的big.LITTLE CPU核心,支持OpenCL及CPU及GPU间的异构运算。不仅增强管理CPU核心,而且还有效的管理处理器的GPU核心。由于CPU和GPU中的核心适合不同的工作负载,在这方面,CorePilot 2.0技术可以确定哪些任务由哪些核心运行效果更好。
人脸检测和性能/能量消耗比较(图片引自联发科官网)
联发科Corepilot 2.0技术支持120Hz动态影像显示技术,将移动设备屏幕的画面更新率提升到120Hz,比一般60Hz显示提供了双倍流畅的翻屏效果及更加清晰的影像,降低文字及影像的残影或模糊现象。
CorePilot 3.0:最大限度提高续航和极致性能
三丛集架构介绍(图片引自联发科官网)
CorePilot 3.0通过设备Tri-Cluster处理器架构支持三种不同负荷等级:轻度、中度以及高度丛集处理器来解决问题,三方各司其职的处理方式效果显著,有效提升了智能手机的性能,高度丛集处理器的极致性能预留给特定应用需要才启动,中度丛集处理器对于处理日常应用已游刃有余,轻度丛集处理器负责处理器一般背景更新的应用,以确保无需额外功耗的工作任务,以至于不损耗过多电量。
CorePilot 3.0技术(图片引自联发科官网)
CorePilot 3.0持续沿用自调试温控管理,不仅能够延长电池的寿命,还能让手机随时处于待命状态,通过密切监控温度,主动调整效能,使其不超过特定温度空间,让手机性能达到最优化,同时也不至于过热,CorePilot 3.0智能优化功能可为移动设备节省功耗平均达30%,另外,除了延长电池寿命,日常中度使用负载任务处理效能可提升12%,处理重度负载的极大效能更是提升15%,使得智能手机可以做更多的事情。
从目前的情况来看,联发科的高端梦一直在路上,虽然发布全球首款十核大杀器Helio X20,但事实证明联发科高端梦再次被“玩坏”。其中不可置疑的是,联发科的CorePilot技术在性能体验上做出了不可磨灭的贡献,使得搭载该技术芯片的终端产品性能续航更加均衡,随着技术的不断优化,未来CorePilot技术将更加完善,相信会给智能手机带来更佳的体验。
责任编辑:
声明:本文由入驻搜狐号的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。如今,多核处理器已经非常流行了,在市场上几乎已经买不到单核心的处理器了。不过虽然多核处理器性能够强劲,但有的时候我们其实用不到那么多核心,尤其是买了Intel的Core i5/i7系列处理器或者AMD的AthlonⅡ/PhenomⅡ这些有4个及以上核心的处理器时,在低负载的时候也许会在BIOS里将之设置为双核甚至单核处理器以降低功耗。不过这种在BIOS里屏蔽核心的做法究竟是不是有意义呢?疯狂博士特地研究一番。
虽说由于制程的大幅度进步,现在的处理器和以前相比,功耗和发热也都有了相当大程度的降低,而且Intel和AMD也都将它们各自的节能技术应用到处理器上。例如Intel就早已将增强型英特尔Speed Step技术应用到了桌面级处理器上,部分高端处理器还应用了能够自动超频的睿频技术,从效果上来说增强型Speed Step技术能够根据系统的负载对处理器的频率进行调节,甚至能够关闭部分处理器核心,以达到在不影响性能的基础上节能降耗的目的。AMD也相应地有Cool &n& Quiet和Turbo Core技术,同样可以根据系统负载的需要降低或提升处理器的频率,在不影响性能的基础上节能降耗。
不过不管是升降频率还是开闭核心,还是有很多用户会有疑虑,在系统负载不高的时候,也会有关闭几个核心更节能一些的想法。
博士以Intel和AMD的高端平台为测试样本,选择酷睿i7 2600K和PhenomⅡ X6 1090T为测试对象,分别测试Intel和AMD的多核处理器在关闭不同数量核心后在日常的各种常见应用中的功耗变化,对于Intel处理器还测试关闭超线程对功耗的影响。本博士将具体测试分为五项,分别记录开机三分钟、开机后静置十分钟、播放码率为32000Kbps的1080P视频文件、运行大型DX11游戏《天堂2.5》、以及将码率为32000Kbps、时长1分14秒、大小为159MB的的视频文件转换成的视频文件时的功耗,看看在日常应用中,关闭物理核心究竟能否起到节能降耗的作用。对于时间长度不变的应用,不记录运行时间,而对于视频转码这类时间长度有明显变化的应用则同时记录完成的时间。
由于日常的应用对于目前的中高端处理器来说并不能完全使所有核心都达到最高负荷,因此本博士特别加入了能够让每颗核心都全速工作的Cinebench 11.5对Intel和AMD的多核处理器进行比较性测试,看看在CPU满载的情况下,关闭处理器物理核心是否对功耗有明显影响。
在基准测试中本博士采用的是没有通过80PLUS认证的大功率电源,为了更好地说明问题,本博士在AMD平台的测试中特别加入了采用了转换效率更高的80PLUS铜牌认证电源的测试成绩,以对比平台功耗的变化。
Intel测试平台
处理器:酷睿i7 2600K&主板:技嘉Z68A-D3H-B3&内存:宇瞻DDR3 1600 2GB&2&硬盘:希捷TB&显卡:GeForce GTX 560Ti&显示器:飞利浦240PW9 操作系统:Windows7 64Bit
AMD测试平台
处理器:PhenomⅡ X6 1090T&主板:映泰TA880GU3+ 内存:宇瞻DDR3 1600 2GB&2 硬盘:希捷TB 显卡:Radeon HD 6870 显示器:飞利浦240PW9 操作系统:Windows7 64Bit
在开机进入系统测试项上,无论是否打开超线程、无论启用的核心数有几个,功耗都保持一致,没有任何变化;系统静置10分钟后,开始出现了一些小变化,核心数量少的、关闭超线程的平台,主机功耗有轻微的下降,不过幅度并不大;在播放1080P视频的测试中整个平台都经历了功耗先提高到110W左右然后下降到73W左右稳定下来的过程,究其原因博士认为应该是前期程序载入带来的功耗提升,不同核心数平台之间的差距非常小;在运行大型3D游戏时也是这样,运行大型3D游戏时系统的耗电大户主要是显卡,CPU核心数的变化无关大局,可以看到平台的功耗差距也非常小。只有在对CPU负荷较大的视频转码项目中可以看到减少物理核心数,平台功耗有明显降低&&最高降低幅度接近20%,不过转码时间也大幅度延长&&最高延长时间超过100%,即便计算多核心系统完成处理后的闲置时间,降低核心后的总能耗也大于开启所有核心时的能耗。
从Intel平台的整体测试结果来看,关闭处理器的物理核心并不能明显达到降低功耗的作用,在某些应用中甚至会使总功耗增加不少(核心少了之后,睿频频率更高)。
和Intel平台不同,AMD平台在开机进入系统、系统静置、播放1080P视频以及运行大型3D游戏时,关闭处理器物理核心,功耗都会有一定程度的降低,不过降低的幅度各有不同。在对CPU负荷较大的视频转码项目中,和Intel平台表现相同,减少物理核心数,平台功耗有明显降低&&最高降低幅度超过30%,不过转码时间也大幅度延长&&最高延长时间超过100%;和Intel平台不同的是,在视频转码测试项上,AMD平台减少核心数能够明显降低能耗,计算多核心系统完成处理后的闲置时间,降低核心后的总能耗也小于开启所有核心时的能耗,不过时间的大幅度增加会明显降低工作效率。
从AMD平台的整体测试结果来看,在日常操作中关闭处理器的物理核心并不能明显达到降低功耗的作用,只有在视频转码项上,关闭物理核心才能降低功耗,不过大幅延长处理时间耽误的人工也非常大。
在Cinebench 11.5这种需要所有核心满载运算的测试项上,我们同样计算处理完成后的系统闲置功耗,Intel平台的核心开启越多总能耗越少,而AMD平台在开启或关闭物理核心后,总能耗的差距很小,几乎可以忽略不计。
疯狂博士 多核处理器别关闭核心
通过本周对多核处理器平台的功耗测试我们可以看到,在绝大多数日常应用情况下,开启处理器的所有核心,功耗并没有明显变化,只有在视频转码和图像渲染应用中减少核心数能够带来系统功耗的降低,不过相应地,处理时间也大幅延长,总能耗算起来其实并不低,而且浪费了许多时间。即便AMD平台在视频处理项目中减少核心数能够省一点电,但翻倍甚至数倍的处理时间也大幅提高了应用成本,因此本博士认为在日常操作环境中,开启处理器的所有核心并不会明显增大能耗,而且在部分应用中还能够迅速完成工作进入闲置状态,不仅节省处理的时间也更省电。而对于需要多核心满载工作的项目,如图像渲染,无论是Intel还是AMD平台开启全部核心都更划算,当然本博士也建议大家开启全部的处理器核心。
也就是说,关闭部分处理器核心以节省电能的说法是错误的,无论什么应用环境,本博士都推荐大家开启处理器全部的核心,真的要想节能,还不如购买一款转换效率更高的电源。
★★★ 电脑店行业门户()独家文章,欢迎大家转载 ★★★中国大众健康网官方群
丰胸交流群:
美白交流群:
美容交流群:
控油交流群:
祛斑交流群:
祛痘交流群:
当前位置: =>
幼儿教师资格课程
小学教师资格课程
中学教师资格课程
教师资格题库
幼儿教师招聘课程
小学教师招聘课程
中学教师招聘课程
教师资格资料
幼儿特岗教师课程
小学特岗教师课程
中学特岗教师课程
特岗教师资料
多核处理器功耗研究
如今,多核处理器已经非常流行了,在市场上几乎已经买不到单核心的处理器了。不过虽然多核处理器性能够强劲,但有的时候我们其实用不到那么多核心,尤其是买了Intel的Core i5/i7系列处理器或者AMD的AthlonⅡ/PhenomⅡ这些有4个及以上核心的处理器时,在低负载的时候也许会在BIOS里将之设置为双核甚至单核处理器以降低功耗。不过这种在BIOS里屏蔽核心的做法究竟是不是有意义呢?疯狂博士特地研究一番。
虽说由于制程的大幅度进步,现在的处理器和以前相比,功耗和发热也都有了相当大程度的降低,而且Intel和AMD也都将它们各自的节能技术应用到处理器上。例如Intel就早已将增强型英特尔Speed Step技术应用到了桌面级处理器上,部分高端处理器还应用了能够自动超频的睿频技术,从效果上来说增强型Speed Step技术能够根据系统的负载对处理器的频率进行调节,甚至能够关闭部分处理器核心,以达到在不影响性能的基础上节能降耗的目的。AMD也相应地有Cool &n& Quiet和Turbo Core技术,同样可以根据系统负载的需要降低或提升处理器的频率,在不影响性能的基础上节能降耗。
Intel测试平台
AMD测试平台
不过不管是升降频率还是开闭核心,还是有很多用户会有疑虑,在系统负载不高的时候,也会有关闭几个核心更节能一些的想法。
博士以Intel和AMD的高端平台为测试样本,选择酷睿i7 2600K和PhenomⅡ X6 1090T为测试对象,分别测试Intel和AMD的多核处理器在关闭不同数量核心后在日常的各种常见应用中的功耗变化,对于Intel处理器还测试关闭超线程对功耗的影响。本博士将具体测试分为五项,分别记录开机三分钟、开机后静置十分钟、播放码率为32000Kbps的1080P视频文件、运行大型DX11游戏《天堂2.5》、以及将码率为32000Kbps、时长1分14秒、大小为159MB的的视频文件转换成的视频文件时的功耗,看看在日常应用中,关闭物理核心究竟能否起到节能降耗的作用。对于时间长度不变的应用,不记录运行时间,而对于视频转码这类时间长度有明显变化的应用则同时记录完成的时间。
系统闲置时 Intel处理器功耗为12W
系统闲置时AMD处理器核心电压约为2.8V
由于日常的应用对于目前的中高端处理器来说并不能完全使所有核心都达到最高负荷,因此本博士特别加入了能够让每颗核心都全速工作的Cinebench 11.5对Intel和AMD的多核处理器进行比较性测试,看看在CPU满载的情况下,关闭处理器物理核心是否对功耗有明显影响。
在基准测试中本博士采用的是没有通过80PLUS认证的大功率电源,为了更好地说明问题,本博士在AMD平台的测试中特别加入了采用了转换效率更高的80PLUS铜牌认证电源的测试成绩,以对比平台功耗的变化。
Intel测试平台
处理器:酷睿i7 2600K 主板:技嘉Z68A-D3H-B3 内存:宇瞻DDR3 1600 2GB&2 硬盘:希捷TB 显卡:GeForce GTX 560Ti 显示器:飞利浦240PW9 操作系统:Windows7 64Bit
AMD测试平台
处理器:PhenomⅡ X6 1090T 主板:映泰TA880GU3+ 内存:宇瞻DDR3 1600 2GB&2 硬盘:希捷TB 显卡:Radeon HD 6870 显示器:飞利浦240PW9 操作系统:Windows7 64Bit
在开机进入系统测试项上,无论是否打开超线程、无论启用的核心数有几个,功耗都保持一致,没有任何变化;系统静置10分钟后,开始出现了一些小变化,核心数量少的、关闭超线程的平台,主机功耗有轻微的下降,不过幅度并不大;在播放1080P视频的测试中整个平台都经历了功耗先提高到110W左右然后下降到73W左右稳定下来的过程,究其原因博士认为应该是前期程序载入带来的功耗提升,不同核心数平台之间的差距非常小;在运行大型3D游戏时也是这样,运行大型3D游戏时系
第1页 / 总2页&&&&
多核处理器功耗研究相关
硬件维修阅览排行
硬件维修兴趣排行1129人阅读
  多内核(multicore chips)是指在一枚处理器(chip)中集成两个或多个完整的计算引擎(内核)。多核技术的开发源于工程师们认识到,仅仅提高单核芯片(one chip)的速度会产生过多热量且无法带来相应的性能改善,先前的处理器产品就是如此。他们认识到,在先前产品中以那种速率,处理器产生的热量很快会超过太阳表面。即便是没有热量问题,其性价比也令人难以接受,速度稍快的处理器价格要高很多。
  英特尔工程师们开发了多核芯片,使之满足“横向扩展”(而非“纵向扩充”)方法,从而提高性能。该架构实现了“分治法”战略。通过划分任务,线程应用能够充分利用多个执行内核,并可在特定的时间内执行更多任务。多核处理器是单枚芯片(也称为“硅核”),能够直接插入单一的处理器插槽中,但操作系统会利用所有相关的资源,将它的每个执行内核作为分立的逻辑处理器。通过在两个执行内核之间划分任务,多核处理器可在特定的时钟周期内执行更多任务。
  多核架构能够使用的软件更出色地运行,并创建一个促进未来的软件编写更趋完善的架构。尽管认真的软件厂商还在探索全新的软件并发处理模式,但是,随着向多核处理器的移植,已有软件无需被修改就可支持多核平台。操作系统专为充分利用多个处理器而设计,且无需修改就可运行。为了充分利用多核技术,应用开发人员需要在程序设计中融入更多思路,但设计流程与对称多处理 (SMP) 系统的设计流程相同,并且单线程应用也继续运行。
  得益于线程技术的应用在多核处理器上运行时将显示出卓越的性能可扩充性。此类软件包括多媒体应用(内容创建、编辑,以及本地和数据流回放)、工程和其他技术计算应用以及诸如应用服务器和数据库等中间层与后层服务器应用。
多核技术能够使服务器并行处理任务,此前,这可能需要使用多个处理器,多核系统更易于扩充,并且能够在更纤巧的外形中融入更强大的处理性能,这种外形所用的功耗更低、计算功耗产生的热量更少。多核技术是处理器发展的必然。
为什么要发展多核
  为什么不能用单核的设计达到用户对处理器性能不断提高的要求呢?答案是功耗问题限制了单核处理器不断提高性能的发展途径。
  作为计算机核心的处理器就是将输入的数字化的数据和信息,进行加工和处理,然后将结果输出。假定计算机的其他子系统不存在瓶颈的话,那么影响计算机性能高低的核心部件就是处理器。反映在指令上就是处理器执行指令的效率。
  处理器性能 = 主频 x IPC
  从上面的公式可以看出,衡量处理器性能的主要指标是每个时钟周期内可以执行的指令数(IPC: Instruction Per Clock)和处理器的主频。其实频率就是每秒钟做周期性变化的次数,1秒钟只有1次时钟周期的改变叫1Hz(赫兹)。主频为1GHz 就是1秒钟有10亿个时钟周期。
  因此,提高处理器性能就是两个途径:提高主频和提高每个时钟周期内执行的指令数(IPC)。处理器微架构的变化可以改变IPC,效率更高的微架构可以提高IPC从而提高处理器的性能。但是,对于同一代的架构,改良架构来提高IPC的幅度是非常有限的,所以在单核处理器时代通过提高处理器的主频来提高性能就成了唯一的手段。
  不幸的是,给处理器提高主频不是没有止境的,从下面的推导中可以看出,处理器的功耗和处理器内部的电流、电压的平方和主频成正比,而主频和电压成正比。
  因为: “处理器功耗 正比于 电流x 电压 x 电压 x 主频”,“主频 正比于 电压”
  所以:“处理器功耗 正比于 主频的三次方”
  如果通过提高主频来提高处理器的性能,就会使处理器的功耗以指数(三次方)而非线性(一次方)的速度急剧上升,很快就会触及所谓的“频率的墙”(frequency wall)。过快的能耗上升,使得业界的多数厂商寻找另外一个提高处理器性能的因子,提高IPC。
  提高IPC可以通过提高指令执行的并行度来实现,而提高并行度有两种途径:一是提高处理器微架构的并行度;二是采用多核架构。
  在采用同样的微架构的情况下,为了达到处理器IPC的目的,我们可以采用多核的方法,同时有效地控制功耗的急剧上升。为什么?看看下面的推导。
  因为:“处理器功耗 正比于 电流x 电压 x 电压 x 主频”,“IPC 正比于 电流”
  所以:“处理器功耗 正比于 IPC”
  由单核处理器增加到双核处理器,如果主频不变的话,IPC理论上可以提高一倍,功耗理论上也就最多提高一倍,因为功耗的增加是线性的。而实际情况是,双核处理器性能达到单核处理器同等性能的时候,前者的主频可以更低,因此功耗的下降也是指数方(三次方)下降的。反映到产品中就是双核处理器的起跳主频可以比单核处理器更低,性能更好。
  由此可见,将来处理器发展的趋势是:为了达到更高的性能,在采用相同微架构的情况下,可以增加处理器的内核数量同时维持较低的主频。这样设计的效果是,更多的并行提高IPC,较低的主频有效地控制了功耗的上升。
  除了多核技术的运用,采用更先进的高能效微架构可以进一步提高IPC和降低功耗——即提高能效。基于英特尔(R)酷睿(TM) 架构的英特尔(R) 酷睿(TM) 2 双核处理器和至强处理器就是现实中的例子。相比英特尔前一代的NetBurst 微架构(Intel(R) Pentium(R) 4 和Pentium(R) D),酷睿微架构采用的英特尔(R) 宽区动态执行引擎和英特尔(R) 高级数字媒体增强技术,就是提高IPC的创新技术;英特尔(R) 智能功率特性则是降低微架构功耗的技术。[1]
  一些芯片的厂商指出,当处理器的频率达到某种程度后,处理器在工作量的要求会比速度的要求要大,且0.13微米所含的晶体管已很高,将来65纳米和45纳米,其1组光罩的成本会倍增。但是,这种成本成倍的增长并不会给厂商们带来相应的收入增长。且发热量和干扰的因素的介入使得集成度和处理器的频率已经越来越趋近于一个极限。
  因此,使摩尔定律失效的有可能是技术,有可能是经济效益。
  处理器实际性能是处理器在每个时钟周期内所能处理器指令数的总量,因此增加一个内核,理论上处理器每个时钟周期内可执行的单元数将增加一倍。原因很简单,因为它可以并行的执行指令,含有几个内核,单位时间可以执行的指令数量上限就会增加几倍。而在芯片内部多嵌入几个内核的难度要远远比加大内核的集成度要简单很多。于是,多核就能够在不提高生产难度的前提下,用多个低频率核心产生超过高频率单核心的处理效能,特别是服务器产品需要面对大量并行数据,多核心分配任务更能够提高工作效率。可以看作一种多处理器协作的微缩形式,并且达到更加的性能价格比,一套系统达到多套系统的性能。
  多核的介入,使得摩尔定律在另一个层面的意义上,避免了尴尬的局面。从单核到双核到多核的发展就证明了摩尔定律还是非常正确的。从单核到双核再到多核的发展,可能是摩尔定律问世以来在芯片发展历史上速度最快的性能提升过程。&
多核的出现是技术发展的必然性
  上世纪八九十年代以来,推动微处理器性能不断提高的因素主要有两个:半导体工艺技术的飞速进步和体系结构的不断发展。半导体工艺技术的每一次进步都为微处理器体系结构的研究提出了新的问题,开辟了新的领域;体系结构的进展又在半导体工艺技术发展的基础上进一步提高了微处理器的性能。这两个因素是相互影响,相互促进的。一般说来,工艺和电路技术的发展使得处理器性能提高约20倍,体系结构的发展使得处理器性能提高约4倍,编译技术的发展使得处理器性能提高约1.4倍。但这种规律性的东西却很难维持。多核的出现是技术发展和应用需求的必然产物。这主要基于以下事实:
  1.晶体管时代即将到来
  根据摩尔定律,微处理器的速度以及单片集成度每18个月就会翻一番。经过发展,通用微处理器的主频已经突破了4GHz,数据宽度也达到64位。在制造工艺方面也同样以惊人的速度在发展,0.13um工艺的微处理器已经批量生产,90nm工艺以下的下一代微处理器也已问世。照此下去,到2010年左右,芯片上集成的晶体管数目预计超过10亿个。因此,体系结构的研究又遇到新的问题:如何有效地利用数目众多的晶体管?国际上针对这个问题的研究方兴未艾。多核通过在一个芯片上集成多个简单的处理器核充分利用这些晶体管资源,发挥其最大的能效。
  2.门延迟逐渐缩短,而全局连线延迟却不断加长
  随着VLSI工艺技术的发展,晶体管特征尺寸不断缩小,使得晶体管门延迟不断减少,但互连线延迟却不断变大。当芯片的制造工艺达到0.18微米甚至更小时,线延迟已经超过门延迟,成为限制电路性能提高的主要因素。在这种情况下,由于CMP(单芯片多处理器)的分布式结构中全局信号较少,与集中式结构的超标量处理器结构相比,在克服线延迟影响方面更具优势。
  3.符合Pollack规则   
按照Pollack规则,处理器性能的提升与其复杂性的平方根成正比。 如果一个处理器的硬件逻辑提高一倍,至多能提高性能40%,而如果采用两个简单的处理器构成一个相同硬件规模的双核处理器,则可以获得70%~80%的性能提升。同时在面积上也同比缩小。
  4.能耗不断增长
  随着工艺技术的发展和芯片复杂性的增加,芯片的发热现象日益突出。多核处理器里单个核的速度较慢,处理器消耗较少的能量,产生较少的热量。同时,原来单核处理器里增加的晶体管可用于增加多核处理器的核。在满足性能要求的基础上,多核处理器通过关闭(或降频)一些处理器等低功耗技术,可以有效地降低能耗。
  5.设计成本的考虑
  随着处理器结构复杂性的不断提高,和人力成本的不断攀升,设计成本随时间呈线性甚至超线性的增长。多核处理器通过处理器IP等的复用,可以极大降低设计的成本。同时模块的验证成本也显著下降。
  6.体系结构发展的必然
  超标量(Superscalar)结构和超长指令字(VLIW)结构在高性能微处理器中被广泛采用。但是它们的发展都遇到了难以逾越的障碍。Superscalar结构使用多个功能部件同时执行多条指令,实现指令级的并行(Instruction-Level Parallelism,ILP)。但其控制逻辑复杂,实现困难,研究表明,Superscalar结构的ILP一般不超过8。VLIW结构使用多个相同功能部件执行一条超长的指令,但也有两大问题:编译技术支持和二进制兼容问题。
摩尔定理:当价格不变时,集成电路上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。换言之,每一美元所能买到的电脑性能,将每隔18个月翻两倍以上。这一定律揭示了信息技术进步的速度。
&&&&&&& 多CPU对称处理(SMP,Symmetric Multi-Processing)技术,是指在一个计算机上汇集了一组处理器(多CPU),各CPU之间共享内存子系统以及总线结构。虽然同时使用多个CPU,但是从管理的角度来看,它们的表现就像一台单机一样。随着网络应用水平的提高.只使用单个处理器确实已经很难满足实际应用的需求,此时,就必须借助对称多处理系统,为服务器插满CPU来解决这一矛盾。服务器中最常见的对称多处理系统通常采用2路、4路、6路或8路处理器。
&&相关文章推荐
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:511179次
积分:7565
积分:7565
排名:第2635名
原创:203篇
转载:358篇
评论:35条
(5)(13)(8)(11)(19)(5)(8)(9)(9)(11)(5)(6)(9)(13)(2)(6)(2)(2)(1)(3)(3)(3)(5)(7)(8)(5)(5)(3)(6)(6)(3)(2)(19)(4)(17)(11)(2)(9)(13)(13)(10)(13)(11)(15)(17)(18)(13)(5)(11)(11)(20)(30)(36)(35)(8)(3)(2)(8)(3)

我要回帖

更多关于 cpu单核与多核的区别 的文章

 

随机推荐