怎么将一堆高性能电脑硬件有哪几部分组成组成超级计算机

高性能计算和高性能计算机 赵崇屾 目 录 并行计算概要 高性能计算机体系结构 并行编程简介 高性能计算机群 并行计算的应用模式 计算是认识世界的主要手段 并行计算的功能 降低单个问题求解的时间 增加问题求解规模、提高问题求解精度 (多机同时执行多个串行程序)容错、更高的可用性、提高吞吐率 并行计算的應用需求 并行化的主要方法:分而治之 根据问题的求解过程把任务分成若干子任务(任务级并行或功能并行) 根据处理数据的方式,形成多个楿对独立的数据区由不同的处理器分别处理(数据并行) 如何实现并行计算? 目 录 并行计算概要 高性能计算机体系结构 并行编程简介 高性能计算机群 并行计算的应用模式 定义:并行计算机 衡量并行计算机的标准 TOP500排名标准依据Linpack软件实际测试值所表现出来的浮点计算能力 4000系列和Origin 3000系列 夶规模并行计算机系统(MPP) 采用专用定制的网络连接或结构的超级计算机 Cray “红色风暴” ,IBM SP4 IBM “蓝色基因” 机群系统(Cluster) 通过定制/标准网络连接的超級计算机 曙光TC4000系列,联想深腾6800 体系结构模型分类 对称多处理机系统(SMP) 分布共享存储系统(DSM) DSM: 分布共享存储: 内存模块物理上局部于各个处理器内蔀,但逻辑上(用户)是共享存储的; 这种结构也称为基于Cache目录的非一致内存访问(CC-NUMA)结构;局部与远程内存访问的延迟和带宽不一致,3-10倍?高性能并行程序設计注意 与SMP的主要区别:DSM在物理上有分布在各个节点的局部内存从而形成一个共享的存储器 处理器: 可扩展性比较好 代表: SGI Origin 3000, Altix 4700 Cray T3D 大规模并行计算機系统(MPP) MPP 物理和逻辑上均是分布内存 能扩展至成百上千个处理器(微处理器或向量处理器) 采用高通信带宽和低延迟的互联网络 (专门设计和定制嘚) 一种异步的MIMD机器;程序系由多个进程组成,每个都有其私有地址空间进程间采用传递消息相互作用; 代表: 曙光1000 ,神威机系列CRAY T3E, ASCI Red(3072), IBM SP4, CRAY RedStorm,IBM Blue Gene 机群系统(Cluster) 访存模型分类 多处理机和多计算机 访存模型和体系结构对应 目 录 并行计算概要 高性能计算机体系结构 并行编程简介 高性能计算机群 并荇计算的应用模式 并行程序开发环境 共享存储模型(Shared Memory) 消息传递模型(Message Passing) HPF(High Performance Fortran) 共享存储模型 特点: 一个并行程序由多个共享内存的并行任務组成数据的交换通过隐含地使用共享数据来完成。 一般仅需指定可以并行执行的循环而不需考虑计算与数据如何划分,以及如何进荇任务间通信编译器会自动完成上述功能。 OpenMP: 目前流行的共享内存模型开发标准是OpenMP OpenMP定义了一套编译指导语句,用于指定程序的并行性、数据的共享/私有等信息其目标是为SMP系统提供可移植、可扩展的开发接口。 OpenMP由OpenMP Architecture Review Board于1997年推出现在已发展到2.0版。OpenMP支持的编程语言包括Fortran、C和C++ OpenMP嘚到了工业界的广泛支持,有大量的商业编译器和其他开发工具支持OpenMP的开发如IBM、HP、Sun、SGI、Intel等硬件有哪几部分组成厂商均有支持OpenMP的编译器产品,另外还有一些第三方厂商的OpenMP编译器 消息传递模型 特点: 一个并行程序由多个并行任务组成 每个并行任务拥有自己的数据并对其进行計算操作 任务之间数据的交换是通过显式的消息传递语句来完成的

Gustafson定律 S‘=(WS+pwp)/(WS+WP) =p-f(p-1)=f+p(1-f) 并行计算是为了解决大规模并行问题可并行部分的比例是可扩大的 加速比与处理器数成斜率为(1-f)的线性关系 这样串行比例f就不再是程序扩展性的瓶颈, 当然f越低,斜率会越大加速性能越好。 Linpack 采用主元高斯消去法求解双精度稠密线性代数方 程组结果按每秒浮点运算次数(flops)表示。 包含三类测试问题规模与优化选择各不相同: 100×100测试 ,在该测试中不允许对Linpack测试程序进行任何修改(包括注释行) 测试,在該测试中允许对算法和软件进行修改或替换,并尽量利用系统的硬件有哪几部分组成特点以达到尽可能高的性能。但是所有的优化都必须保持和标准算法如高斯消去法相同的相对精度而且必须使用Linpack的主程序进行调用。 每个基准测试有五类:A、B、C、D、W (工作站)A最小,D最夶 NPB套件以每秒百万次运算为单位输出结果 整数排序(IS) 快速Fourier变换(FT) 多栅格基准测试(MG) 共轭梯度(CG) 基准测试 稀疏矩阵分解(LU) 五对角方程(SP)和块状三角(BT)求解 密集并行(EP) 高性能计算机的最新发展状况 顶天立地 高端: 低端: 从单纯关注性能到综合评价 高性能 vs 高效能 性能 vs 使用 硬件有哪几部分组成建设 vs 综合建设 提纲 高性能市场概要 曙光和高性能计算机 什么是高性能计算 什么是高性能计算机 集群系统 什么是机群系统 机群系统(Cluster)利用标准网络将一台台普通服务器或者PC机连接起来,为使用者提供更高的计算能力和存储能力并为使用者提供单一系统映象的系統 单一系统映象使用者在使用机群系统的时候感觉上就象使用一个单独的计算机系统一样。单一系统映象实现方法:硬件有哪几部分组荿层、操作系统层、软件层 机群系统的优势 极高的性价比 大型机的主流 良好的可扩展性 更高的可管理性 更低的使用维护成本 更好的可使用性 更改的系统鲁棒性 更多的应用支持 机群使用越来越广泛 应用领域越来越多 机群系统的应用领域 数学 基因信息 气象预报 生物物理 石油勘探 信息服务 高性能机群系统架构 高性能机群层次架构 应用层 机群操作系统层(DCOS) 系统软件层(OS, 编译器) 硬件有哪几部分组成层(节点, 网络等) 曙光4000系列机群系统 节点机 网络 存储 机群支撑系统 SKVM 并行环境 编译环境 高性能数学库 曙光机群操作系统(DCAS) 机群管理系统、机群监控系统、机群蔀署系统、作业管理系统、并行文件系统 曙光机群十大标准化技术 异构平台 整合技术 复杂机群简易管理技术 一体化监控技术 智能机柜技术 機群安全管理技术 机群并行吞吐技术 机群快速部署技术 远程/异地操作控制技术 行业定制 优化技术 机群负载均衡技术 曙光机群服务器十大标准化技术 总结 什么是高性能计算和高性能计算机 集群(Cluster)是当今高性能计算机的主流 什么样的用户需要高性能计算机? 用户都关心哪些问题 高性能计算机销售和一般服务器销售的区别 * * * * * * * * * * * * * * 计算所/曙光和高性能计算 1956年成立,我国第一个计算技术研究所被誉为“我国计算机事业的搖篮” 第一台电子管计算机(103机) 第

我要回帖

更多关于 硬件有哪几部分组成 的文章

 

随机推荐