以文本方式查看主题 - 康柏仕电脑学院 (http://combss.com/bbs/index.asp) -- COMBSS情报站 (http://combss.com/bbs/list.asp?boardid=16) ---- AMD破局高性能计算 四核皓龙赌未来 (http://combss.com/bbs/dispbbs.asp?boardid=16&id=1350) |
-- 作者:轻轻风聆 -- 发布时间:2007/12/6 9:18:02 -- AMD破局高性能计算 四核皓龙赌未来 市场研究公司iSuppli发布针对第三季度的全球芯片研究报告,报告指出在X86市场中,主要两家竞争公司英特尔和超微半导体(以下简称“AMD”)都受益于全球个人电脑爆炸式增长。
投身超级计算竞争 除了在消费级别的电脑,商用计算市场x86逐渐获得了自己的地位,过去X86芯片上双方展开剑拔弩张的价格战,在第三季度看来趋于平缓。从目前高性能计算发展的趋势来看,AMD将发挥越来越重要的角色,其产品逐步获得认可,将炙手可热。 上周末,AMD入选中国软件行业协会数学软件分会的理事单位,其中国区高级技术经理刘文卓成为中国软件行业协会数学软件分会理事。 刘文卓向比特网(ChinaByte)透露:“在科学计算领域对AMD的认可,也证明了AMD巴塞罗那系列四核产品在直连架构和集成内存控制器这条道路上的正确选择。” 之前,AMD曾经为了追求在技术架构上获得突破,而延迟了四核处理器上市的时间。对此,不少分析机构认为,AMD可能陷入了唯技术论的牛角尖。不过,由于在产能和工艺方面的限制,使得AMD必然选择与竞争对手采用不同技术方向和市场策略。 目前,四核产品还并没有进入普通消费者的家庭或者办公等桌面端普及应用,因此AMD依然将高性能计算领域视为四核巴塞罗那产品主攻的市场方向。 作为商用高性能计算以及科学计算能力的风向标——“TOP500”排名,于今年11月份发布。对此,刘文卓透露:“当时AMD与SUN合作的采用16000颗AMD四核皓龙处理器的超级计算机错过了评选”,不过这个代号为“巡逻兵”超级计算机实现高达 500TFlop/s的峰值运算性能,超过11月份排名第一的BlueGene/L System。 在11月发布的高性能计算处理器家族份额中,AMD以339273的数量获得了TOP500中15.80% 的份额。虽然相比6月有所下滑,巴塞罗那的发布和应用推动将可能在明年改变这一现状。此外,Appro也将采用12000颗四核皓龙处理器为美国三大国家实验室搭建438 tFLOP/s峰值的Xtreme-X高性能计算集群。 高性能处理器结构决定论 参与高性能计算中超级计算机的构建,是AMD突出的想证明自己产品的架构优势原因之一。 在11月29日到12月1日全国高性能算法软件研究开发研讨会上,有关专家认为,根据目前业界提供的测试芯片测试,所有厂商的x86架构产品在单核单线程上都表现出与主频高度相关的计算能力。而到多核多线程情况,线程越多每个线程的性能都会出现下降的 趋势。该专家表示,这是处理器之间在为并行计算所做的通讯上消耗了等待查询的时间。因此,架构的差别将在这个时候表现出来。 AMD中国区高级技术经理刘文卓解释到:“在大规模的进行并行计算的时候,处理器架构和核间通讯的效率将成为决定处理器计算性能一个不可忽视的参数。”四核巴塞罗那的这种架构具有这样的特点,能够很好的适应并行化带来的挑战。 另外,随着超级计算机的发展,其异构情况下的性能和计算能力也是考量未来建设超级计算机实用性的问题,超级计算可能面临异构的挑战。 目前,针对某一行业的计算需求,流行的做法是将该需求中大规模用同一方式处理的数据采用物理加速卡的方式来进行。那么,如果处理器在结构上无法实现与物理加速卡更有效的通信,同样会影响计算的性能。这也要求市场提供更为适合的架构产品。 计算性能仍有瓶颈 AMD在高性能计算上的成功,还在于与算法研究者的合作。 中科软负责并行计算的博士生导师张云泉告诉比特网(ChinaByte):“除了处理器本身的结构之外,针对处理器的软件优化,也是在高性能计算中非常重要的。目前决定处理器性能的方法,是在公认的一些计算模型下,考量处理器的处理能力。但是如果处理 器厂商合作针对某种处理器优化软件的设计,将更大的改观处理器效能。” 在目前的软件开发中,许多公司并没有对并行化进行很好的研究,对计算数据粒度的把握可能导致不同处理器上运行效率的差异。不过从实践上来看,目前,AMD采用了Torrenza开放式协作平台,的确吸引了中国用户的加入。 刚刚出炉的2007年中国高性能计算TOP100强名单来看,基于AMD皓龙系统的总量从去年的24套增加到了28套,增长了16.7%。新上榜的系统中有3套是基于AMD四核皓龙处理器“巴塞罗那”。 其中,北京航空航天大学高性能机群曙光TC4000A,linpack成绩为2821.73Gflops,峰值浮点运算能力为每秒4.2万亿次;苏州气象局的高性能机群,峰值浮点运算能力高达每秒2.5万亿次;中国科技大学科学计算机群,linpac k成绩为1851.24Gflops。这些应用揭示了AMD四核在高性能计算中的应用潜力巨大。 处理器在高性能计算中的竞争,更加注重效率。不过目前的计算效率,并不简单的受制于处理器本身的结构。从处理器结构,平台的I/O接口,存储节点性能,软件算法优化,散热等因素形成一个制约计算效能的环境。 芯片企业必须跳出仅仅作为处理器研发和制造的简单产业分工,必须与产业环节中的每一环节共同发展。 出处: 比特网 |