硬件项目:GRAPE家族

恒星动力学中的特殊用途计算机

牧野君与葡萄

1989年,我们在东京大学开始了一个项目,建造专门用于恒星动力学计算的硬件。第一个项目负责人是Daiichiro杉本学.退休后,小君牧野成为这个项目的负责人。

缩写葡萄代表重力管道,并指定了一个非常有效的硬件实现自引力n体系统中粒子之间的牛顿对偶力计算。每台GRAPE机器都可以与一台普通的工作站结合使用,从用户的角度来看,GRAPE的存在是完全透明的。唯一的区别是,库调用牛顿引力计算结果的有效速度比工作站的名义速度快几个数量级。从这个意义上说,GRAPE硬件扮演着“重力加速器”的角色,类似于图形加速器(一种加速特定图形功能的硬件)。

  • 有关概述,包括关于如何购买自己的桌面GRAPE板的信息,请参阅GRAPE网站
  • 这篇关于GRAPE项目的文章发表在了大众科学杂志《发现》上18, No. 6, 76-83(1997),见星际机器
  • 更偏向天体物理学的评论是特殊用途计算机GRAPE家族的天体物理学,胡特,P.和牧野,J., 1999科学283, 501-505(以预印本形式提供astro-ph / 9811418).
  • 另一篇针对工程观众的评论是科学中的高性能专用计算机,福志,T., Hut, P.和牧野,J., 1999IEEE科学与工程计算1,第2期,第12-13页。(以预印本形式提供astro-ph / 9811419).

的GRAPE-3

GRAPE-3董事会

GRAPE-1和GRAPE-2都是用现成的组件放在一块单板上。GRAPE-1在1989年完成,在单精度精度下以240 mflop的速度运行。一年后,GRAPE-2完成,运行速度为40 mflop,但精度提高了一倍。它们的名称将为后续的编号方案设定趋势:奇数(偶数)GRAPE数字表示单(双)精度机器。

第一台GRAPE-3板于1991年完成,运行速度为15 Gflops,在当时已经是惊人的速度了。速度的提高是由于GRAPE-3是第一款使用特别设计的“重力”芯片建造的葡萄,每个芯片都有效地结合了整个GRAPE-1板的设计。所有后续的GRAPEs都将使用这种定制设计的芯片。

我们在GRAPE-3上运行的众多应用程序之一是对星系间相遇的研究,在那里我们可以第一次准确地测量两个星系之间发生合并的横截面。我们只是简单地使用了一束星系,瞄准了类似星系的“目标板”,并观察了每次散射实验的结果,看看哪些相遇只会导致暂时的扰动,哪些会导致两个星系粘在一起。我们的研究结果发表在论文上等质量球形星系的合并速率,牧野,J.和胡特,P., 199712,54。J。481, 83 - 94。

的GRAPE-4

GRAPE-4董事会

第一个使用定制芯片的高精度葡萄是1995年完成的GRAPE-4。它也是第一台打破世界速度记录的GRAPE:它是第一台速度达到每秒1万亿次浮点运算的计算机。牧野俊和太地真因此获得了1995年的戈登·贝尔奖。他们在葡萄项目开始仅六年之后就在一本书中记录了他们的非凡成就特殊用途计算机的科学模拟-葡萄系统,牧野,J.和太极,M. 1998(威利)。

有关更简短的概述,请参见GRAPE-4,万亿次浮点运算的恒星动力学计算机,由Hut, P., 1997,在“计算天体物理学”,第12届“金斯顿会议”的理论天体物理学论文集,编。D. A.克拉克和M. J.韦斯特,ASP会议系列,第123卷(旧金山:ASP),第177-188页(以预印本形式提供)astro-ph / 9704277).

GRAPE-4,每秒1万亿次浮点运算

我们早期的大部分工作星团生态学是在各种GRAPE-4系统上完成的,从东京大学的大型系统到世界各地

GRAPE-4的成功引发了关于GRAPE系列未来的讨论。最好是继续建造GRAPE-6和GRAPE-8,每一个都比前一个快一到两个数量级?或者,将该程序扩展到引力以外的天体物理模拟的其他方面是否有意义?1997年,我在高等研究院(Institute for Advanced Study)组织的一次研讨会上讨论了最后一个问题。Bob的游戏我们得出的结论是,将流体力学以及其他物理形式(如辐射效应和等离子体物理)包括在内是可行的,但所需的努力和获得的速度之间的权衡不像仅在重力情况下那么明确。鉴于东京的小团队已经忙于构建常规的GRAPE系列,我们将不得不等待其他感兴趣的团队来承担构建特殊用途计算机的工作,以加速其他物理效果。我们的报告光滑粒子流体力学:模型、应用和使能技术,由Hut, P., Hernquist, L., Lake, G.,牧野,J.,麦克米兰,S.和斯特林,T.所著,1997年出版astro-ph / 9710212

的GRAPE-6

GRAPE-6,每秒48万亿次浮点运算

2001年夏天,东京大学(Tokyo University)部分完成的GRAPE-6系统再次打破了世界速度纪录,它以32万亿次浮点运算的速度运行,有4个机箱,每个机箱有8块板子(单个GRAPE-6板子以1万亿次浮点运算的速度与6年前建造的完整的4个机箱的GRAPE-4系统一样快)。同年晚些时候,又完成了两个机柜,使该系统达到48万亿次浮点运算。

1万亿次浮点运算的GRAPE-6美国自然历史博物馆

整个系统的最终运算速度有望达到每秒100万亿次浮点运算。同时,单板系统和少板系统可以从东京采购以比同样速度运行的商业产品价格低一两个数量级的价格:现在你只需要不到10万美元就可以建立一个每秒1万亿次浮点运算的系统(如果你对恒星动力学感兴趣的话)。

如果能找到资金,GRAPE-8可以在本十年的晚些时候建造出来,然后有望达到每秒千万亿次的最高速度。最有可能的是,它将是第一台突破千万亿次浮点运算障碍的计算机,正如我们几年前在第一次千万亿次浮点运算会议上所预测的那样粒子模拟千万亿次专用硬件的设计研究,麦克米伦,S.L.W,胡特,P.,牧野,J.,诺曼,M.L.和萨默斯,f.j., 1996,在Petaflops架构工作坊[奥克斯纳德,加利福尼亚州,1996年4月21-25日],第6.4章(可作为apostscript文件).我们在后续会议的论文中更详细地阐述了我们的观点GRAPE-6: Petaflops原型机,由Hut, P., Arnold, j.m., Makino, J., McMillan, S.L.W.和Sterling, t.l., 1997,在1997年4月13-18日在弗吉尼亚州威廉斯堡举行的1997千万亿次浮点运算算法研讨会(PAL'97)的会议记录中astro-ph / 9704183).

目前,我们正在使用各种GRAPE-6系统继续我们的研究星团生态学,以及星团和星系核的恒星动力学方面的其他主题。一些早期的结果可以在IAU第208次研讨会的论文集中找到,使用粒子的天体物理超级计算2001年7月,牧野淳和我在东京组织了这次活动。另请参阅GRAPE-6网站