排序方式: 共有11条查询结果,搜索用时 13 毫秒
1.
2.
面向未来E级超级计算机,提出用于故障预测的数据采集框架,能够全面采集与计算结点故障相关的状态数据。采用自适应多层分组数据汇集方法,有效解决随着系统规模增长数据汇集过程开销过大的问题。在TH-1A超级计算机上的实现和测试表明,该数据采集框架具有开销小、扩展性好的优点,能够满足未来大规模系统故障预测数据采集的需求。 相似文献
3.
苏诺雅 《国防科技大学学报》2021,43(3):86-97
超级计算是解决国家安全、经济建设、科学进步、社会发展和国防建设等领域重大挑战性问题的重要手段,是各国科技发展中必争的战略制高点。通过调查和实证,重点分析了中国超算技术追赶中政府的引导作用和企业作为市场主体的作用。面向领域的战略需求,在财政能力非常有限的情况下,政府通过长期资助,形成厚实的知识和人才队伍积累;面向科技创新,政府主导全国的集群创新实现中国超算登顶,并建设国家超算基础设施;面向全面发展,积极发展超算应用,并按照企业是市场主体的原则,通过企业参与超算竞争研制,实现技术溢出和市场突破。超算技术发展模式可以为其他高技术领域发展提供借鉴经验。 相似文献
5.
并行作业特征分析是负载分析的重要基础。作业记账日志是开展作业特征分析的重要数据源。由于作业记账日志中没有记录应用名称,现有工具无法按应用名称开展作业特征分析。提出基于关键字模糊匹配的作业记账日志标记方法,设计通用的作业数据模型和柔性可扩展软件架构,集成实现并行作业特征分析工具JobCAT。通过某超级计算机系统百万量级作业记账日志数据测试验证,JobCAT的作业记账日志标记率大于95%。JobCAT支持7个插件、29项统计报表,可一键生成应用的作业特征分析报告,对负载分析研究具有实用价值。 相似文献
6.
2009年10月,国家首台千万亿次超级计算机系统——“天河一号”在国防科学技术大学诞生。“天河一号”的诞生,是我国高性能计算机技术发展的又一重大突破,标志着我国超级计算机研制能力实现了从百万亿次到千万亿次的重大跨越,我国成为继美国之后第二个能研制千万亿次超级计算机系统的国家。 相似文献
7.
在超级计算机体系结构设计阶段 ,有必要进行时序规划 ,以尽早判断设计方案和性能指标的物理可实现性。提出一种性能驱动的时序规划方法 ,采用适于组件性能描述的时序性能模型 ,并按照线网权重分配路径延时余量 ,算法具有效率高、延时分配合理的优点 相似文献
8.
科学计算产生和分析的数据规模日益增长,高性能计算机的存储系统在体系架构和软件管理方法上面临重大挑战。针对天河-2系统的新型分层混合存储架构,提出一种由应用程序耦合的协同式突发缓冲技术来有效利用其存储资源优势。该方法采用运行时动态耦合的方法,将临近计算任务的分布式高速存储资源聚合成为一个的巨大的协同式突发缓冲区,通过采用文件命名空间投影的映射方法组织全局数据视图,利用位置亲和和感知数据意图的方法来挖掘空间局部性和时间局部性,并利用应用并发度感知的策略优化数据移动效率。天河-2系统的测试结果表明,该方法能够有效优化多种典型应用场景,可获得高可扩展的突发并行输出带宽和稳定的持续并行输出带宽,可显著提升数据分析场景的输入/输出性能,适合应用于大规模超级计算机的存储系统。 相似文献
9.
随着超级计算机规模向E级迅速发展,其可靠性面临巨大挑战,基于故障预测的主动容错技术成为提高系统容错能力的有效方法之一。数据采集是故障预测的基础,现有用于超级计算机故障预测的数据采集方法采集数据属性少、开销大,影响了故障预测的准确性和效率。本文面向未来E级超级计算机,提出数据采集框架(Failure Prediction Data Collection Framework, FPDC),能够全面采集与计算结点故障相关的状态数据,采用自适应多层分组数据汇集方法,有效解决了随着系统规模增长数据汇集过程开销过大的问题。在TH-1A超级计算机上的实现和测试表明,该数据采集框架具有开销小,扩展性好的优点,能够适应未来大规模系统故障预测数据采集的需求。 相似文献
10.