首页 > 产品与服务 > 产品 > 高性能计算 >
润宇RJMS作业调度管理系统(Runyu Job Management System)
 

一、产品概述

  润宇 RJMS作业调度管理系统负责计算资源统一管理和作业调度,帮助用户合理使用计算资源。它提供灵活多样的调度策略、稳定可靠的计算服务、简洁易用的可视化界面,不仅支持大规模异构集群的作业调度,还可以对多个集群实现统一管理。RJMS可大幅度提高集群的计算性能,加速数据分析处理进程。

二、为什么选择我们

稳定
  RJMS已运行18年
强大
  可管理超过20,000 CPU 核心的超大规模计算集群
灵活
  策略实时调整
专业
  资深研发团队


三、业务挑战

  一个大型计算集群系统需要支持上千个名用户同时操作,以及上万个作业同时运行。这对计算集群的稳定性、可靠性提出极其苛刻的要求。
  RJMS根据集群运行情况实时调整作业调度策略,并对每个作业进程实时监视,保证集群高效稳定运行。RJMS提供基于Web页面的系统管理图形界面,帮助管理员随时随地了解运行状态,修改调度策略,增强了计算集群的可用性。RJMS提供细粒度的队列管理功能,将异构资源划分成队列实现资源管理与作业调度,保证系统对不同体系结构资源的支持性。


四、产品功能

调度策略
  提供多个队列的个性化配置,支持GPU计算加速调度
  支持“多级抢占”、“预约回填”、“动态作业优先级”、“节点独占”等多种调度策略

计算服务
  计算节点自检功能,实时故障点排队。对作业异常行为快速响应并提供多种容错处理方案
统一管理
  支持多个集群系统统一管理
  支持异构集群统一管理

可视化界面
  提供脚本、命令行、Web界面等多种用户交互方式,帮助管理员快速便捷完成队列、资源配置管理以及批量作业提交、查询、删除等操作。
  提供方便的工具对用户、队列、节点等属性和权限进行设置。
  提供丰富的作业运行统计分析报表。

性能分析热图
  提供热图展示与分析功能,可直观展示集群整体及节点的多种性能指标,监控集群繁忙与空闲资源,及时满足作业管 理与应用调度,此外,可快速准确检测到集群热点及性能瓶颈,为集群调优提供参考依据。
  提供作业和节点等历史数据查询,以及各 种软硬件监控指标报表,报表可导出为Excel、PDF等格式。

报表系统
  提供报表系统,可按集群、按账号、按应用、按时间等方式,体现集群整体运行情况,以及作业与节点的详细运行情况, 可基于报表分析应用使用情况和用户使用习惯,可生成不同维度的关联报表,并提供关系分析,报表可导出为Excel、PDF等格式。

五、应用场景


六、软件试用

  点击 发送邮件申请试用润宇RJMS作业调度管理系统!