预约演示
预约演示
MMCloud + NextFlow

高性能计算自动化云平台助力实现
更简易,更高效的科研流程

"MMCloud帮助我们MDI生物实验室计算生物学团队更好地使用AWS Spot EC2实例,节省了云计算成本。此外,WaveWatcher工具让我们能够实时观察资源使用情况,帮助我们在Nextflow流程中多角度的优化资源分配。"
——Joel Graber,计算生物学和生物信息学主任
挑战和解决方案
生物信息学家在公有云上运行他们的作业流程常常会遇到如下几个挑战:
  • 学习一个复杂且全新的基础设施管理环境(如阿里云、AWS、百度云等)。
  • 在最佳pipeline性能优化和云主机类型选择进行反复尝试和匹配。
  • 通过使用Spot实例来实现成本效益。
  • 确保在流程、资源和用户之间实现可扩展的自动化。
NextFlow

Memory Machine Cloud 极大地增强了 Nextflow 的工作流编排能力,提供了高性能计算自动化、checkpoint/restore和云主机选型优化能力。Nextflow 通过 nf-float 插件与 MMCloud 无缝集成。产品的SpotSurfer功能用于Spot实例回收后的业务恢复,WaveRider功能用于实时云主机选型优化,WaveWatcher功能用于资源管理可视化,这些产品功能,使云端生物信息学变得轻松无比。

Nextflow

nf-float插件解锁了Memory Machine Cloud的附加价值

Memory Machine Cloud是一个功能丰富的执行器,可以在Nextflow配置文件中轻松部署。其优势包括成本节省、减少运行时间以及深入洞察应用级别的资源利用情况。

WaveWatcher 可视化监控服务

当 Memory Machine Cloud 启动一个工作节点时,它会在容器内部打开一个与资源监视器的通信通道。实时指标可作为 CSV 文件下载分析或以图形方式查看。WaveWatcher 可视化监控服务以实时方式显示每个作业的详细云成本,并在GUI上提供有关每个应用程序、每个用户和每个组的云成本报告。它还提供了有关CPU、内存、网络、存储I/O利用率以及能耗信息的详细数据。利用这些数据来优化云资源以适应您的工作负载。

Nextflow

为了找到优化的机会,WaveWatcher 显示了 CPU、内存、网络和存储的实时应用程序使用情况。左侧屏幕显示 WaveRider 可以通过在较小的实例上启动工作负载,然后仅在需要更多资源时才迁移到较大的实例来降低成本。

WaveRider 云主机实例类型持续优化服务

WaveRider 可以在不影响 NextFlow 的情况下,根据作业实时资源利用情况,将正在运行的作业迁移到最适合的云主机实例类型上。用户只需点击几下鼠标,就能够优化成本,提升运行速度。

Nextflow

灰色区域展示了不同计算实例上的内存和CPU使用情况,WaveRider 在运行时不断根据资源利用率和主机负载压力需求来对云主机实例的类型规格进行大小调整。

SpotSurfer Checkpoint/restore服务

Spot 实例是云厂商用于变现闲置计算能力的一种方式。Spot 实例的价格折扣高达按需实例价格的 90%。但有个小问题 - Spot 实例可能随时被云厂商收回,而且只会提前2分钟通知。Memory Machine Cloud 包含了SpotSurferCheckpoint/restore服务,允许正在运行的作业无缝地从待收回的Spot实例迁移到新的Spot或按需实例上,且作业无须中断。这一功能使用户可以显著降低云成本,而不会增加运行时间。

Nextflow

灰色区域显示了运行时的内存和CPU使用情况,白色区域代表工作负载自动迁移到新的计算实例并启动继续运行的时间段。