算力调度平台
为了更好的服务于“人工智能”、“智慧建造”等高性能计算的业务场景,公司开发了一套算力调度平台,改变过去“全手工”创建资源、分配资源、交付资源、回收资源的过程中,效率低、交付慢的管理模式,提升资源利用率和管理效率,实现算力资源的高效共享,高效利用;提供自动化交付能力、为算力资源提供分时复用能力,促进创新和发展合作,实现整体降本增效。
算力调度平台
为了更好的服务于“人工智能”、“智慧建造”等高性能计算的业务场景,公司开发了一套算力调度平台,改变过去“全手工”创建资源、分配资源、交付资源、回收资源的过程中,效率低、交付慢的管理模式,提升资源利用率和管理效率,实现算力资源的高效共享,高效利用;提供自动化交付能力、为算力资源提供分时复用能力,促进创新和发展合作,实现整体降本增效。
对算力涉及的软硬件资源进行统一的纳管,通过虚拟化技术对资源进行“云化”;为用户提供自助的资源申请和管理界面,结合知识库、自助服务机器人等,方便用户快捷易用。
该平台由自助服务页面和云资源调度器来组成,其中自助服务页面基于HTML5进行开发;云资源调度器使用SDK、API等方式来调用虚拟化平台、桌面云等底层资源,对现有的云计算基础架构软硬件产品进行统一纳管,并对底层资源进行全局生命周期管理,包括云资源的自动化创建、回收和销毁;实现将纳管的资源的进行统一管理和自动化交付。
实现按时间、按资源使用率、按资源整合效率,多个维度来制定全局的调度策略,实现对资源的全局负载监控及智能调度,实现闲置资源分时复用。
实现对CPU和GPU资源统一调度。算力调度平台可自动调用其它系统的闲置资源,自动切换工作环境、自动进行任务排队、任务完成后自动释放资源。
1 统一纳管
对现有的基础架构软硬件进行统一的纳管
2 自动化交付
实现项目所需的“工作环境”自动化部署交付
3 统一调度
实现对CPU和GPU资源统一调度,分时复用
4 统一运营
资源使用及任务调度集中展示、集中计费