关于我们
书单推荐
新书推荐
|
LaaS模式云训练系统资源管理余调度方法
本书是近些年编者及其所属团队在云训练领域进行理论研究和应用探索的基础上总结而成的。本书介绍了网络化模拟训练背景下,依托系统建模与仿真技术、云计算相关技术及神经网络、人工兔疫等相关技术,实现云训练系统构建、虚拟机放置调度、虛拟机资源优化和训练系统容错的方法和途径。本书核心内容是laaS(基础设施即服务,InfrastructureasaService)模式云训练系统及其资源管理调度方法,总共分为6章。第1章为绪论,介绍了-脉相承的云计算、云仿真和云训练相关内容;对云训练进行了归类,并重点对SaaS和laaS两种模式进行了剖析和比较。第2章介绍了laaS模式云训练系统基础架构设计,解决制约虚拟训练节点3D任务处理性能的瓶颈一虚拟GPU共享问题,并定性和定量地对虚拟GPU性能进行了评估;总结了云训练系统管理功能,梳理了不同管理功能模块之间的关系与信息流。第3章针对训练虚拟机在服务器中的放置问题,分析了虚拟机放置的原则与目标,对人工免疫算法进行改进,介绍了一种基于约束免疫优势与记忆克隆的训练虚拟机放置优化算法。第4章针对虚拟机运行时的资源配置调度问题,在分析系统任务与资源需求特点的基础上,介绍了一种基于集成模型和优化神经网络的资源需求预测与调度算法。第5章介绍了一种基于减模糊聚类的模糊神经网络预测算法实现多步预测并改善预测精度。第6章则针对如何保证系统容错效果的基础上降低容错开销,介绍了一种检查点-副本迁移相结合的系统自适应容错调度优化方法。
你还可能感兴趣
我要评论
|