微软取消了“全球规模”人工智能基础设施的计划
来源:http://www.tudoupe.com时间:2022-02-25

微软透露,它正在为 AI 工作负载开发一种新的“全球规模”调度系统,称为 Singularity。
正如该公司发表的一篇技术论文中所解释的那样,Singularity 是“一种新型的、工作负载感知的调度程序,它可以透明地抢占和弹性扩展深度学习工作负载,以推动高利用率,而不会影响它们在全球人工智能加速器中的正确性或性能”。
在非技术方面,这意味着该系统旨在帮助确保以最佳方式利用公司的全球服务器硬件网络,从而降低与运行 AI 工作负载相关的成本。
微软奇点
Singularity 价值主张的核心是能够在流动中调整工作规模,以及在全球不同基础设施之间转移它们。
正如论文中所解释的,可以将实时作业迁移到不同的集群或数据中心,并在其停止的精确点恢复,从而优化容量使用。它还可以根据需要利用不同数量和类型的 AI 加速器弹性地向上或向下扩展。
微软表示,该系统的美妙之处在于它不需要开发人员进行额外的工作,因为 Singularity 无需修改代码即可运行。
然而,为了使这一切成为可能,微软必须找到一种方法来将工作负载与硬件资源分离。这种新颖的解决方案利用了公司称之为“设备代理”的东西,它在自己的地址空间中运行,并建立了一个分离层,允许资源的流动重新分配。
微软在总结中写道:“Singularity 在调度深度学习工作负载方面取得了重大突破,将弹性等小众特性转化为主流、始终在线的特性,调度程序可以依赖这些特性来实施严格的 SLA。”
“凭借使未修改的作业可抢占且可调整大小且性能开销可忽略不计的新颖机制,Singularity 实现了前所未有的工作负载可替代性,使作业能够利用全球分布机队中任何地方的备用容量。”
尽管调度服务是本文的主要关注点,但作者表示,该系统旨在跨数十万个 GPU 和其他 AI 加速器进行扩展。
下一篇:没有了
相关新闻
- 2022-02-25 Windows 11累积更新修复一个恼人的错
- 2022-02-25 微软4000亿收购动视暴雪,如何从商
- 2022-02-25 微软将 Groove音乐更名为“微软媒体
- 2022-02-25 微软、索尼后育碧又坐不住了,游
- 2022-02-25 开发者魔改一代神机Surface Duo:Wi
- 2022-02-25 终于来了!Win11推送重大更新:支持
- 2022-02-25 微软:有一些非常兴奋的游戏要来
- 2022-02-25 微软在监管之前采纳新的应用商店
- 2022-02-25 终于来了!Win11推送重大更新:支持
- 2022-02-25 微软将在3月开始开发windows12
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
