K8s 基于 HAMi 的 GPU/NPU 算力切分实践指南

K8s生态的HAMi方案可实现GPU/NPU算力精细化切分,含组件介绍、部署配置与验证流程,能提升异构资源利用率,适配AI场景需求。

K8s 基于 Volcano 优先级调度的 NPU 算力切分实践指南

该指南介绍K8s生态下,Volcano调度器与hami-ascend-device-plugin、Ascend Docker Runtime协同,实现NPU算力精细化切分与优先级调度的方案。

K8s 基于 Volcano 优先级调度的 GPU 算力切分实践指南

该指南介绍K8s生态中Volcano调度器结合volcano-vgpu-device-plugin的GPU算力切分方案,涵盖运行时配置、Volcano与插件部署流程,支持按显存和核心切分vGPU,通过

K8s 基于 IB RDMA 网络加速大模型分布式训练的实践指南

该文件围绕K8s环境下利用IB RDMA网络加速大模型分布式训练展开,先明确了包含v1.23.7版本K8s集群、Ubuntu 24.04 LTS系统、IB RDMA网络的基础环境,接着介绍了k8s-d

Containerd Rootless模式完整配置与使用指南

这篇博客聚焦 Containerd Rootless 模式的配置与使用,核心是通过 Linux 用户命名空间技术,让容器以非特权用户运行,规避传统 root 权限运行的安全隐患。

Kata Containers:从原理到部署的安全容器全攻略

本文详解Kata Containers,其融合容器轻量性与虚拟机强隔离性,介绍架构、部署前提,提供containerd/K8s集成方案与实操,适用于敏感 workload 安全部署。

AI原生的API网关Higress

Higress是阿里出身的AI原生云原生API网关,基于Istio和Envoy,集多网关功能,支持AI集成与热更新,提供多样安装使用方式,适配云原生与AI场景。

多集群网络Submariner集成

本文将介绍如何使用Submariner实现跨集群的网络通信,包括安装Submariner、配置Submariner、验证Submariner是否正常工作等。