- 今天
K8s 基于 HAMi 的 GPU/NPU 算力切分实践指南
K8s生态的HAMi方案可实现GPU/NPU算力精细化切分,含组件介绍、部署配置与验证流程,能提升异构资源利用率,适配AI场景需求。
- 4天前
K8s 基于 Volcano 优先级调度的 NPU 算力切分实践指南
该指南介绍K8s生态下,Volcano调度器与hami-ascend-device-plugin、Ascend Docker Runtime协同,实现NPU算力精细化切分与优先级调度的方案。
- 6天前
K8s 基于 Volcano 优先级调度的 GPU 算力切分实践指南
该指南介绍K8s生态中Volcano调度器结合volcano-vgpu-device-plugin的GPU算力切分方案,涵盖运行时配置、Volcano与插件部署流程,支持按显存和核心切分vGPU,通过
- 25天前
K8s 基于 IB RDMA 网络加速大模型分布式训练的实践指南
该文件围绕K8s环境下利用IB RDMA网络加速大模型分布式训练展开,先明确了包含v1.23.7版本K8s集群、Ubuntu 24.04 LTS系统、IB RDMA网络的基础环境,接着介绍了k8s-d
- 27天前
Containerd Rootless模式完整配置与使用指南
这篇博客聚焦 Containerd Rootless 模式的配置与使用,核心是通过 Linux 用户命名空间技术,让容器以非特权用户运行,规避传统 root 权限运行的安全隐患。
- 7/29/2025
Kata Containers:从原理到部署的安全容器全攻略
本文详解Kata Containers,其融合容器轻量性与虚拟机强隔离性,介绍架构、部署前提,提供containerd/K8s集成方案与实操,适用于敏感 workload 安全部署。
- 6/17/2025
AI原生的API网关Higress
Higress是阿里出身的AI原生云原生API网关,基于Istio和Envoy,集多网关功能,支持AI集成与热更新,提供多样安装使用方式,适配云原生与AI场景。
- 5/15/2025
多集群网络Submariner集成
本文将介绍如何使用Submariner实现跨集群的网络通信,包括安装Submariner、配置Submariner、验证Submariner是否正常工作等。