Ascend 910C 算力卡 Kubernetes 接入实践指南
围绕 Ascend 910C 算力卡在 Kubernetes 集群中的接入实践展开,涵盖驱动与固件安装、Ascend Docker Runtime 配置、Kubernetes 组件部署、NPU 资源验证,以及 Volca
Library
105
持续更新的文章与实践记录
Picks
4
首页推荐与置顶内容
Explore
AI、K8s、容器、Istio、工程实践
围绕 Ascend 910C 算力卡在 Kubernetes 集群中的接入实践展开,涵盖驱动与固件安装、Ascend Docker Runtime 配置、Kubernetes 组件部署、NPU 资源验证,以及 Volca
K8s生态的HAMi方案可实现GPU/NPU算力精细化切分,含组件介绍、部署配置与验证流程,能提升异构资源利用率,适配AI场景需求。
该指南介绍K8s生态下,Volcano调度器与hami-ascend-device-plugin、Ascend Docker Runtime协同,实现NPU算力精细化切分与优先级调度的方案。
该指南介绍K8s生态中Volcano调度器结合volcano-vgpu-device-plugin的GPU算力切分方案,涵盖运行时配置、Volcano与插件部署流程,支持按显存和核心切分vGPU,通过优先级调度保障核心任
围绕 Ascend 910C 算力卡在 Kubernetes 集群中的接入实践展开,涵盖驱动与固件安装、Ascend Docker Runtime 配置、Kubernetes 组件部署、NPU 资源验证,以及 Volcano 插件定制编译流程,为昇腾算力在云原生环境中的落地提供完整参考。
围绕Fluid v1.0.8,详述K8s环境部署(含Helm安装、ARM64镜像构建)、测试准备(PVC与Pod创建、大文件上传)、数据集配置与缓存加速,性能测试显示缓存使3.3GB文件复制耗时降8.
K8s生态的HAMi方案可实现GPU/NPU算力精细化切分,含组件介绍、部署配置与验证流程,能提升异构资源利用率,适配AI场景需求。
该指南介绍K8s生态下,Volcano调度器与hami-ascend-device-plugin、Ascend Docker Runtime协同,实现NPU算力精细化切分与优先级调度的方案。
该指南介绍K8s生态中Volcano调度器结合volcano-vgpu-device-plugin的GPU算力切分方案,涵盖运行时配置、Volcano与插件部署流程,支持按显存和核心切分vGPU,通过
该文件围绕K8s环境下利用IB RDMA网络加速大模型分布式训练展开,先明确了包含v1.23.7版本K8s集群、Ubuntu 24.04 LTS系统、IB RDMA网络的基础环境,接着介绍了k8s-d
这篇博客聚焦 Containerd Rootless 模式的配置与使用,核心是通过 Linux 用户命名空间技术,让容器以非特权用户运行,规避传统 root 权限运行的安全隐患。
本文详解Kata Containers,其融合容器轻量性与虚拟机强隔离性,介绍架构、部署前提,提供containerd/K8s集成方案与实操,适用于敏感 workload 安全部署。
Higress是阿里出身的AI原生云原生API网关,基于Istio和Envoy,集多网关功能,支持AI集成与热更新,提供多样安装使用方式,适配云原生与AI场景。
本文将介绍如何使用Submariner实现跨集群的网络通信,包括安装Submariner、配置Submariner、验证Submariner是否正常工作等。