lomtom

专栏

云计算 K8s go Ai

关于

关于我 algorithm 今日热榜
  • 文库
  • 分类
  • 标签
  • 文档
Ai 9 云计算 20 考试 2 工具 11 存储 11 语言 20 底层 1 容器 3 运维 5 数据结构 1 框架 11 博客 1 大数据 1 每天一个小知识 3 前端 1 算法 3 安装部署 2 设计模式 2
  • 5天前
    • Ai

Ascend 910C 算力卡 Kubernetes 接入实践指南

围绕 Ascend 910C 算力卡在 Kubernetes 集群中的接入实践展开,涵盖驱动与固件安装、Ascend Docker Runtime 配置、Kubernetes 组件部署、NPU 资源验

阅读全文 →
  • 11/28/2025
    • Ai

分布式数据集编排和加速引擎fluid

围绕Fluid v1.0.8,详述K8s环境部署(含Helm安装、ARM64镜像构建)、测试准备(PVC与Pod创建、大文件上传)、数据集配置与缓存加速,性能测试显示缓存使3.3GB文件复制耗时降8.

阅读全文 →
  • 11/16/2025
    • Ai

K8s 基于 HAMi 的 GPU/NPU 算力切分实践指南

K8s生态的HAMi方案可实现GPU/NPU算力精细化切分,含组件介绍、部署配置与验证流程,能提升异构资源利用率,适配AI场景需求。

阅读全文 →
  • 11/12/2025
    • Ai

K8s 基于 Volcano 优先级调度的 NPU 算力切分实践指南

该指南介绍K8s生态下,Volcano调度器与hami-ascend-device-plugin、Ascend Docker Runtime协同,实现NPU算力精细化切分与优先级调度的方案。

阅读全文 →
  • 11/10/2025
    • Ai

K8s 基于 Volcano 优先级调度的 GPU 算力切分实践指南

该指南介绍K8s生态中Volcano调度器结合volcano-vgpu-device-plugin的GPU算力切分方案,涵盖运行时配置、Volcano与插件部署流程,支持按显存和核心切分vGPU,通过

阅读全文 →
  • 6/17/2025
    • Ai

AI原生的API网关Higress

Higress是阿里出身的AI原生云原生API网关,基于Istio和Envoy,集多网关功能,支持AI集成与热更新,提供多样安装使用方式,适配云原生与AI场景。

阅读全文 →
史上最大开源LLM,参数高达3140亿!马斯克如约开源Grok,10小时狂揽10000颗Star
  • 3/18/2024
    • Ai
  • 转载

史上最大开源LLM,参数高达3140亿!马斯克如约开源Grok,10小时狂揽10000颗Star

特斯拉CEO马斯克的xAI公司发布了史上最大开源大语言模型Grok-1,参数量达3140亿。Grok-1在发布10小时内获得10000个GitHub Star,展现了其受欢迎程度。该模型基于Apach

阅读全文 →
如何离线运行大模型StarCoder
  • 12/20/2023
    • Ai

如何离线运行大模型StarCoder

这篇博客介绍了如何在离线环境下运行大模型StarCoder,提供了两种方法:使用text-generation-inference和transformers库。text-generation-infe

阅读全文 →
如何运行Hugging Face大模型StarCoder
  • 12/16/2023
    • Ai

如何运行Hugging Face大模型StarCoder

博客提供了在本地部署Hugging Face的StarCoder大模型的步骤。首先,介绍了StarCoder的代码补全功能,并建议使用NVIDIA A800 GPU和CentOS 7.9。然后,指导如

阅读全文 →

LOMTOM.CN

© 2019 - 2026 Made with love By lomtom