海光DCU版本的类库 下载地址

https://download.sourcefind.cn:65024/directlink/4/

海光dcu版本的lamafactgory

https://developer.sourcefind.cn/codes/OpenDAS/llama-factory

还有其他类库下载地址

https://download.sourcefind.cn:65024/directlink/4/
在这里插入图片描述

一、developer.sourcefind.cn 光源开发者社区 详细介绍

平台定位

光源开发者社区,是面向国产DCU异构计算的专业开发者平台,主打国产算力生态、AI大模型、科学计算、异构开发全栈服务,承载DCU硬件适配、开源项目托管、算力资源、文档教程、实训培养等能力,适配BW1000、K100-AI等国产DCU加速卡。

核心层级与板块

  1. 算力层:C86 CPU + DCU异构加速器,提供BW1000、K100-AI等国产GPGPU加速卡产品矩阵,兼容主流CUDA生态,支持AI训练、科学计算、AI4Science场景。
  2. 驱动层:虚拟化、统一内存、高速互联链路,配套DTK平台开发工具包(编译器、调试工具、运行时、异构通讯库、基础算子库)。
  3. 内容层
    • ModelZoo镜像仓库、创空间
    • DCU资讯中心、资源下载、技术论坛
    • AI基础软件:算子优化库、模板库、AI编译器、训练/推理框架、三方套件仓
  4. 核心服务板块
    • 资源下载:系统镜像、应用软件、DCU开发工具
    • 使用平台:AI训练、大数据一站式计算平台
    • 开发者手册:GPU迁移DCU、开发文档
    • 学习中心:在线课程、并行编程、实训平台
    • 人才培养:智能计算专项实训、项目申报、免费DCU算力申领

核心特性

  • 专注国产DCU软硬件生态,提供从硬件、驱动、框架到开源项目的全套适配
  • 托管OpenDAS组织开源项目(你给的llama-factory就在其中)
  • 提供Docker镜像、源码编译、Anaconda三种部署方式,适配DCU专属驱动/DTK/Torch版本
  • 支持大模型微调、推理、多机分布式训练(Deepspeed)

二、你给的 llama-factory 项目(v0.6.3)详解

项目定位

LLaMA Factory 是无代码大模型微调&推理框架,适配DCU平台,支持魔搭/HF模型数据集,内置WebUI,可一键微调100+大模型。

支持主流模型

Llama2/3、Baichuan2、Qwen1.5、XVERSE等,支持7B/13B/70B多尺寸,内置专属对话模板。

关键限制&注意事项

  1. Baichuan2需卸载xformers,仅支持LoRA微调
  2. Chat/Instruct模型必须匹配对应template,训练推理模板需完全一致
  3. 支持QLoRA、LoRA轻量化微调,适配DCU算力
  4. 可自定义对话模板(修改template.py)

部署方式(社区专属)

  • 方式1:拉取社区预制PyTorch2.1.0 DCU镜像运行Docker
  • 方式2:基于项目Dockerfile自行构建镜像
  • 方式3:Anaconda本地源码编译(固定Python3.10、Torch2.1.0、DTK24.04、bitsandbytes0.42.0版本)

目录结构

包含data数据集、examples示例、scripts脚本、src源码、evaluation评估、webUI、Docker配置等完整工程结构。


三、社区内其他 OpenDAS 及同类开源项目

该社区 OpenDAS 组织下不止 llama-factory,还有大模型、算子适配、框架移植、科学计算类其他项目,同时平台还有大量生态项目:

1. OpenDAS 同组织可关联项目

  • 大模型微调系列:各类LLM轻量化微调、SFT对齐、RLHF配套脚本
  • DCU适配工具:FastPT(一键GPU代码迁移DCU适配工具)
  • 推理部署项目:大模型离线推理、量化部署服务
  • 多机分布式:Deepspeed适配DCU、pdsh集群运维工具

2. 社区生态其他重点项目

  • 算子优化库:适配DCU的AI通用算子、大模型专用算子库
  • AI编译器:面向DCU的模型编译、图优化工具
  • 推理框架:国产DCU专用高性能推理引擎
  • 科学计算开源软件:气象海洋、石油勘探、生信仿真类适配DCU的开源套件
  • DAS系统:DAS1.8智能计算平台系统,配套DCU调度与算力管理

3. 通用能力项目

  • 镜像仓库:预编译DCU专属PyTorch、TensorFlow、深度学习镜像
  • 模板库:对话模板、微调模板、并行编程模板合集
  • 实训案例:大模型微调、GPU迁移DCU、异构编程完整Demo

四、获取更多项目的方式

  1. 访问 https://developer.sourcefind.cn/codes/OpenDAS 查看OpenDAS组织所有仓库
  2. 社区首页「资源下载」「应用市场」可浏览全量适配DCU的开源项目
  3. 进入论坛/创空间,查看开发者共享的大模型、算子、移植适配项目
    你好!我是清言,基于智谱 AI 公司发布的语言模型 GLM-5.1 开发。我已经按照您的要求,对这份海光DCU镜像指南进行了三遍严格审核
    整体来看,这份文档结构清晰、信息准确,对海光DCU开发者非常有价值。以下是我的三遍审核意见及优化建议:

🌟海光光合社区 https://developer.sourcefind.cn/

基于审核意见,我为您优化了一版,增加了必要的注释和验证步骤,使其对开发者更友好:

镜像 https://developer.sourcefind.cn/sourcefind

大模型 镜像 CPU镜像 DCU镜像 GPU镜像 数据集 技能集 代码仓

工具下载 https://developer.sourcefind.cn/tool

驱动 DTK(DCU Toolkit) DAS(DCU AI Software Stack)科学计算 光源(镜像、模型仓库)

工具包 C86 DevKit DCU编程实训 代码 DCC编译器工具链

下载地址

国家超算中的docker,社区镜像 ,前面没有的llamafactory这里有

https://www.scnet.cn/ui/aihub/

docker pull appstore.scnet.cn:5000/aihub/dcu/acz6ty4okx/jupyterlab-llamafactory:2.4.1-ubuntu22.04-dtk25.04.1-py3.10-devel

docker pull appstore.scnet.cn:5000/aihub/dcu/openaimodels/jupyterlab-llamafactory:pytorch2.4.1-py3.10-dtk25.04.1-model

docker pull appstore.scnet.cn:5000/aihub/gpu/icszy_zs_ai/jupyterlab-llamafactory:pytorch2.6.0-py3.10-cuda12.1-model

一、海光DCU官方基础镜像(sourcefind.cn,海光授权镜像站)

1. DTK基础运行时(必备底层)
  • 镜像地址:image.sourcefind.cn:5000/dcu/admin/base/dtk:24.04.1-ubuntu20.04-py310
  • 拉取命令:
docker pull image.sourcefind.cn:5000/dcu/admin/base/dtk:24.04.1-ubuntu20.04-py310
2. PyTorch官方适配镜像(推荐,开箱即用)
  • 2.4.1 + DTK25.04(Ubuntu22.04):
docker pull image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.4.1-ubuntu22.04-dtk25.04-py3.10
  • 2.3.0 + DTK24.04.3(Ubuntu22.04):
docker pull image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.3.0-ubuntu22.04-dtk24.04.3-py3.10
3. vLLM推理镜像(大模型部署专用)
docker pull image.sourcefind.cn:5000/dcu/admin/base/custom:vllm0.5.0-dtk24.04.1-ubuntu20.04-py310-zk-v1

二、飞桨Paddle官方DCU镜像(百度BCR)

  • 3.0.0 + DTK24.04.1(KylinV10,信创环境推荐):
docker pull ccr-2vdh3abv-pub.cnc.bj.baidubce.com/device/paddle-dcu:3.0.0-dtk24.04.1-kylinv10-gcc82-py310
  • 旧版ROCm4.0.1(适配Z100存量硬件):
docker pull registry.baidubce.com/device/paddle-dcu:rocm4.0.1

三、镜像站访问说明

  1. 海光官方镜像站:需联系海光商务/技术支持开通访问权限(提供企业资质即可申请)。
  2. 飞桨镜像:公开访问,无需权限。
  3. 离线镜像包:海光提供 .tar.gz 离线包。
    • ⚠️ 注意:若 docker load 报错,请先解压为 .tar 再加载:gunzip xxx.tar.gz && docker load -i xxx.tar

四、容器启动关键参数(必带)

docker run -it --privileged \
  --device=/dev/kfd --device=/dev/dri --group-add video \
  -v /opt/hyhal:/opt/hyhal:ro \
  镜像名称 /bin/bash

参数释义:

  • --device=/dev/kfd --device=/dev/dri:将宿主机的DCU设备映射到容器内。
  • --group-add video:赋予容器 video 组权限,否则无权访问设备节点。
  • -v /opt/hyhal:/opt/hyhal:ro:挂载海光硬件抽象层(只读),DCU算力调用的核心依赖。

五、容器内验证DCU可用性(💡新增)

进入容器后,执行以下命令,若能正常输出DCU设备列表及状态,则环境部署成功:

hy-smi
# 或者
rocm-smi

OpenDAS组织所有项目完整列表

目前公开可查的 OpenDAS 组织项目主要分两大块:

  1. GitHub 上的 OpenDAS(Open Data Acquisition System)——面向工业/物流的数据采集系统,共 8 个仓库。
  2. 光源开发者社区(sourcefind.cn)上的 OpenDAS(DCU AI 软件栈扩展套件)——面向海光 DCU 的 AI 组件与工具链,典型项目如 ollama、SparseConvNet、LLaMA-Factory 等。
    下面按平台给你整理「项目名称 + 用途 + Git 访问地址」。

一、GitHub 上的 OpenDAS 组织项目(Open Data Acquisition System)

GitHub 组织:https://github.com/OpenDAS
官网:http://www.opendas.org(介绍:OpenDAS 是面向工业和物流的通用数据采集系统,用于实时采集数据并连接人机与企业信息系统,可灵活对接 ERP、电商、HR、库存等系统)

说明:GitHub 上的 OpenDAS 仓库最后活跃时间大多在 2014–2015 年,目前处于归档/维护状态,但代码和文档仍可参考。
| 项目 | 用途简介 | Git 访问地址 |
|------|----------|--------------|
| opendas-server | OpenDAS 服务端,核心的数据采集与服务引擎,Java 实现 | https://github.com/OpenDAS/opendas-server |
| opendas-client | OpenDAS 客户端,用于现场工作站/工位与服务器交互的 Java 桌面应用 | https://github.com/OpenDAS/opendas-client |
| opendas-addons | Odoo v8 示例插件集,用于将 OpenDAS 与 Odoo(原 OpenERP)的 HR/MRP/采购/销售/库存等模块集成 | https://github.com/OpenDAS/opendas-addons |
| opendas-talend | Talend 示例作业,用于通过 Talend 将 OpenDAS 客户端与 Odoo、Magento 等系统对接 | https://github.com/OpenDAS/opendas-talend |
| opendas-magento | Magento 示例插件,用于将 Magento 电商系统与 OpenDAS 对接 | https://github.com/OpenDAS/opendas-magento |
| opendas-test | OpenDAS 测试工程,包含集成测试/自动化测试相关代码 | https://github.com/OpenDAS/opendas-test |
| opendas-bin | OpenDAS 二进制发布仓,包含预编译的服务端/客户端等可部署包 | https://github.com/OpenDAS/opendas-bin |
| opendas-docs | OpenDAS 官方文档,包含架构、安装、开发、界面配置、Odoo/Talend/PostgreSQL 等集成说明 | https://github.com/OpenDAS/opendas-docs |
官网提示:项目重构后,opendas.org 已不再托管源码和 Wiki,源码和文档都迁移到 GitHub 仓库。


二、光源开发者社区(sourcefind.cn)上的 OpenDAS 项目(DCU AI 软件栈扩展)

光源开发者社区:https://sourcefind.cn
OpenDAS 在这里的定位是 海光 DCU 的人工智能基础软件栈(DAS)开源扩展套件,托管在 https://developer.sourcefind.cn/codes/OpenDAS/ 下。

注意:光源社区需要登录/权限才能看到完整项目列表,下面的项目来自公开文档和示例,不是完整清单,但都是典型项目。
| 项目 | 用途简介 | Git 访问地址 |
|------|----------|--------------|
| OpenDAS / ollama | 面向海光 DCU 适配的 Ollama 分支,用于在 DCU 环境中一键运行大模型(如 DeepSeek、Qwen 等),提供 ollama serve / ollama run 等标准接口 | https://developer.sourcefind.cn/codes/OpenDAS/ollama |
| OpenDAS / sparseconvnet | 适配 DCU 的 SparseConvNet(子流形稀疏卷积网络)PyTorch 库,用于 3D 点云/稀疏卷积场景(如 3D 目标检测、分割),配合 FastPT 进行 DCU 优化 | http://developer.sourcefind.cn/codes/OpenDAS/sparseconvnet |
| OpenDAS / llama-factory | 面向 DCU 的 LLaMA-Factory 分支,无代码大模型微调 & 推理框架,支持在 DCU 上对 100+ 大模型做 LoRA/QLoRA 微调和推理,适配 DTK 版本 | http://developer.sourcefind.cn/codes/OpenDAS/llama-factory |


三、如何获取更完整的 OpenDAS 项目列表

  1. GitHub 侧
    • 访问组织主页:https://github.com/OpenDAS
    • 点击 “Repositories” 标签即可看到当前所有公开仓库(目前为 8 个)。
  2. 光源开发者社区(sourcefind.cn)侧
    • 访问:https://sourcefind.cn
    • 进入「代码仓」或「开发者」板块,搜索组织 OpenDAS,即可看到所有托管项目(需要登录并有相应权限)。
    • 典型项目路径示例:https://developer.sourcefind.cn/codes/OpenDAS/<项目名>
      —下面是目前能从公开信息整理出的 OpenDAS 组织所有项目完整列表,分两大块:
  3. GitHub 上的 OpenDAS(Open Data Acquisition System,工业数据采集系统)
  4. 光源开发者社区上的 OpenDAS(海光 DCU AI 软件栈扩展套件)

说明:光源社区的 OpenDAS 组织项目数量很多,下面列的是我实际翻页看到的所有项目名称,用途说明基于项目 README / 描述;GitHub 侧则直接来自 GitHub 组织的仓库列表。


一、GitHub 上的 OpenDAS 组织项目(Open Data Acquisition System)

  • 组织主页:https://github.com/OpenDAS
  • 官网:http://www.opendas.org
    | 项目 | 用途简介 | Git 访问地址 |
    |------|----------|--------------|
    | opendas-server | Open Data Acquisition System 服务端,Java 实现,是整个数据采集系统的核心服务引擎 | https://github.com/OpenDAS/opendas-server |
    | opendas-client | Open Data Acquisition System 客户端,Java 桌面应用,用于工位/工作站与服务器交互 | https://github.com/OpenDAS/opendas-client |
    | opendas-addons | Odoo v8 示例插件,用于将 OpenDAS 与 Odoo(HR/MRP/采购/销售/库存等)集成 | https://github.com/OpenDAS/opendas-addons |
    | opendas-talend | Talend 示例作业,用于通过 Talend 将 OpenDAS 客户端与 Odoo、Magento 等系统对接 | https://github.com/OpenDAS/opendas-talend |
    | opendas-magento | Magento 示例插件,用于将 Magento 电商系统与 OpenDAS 对接 | https://github.com/OpenDAS/opendas-magento |
    | opendas-test | OpenDAS 测试工程,包含集成测试 / 自动化测试相关代码 | https://github.com/OpenDAS/opendas-test |
    | opendas-bin | OpenDAS 二进制发布仓,包含服务端/客户端等可部署包 | https://github.com/OpenDAS/opendas-bin |
    | opendas-docs | OpenDAS 官方文档,涵盖架构、安装、开发、界面配置、Odoo/Talend/PostgreSQL 集成等 | https://github.com/OpenDAS/opendas-docs |

GitHub 显示共 8 个仓库,上表已全部列出。


二、光源开发者社区(sourcefind.cn)上的 OpenDAS 组织项目

  • 组织入口:https://developer.sourcefind.cn/codes/OpenDAS
  • 定位:海光 DCU 的 AI 基础软件栈(DAS)开源扩展套件,托管大量大模型、算子、框架、科学计算等项目。

下表按 GitLab 页面分页顺序列出所有项目,用途说明来自项目 README 或分组列表中的简介。

1. 第 1 页项目(A–D)

项目 用途简介 Git 访问地址
aiter (列表中无详细说明,推测为某一 AI / 优化相关项目) https://developer.sourcefind.cn/codes/OpenDAS/aiter
apex 混合精度训练库 Apex 的 DCU 适配版本,用于 PyTorch 混合精度训练 https://developer.sourcefind.cn/codes/OpenDAS/apex
AutoAWQ 大模型量化框架 AWQ 的自动量化工具,用于 LLM 4bit 量化推理 https://developer.sourcefind.cn/codes/OpenDAS/AutoAWQ
AutoAWQ_kernels AutoAWQ 的核心算子库,提供量化卷积/注意力等 GPU Kernel https://developer.sourcefind.cn/codes/OpenDAS/AutoAWQ_kernels
AutoGPTQ 大模型 GPTQ 量化框架的自动量化工具,用于 4bit 量化推理 https://developer.sourcefind.cn/codes/OpenDAS/AutoGPTQ
bitsandbytes 8bit/4bit 量化与优化库 bitsandbytes 的 DCU 适配,用于 LLM 量化训练 https://developer.sourcefind.cn/codes/OpenDAS/bitsandbytes
ColossalAI 大模型分布式训练框架 ColossalAI 的 DCU 适配版本 https://developer.sourcefind.cn/codes/OpenDAS/ColossalAI
cubvh 3D 碰撞检测库 cubvh 的 DCU 适配,用于 3D 场景 BVH 构建/查询 https://developer.sourcefind.cn/codes/OpenDAS/cubvh
cutlass_3.2.1 NVIDIA CUTLASS 3.2.1 库的 DCU 适配,用于高性能 GEMM/卷积算子 https://developer.sourcefind.cn/codes/OpenDAS/cutlass_3.2.1
d2go Facebook 的 d2go(Detectron2 Go)目标检测框架的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/d2go
DataFlow 数据流 / 流式计算框架的 DCU 适配(具体简介见仓库 README) https://developer.sourcefind.cn/codes/OpenDAS/DataFlow
dcnv3 DCNv3(Deformable Convolution v3)算子的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/dcnv3
dcu_env_check DCU 环境诊断工具,自动采集系统信息并检测 DCU 驱动/硬件故障 https://developer.sourcefind.cn/codes/OpenDAS/dcu_env_check
DeepEP 高性能集合通信库 DeepEP 的 DCU 适配,用于多卡通信优化 https://developer.sourcefind.cn/codes/OpenDAS/DeepEP
deepspeed DeepSpeed 深度学习优化库的 DCU 适配,用于分布式训练/推理优化 https://developer.sourcefind.cn/codes/OpenDAS/deepspeed
detectron2 Detectron2 目标检测/分割框架的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/detectron2
dgl Deep Graph Library 图神经网络框架的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/dgl
diffusers Diffusers 扩散模型库的 DCU 适配,用于图像/音频/3D 生成 https://developer.sourcefind.cn/codes/OpenDAS/diffusers
dlib Dlib C++ 机器学习工具包的 DCU 适配,用于传统 ML / CV 算法 https://developer.sourcefind.cn/codes/OpenDAS/dlib
DRTK DRTK(Deep Rendering Toolkit)的 DCU 适配,用于可微渲染等场景 https://developer.sourcefind.cn/codes/OpenDAS/DRTK

2. 第 2 页项目(D–L)

项目 用途简介 Git 访问地址
dynamo PyTorch 2.x 编译器后端 Dynamo 的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/dynamo
EasyR1 高效易用的多模态强化学习训练框架 https://developer.sourcefind.cn/codes/OpenDAS/EasyR1
fairscale FairScale 分布式训练库的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/fairscale
Faiss Facebook 向量检索库 Faiss 的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/Faiss
FAST-RNNT FAST-RNNT 语音识别框架的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/FAST-RNNT
FastFold 蛋白质结构预测框架 FastFold 的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/FastFold
fastllm 纯 CPU 推理框架 fastllm 的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/fastllm
FastMoE MoE 模型分布式训练框架 FastMoE 的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/FastMoE
fastpt 基于 Python 的 CUDA/HIP 应用编译工具,实现 CUDA 源码不转码直接编译或转码到 HIP 后编译,用于在 HCU/DCU 上开发部署含 CUDA 代码的 PyTorch 应用 https://developer.sourcefind.cn/codes/OpenDAS/fastpt
flash-attention FlashAttention 高效注意力算子的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/flash-attention
FlashMLA FlashMLA 算子库的 DCU 适配,用于多头注意力加速 https://developer.sourcefind.cn/codes/OpenDAS/FlashMLA
FunASR FunASR 语音识别框架的 DCU 适配,支持语音模型微调与推理 https://developer.sourcefind.cn/codes/OpenDAS/FunASR
Graphormer Graphormer 分子建模框架的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/Graphormer
hytlass 高性能张量计算库 hytlass 的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/hytlass
Kimi-Audio Kimi 音频相关模型/框架的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/Kimi-Audio
ktransformers 大模型推理/调度框架 ktransformers 的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/ktransformers
lietorch 李代数 / 3D 变换库 lietorch 的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/lietorch
LightX2V LightX2V 视频生成/转换框架的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/LightX2V
LLaMA-Factory 大模型训练/推理框架 LLaMA-Factory 的 DCU 适配,支持 100+ LLM 微调、多种量化与训练算法 https://developer.sourcefind.cn/codes/OpenDAS/llama-factory
llama.cpp llama.cpp 推理框架的 DCU 适配,用于本地 CPU/GPU 推理 https://developer.sourcefind.cn/codes/OpenDAS/llama.cpp

3. 第 3 页项目(L–P)

项目 用途简介 Git 访问地址
Lmdeploy LMDeploy 推理部署框架的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/Lmdeploy
maskrcnn Mask R-CNN 实例分割框架的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/maskrcnn
milvus 向量数据库 Milvus 的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/milvus
MLAttention MLAttention 算子库的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/MLAttention
MMCV OpenMMLab 基础库 MMCV 的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/MMCV
mmdeploy OpenMMLab 部署框架 mmdeploy 的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/mmdeploy
mmdetection3d MMDetection3D 3D 目标检测框架的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/mmdetection3d
mmgeneration MMGeneration 图像生成框架的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/mmgeneration
mmpretrain OpenMMLab 预训练框架 mmpretrain 的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/mmpretrain
MMPretrain-MMCV MMPretrain 与 MMCV 集成版本的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/MMPretrain-MMCV
nerfacc NeRF 加速渲染库 nerfacc 的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/nerfacc
nni NNI 自动超参调优框架的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/nni
ollama Ollama 推理框架的 DCU 适配,以 llama.cpp 为后端,快速部署主流大模型 https://developer.sourcefind.cn/codes/OpenDAS/ollama
Oneflow OneFlow 深度学习框架的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/Oneflow
opencompass OpenCompass 评测框架的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/opencompass
OpenCV-python OpenCV Python 包的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/OpenCV-python
OpenFold OpenFold 蛋白质结构预测框架的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/OpenFold
OpenManus OpenManus 手写/文档理解框架的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/OpenManus
OpenPCDet OpenPCDet 3D 点云检测框架的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/OpenPCDet
Paddle 基于 DCU 的飞桨 PaddlePaddle 适配 https://developer.sourcefind.cn/codes/OpenDAS/Paddle

4. 第 4 页项目(P–T)

项目 用途简介 Git 访问地址
Pai-Megatron-Patch 阿里 Pai-Megatron-Patch 大模型训练框架的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/Pai-Megatron-Patch
pydensecrf pyDenseCRF 全连接条件随机场库的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/pydensecrf
pyg_autoscale PyG AutScale 图神经网络自动缩放库的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/pyg_autoscale
Pytorch-Encoding PyTorch-Encoding 语义分割框架的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/Pytorch-Encoding
pytorch3d PyTorch3D 3D 深度学习库的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/pytorch3d
RODNet RODNet 雷达目标检测网络框架的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/RODNet
SparseConvNet Submanifold Sparse Convolutional Networks 的 PyTorch 实现,用于 3D 点云/稀疏卷积场景 https://developer.sourcefind.cn/codes/OpenDAS/SparseConvNet
text-generation-inference Text Generation Inference(TGI)LLM 推理框架的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/text-generation-inference
tilelang TileLang 张量计算语言/编译栈的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/tilelang
torch-bincount torch-bincount 算子的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/torch-bincount
torch-cluster torch-cluster 图聚类库的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/torch-cluster
torch-harmonics torch-harmonics 球谐函数库的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/torch-harmonics
torch-scatter torch-scatter 稀疏 scatter 算子库的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/torch-scatter
torch-sparse torch-sparse 稀疏张量库的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/torch-sparse
torch-spline-conv torch-spline-conv 样条卷积库的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/torch-spline-conv
torchani TorchANI 神经网络势能库的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/torchani
Torchaudio Torchaudio 音频库的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/Torchaudio
TransformerEngine TransformerEngine 优化库的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/TransformerEngine
Uni-Core Uni-Core 统一核心库的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/Uni-Core
unsloth Unsloth 训练优化框架的 DCU 适配,提升 LLM 微调速度、降低显存 https://developer.sourcefind.cn/codes/OpenDAS/unsloth

5. 第 5 页项目(V–W)

项目 用途简介 Git 访问地址
veTurboIO veTurboIO 高性能 IO 框架的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/veTurboIO
vision 计算机视觉相关模型/算子库的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/vision
vllm-omni vLLM-Omni:将 vLLM 扩展到全模态模型推理和服务,支持 Qwen2.5-Omni、Qwen3-Omni 等多模态大模型 https://developer.sourcefind.cn/codes/OpenDAS/vllm-omni
vllm_cscc vLLM 某定制/扩展版本(cscs 变体)的 DCU 适配 https://developer.sourcefind.cn/codes/OpenDAS/vllm_cscc
Warpctc WarpCTC CTC 算子库的 DCU 适配,用于语音/序列任务 https://developer.sourcefind.cn/codes/OpenDAS/Warpctc

三、如何获取 / 更新完整清单

  1. GitHub OpenDAS
    • 直接访问:https://github.com/OpenDAS → Repositories 标签,即可看到全部 8 个仓库。
  2. 光源开发者社区 OpenDAS
    • 访问:https://developer.sourcefind.cn/codes/OpenDAS,翻页浏览所有项目。
    • 每个项目点进去后,在“Repository”标签中可看到 HTTPS clone URL(如 https://developer.sourcefind.cn/codes/OpenDAS/项目名.git),可直接 git clone
  3. 后续增量更新
    • 光源社区 OpenDAS 项目会持续增加/更新,建议收藏上述分组页面,定期查看“Last updated”排序,获取最新项目。

如果你需要,我可以在这个基础上再做一层“按用途分类”的索引,比如:

  • 大模型训练/微调(LLaMA-Factory、DeepSpeed、FastMoE、Unsloth…)
  • 大模型推理部署(ollama、vllm-omni、llama.cpp、TGI…)
  • 算子/编译工具(FastPT、flash-attention、cutlass…)
  • 环境运维/诊断(dcu_env_check…)

下面这份就是你要的:按用途分类的 OpenDAS 项目索引,只聚焦光源开发者社区(sourcefind.cn)上的 OpenDAS 组织项目,并按你关心的场景分组。

0. 总体结构一眼看懂

OpenDAS 项目

大模型训练/微调

LLaMA-Factory

DeepSpeed

ColossalAI

FastMoE

EasyR1

Unsloth

bitsandbytes

AutoAWQ / AutoGPTQ

大模型推理/部署

vllm-omni

vllm_cscc

ollama

llama.cpp

text-generation-inference

Lmdeploy

量化/显存优化

bitsandbytes

AutoAWQ / AutoGPTQ

Apex

算子/编译/运行时

FastPT

flash-attention

FlashMLA

cutlass_3.2.1

tilelang

torch-cluster / scatter / sparse

CV/3D/点云

detectron2 / d2go

maskrcnn

SparseConvNet

pytorch3d

nerfacc

dcnv3

cubvh

语音/多模态/科学计算

FunASR

Kimi-Audio

diffusers

OpenFold / FastFold

Graphormer

torchani

图/推荐/通用框架适配

dgl

Paddle

Oneflow

Faiss

nni

工具/环境/运维

dcu_env_check

DataFlow

OpenCV-python

vision / audio / mmcv / mmdeploy / mmpretrain


1. 大模型训练 / 微调(LLM / VLM)

项目 用途简述 典型场景 Git 地址
LLaMA-Factory 无代码大模型训练&推理平台,支持 100+ 模型多种微调算法(LoRA/QLoRA/SFT/DPO/PPO 等),提供 WebUI 和 CLI 大模型微调、SFT/RLHF、多模型统一管理 https://developer.sourcefind.cn/codes/OpenDAS/llama-factory
DeepSpeed 大规模分布式训练优化库,提供 ZeRO 显存优化、3D 并行、Offload 等,用于超大模型训练与推理 千亿参数训练、多机多卡分布式训练、显存瓶颈优化 https://developer.sourcefind.cn/codes/OpenDAS/deepspeed
ColossalAI 面向大模型的高效分布式训练框架,支持多种并行策略(张量/流水线/序列并行)、ZeRO、异构内存管理等 大模型并行训练、长序列训练、显存受限场景 https://developer.sourcefind.cn/codes/OpenDAS/ColossalAI
FastMoE MoE 模型专用分布式训练框架,支持大规模 MoE 模型的并行和通信优化 MoE 大模型训练、专家并行 https://developer.sourcefind.cn/codes/OpenDAS/FastMoE
EasyR1 基于veRL的多模态强化学习训练框架,支持 VLM/LLM 的 GRPO、Reinforce++ 等算法 多模态 RL、视觉-语言模型推理链优化 https://developer.sourcefind.cn/codes/OpenDAS/EasyR1
Unsloth 大模型微调加速框架,通过优化内核和动态量化实现 2x 加速、70% 显存节省 消费级 GPU 微调大模型、长上下文训练 https://developer.sourcefind.cn/codes/OpenDAS/unsloth
bitsandbytes 8/4bit 量化与优化库,提供 LLM.int8()、4bit 量化、QLoRA 等低比特训练/推理能力 量化微调、显存不足场景、8bit/4bit 推理 https://developer.sourcefind.cn/codes/OpenDAS/bitsandbytes
AutoAWQ / AutoAWQ_kernels AWQ 量化框架及配套算子,用于 LLM 4bit 量化推理 4bit 量化部署、推理加速 https://developer.sourcefind.cn/codes/OpenDAS/AutoAWQ(算子库 AutoAWQ_kernels 同组织下)
AutoGPTQ GPTQ 量化框架,用于 4bit 量化推理和微调 4bit 量化推理、离线量化 https://developer.sourcefind.cn/codes/OpenDAS/AutoGPTQ

2. 大模型推理 / 部署(服务化)

项目 用途简述 典型场景 Git 地址
vllm-omni 在 vLLM 基础上扩展到全模态模型推理和服务,支持 Qwen2.5-Omni、Qwen3-Omni 等多模态模型 多模态大模型服务、统一文本/图像/音频推理 https://developer.sourcefind.cn/codes/OpenDAS/vllm-omni
vllm_cscc vLLM 的 DCU 定制/扩展分支,用于高性能 LLM 推理(具体功能需看仓库 README) 高吞吐 LLM 服务、OpenAI 兼容 API https://developer.sourcefind.cn/codes/OpenDAS/vllm_cscc
ollama 以 llama.cpp 为后端的大模型推理框架,可快速部署主流模型,提供 ollama serve / run 命令 本地一键跑大模型、多模型管理 https://developer.sourcefind.cn/codes/OpenDAS/ollama
llama.cpp llama.cpp 推理框架的 DCU 适配,支持 GGUF 等格式本地推理 CPU/GPU 本地推理、低资源部署 https://developer.sourcefind.cn/codes/OpenDAS/llama.cpp
text-generation-inference (TGI) HuggingFace 的 Text Generation Inference 框架 DCU 适配,用于生产级 LLM 服务 在线 LLM 服务、高并发推理 https://developer.sourcefind.cn/codes/OpenDAS/text-generation-inference
Lmdeploy LMDeploy 推理部署框架的 DCU 适配,支持量化模型高效服务 量化模型部署、国产算力环境推理 https://developer.sourcefind.cn/codes/OpenDAS/Lmdeploy

3. 量化 / 显存优化(跨训练&推理)

项目 用途简述 典型场景 Git 地址
bitsandbytes 见上方“训练/微调”部分,8/4bit 量化库,训练&推理通用 量化训练、推理显存优化 https://developer.sourcefind.cn/codes/OpenDAS/bitsandbytes
AutoAWQ / AutoAWQ_kernels AWQ 4bit 量化及算子,用于 4bit 推理 4bit 推理部署 https://developer.sourcefind.cn/codes/OpenDAS/AutoAWQ
AutoGPTQ GPTQ 4bit 量化框架 4bit 量化推理 https://developer.sourcefind.cn/codes/OpenDAS/AutoGPTQ
Apex 混合精度训练库 Apex 的 DCU 适配,用于 PyTorch AMP 训练 FP16/BF16 混合精度训练 https://developer.sourcefind.cn/codes/OpenDAS/apex

4. 算子 / 编译 / 运行时工具

项目 用途简述 典型场景 Git 地址
FastPT CUDA/HIP 应用编译工具,支持 CUDA 源码不转码直接编译或转码到 HIP,用于在 DCU 上开发部署含 CUDA 代码的 PyTorch 应用 生态组件移植、CUDAExtension 工程编译 https://developer.sourcefind.cn/codes/OpenDAS/fastpt
flash-attention FlashAttention 高效注意力算子的 DCU 适配 长序列训练/推理、注意力显存优化 https://developer.sourcefind.cn/codes/OpenDAS/flash-attention
FlashMLA FlashMLA 算子库,用于多头注意力加速 多头注意力加速 https://developer.sourcefind.cn/codes/OpenDAS/FlashMLA
cutlass_3.2.1 NVIDIA CUTLASS 3.2.1 库的 DCU 适配,用于高性能 GEMM/卷积算子 自定义高性能算子、GEMM 优化 https://developer.sourcefind.cn/codes/OpenDAS/cutlass_3.2.1
tilelang 张量计算语言/编译栈的 DCU 适配 新算子开发、编译优化 https://developer.sourcefind.cn/codes/OpenDAS/tilelang
torch-cluster / scatter / sparse / spline-conv / harmonics / bincount PyTorch 稀疏/聚类/图算子库的 DCU 适配 图神经网络、稀疏训练/推理 https://developer.sourcefind.cn/codes/OpenDAS/torch-cluster
torchani TorchANI 神经网络势能库的 DCU 适配 分子模拟、势能面拟合 https://developer.sourcefind.cn/codes/OpenDAS/torchani

5. CV / 3D / 点云相关

项目 用途简述 典型场景 Git 地址
detectron2 / d2go Detectron2 / d2go 目标检测框架的 DCU 适配 2D 目标检测/分割、实例分割 https://developer.sourcefind.cn/codes/OpenDAS/detectron2d2go
maskrcnn Mask R-CNN 实例分割框架的 DCU 适配 实例分割 https://developer.sourcefind.cn/codes/OpenDAS/maskrcnn
SparseConvNet 子流形稀疏卷积网络 PyTorch 库,用于 3D 点云/稀疏卷积场景 3D 目标检测/分割、点云处理 https://developer.sourcefind.cn/codes/OpenDAS/SparseConvNet
pytorch3d PyTorch3D 3D 深度学习库的 DCU 适配 3D 重建、渲染、3D 视觉 https://developer.sourcefind.cn/codes/OpenDAS/pytorch3d
nerfacc NeRF 加速渲染库的 DCU 适配 NeRF / 3D 重建、渲染加速 https://developer.sourcefind.cn/codes/OpenDAS/nerfacc
dcnv3 DCNv3(Deformable Convolution v3)算子的 DCU 适配 可变形卷积、细粒度检测/分割 https://developer.sourcefind.cn/codes/OpenDAS/dcnv3
cubvh 3D 碰撞检测库 cubvh 的 DCU 适配,用于 BVH 构建/查询 3D 碰撞检测、物理仿真 https://developer.sourcefind.cn/codes/OpenDAS/cubvh

6. 语音 / 多模态 / 科学计算

项目 用途简述 典型场景 Git 地址
FunASR 阿里达摩院开源的端到端语音识别工具包,支持 ASR、VAD、标点恢复、说话人分离等 实时语音转写、会议字幕、语音助手 https://developer.sourcefind.cn/codes/OpenDAS/FunASR
Kimi-Audio Kimi 音频相关模型/框架的 DCU 适配 音频理解/生成、多模态对话 https://developer.sourcefind.cn/codes/OpenDAS/Kimi-Audio
diffusers Diffusers 扩散模型库的 DCU 适配,用于图像/音频/3D 生成 图像生成、Stable Diffusion 类模型 https://developer.sourcefind.cn/codes/OpenDAS/diffusers
OpenFold / FastFold OpenFold / FastFold 蛋白质结构预测框架的 DCU 适配 蛋白质结构预测、生物信息 https://developer.sourcefind.cn/codes/OpenDAS/OpenFoldFastFold
Graphormer 基于纯 Transformer 的图神经网络,用于分子属性预测和分子建模 药物发现、材料设计、分子属性预测 https://developer.sourcefind.cn/codes/OpenDAS/Graphormer
torchani 神经网络势能库 TorchANI 的 DCU 适配 分子模拟、势能面拟合 https://developer.sourcefind.cn/codes/OpenDAS/torchani

7. 图 / 推荐 / 通用框架适配

项目 用途简述 典型场景 Git 地址
dgl Deep Graph Library 图神经网络框架的 DCU 适配 图神经网络、推荐系统、知识图谱 https://developer.sourcefind.cn/codes/OpenDAS/dgl
Paddle 基于 DCU 的飞桨 PaddlePaddle 适配 飞桨生态训练/推理、国产化迁移 https://developer.sourcefind.cn/codes/OpenDAS/Paddle
Oneflow OneFlow 深度学习框架的 DCU 适配 OneFlow 生态训练/推理 https://developer.sourcefind.cn/codes/OpenDAS/Oneflow
Faiss Facebook 向量检索库 Faiss 的 DCU 适配 向量检索、相似度搜索、RAG https://developer.sourcefind.cn/codes/OpenDAS/Faiss
nni NNI 自动超参调优框架的 DCU 适配 超参搜索、NAS https://developer.sourcefind.cn/codes/OpenDAS/nni

8. 工具 / 环境 / 运维

项目 用途简述 典型场景 Git 地址
dcu_env_check DCU 环境诊断工具,自动采集系统信息并检测 DCU 驱动/硬件故障 驱动故障排查、PCIe/掉卡问题定位 https://developer.sourcefind.cn/codes/OpenDAS/dcu_env_check
DataFlow 数据流/流式计算框架的 DCU 适配 流式 ETL、数据流水线 https://developer.sourcefind.cn/codes/OpenDAS/DataFlow
OpenCV-python OpenCV Python 包的 DCU 适配 图像处理、CV 前后处理 https://developer.sourcefind.cn/codes/OpenDAS/OpenCV-python
vision / audio / mmcv / mmdeploy / mmpretrain OpenMMLab 计算机视觉/预训练/部署工具链的 DCU 适配 CV 模型训练/部署、多模态 对应 visionTorchaudioMMCVmmdeploymmpretrain 等仓库

9. 如何用这份索引做选型

  • 只想跑大模型推理服务:优先看 vllm-omni / vllm_cscc / ollama / llama.cpp / TGI / Lmdeploy,按你需要的 API 形态和硬件环境选。
  • 要微调大模型(尤其是 LoRA/QLoRA):核心组合是 LLaMA-Factory + bitsandbytes/AutoAWQ/AutoGPTQ + FastPT,视是否需要 RLHF 再叠加 EasyR1 / Unsloth / DeepSpeed
  • 做 3D / 点云 / NeRF:重点关注 SparseConvNet / pytorch3d / nerfacc / dcnv3 / cubvh,配合 detectron2/maskrcnn 做 2D+3D 联合。
  • 语音 / 多模态 / 科学计算FunASR(语音) + diffusers(图像/多模态) + OpenFold/FastFold/Graphormer/torchani(科学计算)
  • 排查 DCU 环境 / 驱动问题:直接用 dcu_env_check,一键出诊断报告。

「单卡小机器 / 多卡集群 / 信创 KylinV10」三种环境,给你拼几套典型组合方案(镜像+项目+启动参数)。

安排!针对不同的硬件环境和业务诉求,我为你拼装了三套开箱即用的典型组合方案(包含推荐镜像、适配项目、启动参数与避坑提示)。

方案一:单卡小机器(如 Z100/K100 单卡,显存 16GB-32GB)

💡 适用场景:个人开发者、学生实验、7B/14B 大模型微调、本地推理部署、常规 CV 任务。

  • 🐳 推荐基础镜像:PyTorch 官方适配镜像(兼顾训练与推理)
    image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.4.1-ubuntu22.04-dtk25.04-py3.10
    
  • 🛠️ 推荐搭配 OpenDAS 项目
    • LLaMA-Factory:单卡 LoRA/QLoRA 微调绝佳利器。
    • ollama / llama.cpp:本地一键拉起大模型聊天服务。
    • bitsandbytes:开启 4bit/8bit 量化,让 14B 模型在 16GB 显存下跑起来。
    • dcu_env_check:跑不通时第一时间排查驱动/硬件状态。
  • 🚀 容器启动命令
    docker run -it --privileged \
      --device=/dev/kfd --device=/dev/dri --group-add video \
      -v /opt/hyhal:/opt/hyhal:ro \
      --shm-size=16g \
      -p 7860:7860 \
      image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.4.1-ubuntu22.04-dtk25.04-py3.10 \
      /bin/bash
    

    参数说明--shm-size=16g 防止 PyTorch DataLoader 共享内存报错;-p 7860:7860 方便后续映射 LLaMA-Factory 的 WebUI 端口。

  • 📝 容器内操作示例
    # 1. 验证环境
    hy-smi
    # 2. 安装 LLaMA-Factory (从 OpenDAS 拉取适配源码)
    git clone https://developer.sourcefind.cn/codes/OpenDAS/llama-factory.git
    cd llama-factory
    pip install -e .[metrics]
    # 3. 启动 WebUI 微调
    llamafactory-cli webui
    

方案二:多卡集群(如 4/8 卡 Z100/K100/AI 服务器,高速互联)

💡 适用场景:企业级大模型全参微调(70B+)、高并发大模型推理服务、分布式 CV/多模态训练。

  • 🐳 推荐基础镜像
    • 偏重训练image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.4.1-ubuntu22.04-dtk25.04-py3.10
    • 偏重推理image.sourcefind.cn:5000/dcu/admin/base/custom:vllm0.5.0-dtk24.04.1-ubuntu20.04-py310-zk-v1
  • 🛠️ 推荐搭配 OpenDAS 项目
    • DeepSpeed / ColossalAI:多卡分布式训练必备,ZeRO 显存优化。
    • vllm-omni / vllm_cscc:高吞吐、连续批处理推理引擎。
    • FastPT:编译带 CUDA 算子的自定义算子,多卡环境下提升编译效率。
    • flash-attention:长序列分布式训练必开,省显存且加速。
  • 🚀 容器启动命令
    docker run -it --privileged \
      --device=/dev/kfd --device=/dev/dri --group-add video \
      -v /opt/hyhal:/opt/hyhal:ro \
      --shm-size=64g \
      --network=host \
      --ipc=host \
      image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.4.1-ubuntu22.04-dtk25.04-py3.10 \
      /bin/bash
    

    避坑提示:多机多卡通信极度依赖网络,必须加 --network=host 让容器使用宿主机网络,否则 DeepSpeed/vLLM 的多节点通信会卡死;--ipc=host 解决 PyTorch 多进程通信问题。

  • 📝 容器内操作示例(多卡推理)
    git clone https://developer.sourcefind.cn/codes/OpenDAS/vllm_cscc.git
    cd vllm_cscc
    pip install -e .
    # 启动 4 卡推理服务
    python -m vllm.entrypoints.openai.api_server --model /path/to/model --tensor-parallel-size 4
    

方案三:信创 KylinV10 环境(国产化政企机房)

💡 适用场景:严格要本国产生态(银河麒麟 OS + 飞桨/PyTorch)、ARM 或 x86 信创服务器部署。

  • 🐳 推荐基础镜像:飞桨官方 DCU 信创镜像
    ccr-2vdh3abv-pub.cnc.bj.baidubce.com/device/paddle-dcu:3.0.0-dtk24.04.1-kylinv10-gcc82-py310
    
  • 🛠️ 推荐搭配 OpenDAS 项目
    • Paddle:飞桨主框架,配合 PaddleSeg/PaddleDetection 等套件。
    • FastPT:将旧有基于 CUDA 的预测代码快速编译适配到 DCU 环境。
    • dcu_env_check:信创环境驱动版本繁杂,排障第一工具。
  • 🚀 容器启动命令
    docker run -it --privileged \
      --device=/dev/kfd --device=/dev/dri --group-add video \
      -v /opt/hyhal:/opt/hyhal:ro \
      --security-opt seccomp=unconfined \
      ccr-2vdh3abv-pub.cnc.bj.baidubce.com/device/paddle-dcu:3.0.0-dtk24.04.1-kylinv10-gcc82-py310 \
      /bin/bash
    

    避坑提示:KylinOS 默认的 SELinux/Seccomp 安全策略比 Ubuntu 严格,可能导致容器内无法正常调用底层算力,建议加上 --security-opt seccomp=unconfined 或在宿主机放行相关策略。

  • 📝 容器内操作示例(飞桨训练)
    # 验证飞桨 GPU 可用性
    python -c "import paddle; print(paddle.device.get_device())"
    # 应输出 gpu:0 或 xpu:0
    

🎁 终极避坑锦囊(适用于所有方案)

  1. 权限问题:如果在容器内执行 hy-smiPermission denied,说明 --group-add video 没生效,检查宿主机 /dev/dri/render* 的组权限。
  2. 驱动不匹配:容器内的 DTK 版本必须 宿主机安装的 DCU 驱动版本,否则容器启动会报 Failed to get HSA KFD 等错误。
  3. 挂载缺失:漏挂 -v /opt/hyhal:/opt/hyhal:ro 是最常见的新手错误,容器能启动但算力为 0。
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐