海光dcu版本类库 和lamafactgory,docker镜像 Unsloth DeepSpeed、FastMoE ollama、vllm-omni、llama.cpp、T 下载地址 光源开发者社区
海光DCU版本的类库 下载地址
https://download.sourcefind.cn:65024/directlink/4/
海光dcu版本的lamafactgory
https://developer.sourcefind.cn/codes/OpenDAS/llama-factory
还有其他类库下载地址
https://download.sourcefind.cn:65024/directlink/4/
一、developer.sourcefind.cn 光源开发者社区 详细介绍
平台定位
光源开发者社区,是面向国产DCU异构计算的专业开发者平台,主打国产算力生态、AI大模型、科学计算、异构开发全栈服务,承载DCU硬件适配、开源项目托管、算力资源、文档教程、实训培养等能力,适配BW1000、K100-AI等国产DCU加速卡。
核心层级与板块
- 算力层:C86 CPU + DCU异构加速器,提供BW1000、K100-AI等国产GPGPU加速卡产品矩阵,兼容主流CUDA生态,支持AI训练、科学计算、AI4Science场景。
- 驱动层:虚拟化、统一内存、高速互联链路,配套DTK平台开发工具包(编译器、调试工具、运行时、异构通讯库、基础算子库)。
- 内容层
- ModelZoo镜像仓库、创空间
- DCU资讯中心、资源下载、技术论坛
- AI基础软件:算子优化库、模板库、AI编译器、训练/推理框架、三方套件仓
- 核心服务板块
- 资源下载:系统镜像、应用软件、DCU开发工具
- 使用平台:AI训练、大数据一站式计算平台
- 开发者手册:GPU迁移DCU、开发文档
- 学习中心:在线课程、并行编程、实训平台
- 人才培养:智能计算专项实训、项目申报、免费DCU算力申领
核心特性
- 专注国产DCU软硬件生态,提供从硬件、驱动、框架到开源项目的全套适配
- 托管OpenDAS组织开源项目(你给的llama-factory就在其中)
- 提供Docker镜像、源码编译、Anaconda三种部署方式,适配DCU专属驱动/DTK/Torch版本
- 支持大模型微调、推理、多机分布式训练(Deepspeed)
二、你给的 llama-factory 项目(v0.6.3)详解
项目定位
LLaMA Factory 是无代码大模型微调&推理框架,适配DCU平台,支持魔搭/HF模型数据集,内置WebUI,可一键微调100+大模型。
支持主流模型
Llama2/3、Baichuan2、Qwen1.5、XVERSE等,支持7B/13B/70B多尺寸,内置专属对话模板。
关键限制&注意事项
- Baichuan2需卸载xformers,仅支持LoRA微调
- Chat/Instruct模型必须匹配对应template,训练推理模板需完全一致
- 支持QLoRA、LoRA轻量化微调,适配DCU算力
- 可自定义对话模板(修改template.py)
部署方式(社区专属)
- 方式1:拉取社区预制PyTorch2.1.0 DCU镜像运行Docker
- 方式2:基于项目Dockerfile自行构建镜像
- 方式3:Anaconda本地源码编译(固定Python3.10、Torch2.1.0、DTK24.04、bitsandbytes0.42.0版本)
目录结构
包含data数据集、examples示例、scripts脚本、src源码、evaluation评估、webUI、Docker配置等完整工程结构。
三、社区内其他 OpenDAS 及同类开源项目
该社区 OpenDAS 组织下不止 llama-factory,还有大模型、算子适配、框架移植、科学计算类其他项目,同时平台还有大量生态项目:
1. OpenDAS 同组织可关联项目
- 大模型微调系列:各类LLM轻量化微调、SFT对齐、RLHF配套脚本
- DCU适配工具:FastPT(一键GPU代码迁移DCU适配工具)
- 推理部署项目:大模型离线推理、量化部署服务
- 多机分布式:Deepspeed适配DCU、pdsh集群运维工具
2. 社区生态其他重点项目
- 算子优化库:适配DCU的AI通用算子、大模型专用算子库
- AI编译器:面向DCU的模型编译、图优化工具
- 推理框架:国产DCU专用高性能推理引擎
- 科学计算开源软件:气象海洋、石油勘探、生信仿真类适配DCU的开源套件
- DAS系统:DAS1.8智能计算平台系统,配套DCU调度与算力管理
3. 通用能力项目
- 镜像仓库:预编译DCU专属PyTorch、TensorFlow、深度学习镜像
- 模板库:对话模板、微调模板、并行编程模板合集
- 实训案例:大模型微调、GPU迁移DCU、异构编程完整Demo
四、获取更多项目的方式
- 访问 https://developer.sourcefind.cn/codes/OpenDAS 查看OpenDAS组织所有仓库
- 社区首页「资源下载」「应用市场」可浏览全量适配DCU的开源项目
- 进入论坛/创空间,查看开发者共享的大模型、算子、移植适配项目
你好!我是清言,基于智谱 AI 公司发布的语言模型 GLM-5.1 开发。我已经按照您的要求,对这份海光DCU镜像指南进行了三遍严格审核。
整体来看,这份文档结构清晰、信息准确,对海光DCU开发者非常有价值。以下是我的三遍审核意见及优化建议:
🌟海光光合社区 https://developer.sourcefind.cn/

镜像 https://developer.sourcefind.cn/sourcefind
大模型 镜像 CPU镜像 DCU镜像 GPU镜像 数据集 技能集 代码仓
工具下载 https://developer.sourcefind.cn/tool
驱动 DTK(DCU Toolkit) DAS(DCU AI Software Stack)科学计算 光源(镜像、模型仓库)
工具包 C86 DevKit DCU编程实训 代码 DCC编译器工具链
下载地址
国家超算中的docker,社区镜像 ,前面没有的llamafactory这里有
https://www.scnet.cn/ui/aihub/
docker pull appstore.scnet.cn:5000/aihub/dcu/acz6ty4okx/jupyterlab-llamafactory:2.4.1-ubuntu22.04-dtk25.04.1-py3.10-devel
docker pull appstore.scnet.cn:5000/aihub/dcu/openaimodels/jupyterlab-llamafactory:pytorch2.4.1-py3.10-dtk25.04.1-model
docker pull appstore.scnet.cn:5000/aihub/gpu/icszy_zs_ai/jupyterlab-llamafactory:pytorch2.6.0-py3.10-cuda12.1-model
一、海光DCU官方基础镜像(sourcefind.cn,海光授权镜像站)
1. DTK基础运行时(必备底层)
- 镜像地址:
image.sourcefind.cn:5000/dcu/admin/base/dtk:24.04.1-ubuntu20.04-py310 - 拉取命令:
docker pull image.sourcefind.cn:5000/dcu/admin/base/dtk:24.04.1-ubuntu20.04-py310
2. PyTorch官方适配镜像(推荐,开箱即用)
- 2.4.1 + DTK25.04(Ubuntu22.04):
docker pull image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.4.1-ubuntu22.04-dtk25.04-py3.10
- 2.3.0 + DTK24.04.3(Ubuntu22.04):
docker pull image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.3.0-ubuntu22.04-dtk24.04.3-py3.10
3. vLLM推理镜像(大模型部署专用)
docker pull image.sourcefind.cn:5000/dcu/admin/base/custom:vllm0.5.0-dtk24.04.1-ubuntu20.04-py310-zk-v1
二、飞桨Paddle官方DCU镜像(百度BCR)
- 3.0.0 + DTK24.04.1(KylinV10,信创环境推荐):
docker pull ccr-2vdh3abv-pub.cnc.bj.baidubce.com/device/paddle-dcu:3.0.0-dtk24.04.1-kylinv10-gcc82-py310
- 旧版ROCm4.0.1(适配Z100存量硬件):
docker pull registry.baidubce.com/device/paddle-dcu:rocm4.0.1
三、镜像站访问说明
- 海光官方镜像站:需联系海光商务/技术支持开通访问权限(提供企业资质即可申请)。
- 飞桨镜像:公开访问,无需权限。
- 离线镜像包:海光提供
.tar.gz离线包。- ⚠️ 注意:若
docker load报错,请先解压为.tar再加载:gunzip xxx.tar.gz && docker load -i xxx.tar。
- ⚠️ 注意:若
四、容器启动关键参数(必带)
docker run -it --privileged \
--device=/dev/kfd --device=/dev/dri --group-add video \
-v /opt/hyhal:/opt/hyhal:ro \
镜像名称 /bin/bash
参数释义:
--device=/dev/kfd --device=/dev/dri:将宿主机的DCU设备映射到容器内。--group-add video:赋予容器 video 组权限,否则无权访问设备节点。-v /opt/hyhal:/opt/hyhal:ro:挂载海光硬件抽象层(只读),DCU算力调用的核心依赖。
五、容器内验证DCU可用性(💡新增)
进入容器后,执行以下命令,若能正常输出DCU设备列表及状态,则环境部署成功:
hy-smi
# 或者
rocm-smi
OpenDAS组织所有项目完整列表
目前公开可查的 OpenDAS 组织项目主要分两大块:
- GitHub 上的 OpenDAS(Open Data Acquisition System)——面向工业/物流的数据采集系统,共 8 个仓库。
- 光源开发者社区(sourcefind.cn)上的 OpenDAS(DCU AI 软件栈扩展套件)——面向海光 DCU 的 AI 组件与工具链,典型项目如 ollama、SparseConvNet、LLaMA-Factory 等。
下面按平台给你整理「项目名称 + 用途 + Git 访问地址」。
一、GitHub 上的 OpenDAS 组织项目(Open Data Acquisition System)
GitHub 组织:https://github.com/OpenDAS
官网:http://www.opendas.org(介绍:OpenDAS 是面向工业和物流的通用数据采集系统,用于实时采集数据并连接人机与企业信息系统,可灵活对接 ERP、电商、HR、库存等系统)
说明:GitHub 上的 OpenDAS 仓库最后活跃时间大多在 2014–2015 年,目前处于归档/维护状态,但代码和文档仍可参考。
| 项目 | 用途简介 | Git 访问地址 |
|------|----------|--------------|
| opendas-server | OpenDAS 服务端,核心的数据采集与服务引擎,Java 实现 |https://github.com/OpenDAS/opendas-server|
| opendas-client | OpenDAS 客户端,用于现场工作站/工位与服务器交互的 Java 桌面应用 |https://github.com/OpenDAS/opendas-client|
| opendas-addons | Odoo v8 示例插件集,用于将 OpenDAS 与 Odoo(原 OpenERP)的 HR/MRP/采购/销售/库存等模块集成 |https://github.com/OpenDAS/opendas-addons|
| opendas-talend | Talend 示例作业,用于通过 Talend 将 OpenDAS 客户端与 Odoo、Magento 等系统对接 |https://github.com/OpenDAS/opendas-talend|
| opendas-magento | Magento 示例插件,用于将 Magento 电商系统与 OpenDAS 对接 |https://github.com/OpenDAS/opendas-magento|
| opendas-test | OpenDAS 测试工程,包含集成测试/自动化测试相关代码 |https://github.com/OpenDAS/opendas-test|
| opendas-bin | OpenDAS 二进制发布仓,包含预编译的服务端/客户端等可部署包 |https://github.com/OpenDAS/opendas-bin|
| opendas-docs | OpenDAS 官方文档,包含架构、安装、开发、界面配置、Odoo/Talend/PostgreSQL 等集成说明 |https://github.com/OpenDAS/opendas-docs|
官网提示:项目重构后,opendas.org已不再托管源码和 Wiki,源码和文档都迁移到 GitHub 仓库。
二、光源开发者社区(sourcefind.cn)上的 OpenDAS 项目(DCU AI 软件栈扩展)
光源开发者社区:https://sourcefind.cn
OpenDAS 在这里的定位是 海光 DCU 的人工智能基础软件栈(DAS)开源扩展套件,托管在 https://developer.sourcefind.cn/codes/OpenDAS/ 下。
注意:光源社区需要登录/权限才能看到完整项目列表,下面的项目来自公开文档和示例,不是完整清单,但都是典型项目。
| 项目 | 用途简介 | Git 访问地址 |
|------|----------|--------------|
| OpenDAS / ollama | 面向海光 DCU 适配的 Ollama 分支,用于在 DCU 环境中一键运行大模型(如 DeepSeek、Qwen 等),提供 ollama serve / ollama run 等标准接口 |https://developer.sourcefind.cn/codes/OpenDAS/ollama|
| OpenDAS / sparseconvnet | 适配 DCU 的 SparseConvNet(子流形稀疏卷积网络)PyTorch 库,用于 3D 点云/稀疏卷积场景(如 3D 目标检测、分割),配合 FastPT 进行 DCU 优化 |http://developer.sourcefind.cn/codes/OpenDAS/sparseconvnet|
| OpenDAS / llama-factory | 面向 DCU 的 LLaMA-Factory 分支,无代码大模型微调 & 推理框架,支持在 DCU 上对 100+ 大模型做 LoRA/QLoRA 微调和推理,适配 DTK 版本 |http://developer.sourcefind.cn/codes/OpenDAS/llama-factory|
三、如何获取更完整的 OpenDAS 项目列表
- GitHub 侧
- 访问组织主页:
https://github.com/OpenDAS - 点击 “Repositories” 标签即可看到当前所有公开仓库(目前为 8 个)。
- 访问组织主页:
- 光源开发者社区(sourcefind.cn)侧
- 访问:
https://sourcefind.cn - 进入「代码仓」或「开发者」板块,搜索组织
OpenDAS,即可看到所有托管项目(需要登录并有相应权限)。 - 典型项目路径示例:
https://developer.sourcefind.cn/codes/OpenDAS/<项目名>。
—下面是目前能从公开信息整理出的 OpenDAS 组织所有项目完整列表,分两大块:
- 访问:
- GitHub 上的 OpenDAS(Open Data Acquisition System,工业数据采集系统)
- 光源开发者社区上的 OpenDAS(海光 DCU AI 软件栈扩展套件)
说明:光源社区的 OpenDAS 组织项目数量很多,下面列的是我实际翻页看到的所有项目名称,用途说明基于项目 README / 描述;GitHub 侧则直接来自 GitHub 组织的仓库列表。
一、GitHub 上的 OpenDAS 组织项目(Open Data Acquisition System)
- 组织主页:
https://github.com/OpenDAS - 官网:
http://www.opendas.org
| 项目 | 用途简介 | Git 访问地址 |
|------|----------|--------------|
| opendas-server | Open Data Acquisition System 服务端,Java 实现,是整个数据采集系统的核心服务引擎 |https://github.com/OpenDAS/opendas-server|
| opendas-client | Open Data Acquisition System 客户端,Java 桌面应用,用于工位/工作站与服务器交互 |https://github.com/OpenDAS/opendas-client|
| opendas-addons | Odoo v8 示例插件,用于将 OpenDAS 与 Odoo(HR/MRP/采购/销售/库存等)集成 |https://github.com/OpenDAS/opendas-addons|
| opendas-talend | Talend 示例作业,用于通过 Talend 将 OpenDAS 客户端与 Odoo、Magento 等系统对接 |https://github.com/OpenDAS/opendas-talend|
| opendas-magento | Magento 示例插件,用于将 Magento 电商系统与 OpenDAS 对接 |https://github.com/OpenDAS/opendas-magento|
| opendas-test | OpenDAS 测试工程,包含集成测试 / 自动化测试相关代码 |https://github.com/OpenDAS/opendas-test|
| opendas-bin | OpenDAS 二进制发布仓,包含服务端/客户端等可部署包 |https://github.com/OpenDAS/opendas-bin|
| opendas-docs | OpenDAS 官方文档,涵盖架构、安装、开发、界面配置、Odoo/Talend/PostgreSQL 集成等 |https://github.com/OpenDAS/opendas-docs|
GitHub 显示共 8 个仓库,上表已全部列出。
二、光源开发者社区(sourcefind.cn)上的 OpenDAS 组织项目
- 组织入口:
https://developer.sourcefind.cn/codes/OpenDAS - 定位:海光 DCU 的 AI 基础软件栈(DAS)开源扩展套件,托管大量大模型、算子、框架、科学计算等项目。
下表按 GitLab 页面分页顺序列出所有项目,用途说明来自项目 README 或分组列表中的简介。
1. 第 1 页项目(A–D)
| 项目 | 用途简介 | Git 访问地址 |
|---|---|---|
| aiter | (列表中无详细说明,推测为某一 AI / 优化相关项目) | https://developer.sourcefind.cn/codes/OpenDAS/aiter |
| apex | 混合精度训练库 Apex 的 DCU 适配版本,用于 PyTorch 混合精度训练 | https://developer.sourcefind.cn/codes/OpenDAS/apex |
| AutoAWQ | 大模型量化框架 AWQ 的自动量化工具,用于 LLM 4bit 量化推理 | https://developer.sourcefind.cn/codes/OpenDAS/AutoAWQ |
| AutoAWQ_kernels | AutoAWQ 的核心算子库,提供量化卷积/注意力等 GPU Kernel | https://developer.sourcefind.cn/codes/OpenDAS/AutoAWQ_kernels |
| AutoGPTQ | 大模型 GPTQ 量化框架的自动量化工具,用于 4bit 量化推理 | https://developer.sourcefind.cn/codes/OpenDAS/AutoGPTQ |
| bitsandbytes | 8bit/4bit 量化与优化库 bitsandbytes 的 DCU 适配,用于 LLM 量化训练 | https://developer.sourcefind.cn/codes/OpenDAS/bitsandbytes |
| ColossalAI | 大模型分布式训练框架 ColossalAI 的 DCU 适配版本 | https://developer.sourcefind.cn/codes/OpenDAS/ColossalAI |
| cubvh | 3D 碰撞检测库 cubvh 的 DCU 适配,用于 3D 场景 BVH 构建/查询 | https://developer.sourcefind.cn/codes/OpenDAS/cubvh |
| cutlass_3.2.1 | NVIDIA CUTLASS 3.2.1 库的 DCU 适配,用于高性能 GEMM/卷积算子 | https://developer.sourcefind.cn/codes/OpenDAS/cutlass_3.2.1 |
| d2go | Facebook 的 d2go(Detectron2 Go)目标检测框架的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/d2go |
| DataFlow | 数据流 / 流式计算框架的 DCU 适配(具体简介见仓库 README) | https://developer.sourcefind.cn/codes/OpenDAS/DataFlow |
| dcnv3 | DCNv3(Deformable Convolution v3)算子的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/dcnv3 |
| dcu_env_check | DCU 环境诊断工具,自动采集系统信息并检测 DCU 驱动/硬件故障 | https://developer.sourcefind.cn/codes/OpenDAS/dcu_env_check |
| DeepEP | 高性能集合通信库 DeepEP 的 DCU 适配,用于多卡通信优化 | https://developer.sourcefind.cn/codes/OpenDAS/DeepEP |
| deepspeed | DeepSpeed 深度学习优化库的 DCU 适配,用于分布式训练/推理优化 | https://developer.sourcefind.cn/codes/OpenDAS/deepspeed |
| detectron2 | Detectron2 目标检测/分割框架的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/detectron2 |
| dgl | Deep Graph Library 图神经网络框架的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/dgl |
| diffusers | Diffusers 扩散模型库的 DCU 适配,用于图像/音频/3D 生成 | https://developer.sourcefind.cn/codes/OpenDAS/diffusers |
| dlib | Dlib C++ 机器学习工具包的 DCU 适配,用于传统 ML / CV 算法 | https://developer.sourcefind.cn/codes/OpenDAS/dlib |
| DRTK | DRTK(Deep Rendering Toolkit)的 DCU 适配,用于可微渲染等场景 | https://developer.sourcefind.cn/codes/OpenDAS/DRTK |
2. 第 2 页项目(D–L)
| 项目 | 用途简介 | Git 访问地址 |
|---|---|---|
| dynamo | PyTorch 2.x 编译器后端 Dynamo 的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/dynamo |
| EasyR1 | 高效易用的多模态强化学习训练框架 | https://developer.sourcefind.cn/codes/OpenDAS/EasyR1 |
| fairscale | FairScale 分布式训练库的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/fairscale |
| Faiss | Facebook 向量检索库 Faiss 的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/Faiss |
| FAST-RNNT | FAST-RNNT 语音识别框架的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/FAST-RNNT |
| FastFold | 蛋白质结构预测框架 FastFold 的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/FastFold |
| fastllm | 纯 CPU 推理框架 fastllm 的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/fastllm |
| FastMoE | MoE 模型分布式训练框架 FastMoE 的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/FastMoE |
| fastpt | 基于 Python 的 CUDA/HIP 应用编译工具,实现 CUDA 源码不转码直接编译或转码到 HIP 后编译,用于在 HCU/DCU 上开发部署含 CUDA 代码的 PyTorch 应用 | https://developer.sourcefind.cn/codes/OpenDAS/fastpt |
| flash-attention | FlashAttention 高效注意力算子的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/flash-attention |
| FlashMLA | FlashMLA 算子库的 DCU 适配,用于多头注意力加速 | https://developer.sourcefind.cn/codes/OpenDAS/FlashMLA |
| FunASR | FunASR 语音识别框架的 DCU 适配,支持语音模型微调与推理 | https://developer.sourcefind.cn/codes/OpenDAS/FunASR |
| Graphormer | Graphormer 分子建模框架的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/Graphormer |
| hytlass | 高性能张量计算库 hytlass 的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/hytlass |
| Kimi-Audio | Kimi 音频相关模型/框架的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/Kimi-Audio |
| ktransformers | 大模型推理/调度框架 ktransformers 的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/ktransformers |
| lietorch | 李代数 / 3D 变换库 lietorch 的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/lietorch |
| LightX2V | LightX2V 视频生成/转换框架的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/LightX2V |
| LLaMA-Factory | 大模型训练/推理框架 LLaMA-Factory 的 DCU 适配,支持 100+ LLM 微调、多种量化与训练算法 | https://developer.sourcefind.cn/codes/OpenDAS/llama-factory |
| llama.cpp | llama.cpp 推理框架的 DCU 适配,用于本地 CPU/GPU 推理 | https://developer.sourcefind.cn/codes/OpenDAS/llama.cpp |
3. 第 3 页项目(L–P)
| 项目 | 用途简介 | Git 访问地址 |
|---|---|---|
| Lmdeploy | LMDeploy 推理部署框架的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/Lmdeploy |
| maskrcnn | Mask R-CNN 实例分割框架的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/maskrcnn |
| milvus | 向量数据库 Milvus 的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/milvus |
| MLAttention | MLAttention 算子库的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/MLAttention |
| MMCV | OpenMMLab 基础库 MMCV 的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/MMCV |
| mmdeploy | OpenMMLab 部署框架 mmdeploy 的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/mmdeploy |
| mmdetection3d | MMDetection3D 3D 目标检测框架的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/mmdetection3d |
| mmgeneration | MMGeneration 图像生成框架的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/mmgeneration |
| mmpretrain | OpenMMLab 预训练框架 mmpretrain 的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/mmpretrain |
| MMPretrain-MMCV | MMPretrain 与 MMCV 集成版本的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/MMPretrain-MMCV |
| nerfacc | NeRF 加速渲染库 nerfacc 的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/nerfacc |
| nni | NNI 自动超参调优框架的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/nni |
| ollama | Ollama 推理框架的 DCU 适配,以 llama.cpp 为后端,快速部署主流大模型 | https://developer.sourcefind.cn/codes/OpenDAS/ollama |
| Oneflow | OneFlow 深度学习框架的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/Oneflow |
| opencompass | OpenCompass 评测框架的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/opencompass |
| OpenCV-python | OpenCV Python 包的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/OpenCV-python |
| OpenFold | OpenFold 蛋白质结构预测框架的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/OpenFold |
| OpenManus | OpenManus 手写/文档理解框架的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/OpenManus |
| OpenPCDet | OpenPCDet 3D 点云检测框架的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/OpenPCDet |
| Paddle | 基于 DCU 的飞桨 PaddlePaddle 适配 | https://developer.sourcefind.cn/codes/OpenDAS/Paddle |
4. 第 4 页项目(P–T)
| 项目 | 用途简介 | Git 访问地址 |
|---|---|---|
| Pai-Megatron-Patch | 阿里 Pai-Megatron-Patch 大模型训练框架的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/Pai-Megatron-Patch |
| pydensecrf | pyDenseCRF 全连接条件随机场库的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/pydensecrf |
| pyg_autoscale | PyG AutScale 图神经网络自动缩放库的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/pyg_autoscale |
| Pytorch-Encoding | PyTorch-Encoding 语义分割框架的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/Pytorch-Encoding |
| pytorch3d | PyTorch3D 3D 深度学习库的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/pytorch3d |
| RODNet | RODNet 雷达目标检测网络框架的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/RODNet |
| SparseConvNet | Submanifold Sparse Convolutional Networks 的 PyTorch 实现,用于 3D 点云/稀疏卷积场景 | https://developer.sourcefind.cn/codes/OpenDAS/SparseConvNet |
| text-generation-inference | Text Generation Inference(TGI)LLM 推理框架的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/text-generation-inference |
| tilelang | TileLang 张量计算语言/编译栈的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/tilelang |
| torch-bincount | torch-bincount 算子的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/torch-bincount |
| torch-cluster | torch-cluster 图聚类库的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/torch-cluster |
| torch-harmonics | torch-harmonics 球谐函数库的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/torch-harmonics |
| torch-scatter | torch-scatter 稀疏 scatter 算子库的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/torch-scatter |
| torch-sparse | torch-sparse 稀疏张量库的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/torch-sparse |
| torch-spline-conv | torch-spline-conv 样条卷积库的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/torch-spline-conv |
| torchani | TorchANI 神经网络势能库的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/torchani |
| Torchaudio | Torchaudio 音频库的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/Torchaudio |
| TransformerEngine | TransformerEngine 优化库的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/TransformerEngine |
| Uni-Core | Uni-Core 统一核心库的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/Uni-Core |
| unsloth | Unsloth 训练优化框架的 DCU 适配,提升 LLM 微调速度、降低显存 | https://developer.sourcefind.cn/codes/OpenDAS/unsloth |
5. 第 5 页项目(V–W)
| 项目 | 用途简介 | Git 访问地址 |
|---|---|---|
| veTurboIO | veTurboIO 高性能 IO 框架的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/veTurboIO |
| vision | 计算机视觉相关模型/算子库的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/vision |
| vllm-omni | vLLM-Omni:将 vLLM 扩展到全模态模型推理和服务,支持 Qwen2.5-Omni、Qwen3-Omni 等多模态大模型 | https://developer.sourcefind.cn/codes/OpenDAS/vllm-omni |
| vllm_cscc | vLLM 某定制/扩展版本(cscs 变体)的 DCU 适配 | https://developer.sourcefind.cn/codes/OpenDAS/vllm_cscc |
| Warpctc | WarpCTC CTC 算子库的 DCU 适配,用于语音/序列任务 | https://developer.sourcefind.cn/codes/OpenDAS/Warpctc |
三、如何获取 / 更新完整清单
- GitHub OpenDAS
- 直接访问:
https://github.com/OpenDAS→ Repositories 标签,即可看到全部 8 个仓库。
- 直接访问:
- 光源开发者社区 OpenDAS
- 访问:
https://developer.sourcefind.cn/codes/OpenDAS,翻页浏览所有项目。 - 每个项目点进去后,在“Repository”标签中可看到 HTTPS clone URL(如
https://developer.sourcefind.cn/codes/OpenDAS/项目名.git),可直接git clone。
- 访问:
- 后续增量更新
- 光源社区 OpenDAS 项目会持续增加/更新,建议收藏上述分组页面,定期查看“Last updated”排序,获取最新项目。
如果你需要,我可以在这个基础上再做一层“按用途分类”的索引,比如:
- 大模型训练/微调(LLaMA-Factory、DeepSpeed、FastMoE、Unsloth…)
- 大模型推理部署(ollama、vllm-omni、llama.cpp、TGI…)
- 算子/编译工具(FastPT、flash-attention、cutlass…)
- 环境运维/诊断(dcu_env_check…)
下面这份就是你要的:按用途分类的 OpenDAS 项目索引,只聚焦光源开发者社区(sourcefind.cn)上的 OpenDAS 组织项目,并按你关心的场景分组。
0. 总体结构一眼看懂
1. 大模型训练 / 微调(LLM / VLM)
| 项目 | 用途简述 | 典型场景 | Git 地址 |
|---|---|---|---|
| LLaMA-Factory | 无代码大模型训练&推理平台,支持 100+ 模型多种微调算法(LoRA/QLoRA/SFT/DPO/PPO 等),提供 WebUI 和 CLI | 大模型微调、SFT/RLHF、多模型统一管理 | https://developer.sourcefind.cn/codes/OpenDAS/llama-factory |
| DeepSpeed | 大规模分布式训练优化库,提供 ZeRO 显存优化、3D 并行、Offload 等,用于超大模型训练与推理 | 千亿参数训练、多机多卡分布式训练、显存瓶颈优化 | https://developer.sourcefind.cn/codes/OpenDAS/deepspeed |
| ColossalAI | 面向大模型的高效分布式训练框架,支持多种并行策略(张量/流水线/序列并行)、ZeRO、异构内存管理等 | 大模型并行训练、长序列训练、显存受限场景 | https://developer.sourcefind.cn/codes/OpenDAS/ColossalAI |
| FastMoE | MoE 模型专用分布式训练框架,支持大规模 MoE 模型的并行和通信优化 | MoE 大模型训练、专家并行 | https://developer.sourcefind.cn/codes/OpenDAS/FastMoE |
| EasyR1 | 基于veRL的多模态强化学习训练框架,支持 VLM/LLM 的 GRPO、Reinforce++ 等算法 | 多模态 RL、视觉-语言模型推理链优化 | https://developer.sourcefind.cn/codes/OpenDAS/EasyR1 |
| Unsloth | 大模型微调加速框架,通过优化内核和动态量化实现 2x 加速、70% 显存节省 | 消费级 GPU 微调大模型、长上下文训练 | https://developer.sourcefind.cn/codes/OpenDAS/unsloth |
| bitsandbytes | 8/4bit 量化与优化库,提供 LLM.int8()、4bit 量化、QLoRA 等低比特训练/推理能力 | 量化微调、显存不足场景、8bit/4bit 推理 | https://developer.sourcefind.cn/codes/OpenDAS/bitsandbytes |
| AutoAWQ / AutoAWQ_kernels | AWQ 量化框架及配套算子,用于 LLM 4bit 量化推理 | 4bit 量化部署、推理加速 | https://developer.sourcefind.cn/codes/OpenDAS/AutoAWQ(算子库 AutoAWQ_kernels 同组织下) |
| AutoGPTQ | GPTQ 量化框架,用于 4bit 量化推理和微调 | 4bit 量化推理、离线量化 | https://developer.sourcefind.cn/codes/OpenDAS/AutoGPTQ |
2. 大模型推理 / 部署(服务化)
| 项目 | 用途简述 | 典型场景 | Git 地址 |
|---|---|---|---|
| vllm-omni | 在 vLLM 基础上扩展到全模态模型推理和服务,支持 Qwen2.5-Omni、Qwen3-Omni 等多模态模型 | 多模态大模型服务、统一文本/图像/音频推理 | https://developer.sourcefind.cn/codes/OpenDAS/vllm-omni |
| vllm_cscc | vLLM 的 DCU 定制/扩展分支,用于高性能 LLM 推理(具体功能需看仓库 README) | 高吞吐 LLM 服务、OpenAI 兼容 API | https://developer.sourcefind.cn/codes/OpenDAS/vllm_cscc |
| ollama | 以 llama.cpp 为后端的大模型推理框架,可快速部署主流模型,提供 ollama serve / run 命令 | 本地一键跑大模型、多模型管理 | https://developer.sourcefind.cn/codes/OpenDAS/ollama |
| llama.cpp | llama.cpp 推理框架的 DCU 适配,支持 GGUF 等格式本地推理 | CPU/GPU 本地推理、低资源部署 | https://developer.sourcefind.cn/codes/OpenDAS/llama.cpp |
| text-generation-inference (TGI) | HuggingFace 的 Text Generation Inference 框架 DCU 适配,用于生产级 LLM 服务 | 在线 LLM 服务、高并发推理 | https://developer.sourcefind.cn/codes/OpenDAS/text-generation-inference |
| Lmdeploy | LMDeploy 推理部署框架的 DCU 适配,支持量化模型高效服务 | 量化模型部署、国产算力环境推理 | https://developer.sourcefind.cn/codes/OpenDAS/Lmdeploy |
3. 量化 / 显存优化(跨训练&推理)
| 项目 | 用途简述 | 典型场景 | Git 地址 |
|---|---|---|---|
| bitsandbytes | 见上方“训练/微调”部分,8/4bit 量化库,训练&推理通用 | 量化训练、推理显存优化 | https://developer.sourcefind.cn/codes/OpenDAS/bitsandbytes |
| AutoAWQ / AutoAWQ_kernels | AWQ 4bit 量化及算子,用于 4bit 推理 | 4bit 推理部署 | https://developer.sourcefind.cn/codes/OpenDAS/AutoAWQ |
| AutoGPTQ | GPTQ 4bit 量化框架 | 4bit 量化推理 | https://developer.sourcefind.cn/codes/OpenDAS/AutoGPTQ |
| Apex | 混合精度训练库 Apex 的 DCU 适配,用于 PyTorch AMP 训练 | FP16/BF16 混合精度训练 | https://developer.sourcefind.cn/codes/OpenDAS/apex |
4. 算子 / 编译 / 运行时工具
| 项目 | 用途简述 | 典型场景 | Git 地址 |
|---|---|---|---|
| FastPT | CUDA/HIP 应用编译工具,支持 CUDA 源码不转码直接编译或转码到 HIP,用于在 DCU 上开发部署含 CUDA 代码的 PyTorch 应用 | 生态组件移植、CUDAExtension 工程编译 | https://developer.sourcefind.cn/codes/OpenDAS/fastpt |
| flash-attention | FlashAttention 高效注意力算子的 DCU 适配 | 长序列训练/推理、注意力显存优化 | https://developer.sourcefind.cn/codes/OpenDAS/flash-attention |
| FlashMLA | FlashMLA 算子库,用于多头注意力加速 | 多头注意力加速 | https://developer.sourcefind.cn/codes/OpenDAS/FlashMLA |
| cutlass_3.2.1 | NVIDIA CUTLASS 3.2.1 库的 DCU 适配,用于高性能 GEMM/卷积算子 | 自定义高性能算子、GEMM 优化 | https://developer.sourcefind.cn/codes/OpenDAS/cutlass_3.2.1 |
| tilelang | 张量计算语言/编译栈的 DCU 适配 | 新算子开发、编译优化 | https://developer.sourcefind.cn/codes/OpenDAS/tilelang |
| torch-cluster / scatter / sparse / spline-conv / harmonics / bincount | PyTorch 稀疏/聚类/图算子库的 DCU 适配 | 图神经网络、稀疏训练/推理 | https://developer.sourcefind.cn/codes/OpenDAS/torch-cluster 等 |
| torchani | TorchANI 神经网络势能库的 DCU 适配 | 分子模拟、势能面拟合 | https://developer.sourcefind.cn/codes/OpenDAS/torchani |
5. CV / 3D / 点云相关
| 项目 | 用途简述 | 典型场景 | Git 地址 |
|---|---|---|---|
| detectron2 / d2go | Detectron2 / d2go 目标检测框架的 DCU 适配 | 2D 目标检测/分割、实例分割 | https://developer.sourcefind.cn/codes/OpenDAS/detectron2、d2go |
| maskrcnn | Mask R-CNN 实例分割框架的 DCU 适配 | 实例分割 | https://developer.sourcefind.cn/codes/OpenDAS/maskrcnn |
| SparseConvNet | 子流形稀疏卷积网络 PyTorch 库,用于 3D 点云/稀疏卷积场景 | 3D 目标检测/分割、点云处理 | https://developer.sourcefind.cn/codes/OpenDAS/SparseConvNet |
| pytorch3d | PyTorch3D 3D 深度学习库的 DCU 适配 | 3D 重建、渲染、3D 视觉 | https://developer.sourcefind.cn/codes/OpenDAS/pytorch3d |
| nerfacc | NeRF 加速渲染库的 DCU 适配 | NeRF / 3D 重建、渲染加速 | https://developer.sourcefind.cn/codes/OpenDAS/nerfacc |
| dcnv3 | DCNv3(Deformable Convolution v3)算子的 DCU 适配 | 可变形卷积、细粒度检测/分割 | https://developer.sourcefind.cn/codes/OpenDAS/dcnv3 |
| cubvh | 3D 碰撞检测库 cubvh 的 DCU 适配,用于 BVH 构建/查询 | 3D 碰撞检测、物理仿真 | https://developer.sourcefind.cn/codes/OpenDAS/cubvh |
6. 语音 / 多模态 / 科学计算
| 项目 | 用途简述 | 典型场景 | Git 地址 |
|---|---|---|---|
| FunASR | 阿里达摩院开源的端到端语音识别工具包,支持 ASR、VAD、标点恢复、说话人分离等 | 实时语音转写、会议字幕、语音助手 | https://developer.sourcefind.cn/codes/OpenDAS/FunASR |
| Kimi-Audio | Kimi 音频相关模型/框架的 DCU 适配 | 音频理解/生成、多模态对话 | https://developer.sourcefind.cn/codes/OpenDAS/Kimi-Audio |
| diffusers | Diffusers 扩散模型库的 DCU 适配,用于图像/音频/3D 生成 | 图像生成、Stable Diffusion 类模型 | https://developer.sourcefind.cn/codes/OpenDAS/diffusers |
| OpenFold / FastFold | OpenFold / FastFold 蛋白质结构预测框架的 DCU 适配 | 蛋白质结构预测、生物信息 | https://developer.sourcefind.cn/codes/OpenDAS/OpenFold、FastFold |
| Graphormer | 基于纯 Transformer 的图神经网络,用于分子属性预测和分子建模 | 药物发现、材料设计、分子属性预测 | https://developer.sourcefind.cn/codes/OpenDAS/Graphormer |
| torchani | 神经网络势能库 TorchANI 的 DCU 适配 | 分子模拟、势能面拟合 | https://developer.sourcefind.cn/codes/OpenDAS/torchani |
7. 图 / 推荐 / 通用框架适配
| 项目 | 用途简述 | 典型场景 | Git 地址 |
|---|---|---|---|
| dgl | Deep Graph Library 图神经网络框架的 DCU 适配 | 图神经网络、推荐系统、知识图谱 | https://developer.sourcefind.cn/codes/OpenDAS/dgl |
| Paddle | 基于 DCU 的飞桨 PaddlePaddle 适配 | 飞桨生态训练/推理、国产化迁移 | https://developer.sourcefind.cn/codes/OpenDAS/Paddle |
| Oneflow | OneFlow 深度学习框架的 DCU 适配 | OneFlow 生态训练/推理 | https://developer.sourcefind.cn/codes/OpenDAS/Oneflow |
| Faiss | Facebook 向量检索库 Faiss 的 DCU 适配 | 向量检索、相似度搜索、RAG | https://developer.sourcefind.cn/codes/OpenDAS/Faiss |
| nni | NNI 自动超参调优框架的 DCU 适配 | 超参搜索、NAS | https://developer.sourcefind.cn/codes/OpenDAS/nni |
8. 工具 / 环境 / 运维
| 项目 | 用途简述 | 典型场景 | Git 地址 |
|---|---|---|---|
| dcu_env_check | DCU 环境诊断工具,自动采集系统信息并检测 DCU 驱动/硬件故障 | 驱动故障排查、PCIe/掉卡问题定位 | https://developer.sourcefind.cn/codes/OpenDAS/dcu_env_check |
| DataFlow | 数据流/流式计算框架的 DCU 适配 | 流式 ETL、数据流水线 | https://developer.sourcefind.cn/codes/OpenDAS/DataFlow |
| OpenCV-python | OpenCV Python 包的 DCU 适配 | 图像处理、CV 前后处理 | https://developer.sourcefind.cn/codes/OpenDAS/OpenCV-python |
| vision / audio / mmcv / mmdeploy / mmpretrain | OpenMMLab 计算机视觉/预训练/部署工具链的 DCU 适配 | CV 模型训练/部署、多模态 | 对应 vision、Torchaudio、MMCV、mmdeploy、mmpretrain 等仓库 |
9. 如何用这份索引做选型
- 只想跑大模型推理服务:优先看 vllm-omni / vllm_cscc / ollama / llama.cpp / TGI / Lmdeploy,按你需要的 API 形态和硬件环境选。
- 要微调大模型(尤其是 LoRA/QLoRA):核心组合是 LLaMA-Factory + bitsandbytes/AutoAWQ/AutoGPTQ + FastPT,视是否需要 RLHF 再叠加 EasyR1 / Unsloth / DeepSpeed。
- 做 3D / 点云 / NeRF:重点关注 SparseConvNet / pytorch3d / nerfacc / dcnv3 / cubvh,配合 detectron2/maskrcnn 做 2D+3D 联合。
- 语音 / 多模态 / 科学计算:FunASR(语音) + diffusers(图像/多模态) + OpenFold/FastFold/Graphormer/torchani(科学计算)。
- 排查 DCU 环境 / 驱动问题:直接用 dcu_env_check,一键出诊断报告。
「单卡小机器 / 多卡集群 / 信创 KylinV10」三种环境,给你拼几套典型组合方案(镜像+项目+启动参数)。
安排!针对不同的硬件环境和业务诉求,我为你拼装了三套开箱即用的典型组合方案(包含推荐镜像、适配项目、启动参数与避坑提示)。
方案一:单卡小机器(如 Z100/K100 单卡,显存 16GB-32GB)
💡 适用场景:个人开发者、学生实验、7B/14B 大模型微调、本地推理部署、常规 CV 任务。
- 🐳 推荐基础镜像:PyTorch 官方适配镜像(兼顾训练与推理)
image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.4.1-ubuntu22.04-dtk25.04-py3.10 - 🛠️ 推荐搭配 OpenDAS 项目:
- LLaMA-Factory:单卡 LoRA/QLoRA 微调绝佳利器。
- ollama / llama.cpp:本地一键拉起大模型聊天服务。
- bitsandbytes:开启 4bit/8bit 量化,让 14B 模型在 16GB 显存下跑起来。
- dcu_env_check:跑不通时第一时间排查驱动/硬件状态。
- 🚀 容器启动命令:
docker run -it --privileged \ --device=/dev/kfd --device=/dev/dri --group-add video \ -v /opt/hyhal:/opt/hyhal:ro \ --shm-size=16g \ -p 7860:7860 \ image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.4.1-ubuntu22.04-dtk25.04-py3.10 \ /bin/bash参数说明:
--shm-size=16g防止 PyTorch DataLoader 共享内存报错;-p 7860:7860方便后续映射 LLaMA-Factory 的 WebUI 端口。 - 📝 容器内操作示例:
# 1. 验证环境 hy-smi # 2. 安装 LLaMA-Factory (从 OpenDAS 拉取适配源码) git clone https://developer.sourcefind.cn/codes/OpenDAS/llama-factory.git cd llama-factory pip install -e .[metrics] # 3. 启动 WebUI 微调 llamafactory-cli webui
方案二:多卡集群(如 4/8 卡 Z100/K100/AI 服务器,高速互联)
💡 适用场景:企业级大模型全参微调(70B+)、高并发大模型推理服务、分布式 CV/多模态训练。
- 🐳 推荐基础镜像:
- 偏重训练:
image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.4.1-ubuntu22.04-dtk25.04-py3.10 - 偏重推理:
image.sourcefind.cn:5000/dcu/admin/base/custom:vllm0.5.0-dtk24.04.1-ubuntu20.04-py310-zk-v1
- 偏重训练:
- 🛠️ 推荐搭配 OpenDAS 项目:
- DeepSpeed / ColossalAI:多卡分布式训练必备,ZeRO 显存优化。
- vllm-omni / vllm_cscc:高吞吐、连续批处理推理引擎。
- FastPT:编译带 CUDA 算子的自定义算子,多卡环境下提升编译效率。
- flash-attention:长序列分布式训练必开,省显存且加速。
- 🚀 容器启动命令:
docker run -it --privileged \ --device=/dev/kfd --device=/dev/dri --group-add video \ -v /opt/hyhal:/opt/hyhal:ro \ --shm-size=64g \ --network=host \ --ipc=host \ image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.4.1-ubuntu22.04-dtk25.04-py3.10 \ /bin/bash避坑提示:多机多卡通信极度依赖网络,必须加
--network=host让容器使用宿主机网络,否则 DeepSpeed/vLLM 的多节点通信会卡死;--ipc=host解决 PyTorch 多进程通信问题。 - 📝 容器内操作示例(多卡推理):
git clone https://developer.sourcefind.cn/codes/OpenDAS/vllm_cscc.git cd vllm_cscc pip install -e . # 启动 4 卡推理服务 python -m vllm.entrypoints.openai.api_server --model /path/to/model --tensor-parallel-size 4
方案三:信创 KylinV10 环境(国产化政企机房)
💡 适用场景:严格要本国产生态(银河麒麟 OS + 飞桨/PyTorch)、ARM 或 x86 信创服务器部署。
- 🐳 推荐基础镜像:飞桨官方 DCU 信创镜像
ccr-2vdh3abv-pub.cnc.bj.baidubce.com/device/paddle-dcu:3.0.0-dtk24.04.1-kylinv10-gcc82-py310 - 🛠️ 推荐搭配 OpenDAS 项目:
- Paddle:飞桨主框架,配合 PaddleSeg/PaddleDetection 等套件。
- FastPT:将旧有基于 CUDA 的预测代码快速编译适配到 DCU 环境。
- dcu_env_check:信创环境驱动版本繁杂,排障第一工具。
- 🚀 容器启动命令:
docker run -it --privileged \ --device=/dev/kfd --device=/dev/dri --group-add video \ -v /opt/hyhal:/opt/hyhal:ro \ --security-opt seccomp=unconfined \ ccr-2vdh3abv-pub.cnc.bj.baidubce.com/device/paddle-dcu:3.0.0-dtk24.04.1-kylinv10-gcc82-py310 \ /bin/bash避坑提示:KylinOS 默认的 SELinux/Seccomp 安全策略比 Ubuntu 严格,可能导致容器内无法正常调用底层算力,建议加上
--security-opt seccomp=unconfined或在宿主机放行相关策略。 - 📝 容器内操作示例(飞桨训练):
# 验证飞桨 GPU 可用性 python -c "import paddle; print(paddle.device.get_device())" # 应输出 gpu:0 或 xpu:0
🎁 终极避坑锦囊(适用于所有方案)
- 权限问题:如果在容器内执行
hy-smi报Permission denied,说明--group-add video没生效,检查宿主机/dev/dri/render*的组权限。 - 驱动不匹配:容器内的 DTK 版本必须 ≤ 宿主机安装的 DCU 驱动版本,否则容器启动会报
Failed to get HSA KFD等错误。 - 挂载缺失:漏挂
-v /opt/hyhal:/opt/hyhal:ro是最常见的新手错误,容器能启动但算力为 0。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)