一、Ollama部署本地大模型

1.1、Ollama介绍

Ollama是一个用于在本地运行大语言模型(LLM)的工具与平台,旨在让开发者和个人在自己的机器或私有服务器上安全、低延迟地部署和使用大模型。下面是关键点总结:

  • 核心功能
    • 在本地或私有基础设施上下载、托管并运行 LLM(例如开源模型),避免把数据发送到第三方云服务。
    • 提供模型管理(安装、升级、版本控制)和运行时接口(API / CLI),便于集成到应用中。
    • 支持推理(inference)、对话(chat)和嵌入向量等常见 LLM 功能。
  • 优点
    • 隐私与数据控制:数据保留在本地,适合对隐私或合规有高要求的场景。
    • 低延迟:本地推理减少网络往返,响应更快。
    • 成本可控:避免持续云推理费用(token),成本取决于硬件与维护。
  • 限制与要求
    • 需要较强的本地硬件(GPU/显存)用于较大模型的推理;轻量或量化模型可在较弱设备上运行。
    • 模型、加速库(如 CUDA)、依赖环境配置可能较复杂。
    • 功能和模型生态比不上大型云厂商托管的服务(可通过社区模型与工具弥补)。

1.2、Ollama的安装

下载网址:https://ollama.com/download

Ollama支持macOS,Linux和Windows系统。(下面以在Windows上安装为例)

image.png

默认安装即可。

1.3、下载模型

  • 打开Ollama,更改配置

    image.pngimage.png

  • 下载模型(以qwen2.5为例)

    image.png

    image.png

    等待下载完即可。

1.4、Ollama核心命令

  • 查看ollama的版本

    ollama -v
    

    image.png

  • 查看本地有那些模型

    ollama list
    

    image.png

  • 下载一个模型

    ollama pull qwen2.5
    
  • 直接进行聊天

    ollama run qwen2:5
    

    image.png

    • 直接打字提问
    • 输入 /bye 退出
    • 输入 /list 看模型
    • 输入 /help 看帮助
  • 查看正在运行的模型

    ollama ps
    

    image.png

  • 停止运行

    ollama stop qwen2.5
    

    image.png

  • 删除不用的模型

    ollama rm qwen2.5
    

1.5、将本地大模型接入Dify

进行插件功能配置

给Dify开启 插件功能 ,让 Dify 能安装、使用各种插件(包括连接本地Ollama大模型)。

进入之前下载的Dify文件夹打开 docker 文件夹,以记事本的形式打开docker-compose.yaml 文件(在修改之前先将这个文件复制一份到桌面,以免修改错误)

image.png

image.png

plugin_daemon:
    image: langgenius/dify-plugin-daemon:0.5.4-local
    restart: always
    networks:
      - default
    environment:
      SERVER_PORT: 5003
      SERVER_KEY: lsk-123456
      DIFY_INNER_API_URL: http://api:5001
      DIFY_INNER_API_KEY: lsk-123456
      DB_USERNAME: postgres
      DB_PASSWORD: difyai123456
      DB_HOST: db_postgres
      DB_PORT: 5432
      DB_DATABASE: dify
      REDIS_HOST: redis
      REDIS_PORT: 6379
      REDIS_PASSWORD: difyai123456
      STORAGE_TYPE: local
      STORAGE_LOCAL_PATH: /app/storage
      PLUGIN_PYTHON_ENV_INIT_TIMEOUT: 600
      PLUGIN_MAX_EXECUTION_TIMEOUT: 2400
      PIP_MIRROR_URL: https://pypi.tuna.tsinghua.edu.cn/simple
      UV_NO_REFLINK: 1
      PLUGIN_REMOTE_INSTALLING_HOST: http://plugin_daemon:5003
      PLUGIN_REMOTE_INSTALLING_PORT: 5003
      PLUGIN_WORKING_PATH: /app/storage/cwd
    ports:
      - "5003:5003"
    volumes:
      - ./storage:/app/storage
    depends_on:
      - api
      - db_postgres
      - redis

然后打开 .env 文件(以记事本形式)

image.png

在末尾加入

PLUGIN_DAEMON_URL=http://plugin_daemon:5003
PLUGIN_DAEMON_KEY=lsk-123456
PLUGIN_DAEMON_ENABLED=true

image.png

下载Ollama插件

打开Docker 启动Dify后,用浏览器打开dify后台页面

image.png

下载Ollama插件

image.png

image.png

image.png

可能会出现下载失败的情况,多下载几次就行了

image.png

配置Ollama本地大模型

image.png

image.png

  • 模型名称:填写在Ollama中下载的模型名称

  • 模型类型:LLM(大语言模型,一般填这个)

  • 基础URL:

    • 同一机器Docker部署:http://host.docker.internal:11434
    • 不同机器部署:http://x.x.x.x:11434 (x.x.x.x Ollama 所在电脑的局域网 IP)

image.png

测试本地模型

创建一个聊天助手

image.png

image.png

image.png

二、云端大模型API调用

2.1、什么是“云端大模型 API”

  • 定义:通过云服务提供的大规模预训练模型(如对话/生成模型、文本理解、图像生成等)的远程调用接口。开发者无需训练或部署模型,只需通过 HTTP/gRPC 等方式发送输入并获取模型输出。
  • 优势
    • 无需自行训练、维护底层基础设施
    • 可按需扩展,低启动成本
    • 快速集成到业务系统(客服、搜索、文档处理、生成内容等)
  • 局限
    • 网络延迟与带宽依赖
    • 成本随使用量增长
    • 对敏感数据需注意隐私与合规

2.2、获取云端大模型

下面将以两个平台为例来进行API调用

  • Deepseek:需要小额付费
  • 阿里云百炼平台:有免费额度
Deepseek

DeepSeek官网:https://www.deepseek.com/

image.png
登录API开放平台
image.png

image.png

image.png

image.png

将这个key复制

阿里云百炼

阿里云大模型服务平台:https://www.aliyun.com/product/bailian

image.png

登录后进行实名认值

获取API Key:https://bailian.console.aliyun.com/cn-beijing/?tab=model#/api-key

image.png

2.3、将云端大模型接入Dify

下载插件

在Dify后台页面下载 OpenAI-API-compatible 插件

image.png

配置DeepseekAPI

deepseekapi配置文档:https://api-docs.deepseek.com/zh-cn/

image.png

image.png

image.png

image.png

API endpoint URL:https://api.deepseek.com

image.png

测试

image.png

配置千问云端模型

官方文档:https://bailian.console.aliyun.com/cn-beijing/?tab=doc#/doc

image.png

image.png

API endpoint URL:https://dashscope.aliyuncs.com/compatible-mode/v1

模型列表网址:https://help.aliyun.com/zh/model-studio/models

image.png

可以参考上面两个网址进行云端大模型的配置。

下面将以Qwen3.5为例进行配置
image.png

image.png
image.png
image.png

image.png

image.png

测试

image.png

至此本地大模型和云端大模型在Dify中的部署全部完成。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐