ollama修改模型问答的上下文长度（num_ctx）

ollama

启动并运行 Llama 2、Mistral、Gemma 和其他大型语言模型。

项目地址：https://gitcode.com/gh_mirrors/oll/ollama

免费下载资源

羊城迷鹿

2167人浏览 · 2024-08-01 14:41:32

羊城迷鹿 · 2024-08-01 14:41:32 发布

文章目录

在使用ollama做大模型问答的过程中，发现存在着当输入问题过长之后，模型无法回答的问题。经过查询资料，这与一个叫做num_ctx的参数有关，它用来控制对话上下文的长度，在大模型动辄支持32k上下文的当下，ollama居然丧心病狂地把这个参数默认设成了2048也就是2.048k，真是叔可忍婶不可忍！

下面记录一下在尝试解决这个问题的过程中，最终成功的几种方法和失败的种种方案。

一劳永逸版：修改模型参数

ollama的每个模型都有个配置文件，这里需要在原基础上生成一个新的配置文件，再根据这个配置文件去生成新的模型，以qwen2为例走一遍流程。
首先获取qwen2的配置文件：

ollama show --modelfile qwen2 > Modelfile

此时本地多了一个Modelfile文件，直接打开。其内容是这样的：

# Modelfile generated by "ollama show"
# To build a new Modelfile based on this, replace FROM with:
# FROM qwen2:latest

FROM /usr/share/ollama/.ollama/models/blobs/sha256-43f7a214e5329f672bb05404cfba1913cbb70fdaa1a17497224e1925046b0ed5
TEMPLATE "{{ if .System }}<|im_start|>system
{{ .System }}<|im_end|>
{{ end }}{{ if .Prompt }}<|im_start|>user
{{ .Prompt }}<|im_end|>
{{ end }}<|im_start|>assistant
{{ .Response }}<|im_end|>
"
PARAMETER stop <|im_start|>
PARAMETER stop <|im_end|>

按照提示修改成这样：

# Modelfile generated by "ollama show"
# To build a new Modelfile based on this, replace FROM with:
# FROM qwen2:latest

FROM qwen2:latest
PARAMETER num_ctx 32000
TEMPLATE "{{ if .System }}<|im_start|>system
{{ .System }}<|im_end|>
{{ end }}{{ if .Prompt }}<|im_start|>user
{{ .Prompt }}<|im_end|>
{{ end }}<|im_start|>assistant
{{ .Response }}<|im_end|>
"
PARAMETER stop <|im_start|>
PARAMETER stop <|im_end|>
...

然后根据这个配置文件生成新的qwen2:ctx32k模型：

ollama create -f Modelfile qwen2:ctx32k

在这里插入图片描述
尝试查看模型参数：

ollama show qwen2:ctx32k

在这里插入图片描述

临时抱佛脚之命令行生效

这个很简单，直接在命令行中输入/set parameter num_ctx 32000，但是缺点是只能在命令行中生效，通过API调用是无效的，下次从命令行再启动也是要重新输的。
在这里插入图片描述

临时抱佛脚之API生效

通过API访问ollama时，传入num_ctx=32000这个参数来指定上下文长度，函数示例如下。

	def chat(self, messages :str, history:list[dict]=[], **kwargs):
        url = "http://{}:{}/api/chat".format(self.host, self.port)
        data = {
            "model": self.model_name,
            "messages": history+[
                {
                    "role": "user",
                    "content": messages
                }
            ],
            "stream": False,
            "options": {
            "num_ctx": 32000, 
            "temperature": 0.9
         },
            # "format": "json",
            "keep_alive": self.keep_alive
        }
        data.update(kwargs)
        response = requests.post(url, json=data, stream=False)
        response.raise_for_status()
        json_data = json.loads(response.text)
        return json_data["message"]

没啥卵用之OpenAI API传参

由于项目是基于OpenaiAPI的，所以不能直接向上面发送请求，而是要先封装成下面这种形式：

	model = ChatOpenAI(
        streaming=streaming,
        verbose=verbose,
        callbacks=callbacks,
        openai_api_key=config.get("api_key", "EMPTY"),
        openai_api_base=config.get("api_base_url", fschat_openai_api_address()),
        model_name=model_name,
        temperature=temperature,
        max_tokens=max_tokens,
        openai_proxy=config.get("openai_proxy"),
        **kwargs
    )

我尝试在里面再加入num_ctx=32000这个参数，直接报了无法解析的错误，失败。

没啥卵用之OpenAI 问答传参

因为不知道/set parameter num_ctx 32000这句话只能在命令行中生效，因此我尝试通过model.predict()和model.invoke()去传入这句话去修改参数，也失败了。

GitHub 加速计划 / oll / ollama

82.42 K

6.3 K

下载

启动并运行 Llama 2、Mistral、Gemma 和其他大型语言模型。

最近提交(Master分支：1 个月前 )

01b80e9f add conversion for microsoft phi 3 mini/medium 4k, 128k 1 个月前

bd5e4326 - 1 个月前

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

[转载]在Windows环境下安装GNU Radio

转自：在Windows环境下安装GNURadio_恐弱智_新浪博客GNU Radio是用Python开发的，大部分开源的工程能够在Linux环境下运行良好，而Windows下却运行的很勉强，而且安装配置都很复杂。GNU Radio算是个例外了，不光提供了Windows的二进制安装，还有比较详细的说明。我是Python小白，所以折腾了好久才弄好，特意记录下来，免得以后再装还折腾。GNU Radio的

GitCode 开源社区

centOS 8 使用dnf安装Docker

DNF是什么？CentOS 8使用YUM软件包管理器版本v4.0.4。现在，该版本使用DNF(已删除YUM)。DNF是软件包管理器。它会在Linux发行版上安装，执行更新并删除软件包。使用DNF安装Docker跳过具有损坏依赖性的程序包一个有效的解决方案是使您的CentOS 8系统使用以下--nobest命令安装最符合条件的版本：sudo dnf install docker...

GitCode 开源社区

定时同步数据库表(mysql+linux+crontab)

sync.sh里面的参数需要改变，ip/username/password/database/tablesync.sh#!/bin/sh# Please change the IP and password of the data source db.# Then change the table name.filename=/home/nington/db/$(date +%Y-%m