ollama-python-Python快速部署Llama 3等大型语言模型最简单方法

ollama

启动并运行 Llama 2、Mistral、Gemma 和其他大型语言模型。

项目地址：https://gitcode.com/gh_mirrors/oll/ollama

免费下载资源

功城师

1726人浏览 · 2024-06-16 14:00:00

功城师 · 2024-06-16 14:00:00 发布

ollama介绍

在本地启动并运行大型语言模型。运行Llama 3、Phi 3、Mistral、Gemma和其他型号。

Llama 3

Meta Llama 3 是 Meta Inc. 开发的一系列最先进的模型，提供8B和70B参数大小（预训练或指令调整）。

Llama 3 指令调整模型针对对话/聊天用例进行了微调和优化，并且在常见基准测试中优于许多可用的开源聊天模型。

在这里插入图片描述

安装



`pip install ollama`

用法

import ollamaresponse = ollama.chat(model='llama2', messages=[  {    'role': 'user',    'content': 'Why is the sky blue?',  },])print(response['message']['content'])

流式响应

可以通过设置stream=True、修改函数调用以返回 Python 生成器来启用响应流，其中每个部分都是流中的一个对象。



`import ollama``   ``stream = ollama.chat(`    `model='llama2',`    `messages=[{'role': 'user', 'content': 'Why is the sky blue?'}],`    `stream=True,``)``   ``for chunk in stream:`  `print(chunk['message']['content'], end='', flush=True)`

应用程序编程接口

Ollama Python 库的 API 是围绕Ollama REST API设计的

聊天



`ollama.chat(model='llama2', messages=[{'role': 'user', 'content': 'Why is the sky blue?'}])`

新增



`ollama.generate(model='llama2', prompt='Why is the sky blue?')`

列表

ollama.list()

展示



`ollama.show('llama2')`

创建



`modelfile='''``FROM llama2``SYSTEM You are mario from super mario bros.``'''``   ``ollama.create(model='example', modelfile=modelfile)`

复制



`ollama.copy('llama2', 'user/llama2')`

删除



`ollama.delete('llama2')``Pull``ollama.pull('llama2')``push``ollama.push('user/llama2')`

嵌入



`ollama.embeddings(model='llama2', prompt='The sky is blue because of rayleigh scattering')`

定制客户端

可以使用以下字段创建自定义客户端：

host：要连接的 Ollama 主机
timeout: 请求超时时间



`from ollama import Client``client = Client(host='http://localhost:11434')``response = client.chat(model='llama2', messages=[`  `{``'role': 'user',``'content': 'Why is the sky blue?',`  `},``])`

异步客户端



`import asyncio``from ollama import AsyncClient``   ``async def chat():`  `message = {'role': 'user', 'content': 'Why is the sky blue?'}`  `response = await AsyncClient().chat(model='llama2', messages=[message])``   ``asyncio.run(chat())`

设置stream=True修改函数以返回 Python 异步生成器：



`import asyncio``from ollama import AsyncClient``   ``async def chat():`  `message = {'role': 'user', 'content': 'Why is the sky blue?'}``async for part in await AsyncClient().chat(model='llama2', messages=[message], stream=True):`    `print(part['message']['content'], end='', flush=True)``   ``asyncio.run(chat())`

错误

如果请求返回错误状态或在流式传输时检测到错误，则会引发错误。

model = 'does-not-yet-exist'try:  ollama.chat(model)except ollama.ResponseError as e:  print('Error:', e.error)if e.status_code == 404:    ollama.pull(model)

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述