基于 ollama 下载，部署AI 大模型提供API 服务

lshan / 2024-09-21 / 原文

1. 下载 ollama https://ollama.com/

2. 安装完成后，没有操作界面（只能CLI）

3. 检测安装是否成功 ollama --version

4.常用命令： ollama help

修改默认模型下载位置：

‌概述‌：Ollama默认将模型保存在‌C盘（‌Windows）、~/.ollama/models（‌MacOS）或/usr/share/ollama/.ollama/models（‌Linux）。
为了解决C盘空间不足的问题，可以通过设置环境变量OLLAMA_MODELS来修改模型存储位置。

‌Windows系统‌：（系统变量）
设置环境变量OLLAMA_MODES，例如E:\ollama\models。
重启Ollama或PowerShell，使设置生效。
‌MacOS系统‌：

通过设置环境变量OLLAMA_MODELS，例如~/ollama/models。
重启Ollama服务。
‌Linux系统‌：

创建新目录并设置权限，例如sudo mkdir /path/to/ollama/models。
编辑ollama.service文件，添加环境变量OLLAMA_MODELS。
重启ollama服务。

5.下载模型： https://ollama.com/library

命令：

ollama run    llama3.1

完成后即可问答了

6. 运行模型提供API

6.1 安装代理服务：

创建新的虚拟环境
python -m venv  D:/ollama
激活环境：

ollama/Scripts/active.bat

(ollama)>  pip install litellm

              pip install litellm[proxy]

(提供代理服务)

6.2 运行模型，提供服务：

litellm --model  ollama/llama3.1

基于 ollama 下载，部署AI 大模型提供API 服务更多相关文章

今日报告-66

设置Windows10暂停更新3000天

AQS公平锁的流程

AMD锐龙7 7800X3D网游专项测试：竟比i9-13900KS强了15%

常用总线技术基本参数对比

探索图像数据中的隐藏信息：语义实体识别和关系抽取的奇妙之旅

设置Chrome浏览器自动升级

JavaScript – 小技巧 Tips

postgresql在插入数据后怎么获取自增id

EF Core 的基本使用

error: failed to push some refs to 'https://github.com/*******/********.github.io.git'

欧拉降幂

编程语言能力对比

基于机器视觉的小车轨迹控制软件界面展示

随机推荐

Fiddler抓包Android7以内版本

AJAX & AXIOS-2024/11/1

验证码处理在自动化测试中的应用

一些学科笑话

NOIP2024模拟赛20 & 11.1 小记

20241101 数据结构与算法期中机试收获

Java，启动！

什么是IT技术

即将到来！

2024/11/1日日志关于JavaScript简介&引入方式以及基础语法的学习

舍得-时间-工作是人的一生最重要的事情-自己要有私房钱-人的一生最重要的事情是书写自己的人生

2.TiUP 部署 DM 集群

原型模式的C++实现

python bytecode解析

09-XSS键盘监听、cookie窃取&文件上传绕过

基于 ollama 下载，部署AI 大模型 提供API 服务

基于 ollama 下载，部署AI 大模型 提供API 服务更多相关文章

随机推荐

热门话题

基于 ollama 下载，部署AI 大模型提供API 服务

基于 ollama 下载，部署AI 大模型提供API 服务更多相关文章