从远程机器通过 Python 调用 本地部署Ollama 大模型服务

本文主要介绍了如何在其他的电脑上调用局域网内部署的 Ollama大模型,本人在ubuntu 系统上部署了 qwen3.5:0.8b ,现用一台windows 电脑进行调用ubuntu电脑上的 qwen3.5:0.8b模型

1.安装Ollama

curl -fsSL https://ollama.com/install.sh | sh

执行这条脚本会完成下面这些事项:

  1. 下载最新的 Ollama。
  2. 自动创建 /usr/lib/systemd/system/ollama.service
  3. 自动启用并启动服务

在ubuntu 系统上安装ollama后,运行下面命令部署  qwen3.5:0.8b模型

ollama run qwen3.5:0.8b

​

配置 Ollama 监听所有网络接口

Ollama 默认只监听 127.0.0.1:11434(仅本机可访问),需要改为监听 0.0.0.0

创建 override 文件

sudo mkdir -p /etc/systemd/system/ollama.service.d

sudo tee /etc/systemd/system/ollama.service.d/override.conf << 'EOF'
[Service]
Environment="OLLAMA_HOST=0.0.0.0:11434"
EOF

sudo systemctl daemon-reload
sudo systemctl restart ollama

确保防火墙放行

# 如果用的是 ufw
sudo ufw allow 11434/tcp

验证

# 2. 查看实际生效的环境变量
systemctl show ollama.service --property=Environment
# 应该输出: Environment=OLLAMA_HOST=0.0.0.0:11434

# 3. 查看监听地址
ss -tlnp | grep 11434
# 应该输出: 0.0.0.0:11434  而不是  127.0.0.1:11434

另一台机器上用 Python 调用:

import requests

OLLAMA_HOST = "http://<服务器IP>:11434"

# --- 非流式调用 ---
def chat(prompt: str) -> str:
    resp = requests.post(
        f"{OLLAMA_HOST}/api/chat",
        json={
            "model": "qwen3.5:0.8b",
            "messages": [{"role": "user", "content": prompt}],
            "stream": False,
        },
    )
    resp.raise_for_status()
    return resp.json()["message"]["content"]

print(chat("用一句话介绍你自己"))

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值