Ubuntu如何使用Ollama运行AI大模型

最新推荐文章于 2026-03-27 10:10:09 发布

原创最新推荐文章于 2026-03-27 10:10:09 发布 · 243 阅读

4 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#人工智能

收录于

SmallThinker-3B-Preview

SmallThinker-3B-preview，这是一个从 Qwen2.5-3b-Instruct 模型微调而来的新模型。

Ollama（本地模型运行平台）

能运行：✅
能调优：❌（只能推理）
适用场景：开发、验证、快速体验
特点：一条命令跑模型，自带 API

“给本地开发者用的，一键跑大模型的运行平台”

它到底干了什么？

下载模型
自动量化
管 GPU / CPU
提供本地 API

用它不是在“跑模型”，而是在：用别人封装好的推理系统

工程定位

快速验证
模型对比
本地开发

如何使用Ollama

安装Ollama管理工具

curl -fsSL https://ollama.com/install.sh | sh

安装脚本检测到系统中安装了 NVIDIA GPU，意味着 ollama 可以利用 GPU 进行模型推理，提升性能

启动Ollama服务

ollama serve

运行qwen2.5:14b模型

ollama run qwen2.5:14b

提问AI时，观察显存占用率

watch -n 1 nvidia-smi

提问前

提问后

您可能感兴趣的与本文相关的镜像

SmallThinker-3B-Preview

文本生成

Ollama

Qwen

SmallThinker-3B-preview，这是一个从 Qwen2.5-3b-Instruct 模型微调而来的新模型。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

欣欣今天开心

关注关注

6
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Ubuntu 22.04系统如何让Ollama使用GPU运行LLM模型

学亮编程手记

06-24

2096

以 NVIDIA 为例，说明 Ollama GPU 模式运行大模型的具体操作。

参与评论您还未登录，请先登录后发表或查看评论

ubuntu部署ollama

Joemt

11-04

5487

离线部署大模型

保姆级教程：在Ubuntu 22.04服务器上离线部署Ollama并运行DeepSeek-R1模型

最新发布

weixin_29251131的博客

03-27

154

本文提供了一份详细的Ubuntu 22.04服务器离线部署Ollama并运行DeepSeek-R1模型的教程。涵盖从依赖分析、二进制包定制到生产级服务配置的全流程，特别针对离线环境中的依赖黑洞、版本锁定和安全加固等挑战提供了解决方案。通过静态编译打包、依赖树分析和沙盒测试等技术路线，确保部署的可靠性和安全性。

Ubuntu安装ollama，并运行ollama和通义千问，使用gradio做界面

lpcarl的专栏

11-16

2816

修改pip下载的源为国内源，这样下载的速度更快，注意这里的路径记得替换成自己电脑安装miniconda的路径。运行后，可以看到绑定了一个本地的端口7860，在浏览器中打开，就能看到对应的界面。前端我们使用python创建访问的接口，并使用gradio创建前端页面。在终端中打入，如下命令可以查看本机安装的大模型。使用下面的命令，可以将相应的模型运行起来，接着打入粘贴上面的命令，回车后自动安装。接着打入粘贴上面的命令，回车后自动安装。可以看到，会出现绑定的端口11434。运行后，可以看到如下的输出，

Ubuntu server下使用Ollama+GPU+NVLink运行deepseek

weixin_53830825的博客

02-11

9190

本文将介绍： 1.如何在Ubuntu Server上安装Ollama并运行deepseek-r1模型。（CPU运行） 2.如何在Ubuntu server上安装nvidia驱动和CUDA。（GPU运行） 3.如何使用显卡NVLink。（多GPU+NVLink运行）

Ubuntu环境通过Ollama部署DeepSeek-R1模型教程

m0_37825219的博客

01-27

5674

Ubuntu环境通过Ollama部署DeepSeek-R1模型教程

ubuntu中 ollama 本地部署模型 llama.cpp本地部署

m0_37603703的博客

08-04

922

首先，访问 Ollama 官方提供的 Linux 下载链接来获取最新的 Ollama 版本。修改配置文件，允许其他客户端调用，默认情况下ollama只能在本机上调用。步骤 1: 下载 Ollama。

Ubuntu_Server22.04部署ollama+open-webui

weixin_53920456的博客

03-09

2463

思路：通过部署ollama和open-webui实现局域网拥有自己的本地deepseek大模型安装环境----操作系统：Ubuntu_Server22.04核显运行本地安装ollma，通过docker安装open-webui先安装好操作系统，参考文档。

【Llama3:8b】手把手教你如何在本地部署自己的 AI 大模型_本地部署ai大模型

Z4400840的博客

08-14

1052

AI时代本地部署大模型的必要性及解决方案在AI时代，本地部署大模型成为企业刚需：1）保障数据安全，避免核心数据外泄；2）实现垂直领域定制化需求。推荐采用Llama3:8b开源模型，配合Ollama框架部署，结合Llama.cpp进行量化优化，使用Unsloth进行训练微调。该方案具有低算力需求、优秀上下文记忆、灵活API接口等优势，支持本地训练保护数据隐私，是兼顾性能与安全的理想选择。（149字）

ollama系列01：轻松3步本地部署deepseek，普通电脑可用

weixin_40613100的博客

05-13

本文介绍了如何使用ollama本地部署DeepSeek等大模型，通过干货分享了ollama常用的指令，以及如何获取更多大模型。但是我们目前仍然只是在命令行使用大模型，非常的不友好。下一章我们将介绍如何摆脱命令行的束缚，将ollama集成到本地的AI工具中，实现聊天、自定义智能体等功能。👉关注我，持续分享AI工具，AI应用场景，AI学习资源❤️。

【Llama3:8b】手把手教你如何在本地部署自己的 AI 大模型 (◍•ᴗ•◍)

kaka0722ww的博客

08-14

752

【Llama3:8b】手把手教你如何在本地部署自己的 AI 大模型 (◍•ᴗ•◍)

拿到一台新服务器，怎么跑AI项目

q_q王的博客

07-01

374

咱们来装下conda，这是一个python环境管理工具，想跑AI项目，这个基本上是必备的了，能很好的帮助我们管理各个ai环境。家风不仅仅是一种行为，而且是潜藏在这种行为背后的，一个更底层的价值理念，是他们看待这个世界的态度。公司新采购一台AI服务器，花大本钱装了个A6000显卡，今天来记录下新服务的使用步骤。大家在使用的过程中有遇到什么问题，或者有什么想实现的欢迎留言，大家一起讨论学习。conda 的安装比较简单，一直回车，等需要输入的时候，输入yes即可。这个没装，没关系，咱们来着手安装下。

服务器Ubuntu22.04系统下 ollama的详细部署安装和搭配open_webui使用

m0_74824954的博客

12-12

4827

安装 NVIDIA Container Toolkit 软件包。查看自己服务器的业务端口，我们这里是30131-30140。按ESC键退出编辑模式，接着输入:wq，保存并退出。配置 Docker 以使用 Nvidia 驱动程序。使ollama保持模型加载在内存（显存）中。7.2 重新加载docker。这里示例下载阿里的通义千问。更新时间较长，请耐心等待。7.3 重启docker。7.1 编辑配置文件。重新启动docker。

如何在Ubuntu 20.04中使用NVIDIA RTX显卡加速AI推理任务，提升智能监控系统的实时响应能力？

A5数据

01-29

702

A5数据通过系统化地搭建Ubuntu 20.04 + NVIDIA RTX显卡 + TensorRT推理优化环境，能够显著提升智能监控系统的AI推理性能，实现更低延迟和更高吞吐。安装与验证NVIDIA驱动和CUDA平台使用TensorRT将模型转换为高性能推理引擎使用Flask/REST封装推理服务进行批量和并发场景性能基准测试这种架构不仅适用于目标检测，还可以推广到语义分割、人脸识别和轨迹预测等AI推理场景，为实际生产应用提供扎实的性能保障。

如何利用多张 GPU 高效运行 Ollama

weixin_44997264的博客

03-20

7868

通过以上步骤，我们可以确保系统尽可能地利用所有多张GPU 来运行 Ollama。如果在配置过程中遇到问题，建议查阅 Ollama 的官方文档，确认其是否支持多 GPU 并行计算，或者对系统性能进行进一步的优化。充分利用多 GPU 的并行计算能力，可以显著提升 Ollama 的运行效率，加快模型的推理和训练速度。希望本文能帮助你顺利实现多张 GPU 的高效利用。

ubuntu上应用ollama

油条不卖的博客

03-11

1780

③如果是通过ollama run 模型名称方式取运行本地不存在的模型，默认已经配置了不需要自己手动创建Modelfile进行配置，但是如果是自己手动转GGUF格式，转完格式后还需要创建Modelfile进行相关配置，配置的内容不固定，不同的模型不一样，详细可以参考B站视频【教程！测试多模型同时运行，打开多个命令窗口使用ollama run 模型名称运行同一模型或不同模型，看是否可以同时对话，还是只能等一个窗口对话完，另一个窗口才开始对话，如果可以同时对话则表示测试成功。

Ubuntu安装大模型LLama，实操步骤

05-20

1603

步骤很详细，需要科学上网。

Ubuntu安装配置Ollama并运行大模型

willhu2008的专栏

06-04

2440

Ollama 是一个开源项目，可以使用官网。这样就直接部署完成了，可以使用。于是直接访问github地址。下载完成后就可以输入对话了。命令查看安装版本进行验证。不过试过多次下载失败。

Ubuntu20.04部署Ollama

阿xin*的嵌入式AI

06-24

4020

Ubuntu Ollama安装llama3:8b，类OpenAI ChatGPT界面操作。