NVIDIA-ChatWithRTX安装环境图文教程

原创已于 2024-02-22 12:12:51 修改 · 1.4k 阅读

·

9

·

本内容遵循CC 4.0 BY-SA版权协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

标签

#chatgpt #AIGC #语言模型

于 2024-02-22 10:41:50 首次发布

本文介绍了如何在NVIDIA官网下载并配置ChatWithRTX环境，包括硬件需求、科学代理设置、安装步骤，以及中文兼容性的注意事项。特别提到内存调整和中文模型的支持方法。

Step3-VL-10B-Base阶跃星辰轻量级多模态基础模型

Step3-VL-10B-Base阶跃星辰轻量级多模态基础模型

Llama

文本生成

图像识别

视觉理解：图像识别、OCR、实体定位、计数、空间理解、GUI 交互多模态推理：看图问答、图文理解、复杂逻辑推理（STEM、数学、代码）

https://www.nvidia.cn/ai-on-rtx/chat-with-rtx-generative-ai/

首先到官网下载ChatWithRTX环境包(35G)

解压缩后运行

确认硬件满足安装环境需求：

Win11/RTX3000&4000显卡8G+显存/16G+内存/显卡驱动535.11+

硬件条件不满足会提示

卡在此处需要科学代理

Llama2 安装失败切换代理多尝试几次

安装完成点击运行，桌面会有快捷方式

运行也需要科学代理

没有联网会提示连接目标计算机失

初次运行成功后会浏览器打开界面，后台有提示报错，需要打开

\RAG\trt-llm-rag-windows-main\ui\user_interface.py 文件第256-257行处添加share=True,

保存后重启即可运行

llama13b.nvi 显存不够的将这个文件里的15改成比显存低的数值

7B占用7G显存

13B占用10G显存

将需要学习的文档放到这个路径下
\RAG\trt-llm-rag-windows-main\dataset

实测目前默认DEMO环境仅支持英文，可以用中文提问，但不是很兼容中文问答

想支持中文模型可参考其他大佬魔改教程

您可能感兴趣的与本文相关的镜像

Step3-VL-10B-Base阶跃星辰轻量级多模态基础模型

Step3-VL-10B-Base阶跃星辰轻量级多模态基础模型

Llama

文本生成

图像识别

视觉理解：图像识别、OCR、实体定位、计数、空间理解、GUI 交互多模态推理：看图问答、图文理解、复杂逻辑推理（STEM、数学、代码）

博客等级

码龄15年

1
原创

9
点赞

15
收藏

142
粉丝

关注

私信

大家在看

TA的历史创作历程

官方同款运行环境

Step3-VL-10B-Base阶跃星辰轻量级多模态基础模型

视觉理解：图像识别、OCR、实体定位、计数、空间理解、GUI 交互多模态推理：看图问答、图文理解、复杂逻辑推理（STEM、数学、代码）

Llama

文本生成

图像识别

OCR

PDF

Step3-VL

显存大小

24GB

CPU

10核心

内存

120GB

系统盘/数据盘

40GB

无需本地环境部署，可直接运行

· AI 阅读助手

目录

展开全部

收起

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Goic 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。