LLM推理部署（四）：一个用于训练、部署和评估基于大型语言模型的聊天机器人的开放平台FastChat

最新推荐文章于 2025-06-23 23:40:05 发布

原创

最新推荐文章于 2025-06-23 23:40:05 发布 · 3.4k 阅读

标签

#语言模型 #机器人 #人工智能

FastChat是一个开源平台，提供SOTA对话模型如Vicuna和FastChat-T5，支持分布式部署和实时反馈收集。文章详细介绍了其安装、聊天应用、命令行推理、WebGUI服务、模型评估以及微调的过程和相关技术细节。

FastChat是用于对话机器人模型训练、部署、评估的开放平台。体验地址为：https://chat.lmsys.org/，该体验平台主要是为了收集人类的真实反馈，目前已经支持30多种大模型，已经收到500万的请求，收集了10万调人类对比大模型的数据，可以在排行榜（https://huggingface.co/spaces/lmsys/chatbot-arena-leaderboard）进行查看。

FastChat核心特性包括：

提供了SOTA模型（比如Vicuna，FastChat-T5）的模型权重，训练代码，评估代码；
分布式多模型部署系统，自带Web UI和OpenAI兼容的RESTful APIs。

一、FastChat安装

方法一：pip安装

pip3 install "fschat[model_worker,webui]"

方法二：源码安装

Step1 克隆源码并切换到对应的目录下

git clone https://github.com/lm-sys/FastChat.gitcd FastChat

如果是mac，还需要执行如下代码

brew install rust cmake

Step2 安装相关的包

pip3 install --upgrade pip  # enable PEP 660 supportpip3 install -e ".[model_worker,webui]"

二、FastChat聊天应用

下面展示一下不同模型以及不同大小启用聊天功能

Vicuna模型

模型大小	聊天命令	Hugging Face
7B	`python3 -m fastchat.serve.cli --model-path lmsys/vicuna-7b-v1.5`	lmsys/vicuna-7b-v1.5
7B-16k	`python3 -m fastchat.serve.cli --model-path lmsys/vicuna-7b-v1.5-16k`	lmsys/vicuna-7b-v1.5-16k
13B	`python3 -m fastchat.serve.cli --model-path lmsys/vicuna-13b-v1.5`	lmsys/vicuna-13b-v1.5
13B-16k	`python3 -m fastchat.serve.cli --model-path lmsys/vicuna-13b-v1.5-16k`	lmsys/vicuna-13b-v1.5-16k
33B	`python3 -m fastchat.serve.cli --model-path lmsys/vicuna-33b-v1.3`	lmsys/vicuna-33b-v1.3