文章目录
一、计划
现在大模型比较多,平时需要调试对比,就把这些大模型简单一个收集。
不断收集,不断学习
目前,开原模型较多,一些能力弱的,没啥意义
基座模型通常指的是一个通用的、预先训练好的语言模型,如GPT-3.5。这种模型在各种自然语言处理任务中表现出色,可以用作其他更具体任务的基础。对话模型则是专门针对对话系统设计的模型,用于理解和生成对话。这些模型通常会在大规模对话数据上进行预训练,以便更好地理解和生成自然对话。
在实际场景中,通常会使用基座模型进行微调,以适应特定的任务或领域。基座模型已经在大规模的通用语言数据上进行了预训练,因此可以作为一个良好的起点,然后通过微调来使其适应特定的应用场景。
对话模型通常已经在对话数据上进行了预训练,因此在构建对话系统或进行对话相关的任务时,可以使用对话模型进行微调,以使其更好地理解和生成自然对话。
无论是使用基座模型还是对话模型进行微调,都需要根据具体的应用场景和任务需求来选择合适的模型,并进行相应的微调工作
二、模块划分
github大模型汇总项目
目前主流大模型汇总
简介:整理开源的中文大语言模型,以规模缩小、可试点化部署、成本降低的模型为主,包括基础模型、垂直领域调整及应用、数据集与等教程。
1. nlp领域
(1). ChatGLM-6B
- ChatGLM-6B
- ChatGLM2-6B
- GLM2-6b 的第三方下载地址
- GLM2-6b int4 第三方下载
- GLM2-6b-32k 第三方下载
- GLM2-6b-32k-int4 下载
- GLM-6b 的第三方下载地址
- GLM-6b-int8 的第三方下载地址
- GLM-6b-int4 的第三方下载地址
ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上,ChatGLM2-6B 引入了如下新特性:
(2). LLaMA
Chinese-Llama-2系列-三方下载
Atom-7B-Chat-三方下载
Chinese-7b-Chat-三方下载
Llama2-Chinese-13b-Chat-三方下载
Llama2-Chinese-13b-Chat-4bit
本项目开源了中文LLaMA模型和指令精调的Alpaca大模型,以进一步促进大模型在中文NLP

本文整理了开源的大语言模型,包括ChatGLM、LLaMA、Mistral系列,以及在信息抽取、知识图谱构建和语音识别方面的应用。此外,还介绍了模型下载的常见方法,如HuggingFace、阿里ModelScope和国内镜像站点。
&spm=1001.2101.3001.5002&articleId=131661634&d=1&t=3&u=f8cd8586cae84bb6ae0930bc50306ae8)
1万+

被折叠的 条评论
为什么被折叠?



