Meta宣布推出Llama 3 80亿和700亿参数版本,这标志着GPT4级模型开源自由访问时代的到来。
Llama 3在各项基准上超越竞争对手,包括超大杯Opus级别的4000亿参数版本。模型采用经典的解码式Transformer架构,训练数据规模达到15T tokens,采用分组查询注意力机制。
Llama 3在多个领域取得SOTA成绩,表现出色,但上下文窗口仅有8k,对比现有大模型略显不足。然而,开源社区对窗口长度扩展持乐观态度。
Llama 3已上线Hugging Face并得到多家云服务平台支持,同时发布了基于Llama 3的官方Web版本Meta AI。平台功能初级,不支持中文,但后续更新仍值得期待。

Meta宣布了Llama3模型,其800亿和700亿参数版本超越竞争对手,尤其在4000亿参数的Opus级别表现出色。尽管上下文窗口较小,但开源社区看好窗口扩展潜力。Llama3已在HuggingFace和部分云服务中可用,官方Web版MetaAI尚无中文支持,未来有望增强。

1070

被折叠的 条评论
为什么被折叠?



