实战匠坊

由百川智能开发的一个开源可商用的大规模预训练语言模型

Baichuan-7B

地址：https://github.com/baichuan-inc/Baichuan-7B

基于Transformer结构，在大约1.2万亿tokens上训练的70亿参数模型，支持中英双语，上下文窗口长度为4096。在标准的中文和英文权威benchmark（C-EVAL/MMLU）上均取得同尺寸最好的效果。

Baichuan-13B

https://github.com/baichuan-inc/baichuan-13B

Baichuan-13B 是由百川智能继 Baichuan-7B 之后开发的包含 130 亿参数的开源可商用的大规模语言模型，在权威的中文和英文 benchmark 上均取得同尺寸最好的效果。该项目发布包含有预训练 (Baichuan-13B-Base) 和对齐 (Baichuan-13B-Chat) 两个版本。

Baichuan2

地址：https://github.com/baichuan-inc/Baichuan2

采用 2.6 万亿 Tokens 的高质量语料训练，在多个权威的中文、英文和多语言的通用、领域 benchmark上取得同尺寸最佳的效果，发布包含有7B、13B的Base和经过PPO训练的Chat版本，并提供了Chat版本的4bits量化。

Baichuan-7B ​

Baichuan-13B ​

Baichuan2 ​

Baichuan-7B

Baichuan-13B

Baichuan2