【基础岛·第1关】书生大模型全链路开源体系

三法师 / 2024-09-25 / 原文

目录
  • 过往一年历程
    • 1. 核心技术
    • 2.大海捞针实验
    • 3、人机解决方式的差别
  • 全链路开源生态
    • 1 数据
    • 2 开源数据处理工具箱
    • 3 预训练
    • 4 微调xtuner
    • 5 评测
    • 6 部署
    • 7智能体
    • 8项目

过往一年历程

image
7b可以应对中小企业业务,但20b才有涌现现象

1. 核心技术

image

2.大海捞针实验

超长文本内容中的问答正确度
image

3、人机解决方式的差别

image

全链路开源生态

image

1 数据

image

2 开源数据处理工具箱

image
label u很好用

3 预训练

image

4 微调xtuner

image

5 评测

image

6 部署

image

7智能体

image
image

8项目

mindsearch对人脑思路模拟的可视化
茴香豆项目