[NLP/AIGC] 大语言模型:零一万物

千千寰宇 / 2024-09-13 / 原文

1 概述:零一万物 - 首款开源中英双语大模型

公司背景

  • 公司名称:零一万物(01.AI)
  • 创始人:李开复博士(知名投资人、创新工场董事长兼CEO)

产品介绍

  • 产品名称:Yi 系列大模型
    • Yi-6B:数据参数量为60亿的双语(英文/中文)开源模型
    • Yi-34B:数据参数量为340亿的双语(英文/中文)开源模型,全球多项评测基准中领先

Yi-34B 模型亮点

  • 全球领先:在多项评测中取得SOTA(国际最佳性能)指标,英文和中文权威排行榜榜首
  • 成本效益:基于超强Infra下模型训练成本实测下降40%,模拟千亿规模训练成本可下降多达50%
  • 超长上下文:支持200K超上下文窗口,能够处理大约40万汉字的超文本输入
  • 功能丰富:支持通用聊天、问答、对话、写作、翻译等功能

官方资源

  • Github开源地址
  • https://github.com/01-ai/Yi
  • 项目地址
  • https://www.lingyiwanwu.com/
  • 免费试用
  • Hugging Face
  • ModelScope

论文与API

  • 论文地址:https://arxiv.org/abs/2403.04652
  • API开放平台:https://platform.lingyiwanwu.com/

模型特性

  • Yi-34B-Chat-0205:支持通用聊天、问答、对话、写作、翻译等功能
  • Yi-34B-Chat-200K:超长上下文版本,适合多篇文档内容理解、海量数据分析挖掘和跨领域知识融合
  • Yi-VL-Plus:多模态模型,支持文本、视觉多模态输入,中文图表体验超过GPT-4V

应用场景

  • 专业书籍翻译:如《机器学习工程》电子书,一天内完成264页翻译
  • 金融分析:快速阅读报告并预测市场趋势
  • 法律解读:精准解读法律条文
  • 科研辅助:高效提取论文要点

技术优势

  • 全球领跑:在MMLU等评测中取得多项SOTA性能指标
  • 模型尺寸轻巧:以更小模型尺寸评测超越大尺寸开源模型
  • 满足多元需求:Yi-6B适合个人及研究用途,Yi-34B适合多元场景
  • 免费商业授权:对学术研究完全开放,同步开放申请免费商业授权

用户体验

  • 超长上下文:提升模型理解深度,适合长篇文本处理
  • 多模态能力:支持图片、表格、图表等识别与理解,中文体验超过GPT-4V

部署与启动

  • 一键启动包:无需配置Python环境,简单点击即可启动
  • 步骤
    1. 下载压缩包并解压
    2. 根据显卡类型选择启动软件(NVIDIA、CPU、AMD)
    3. 点击Launch按钮并选择模型文件启动
    4. 在浏览器中访问 http://localhost:5001/ 免费使用

X 参考文献

  • 零一万物 – 首款开源中英双语大模型,本地部署包,免训练,免安装,李开复最快AI独角兽开源项目~ - 山鲸AI