开源大语言模型(LLM)汇总(持续更新中)
开源大语言模型(LLM)汇总
随着ChatGPT的火爆,越来越多人希望在本地运行一个大语言模型。为此我维护了这个开源大语言模型汇总,跟踪每天不发的大语言模型和精调语言模型。
我将根据个模型采用的基础大模型进行分类,每个大模型下列出各派生模型。
文章目录
- Alpaca (Stanford)
- Alpaca.cpp
- Alpaca-LoRA
- Baize
- Cabrita
- BELLE
- Luotuo
- Vicuna (FastChat)
- Chinese-Vicuna
- GPT4All
- Koala
- llama.cpp
- Lit-LLaMA ️
- BLOOM (BigScience)
- BLOOM-LoRA
- Petals
- Flamingo (Google/Deepmind)
- Flamingo — Pytorch
- OpenFlamingo
- FLAN (Google)
- Flan-Alpaca
- Flan-UL2
- GLM (General Language Model)
- GLM-130B
- ChatGLM-6B
- GPT-J (EleutherAI)
- Dolly (Databricks)
- Cerebras-GPT (Cerebras)
- GPT-NeoX
- HuggingGPT
- Polyglot
- Pythia
- Segment Anything
- The RWKV Language Model
- XGLM
Alpaca (Stanford)
斯坦福Alpaca:一种指令遵从型 LLaMA 模型。
-
开源大语言模型(LLM)汇总(持续更新中)相关推荐
- YOLO 3/4/5/6/7/x、Efficient、MaskRcnn、FasterRcnn、FCOS、SSD、M2Det、Retina、CenterNet、PicoDet等系列数据模型汇总持续更新中
做了很长时间的CV领域的任务了,见到了很多不错的项目,很多时候也是会选择直接拿来开源的项目去使用,自己也做过了很多项目,后面就萌生了一个想法,将看到的不错的文章或者是数据集或者是项目汇总记录一下,以便 ...
- 技术问题收集整理汇总——持续更新中...
此文章的目的是收集自己在网上看到的不错的文章或帖子,并将这些文章的索引统一收集在这里,并持续更新中....大家有好的东西也可以分享过来哦! 1.关于java为什么要使用继承(或java使用继承有什么用 ...
- 软件编程学习网站汇总——持续更新中
持续更新各种国内外关于编程语言学习及讨论的网站,有时间我会添加介绍,不过相信很多网站你们都熟悉了,喜欢的可以收藏,我也留着等以后需要的时候翻阅. 若链接有错误,提醒我下,我来改正.有其他好的站也可以推 ...
- 大数据组件需要额外添加的依赖包汇总(持续更新中)
现在FLINK已经被阿里收购了,所以会有blink的jar包 大数据组件 依赖包来源 具体的依赖包 Hadoop3.1.2 用户添加 javax.ws.rs-api-2.0-m11.jar jerse ...
- 大数据Notebook调研信息汇总(持续更新中)
大数据组件 支持Spark 支持Flink 支持最新版大数据组件 备注 Zeppelin ✓ ✓ X 大概消耗1.3G内存 Jupyter ✓ 必须导入alink才支持 ✓ Databricks ...
- 大数据集群中数据互相导通流程汇总(持续更新中)
X:原理上不存在这种流程或者没有必要. 加粗:数据库或数据仓库 非加粗:表示文件格式 ☆:表示重点,正在整理中 左侧列:数据源头 上侧行:数据传递终点 Hbase HDFS json txt My ...
- Java知识点汇总 持续更新中~~~
一.什么是面向对象? 是基于面向过程而言,面向对象是将功能通过对象来实现,将功能封装进对象之中,让对象去实现具体的细节. 二.标识符的格式? 1.可以使用字母.数字._.$来组成,不能使用特殊符号. ...
- [Linux] Linux指令汇总(持续更新中...)
写在前面: 以前真心没有玩过Linux系统,总感觉整天摆弄Linux的同学都是大牛.如今,在公司里实习需要远程登录Linux服务器,所有的代码都要在开发板上完成,所以被逼无奈也不得不定下心来好好学学L ...
- LeetCode All in One 题目讲解汇总(持续更新中...)
原文地址:https://www.cnblogs.com/grandyang/p/4606334.html 终于将LeetCode的大部分题刷完了,真是漫长的第一遍啊,估计很多题都忘的差不多了,这次开 ...
最新文章
- JavaScript获取鼠标左键选中的内容
- iPhone:文本设计的注意事项
- 优秀!腾讯AI Lab开源模型压缩与加速框架PocketFlow!
- iOS版本更新的方法
- php命令模式,老生常谈PHP面向对象之命令模式(必看篇)
- android+桌面组件开发,Android桌面小部件开发,及注意事项
- 关于tomcat启动的错误:Error running... jmxremote.access
- 将m3u8文件转MP4、TS、flv、mkv等文件
- 【Web3】什么是Web3?一个新的去中心化网络,或是最新的营销流行语
- vr全景视频是如何拍摄的呢,商家为何要进行拍摄全景
- 商城项目15_采购需求、合并采购单、领取采购单、完成采购、仓库流程图
- 基于STM32指纹密码锁设计
- Android Home键按键事件监听
- 从经济学角度解读人工智能
- 图解“管道过滤器模式”应用实例:SOD框架的命令执行管道
- PE工具制作/装机U盘制作
- 简析金融IT行业发展前景
- 华为荣耀平板s8-701w刷机记
- 安卓gps北斗搜星源码和导航工具支持安卓12无广告
- 已知判断闰年的规则是:能被4整除,但是不能被100整除。或者能被400整除。打印从1900年至2050年期间所有的闰年。
热门文章
- 原码、反码、补码运算规则
- 爬取全民K歌主页上的歌
- Mercurial hg轻量级分布式版本控制系统
- ESP8266开发之旅 进阶篇⑤ 代码规范 —— 像写文章一样优美
- 哈夫曼树(一)基本概念与C语言实现
- (基于安卓app开发的毕业设计)智能手机图片管理.(附源码+论文)
- C++ P0003--孪生素数
- highstock,highchart ,polt lines on Y axis
- 相对位置编码,绝对位置编码代码pytorch实现
- 输入框回车多个文本_Excel回车键的五大高效率操作,80%人还被蒙在鼓里
- YOLO 3/4/5/6/7/x、Efficient、MaskRcnn、FasterRcnn、FCOS、SSD、M2Det、Retina、CenterNet、PicoDet等系列数据模型汇总持续更新中