LLaMA需要进行申请才能获得官方模型权重。

但是申请的审批时间一般都很长。

这里提供现有的huggingface上,第三方上传的一些LLaMA模型文件:

  • LLaMA-7B
  • LLaMA-13B
  • LLaMA-7B-hf
  • LLaMA-13B-hf

这里要注意,原始的LLaMA权重文件,是不能直接调用huggingface的transformers库进行使用的

如果要使用huggingface transformer训练LLaMA,需要使用额外的转换脚本(具体详见huggingface官网指南),把上述的LLaMa-xx进行额外的转换;或者使用上述已经被转换好的LLaMA-xx-hf.


另外,LLaMA的在不同版本huggingface中的模型类名也不同:LlamaLLaMA。。。(大致见如下)

建议提前确认自己的huggingface版本。参考报错:ValueError: Tokenizer class LLaMATokenizer does not exist or is not currently imported. #22222

LLaMA模型文件 (搬运工)相关推荐

  1. xBIM 实战01 在浏览器中加载IFC模型文件

    系列目录    [已更新最新开发文章,点击查看详细]  一.创建Web项目 打开VS,新建Web项目,选择 .NET Framework 4.5  选择一个空的项目 新建完成后,项目结构如下: 二.添 ...

  2. 查看tensorflow pb模型文件的节点信息

    查看tensorflow pb模型文件的节点信息: import tensorflow as tf with tf.Session() as sess:with open('./quantized_m ...

  3. Tensorflow:TF模型文件(checkpoint文件夹下ckpt文件之data、index、meta)保存、模型导入、恢复并fine-tuning之详细攻略

    Tensorflow:TF模型文件(checkpoint文件夹下ckpt文件之data.index.meta)保存.模型导入.恢复并fine-tuning之详细攻略 目录 保存TF训练好的模型 1.T ...

  4. ML之模型文件:机器学习、深度学习中常见的模型文件(.h5、.keras)简介、h5模型文件下载集锦、使用方法之详细攻略

    ML之模型文件:机器学习.深度学习中常见的模型文件(.h5..keras)简介.h5模型文件下载集锦.使用方法之详细攻略 目录 ML/DL中常见的模型文件(.h5..keras)简介及其使用方法 一. ...

  5. ModelFileType:XML、Hdf5、dat等不同模型文件后缀文件的简介、使用方法之详细攻略

    ModelFileType:XML.Hdf5.dat等不同模型文件后缀文件的简介.使用方法之详细攻略 目录 一.XML文件 XML简介 XML使用方法 二.HDF5文件 HDF5简介 HDF5常见文件

  6. TF之TFOD-API:基于tensorflow框架利用TFOD-API脚本文件将YoloV3训练好的.ckpt模型文件转换为推理时采用的.pb文件

    TF之TFOD-API:基于tensorflow框架利用TFOD-API脚本文件将YoloV3训练好的.ckpt模型文件转换为推理时采用的frozen_inference_graph.pb文件 目录 ...

  7. TF:利用TF的train.Saver将训练好的W、b模型文件保存+新建载入刚训练好模型(用于以后预测新的数据)

    TF:利用TF的train.Saver将训练好的W.b模型文件保存+新建载入刚训练好模型(用于以后预测新的数据) 目录 输出结果 代码设计 输出结果 代码设计 import tensorflow as ...

  8. python加载模型文件进行图片分类_tensorflow通过模型文件,使用tensorboard查看其模型图Graph方式...

    Google提供了一个工具,TensorBoard,它能以图表的方式分析你在训练过程中汇总的各种数据,其中包括Graph结构. 所以我们可以简单的写几行Pyhton,加载Graph,只在logdir里 ...

  9. tensorflow打印模型图_从Tensorflow模型文件中解析并显示网络结构图(pb模型篇)...

    最近看到一个巨牛的人工智能教程,分享一下给大家.教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家.平时碎片时间可以当小说看,[点这里可以去膜拜一下大神的" ...

最新文章

  1. JVM结构、内存分配、垃圾回收算法、垃圾收集器。
  2. FATE 集群部署 step2
  3. 【原创】大叔经验分享(33)hive select count为0
  4. Spring Boot - 修改Tomcat默认的8080端口
  5. this super的用法
  6. HDU 2222- Keywords Search
  7. LeetCode Longest Increasing Subsequence
  8. apache 网页301重定向、自定义400/403/404/500错误页面
  9. 学写网站(二)前端配置之glup
  10. 只需 1 分钟,这个网站用 AI 分离歌曲的人声、伴奏和乐器声
  11. 区块链学习笔记25——总结
  12. 慧都MES系统怎么实施?有哪些注意事项?
  13. [AV1] AV1 Reference Software
  14. Flash Tech: this.el_.vjs_getProperty is not a function video.js
  15. Django针对上一篇和下一篇文章标题的实现逻辑
  16. HDOJ1495 非常可乐(bfs)
  17. ios pan手势滑动消失动画_iOS 当你的左滑手势失效时的解决方案
  18. 用Python设计第一个游戏,小插曲之变量和字符串(课堂笔记)
  19. Android AM命令及使用
  20. 可能你也怀疑,5G时代下,学web前端培训会有什么影响?

热门文章

  1. java 数组的行数和列数
  2. 《Windows 程序设计(第3版)》——导读
  3. linux一键安装虚拟机系统
  4. [Android]朝花夕拾之使用DexClassLoader动态加载广点通jar包
  5. python初中生有必要学吗_作为初中生该如何学编程?
  6. WireShark 抓包使用教程--详细
  7. Object.assign方法的使用和splice方法用法
  8. ES Elasticsearch
  9. 学习java必读书籍
  10. EIGRP协议工作过程与配置详解