原文:https://baijiahao.baidu.com/s?id=1760680452362672475&wfr=spider&for=pc

就在GPT4发布的同一天,唐教授在微博宣布:

基于千亿参数大模型的对话机器人ChatGLM,现在开启邀请制内测。

据介绍,ChatGLM专门针对中文进行了优化,可以说是国人友好~

看起来,写博客提纲、创作剧本、解数学题、写代码,甚至是扮演高冷御姐,它都拿捏的死死的。

量子位有幸拿到了内测名额,将在后文进行一波实测。

与此同时,还有另一个消息宣布:

唐杰团队为了与社区一起更好地推动大模型技术的发展,同时开源了包含62亿参数的双语ChatGLM-6B模型。

它最大的特点是在普通电脑上就能进行部署,有一块2080Ti就行。

一起来看看。

能写文言文致辞,知道何恺明最新动态,但……

先看ChatGLM,它是唐杰团队大模型家族时隔半年诞生的一位新成员。

alpha内测版名称叫QAGLM(全称qa-glm-v0.7)。

浅试一下效果。

首先,我们让它说了一下它和ChatGPT的区别。

它点出了自己的研发机构,和擅长中文的特点。

那么,就让它用文言文写个致谢词叭。

咋说,虽然多了一个“余”、出现了一个莫名其妙的繁体字,但读着还可以,用的排比句增强了气势。

接着,我们把前几日硅谷暴雷的文章开头丢给它,让它起个标题。

感觉还不错,起码抓住了几个关键信息。

不幸的是,论文挑战没有通过,我们把GLM-130B的链接扔给它,让它简要概括一下主题时,它说的根本不是这篇。

跟ChatGPT胡邹参考文献的操作简直有得一拼(手动狗头)。

接下来,考考它的数学能力吧。

这道小学应用题没问题:

不过鸡兔同笼,就难倒它了,最后居然还算出了负数==

编程方面,也可以解决简单的算法题。

归纳信息能力呢?我们给了一段英文需求,不难:

结果正确:

需要注意的是,目前ChatGLM每轮对话最多只可以进行5个来回,每次最多输入1000字。

它对新信息的掌握度不错,知道推特现在的CEO是马斯克,也知道何恺明3月10日回归学界的事情,但还没发现GPT-4已经发布了。

以及,目前响应速度还是非常快的,无论什么问题,回答得对不对,基本几秒内就能给出答案。

最后,量子位也让它来了个cosplay,看看哄女朋友的本事如何:

emmm,虽然有点板正,但听完这段话“我”的气确实消了。

那么,以上就是我们的测试结果,各位觉得如何?

基于1300亿参数的基座模型打造

据官方介绍,ChatGLM参考了ChatGPT的设计思路,在千亿基座模型GLM-130B中注入了代码预训练,通过有监督微调等技术来实现人类意图对齐(就是让机器的回答符合人类价值观、人类期望)。

这个GLM-130B的来头值得说道一番。

它是由清华大学知识工程实验室(KEG)与智谱AI共同研发的一个大规模中英文预训练语言模型,参数1300亿,去年8月正式对外发布。

不同于BERT、GPT-3以及T5的架构,GLM-130B是一个包含多目标函数的自回归预训练模型。

它的优势包括:

在Stanford报告的30个世界主流大模型评测中,GLM-130B也成为了亚洲唯一入选的模型。

且获得了不错的成绩:

比如在准确性和恶意性指标上与GPT-3 175B (davinci) 接近或持平,鲁棒性和校准误差在所有千亿规模的基座大模型(作为公平对比,只对比无指令提示微调模型)中也可圈可点。

而就在CCF最近的一场会议上,有现场观众提问:ChatGPT为什么没有诞生在中国?是我们没有关注这件事吗?

嘉宾就把GLM-130B搬了出来(它也入选了ICLR’23)。

现在,GLM-130B也终于被派上了“大用场”。

关于内测,唐杰团队表示,后续会逐步扩大范围,有兴趣的朋友可以再等一等。

60亿参数的缩小版同时开源

除了这个聊天机器人ChatGLM,唐杰团队这次也把GLM-130B的“缩小版”ChatGLM-6B开源了出来。

ChatGLM-6B使用与ChatGLM相同的技术,初具中文问答和对话功能。

特点如下:

当然,缺点就是容量只有60亿,其模型记忆和语言能力较弱,不擅长逻辑类问题(如数学、编程),以及多轮对话可能会出现上下文丢失和理解错误的情况。

但它主打的就是一个低门槛,在单张2080Ti上就能进行推理使用,硬件需求不高。

因此,只要有兴趣都可以下载下来试试,进行研究和(非商用的)应用开发都可以。

传送门:https://chatglm.cn/https://github.com/THUDM/ChatGLM-6B

参考链接:[1]https://weibo.com/2126427211/MxlsQ6w4A#repost[2]https://chatglm.cn/blog?continueFlag=d70d7590143c950d12ac7283214d879d

清华系ChatGPT发布!唐杰团队打造,专对中文优化,把握新闻动态相关推荐

  1. 清华系ChatGPT发布!唐杰团队打造,专对中文优化,还能把握最新新闻动态

    终于,清华大学唐杰团队也出手了. 就在GPT4发布的同一天,唐教授在微博宣布: 基于千亿参数大模型的对话机器人ChatGLM,现在开启邀请制内测. 据介绍,ChatGLM专门针对中文进行了优化,可以说 ...

  2. 清华唐杰团队造了个“中文AI设计师”,效果比Dall·E好,可在线试玩

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI 要说20 ...

  3. 清华BAAI唐杰团队提出第一个开源的通用大规模预训练文本到视频生成模型CogVideo,含94亿超大参数量!代码即将开源!...

    关注公众号,发现CV技术之美 我爱计算机视觉 专业计算机视觉技术分享平台,"有价值有深度",分享开源技术与最新论文解读,传播视觉技术的业内最佳实践.知乎/微博:我爱计算机视觉,官网 ...

  4. 驱动AI产业“第二增长曲线”,清华系RealAI发布首个企业级隐私保护机器学习平台与升级版AI模型杀毒软件

    12月9日,由清华大学人工智能研究院.北京智源人工智能研究院.北京瑞莱智慧科技有限公司联合主办的"2020第三代人工智能产业论坛暨瑞莱智慧RealAI战略发布会"在北京召开.清华大 ...

  5. 专访:经历了时间检验的不仅是论文,还有唐杰自己 | SIGKDD 2020时间检验奖

    KDD 2020即将在8月23-27日召开.而近日,SIGKDD 2020官方推特也公布了本年度的各种奖项,其中清华大学教授.智源研究院学术副院长唐杰团队获得了ACM SIGKDD 2020时间检验应 ...

  6. 专访唐杰:万亿参数大模型只是一个开始

    机器之心原创 作者:闻菲 智源悟道团队不仅会在「大」这条路上走下去,还将对构建「神经-符号结合模型」进行更深入和底层的探索. 图灵写于 1950 年的论述<计算机器与智能>被誉为人工智能的 ...

  7. 「打造中国人自己的开放 AI」:清华教授唐杰宣布成立AI新期刊

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 今天,清华大学计算机科学与技术系教授唐杰在社交媒体上宣布,他们成立了一个新期刊--&l ...

  8. 清华AMiner团队推出AI订阅:实时追踪科研动态,定制个人科研信息流 | 专访唐杰教授团队

    科技情报大数据挖掘与服务系统平台 AMiner,是由清华大学计算机系唐杰教授团队建立,具有完全自主知识产权的新一代科技情报分析与挖掘平台. 近日,清华大学 AMiner 团队再次上线重磅功能 --AI ...

  9. 北大教授杨超、清华教授唐杰获首届“王选杰出青年学者奖”

    4月21日,2020年度"王选杰出青年学者奖"颁奖典礼在北京大学百周年纪念讲堂举行.北京大学数学科学学院教授杨超和清华大学计算机科学与技术系教授唐杰,作为我国计算机和应用数学领域中 ...

最新文章

  1. Win8 Metro(C#)数字图像处理--2.66FloodFill算法
  2. PHP解决方案@时间戳与时间日期
  3. RabbitMQ入门-环境搭建
  4. RuoYi-Cloud 进阶篇_01( Seata 单机环境搭建)
  5. 利用matlab绘制函数图像
  6. iOS开发之SQLite的Object-C封装
  7. 你不知道的JS(原型)
  8. vm服务器虚拟机如何导出报表,教程:浏览 VM 中的 Power BI 报表服务器 - Power BI | Microsoft Docs...
  9. IE下载时中文文件名乱码解决
  10. Let's Use Chinaese in Flex Successfully
  11. 全民开发者时代到来!华为云开发者日深圳站成功举办
  12. LDO和BUCK降压稳压器对比
  13. CentOS 7 操作防火墙
  14. 如何提交form表单嵌套(提交表单外的数据方法 )
  15. RabbitMQ特殊应用
  16. H3C设备 配置Web管理
  17. 第29届奥运会中国代表团夺金榜
  18. 图像的表示方法和种类
  19. Gitflow(git工作流)
  20. 【手绘漫画】图解LeetCode之旋转链表(LeetCode 61题)

热门文章

  1. linux kernel --- dts的相关操作函数
  2. 跟我学UDS(ISO14229) ———— 0x14(ClearDiagnosticInformation)
  3. Linux: config: INET_DIAG_DESTROY INET_DIAG
  4. FIL WORLD算力众筹助推Filecoin生态落地
  5. kangle登陆html,谈kangle的访问控制
  6. SharePoint客户端对象模型—任务日历生成
  7. java声明一个父类A,java 子类强转父类 父类强转子类
  8. 5个golang中易犯的错误
  9. SimpleFOC移植STM32(五)—— 电流采样及其变换
  10. Variable-Length Subsequence Clustering in Time Series(TKDE)