来源:人机与认知实验室

【本文是鲁晨光老师发表的一篇关于语义信息论和统计学习的论文写后感,发表在科学网上,特摘录推荐】

2019-8-21 01:04 |个人分类:信息的数学和哲学|系统分类:论文交流| 信息论, 语义信息, 机器学习, 归纳, 科学哲学

这是我近五年研究的总结, 也基于我以前的研究结果。

发表的期刊是:

Information:https://www.mdpi.com/journal/information

文章是:

https://www.mdpi.com/2078-2489/10/8/261

英文open access 期刊, 不限长度。 我用的方法——语义信息方法——与众不同, Information正好适合我。同行评论要过两关,要老实按reviewers要求,逐条回应。以前不知道,吃过大亏。

西方研究语义信息论的名人Luciano Floridi和Wolfgang Johannsen也在上面发表过文章。

Flridi还是Information中Information Theory and Methodology Section的编委。

现在可以让大家比较了。

文章有30多页。我很开心,等于发表了四篇。我以前发表的一篇英文也是很长的http://www.survivor99.com/lcg/english/information/GIT/index.htm ,40多页。好像短的反而难发表——只发表过会议。可能新东西不全面就很难让人理解。

我的文章中,背景包含两个部分:

1.从Shannon信息论到语义信息G理论, 也谈及其他人的语义信息理论(包括Floridi和钟义信教授的);

2.从传统的贝叶斯预测到逻辑贝叶斯推理, 主要是对贝叶斯推理(Bayesian Inference)的挑战。

方法包含我独创的4个信道匹配算法:

1.语义信道匹配香农信道,求解多标签学习函数——隶属函数——的简单方法。但是最重要的应用是求解if-then叙述的确证度。

2. 两个信道相互匹配:求解多标签分类;比流行的方法简便很多。

3. 重复两个信道相互匹配,迭代算法, 求解最大互信息分类。根据特征求解最大互信息分类或估计,这可是Shannon信息论和经典信息论留下的难题。

4. 两个信道相互匹配,通过求解最大通信效率G/R, 求解混合模型. 顺便证明EM算法所依据的混合模型理论是错的。

文中提供了不少例子;补充存料还提供了这些算法的Python 3.6程序。读书我自己编的。方法应用迫使我学习Python编程。幸亏我是老程序员。

对于机器学习,2,3用于分类是很实用的; 难度最大的是求解混合模型,特别是证明迭代收敛。 但是最有理论意义的是提供新的确证度b*.

归纳问题由来已久。由于绝对正确的全称假设的归纳被否定,归纳问题演变为求不完全正确假设的归纳问题——即确证度计算问题。证伪主义者Popper也曾试图解决这一问题。早期逻辑贝叶斯主义者凯恩斯和卡尔纳普企图用逻辑概率或条件逻辑概率(在0和1之间变化)表示确证度,但是现代归纳主义者大多用可信度或归纳支持度(在-1和1之间变化)表示确证度(见这里http://www.fitelson.org/probability/comp.pdf )。

我的确证度也在-1和1之间,但是和流行的确证度不同, 流行的确证度主要取决于正例是否多,而我的确证度b*主要取决于反例是否少——这就兼容Popper的证伪思想。要让大家信服, 还需要继续努力。

我相信我的确证度公式迟早会被大多数人接受,不过其命运可能就像我的色觉模型(http://blog.sciencenet.cn/home.php?mod=space&uid=2056&do=blog&id=1160412)。

徐匡迪院士呼吁研究算法:

http://www.sohu.com/a/312151330_680938

我的努力就是。但是这样的文章在还真不容易再国内期刊发表。我的最大互信息分类文章就再三被拒绝。不知道审稿人是否知道:Shannon及后来者至今无法解决这一问题!这应该是信息论王冠上的钻石啊!

一个中文初稿见:

http://www.survivor99.com/lcg/CM/Homepage-NewFrame.pdf

关于语义信息论和统计学习的更多讨论见:http://www.survivor99.com/lcg/books/GIT/

欢迎交流。

张亚勤、刘慈欣、周鸿祎、王飞跃、约翰.翰兹联合推荐

这是一部力图破解21世纪前沿科技大爆发背后的规律与秘密,深度解读数十亿群体智能与数百亿机器智能如何经过50年形成互联网大脑模型,详细阐述互联网大脑为代表的超级智能如何深刻影响人类社会、产业与科技未来的最新著作。

《崛起的超级智能;互联网大脑如何影响科技未来》2019年7月中信出版社出版。刘锋著。了解详情请点击:【新书】崛起的超级智能:互联网大脑如何影响科技未来

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

发表了一篇英文长文:语义信息G理论和逻辑贝叶斯推理for统计学习相关推荐

  1. 实用!200篇英文论文中总结的最常见错误!

    文章The Most Common Habits from more than 200 English Papers written by Graduate Chinese Engineering S ...

  2. 统计一篇英文文章中出现的 单词 和 词频

    统计一篇英文文章中出现的单词和词频, 统计一篇英文文章中出现的单词和词频. 输入:某篇文章的绝对路径 输出:词典(词典中的内容为每一行都是一个"词频 单词 ") #include ...

  3. 打破校史!这位参与发表学校首篇Science的博士小姐姐,近日一作再发Nature

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要13分钟 Follow小博主,每天更新前沿干货 本文来源:科研大匠综合自西南交大新闻网.官微.扬华研究生新闻中心 转载自:募格学术 导读: 1 ...

  4. 统计一篇英文文章中26 字母出现的概率

    统计一篇英文文章中26 字母出现的概率 //统计英文文章中26 字母出现的概率 #include <stdio.h> void main() { float number[26]={0}; ...

  5. 统计一段英文中单词的个数c语言,C语言统计一篇英文短文中单词的个数实例代码...

    具体代码如下所述: #include #define N 1000 void main(){ char en[N][81]; int i,j,num=0,n,state; //num 用来统计单词的个 ...

  6. 首发:徐亦达教授团队最新发表的两篇机器学习论文

    徐亦达团队在 Asian Conference on Machine Learning 的发表了两篇机器学习论文,本人得到徐老师授权在本站发布论文. 论文 1:Realistic Image Gene ...

  7. python统计单词个数算法_统计一篇英文文章单词个数,取出出现频次前10的单词(Python实现)...

    题目: 用python实现统计一篇英文文章内每个单词的出现频率,并返回出现频率最高的前10个单词及其出现次数. 常规解法 怎么判定单词? 1 不是字母的特殊字符作为分隔符分割字符串 (避免特殊字符的处 ...

  8. split函数python统计英文单词_统计一篇英文文章单词个数,取出出现频次前10的单词(Python实现)...

    题目: 用python实现统计一篇英文文章内每个单词的出现频率,并返回出现频率最高的前10个单词及其出现次数. 常规解法 怎么判定单词? 1 不是字母的特殊字符作为分隔符分割字符串 (避免特殊字符的处 ...

  9. 知道吗?BAT去年在KDD上作为第一单位发表了12篇文章!(内附每篇文章解读)...

    本文转载自"SciTouTiao"微信公众号 如今,全世界每天都有几十亿人在使用计算机.平板电脑.手机和其它数字设备产生海量数据.各个行业和领域都已经被数据给渗透,数据已成为非常重 ...

最新文章

  1. [C++] NULL VS nullptr
  2. Java 8 中的这个接口真好用!
  3. mysql 单标递归_MySQL递归CTE(公共表表达式)
  4. COBOL入门到精通
  5. python迷宫小游戏代码_C++课程设计迷宫小游戏
  6. .NET面试题(三)
  7. php jquery ajax裁剪图照片,php+jquery+ajax无刷新图片上传裁切,模拟flash头像上传实例...
  8. 如何在Ubuntu系统的顶部标题栏中增加CPU/内存/网速实时监控的小控件
  9. 先装vs还是先装sql_【家装话题】装修师先装门还是先装地板?
  10. 通过Servlet的response绘制页面验证码
  11. lintcode 单词接龙II
  12. jQuery----选择器
  13. leetcode题目:第 k 个数
  14. 第5条:用枚举表示状态、选项、状态码
  15. 11.构建Ubuntu系统
  16. 复杂性研究简介——从西蒙到霍兰
  17. 4. 彤哥说netty系列之Java NIO实现群聊(自己跟自己聊上瘾了)
  18. 如何用低成本方案解决室内超大场景下机器人定位与导航难题?
  19. wordpress优化插件_专为移动设备优化的社交共享WordPress插件
  20. wps js宏合并相同列的单元格

热门文章

  1. 独家 | 展望未来:数据科学、数据工程及技术(附链接)
  2. 再见,Teamviewer!这款国产轻量级远程桌面软件超牛逼!
  3. 2021年人工智能全球最具影响力学者榜单AI 2000发布
  4. 一文读懂机器学习、数据科学、人工智能、深度学习和统计学之间的区别!
  5. SAP MM 外部采购流程里的Advanced Return Management
  6. 放心,GPT-3 不会“杀死”编程
  7. SAP QM Dynamic Modification Rule (动态修改规则)
  8. 人脸识别虽好,还需行业自律与法律监管有道
  9. 什么是XLNet中的双流自注意力
  10. 原理解释|直觉与实现:Batch Normalization