最近抽时间翻译了机器学习工具包SHOGUN的技术文档,这真不是一件容易的活。

首先需要把软件的基本架构搞懂。例如SHOGUN有一套自己的内存管理机制,主要原理就是引用计数。如果不先把这个搞懂,看其它的源代码就会有很多不明白的地方。另外SHOGUN主要还是通过继承来扩展, 所以几个重要的基本类一定要搞清楚,如CFeatures, CKernel。

对SHOGUN实现的算法要了解。SHOGUN中实现了很多算法,要一个个搞懂不太容易。但是它的核心是SVM,各种SVM的基本思想都是类似的,所以必须得知道SVM的基本原理。自己之前对SVM也不熟悉,所以翻译的时候还一边看<An Introduction to Support Vector Machines and Other Kernel-based Learning Methods >, 这书还是很好看的,但是现在还没看完,呃。这书还有中文版,但感觉译得不好,推荐大家看原书。

翻译的时候遣词造句不容易。其实SHOGUN文档都是一些很简单的句型,但是有些句子英文意思很好懂,但就是找不到一个很好懂的中文句子来翻译。没办法,只能怪自己的中英文水平都太烂,==!。翻译过程中还专门了解了一下科技翻译要注意的地方,然后看到了侯捷以前写的一篇文章<科技翻译面面观 >。他翻译的书我看过几本,感觉还是不错的,而他写的这篇文章也不愧文章的名字--面面观,讲得的确挺全。如文章提到的应该保留一些英文术语,我翻译的过程中也保留了一些英文术语,把它们译成中文实在很别扭。另外文章里还提到,做研究还是直接看原文比较好,我也觉得其实翻译这些文档意义可能不大,顶多就方便入门罢了。大部分的科技文献都是英文的,你能都翻译过来吗?翻译过来都能保证质量吗?还不如好好把英文这门用得最广的外语学好。

最后总结一下SHOGUN这个软件包的优点,希望能有更多人来使用这个优秀的软件包并参与到这个开源项目中来。开源带给我们很多,你为开源贡献了多少呢?

  • 清晰的架构

SHOGUN采用C++实现。因为主要是实现算法,所以不需要很复杂的架构,使用继承和组合就能得到比较好的扩展性,实现和接口之间分离得很好。另外,异常和错误处理也都有一套完善的机制。

  • 丰富的内容

SHOGUN中实现大量的SVM算法(现在还在不断增加中),这些算法都可以用于许多种数据类型。除了SVM,还有其它一些常见的机器学习方法,如HMM,聚类方法等等。

  • 多样化的接口

SHOGUN除了C/C++接口外,还为python,octave, matlab以及R提供接口,这可以方便很多非C/C++开发者使用SHOGUN。而且在不同的语言中使用SHOGUN的方法非常相似,所以懂得一种接口后,在别的语言中使用时不需要什么学习时间。

  • 充足的文档

SHOGUN有很详实的用户文档和开发文档,带有非常多的可直接运行的例子。结合例子来学习会让你事半功倍。

  • 活跃的邮件列表

订阅了SHOGUN的邮件列表后,几乎每天都会有用户反馈, 或是report bug, 或者寻求帮助。列表中的很多人(包括作者)都会很热心地回答大家的问题。

如果你是做机器学习相关工作的,赶快来使用一下SHOGUN吧。

SHOGUN中文文档已经放到SHOGUN网站上,请看http://www.shogun-toolbox.org/doc_cn/ 。

机器学习工具包SHOGUN用户文档翻译完成相关推荐

  1. Shogun网站上的关于主流机器学习工具包的比较

    Shogun网站上的关于主流机器学习工具包的比较: http://www.shogun-toolbox.org/page/features/   created last updated main l ...

  2. 小心!你下载的机器学习工具包可能是病毒:CuPy被掉包,官方一天后才发现

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 小心! ...

  3. 微软亚洲研究院开源分布式机器学习工具包

    微软亚洲研究院开源分布式机器学习工具包 为了满足研究人员和开发者日益增长的各种需求,微软亚洲研究院于日前将分布式机器学习工具包(DMTK)通过Github开源.DMTK由一个服务于分布式机器学习的框架 ...

  4. 掌财社:Python 机器学习工具包SKlearn的安装与使用

    很多小伙伴在学习机器学习的时候会苦恼到底用什么进行学习.在看了大佬的介绍后可能会使用Keras或者pytorch直接进行学习,但实际上有优秀的机器学习工具包.没错,小编接下来要介绍的SKlearm就是 ...

  5. 基于机器学习技术的用户行为分析:当前模型和应用研究综述(A survey for user behavior analysis based on machine learning technique)

    A survey for user behavior analysis based on machine learning techniques: current models and applica ...

  6. 打算翻译机器学习工具包--SHOGUN使用文档

    SHOGUN是一个在机器学习尤其支持向量机方面很出色的开源项目,现在已经包含在Debian安装包中.自己现在正在学这方面的知识,但SHOGUN在国内使用好像很少,没有什么中文文档.虽然本人的E文很一般 ...

  7. 清华大学发布首个自动图机器学习工具包 AutoGL,开源易用可扩展,支持自定义模型...

    来源:机器之心本文约2800字,建议阅读6分钟如何应用自动机器学习 (AutoML) 加速图机器学习任务的处理? 清华大学发布全球首个开源自动图学习工具包:AutoGL (Auto Graph Lea ...

  8. 微软开源可解释机器学习工具包lnterpretML

    https://mp.weixin.qq.com/s?__biz=MzI5NTIxNTg0OA==&mid=2247495335&idx=3&sn=26200d9a952fd8 ...

  9. 赞!清华大学发布首个自动图机器学习工具包AutoGL

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:机器之心 AI博士笔记系列推荐 周志华<机器学习> ...

最新文章

  1. Division 贪心,模拟 牛客练习赛95
  2. springcloud的理解
  3. 花鱼儿家的家常小菜~~~~~~丁香鱼炒花菜
  4. unet网络python代码详解_python网络编程详解
  5. 前端面试准备---浏览器和网络篇(一)
  6. ylbtech_dbs_article_五大主流数据库模型
  7. VB 去除文本框粘贴功能
  8. moss item adding
  9. 【svn】Centos搭建svn服务器环境
  10. 181027每日一句
  11. 网页设计html对联样式代码,纯CSS做对联广告代码
  12. 【win10清理系统垃圾脚本】
  13. mySQL中的内外连接
  14. 纸牌小五张游戏的开发
  15. 知识管理文档协同不一定要用语雀和石墨,用它效果更好
  16. 或许,这是最好的一款微信公众号编辑器!
  17. 树莓派卸载系统自带应用增大硬盘空间
  18. MotionLayout MotionScene 动画从未如此简单!
  19. javaweb超市管理系统--用户管理
  20. css设置高度和宽度相同

热门文章

  1. 奔梦向前-用代码实现网页爱心动画
  2. 送外卖优先级_美团众包派单规则是怎么样的?主要是这四点!
  3. uva11400 动态规划
  4. Jetson Nano部署YOLOv5与Tensorrtx加速——(自己走一遍全过程记录)
  5. 全屏Dialog的几种实现
  6. 树泽:汽车次贷,可能正在酝酿下一次经济危机
  7. node.js ajax语法
  8. MATLAB的MEX文件编写和调试
  9. a5 1c语言实现,A5算法的C语言实现
  10. 数据分析-分类-案例