项目背景

因为最近一直都在搞数据挖掘类的项目,且现在国内的大数据潮火热。在前几天与群里的几位兄弟聊天所以有了做一个开源项目的想法,以前也搞过一个开源的项目,当时只是想把权限集中化做一下,项目的名称和地址是:

http://www.cnblogs.com/skyme/archive/2012/02/07/2341364.html

但是后期实在工作太忙,就搁置在那里了。

所以现在又搞了一个,目前方向已经大致明确,下边介绍一下思路。

仿今日头条

java+新闻等+仿今日头条+大数据分析和挖掘(分类器+聚类分析+推荐系统等)

经过大家几天的讨论,项目方向已经基本确定!

在github上会发起新项目

这个是讨论的投票结果,结果见下图。

系统定位

所有的app都可以接入,不重点做app端,而是做个性化推荐这一块,在服务端。

项目目前的思路如下图所示:

目的是提供一个大众化的信息收集系统,让今日头条中所使用的技术不再神秘。

有想参与的可以一起进来讨论

群号 194338168
想深度参与的加,不想参与的就别往里进了,现在需要的主要是开发和文档两类人。群会定期往出清人! (项目会开源出来)

数据挖掘开源项目立项相关推荐

  1. java 数据挖掘 开源_5个开源数据挖掘工具,收下这波干货

    数据挖掘是从大量数据中提取隐藏的或未知,但可能有用信息的过程.尤其在机器学习中,数据挖掘是十分重要的一环.今天给大家介绍5个开源数据挖掘工具,收下这波干货吧. 1. Orange Orange 是由C ...

  2. 数据挖掘里的开源问题(PAKDD 2009 WORKSHOP CALL FOR PAPER)

    对数据挖掘开源项目有心得的朋友,包括研究.开发和应用,可以参考下: http://osdm09.togaware.com/ .这是PAKDD 2009的一个WORKSHOP,可以考虑投稿啊. 几个重要 ...

  3. 数据挖掘系列(5)使用mahout做海量数据关联规则挖掘

    上一篇介绍了用开源数据挖掘软件weka做关联规则挖掘,weka方便实用,但不能处理大数据集,因为内存放不下,给它再多的时间也是无用,因此需要进行分布式计算,mahout是一个基于hadoop的分布式数 ...

  4. 数据挖掘工具weka使用

    http://xiaogao39.blog.163.com/blog/static/7285602200910395121696/ Weka全名为怀卡托智能分析环境(WaikatoEnviron-me ...

  5. 漫谈数据挖掘从入门到进阶

    入门: 数据挖掘入门的书籍,中文的大体有这些: Jiawei Han的<数据挖掘概念与技术> Ian H. Witten / Eibe Frank的<数据挖掘 实用机器学习技术> ...

  6. python 数据挖掘工具_推荐19款最常用的数据挖掘工具

    数据在当今世界意味着金钱.随着向基于app的世界的过渡,数据呈指数增长.然而,大多数数据是非结构化的,因此需要一个过程和方法从数据中提取有用的信息,并将其转换为可理解的和可用的形式. 数据挖掘或&qu ...

  7. 12款最好用的数据挖掘工具

    数据在当今世界意味着金钱.随着向基于app的世界的过渡,数据呈指数增长.然而,大多数数据是非结构化的,因此需要一个过程和方法从数据中提取有用的信息,并将其转换为可理解的和可用的形式. 数据挖掘或&qu ...

  8. 未来的数据是无价的,推荐十大数据挖掘工具

    数据肯定是无价的.但分析数据并非易事,因为结果越准确,成本就越高.鉴于数据急剧增长,需要一个过程来提供有意义的信息,最终变成实用的洞察力. 数据挖掘是指这个过程:在庞大数据集当中发现模式,将它转换成有 ...

  9. 近二十年大数据行业怎么样?解决了什么?经历了什么?

    导读:2001-2020,21世纪的前20年已接近尾声,大数据从无到有,从火爆到被质疑.本文带你了解这20年里,大数据解决了哪些问题.面临着哪些挑战? 作者:阿尔伯特·比费特(Albert Bifet ...

最新文章

  1. Forrtl: severe(157): Program Exception - access violation
  2. libevent+多线程的服务器模型
  3. 导入第三方依赖库slidingmenu
  4. 黑马-程序员C#泛型简介
  5. post postman 传递数组对象_如何使用postman做接口测试
  6. 计算机网络双向传输,计算机网络:传输层(2)
  7. 用于服务器接入的防火墙网关的八个关键×××
  8. hdu3336 Count the string
  9. spring的九大组件
  10. 五笔字根表识别码图_五笔字根识别码学习
  11. html小写罗马字符怎么写,如何在 LATEX 中插入大小写的罗马字符
  12. php小程序秒抢高并发,微信小程序的10个请求并发限制的优化消息!!!
  13. 史上最全破解安卓APK和反编译
  14. 亲测,2023年私藏的免费好用的磁力网盘资源搜索网站,找资源不用愁
  15. ThinkPHP5.0+PHPMailer 实现qq邮箱验证码
  16. html select 选中触发,实现select中指定option选中触发事件
  17. 大华摄像头网页端控制+web串口(适用任何浏览器,不能用来打我)通讯合集
  18. 云知声持续发挥企业优势,赋能AIoT 落地,让未来生活更进一步
  19. k8s篇-Pod健康检测
  20. 【如何更新几十万上百万的数据在ORACLE和MYSQL】

热门文章

  1. Centos6.10源码部署zabbix-3.2.6
  2. 查询数据库 收集 (如某个字段不是中文)
  3. 久违的反省,容忍现在的自己
  4. 调研Android的开发环境的发展演变
  5. 项目不需要SVN控制的时候,该怎么办
  6. 大理三塔,及崇圣寺里的假深沉
  7. docker CE 的安装
  8. 启动tomcat出现too many connections的原因及解决方法
  9. 这可能是我见过最详细的快速排序!
  10. Exception和RuntimeException的区别