今天中午的时候有和邹欣老师的Lunch Discussion,讨论了很多东西,有很多收获。

首先确定的是page cluster之类的事情是不需要做了,而之前相对比较纠结的就是这一点,是否要做cluster,如何cluster是很蛋疼的问题。讨论的过程中我们注意到其实M2的重点也可以不是这里,虽然将网页聚类并产生新的keywords是非常激动人心的事情,但我们毕竟不是在做research,对于grow search而言,更多的可能还是要考虑用户可能会需要什么。

晚上的讨论里我们又将中午的内容稍微总结了一下,基本上清楚M2我们要做的东西:

1 对于长得过于茂盛的树,我们决定将比较旧的结果周期性地聚为一个叶节点,当然这个叶节点不同于普通的叶节点,当在上面点击的时候应该可以得到被收入内容的枝条。这样做的好处是树本身不会过于“繁茂”而且被收缩的节点会使得树本身有着更深的层次,而非现在的a tree of depth 2。至于何时进行收缩现在有集中想法:按照时间,譬如每一小时收缩一次;按照节点个数,譬如每100个节点收缩一次。但无论如何将收缩功能实现和收缩的criteria无关,但是对于如何“优雅地”收缩枝条,大概是一个需要很多尝试的有难度的事情。

2 应当允许用户剪掉枝条。树长得过于茂盛的时候如果用户可以修剪,好像修剪现实生活中的树那样的话,应该是很有趣的事情。至于修剪的方法当然可以是像割绳子游戏里那样用鼠标划一下就刷刷剪掉,不过我们暂时也还没想要做到那样,点击枝条能删除这样的程度就可以了吧。

3 多棵树。之前我们本来打算放弃多棵树的,但是中午的时候听邹老师提到了“花园”之类的东西,又开始觉得加入多棵树的话也许也不错,而且既然现在既然丢掉了网页聚类的设想,那么实际上一棵树并非会变成一个knowledge graph,换句话讲不会非常地占据空间,所以多棵树还是有必要的,不然只有一棵树未免单调。

4 关于数据来源,之前一直使用的是BingAPI获取的数据进行按时间的排序后再进行显示。但是这样的问题是按照时间排序后会丢失掉原本search engine对结果的排序,而对于搜索新闻的用户而言想要的还是rank最高的排序。之后我们打算使用的数据是BingNews的RSS订阅,今天惊喜地发现自己的关键词也可以使用RSS订阅了,但是因为在最下面所以昨天没有发现,以为只能按类别去订阅。使用RSS订阅的好处是内容会比较make sense。但愿。。。

虽然对于要做的东西有了一些初步的想法,但是仔细看看哪一个都绝非能够轻易实现的东西,所以今天之后队员们都去各自探索各自的内容,看看需要做的东西我们能不能做到,看看我们能做到哪里,再确定具体的计划。

以上。

转载于:https://www.cnblogs.com/smart-code/archive/2012/10/31/2748713.html

M2 Planning Day3相关推荐

  1. c语言 -1%4,**************

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 #include"stdio.h" main() { int y1,y2,m1,m2,d1,d2,days,i,t,day1,day2 ...

  2. c语言中1%100是什么意思,**************

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 #include"stdio.h" main() { int y1,y2,m1,m2,d1,d2,days,i,t,day1,day2 ...

  3. linux打开 root .m2,小辣椒M2 (LA-M2)获取ROOT权限教程,新手root必看

    小辣椒M2 (LA-M2)如何获取ROOT权限?用什么ROOT工具最简单?请跟着小编一起来看看如何用奇兔刷机对小辣椒M2 (LA-M2)进行一键ROOT,小编特别亲手制作了详细的小辣椒M2 (LA-M ...

  4. 极限编程 (Extreme Programming) - 迭代计划 (Iterative Planning)

    (Source: XP - Iteration Planning) 在每次迭代开始时调用迭代计划会议,以生成该迭代的编程任务计划.每次迭代为1到3周. 客户从发布计划中按照对客户最有价值的顺序选择用户 ...

  5. ARP(Accounting Resource Planning)项目感想

    ARP是Accounting Resource Planning(会计资源计划)的简称. 转载于:https://blog.51cto.com/lya041/690079

  6. 金融学名词M0, M1, M2, M3, M4, M5, M6

    货币层次的划分:世界各国对货币供应量的统计口径有狭义和广义之分,以便中央银行控制有所侧重,具体为: M0=现金(通货) M1=M0+商业银行的活期存款 M2=M1+商业银行的定期存款(包括定期储蓄存款 ...

  7. idea中 maven打包时时报错User setting file does not exist C:\Users\lenevo\.m2\setting.xml,

    第一种错误 :idea中 maven打包时时报错User setting file does not exist C:\Users\lenevo\.m2\setting.xml, 解决方案如下:将ma ...

  8. 苹果放大招?「廉价版」5G iPhone 将揭晓,M2芯片来袭?

    整理 | 张洁 来源 | CSDN 3 月 2 日,苹果公司正式宣布将于北京时间 3 月 9 日凌晨 2 点举办 2022 年的首场活动,主题为"peek performance(高能传送) ...

  9. M2 芯片终于要来了?全线换新,性能远超M1 Max

    ‍‍不知不觉日历已翻至 2 月下旬,掐指一算,距离苹果一年一度春季新品发布会的召开似乎已越来越近.根据年初统计的 2022 年苹果新品预测,预计今年的苹果"小春晚"将在 Mac 方 ...

最新文章

  1. centos在线安装svn
  2. Java GUI中实现文件拷贝
  3. 拉取远程分支到本地分支_保险公司在本地没有分支机构可以投保吗?异地投保会影响理赔吗?...
  4. python find函数实现原理_非常干货:Python 探针实现原理
  5. 深入理解CSS定位中的堆叠z-index
  6. Java—Map集合详解(HashMap/Hashtable/LinkedHashMap/Properties/TreeMap/WeakHashMap/IdentityHashMap/EnumMap)
  7. 论文解读二十七:文本行识别模型的再思考
  8. 自定义模块的查找方式
  9. matlab经纬度画二维图,Matlab绘制汉经纬度的散点图 2
  10. C语言多线程基础-02-临界区,互斥量
  11. linux设备符,linux 字符设备(一)
  12. Chrome开发者调试工具Copy element和Copy OuterHTML区别
  13. CRT设置LOG日志功能
  14. 《大学英语翻译》课程相关复习笔记
  15. 【边缘计算】刘阳:边缘计算发展中的若干热点问题及思考
  16. ONF执行主席Dan Pitt:SDNFV会聚而合
  17. Python超市管理系统毕业设计源码111042
  18. vue百度地图 一进页面加载卫星图
  19. Java计算机毕业设计中期检查写作参考
  20. 【深度学习目标检测】一、基于yolov3的水果商品检测分类

热门文章

  1. 谷歌搜索和谷歌站内搜索
  2. [Oracle 学习] Oracle中将查询语句执行结果导入文本文件
  3. Windows完成端口的理解
  4. dynamic_cast详解
  5. s5-13 RIP 为什么会 衰败
  6. java反序列化漏洞 tomcat_CVE-2020-9484 Apache Tomcat反序列化漏洞浅析
  7. js map 排序_数组方法写给女友的一系列 JS 数组操作(建议收藏 | 内附思维导图)...
  8. java 固定电话正则_java针对电话号码正则匹配实例
  9. 车主无忧:为什么放弃开源Kafka?
  10. python把一堆图片分成n份,用Python一键生成炫酷九宫格图片,火了朋友圈