语义,艰难旅程上你所需要知道的
郑昀 20080712<?XML:NAMESPACE PREFIX = O />
答某位网友的询问。
语义,是一条艰难的旅程。
语义,只能做到一些特定的事情而已,算法的正确率是有限的,到了某种精度后,再提高一点点就需要花费大量的时间和耐性。
但,它是一个没有天花板的空间。
这里水很深,全球高手如云,但一旦进入,就上不封顶,有极大的发展空间。
它绝对不是一个人能做成的事情,需要很多人很多钱很多机器。
每个人都有很多想法、很多思路。
但,不考虑成本是不行的。
所以,我为什么要建议你去研究还活着的语义技术应用较深入的国内外网站,看看他们做到了哪一步,用了几年时间,有多少人。
所以,基于我们团队的创业经验,我对你的建议是:
第一步,想清楚你的模型和思路。
是否符合国外的大的科技发展趋势;
是否能用较少的钱和人力先做出一个模型;
是否能够尽量符合中国用户的使用习惯。
第二步,想清楚你的方案是否对你的个人迫切需求有切实的解决。
这个很重要。如果你自己的原始需求都不能被你的方案充分满足,其他陌生用户更不会满足。
更为重要的是,你这个需求是迫切的,而不是无所谓的、可有可无的需求。
第三步,搞清楚中国或者国外有哪些团队也在做同样的事情。
这个很重要。
你要是搞科研的话,就肯定知道,如果别人不在做这方面的努力,也许说明你的方向是错误的;如果别人都在做努力,甚至是大公司在做研发,那你估计没什么戏。只有说部分的小公司小团队在探索这个方向,大公司只是在预研,才可能说明你还赶上了一个未来潮流。
如果不知道别人在做什么,那你可能总是在做无用功,做出来往往会发现自己是闭门造车。
第四步,如果技术短期内达不到需求,怎么办?
如果你前面的知识储备到位了,
同时又明白自己想要什么样的知识解决了,而不是用现在的Wiki/知识问答、UGC、SNS、Blog等工具就能搞定的,确实需要语义技术,
那么,不需要明白语义算法,只需要提前思考一点:
如果技术达不到你要的效果,你怎么办?用什么来补充、丰富和整理?
第五步,你的钱够吗?在找到能被市场认可的商业模式之前(不是你臆想的商业模式),你的钱能管多久?
语义应用,在中国,现阶段,有点像一个科研任务,更像是导师交给你的一个他也未知如何的方向。那么,用一些方法论,不妨作些调查,做些实验,更能有效率地成就你的梦想,至少比我们活得轻松些。
拉一个你需要仔细琢磨的名单:
国外的:
- Twine
- Powerset / Hakia
- Freebase
- Evri
- Kango / Circos
- techmeme / megite
- Monitor110
- healthline
- TripIt
国内的:
- 一起网
- 360doc
- 百度新闻
- 搜狗实验室
- 奇虎问答机器人
- 宝聚
- 玩聚SD
语义,艰难旅程上你所需要知道的相关推荐
- 【趣题分享】关于蒋干盗书你所需要知道的
文章目录 序言 1 明牌条件下的最优盗书策略 1.1 最优策略的猜想 1.2 辅助分布列 1.3 最优策略的证明 2 一张过河拆桥的力量 3 先盗后拆 v.s. 先拆后盗 4 总结与推论 5 仿真代码 ...
- 关于在开源社区中的“工作倦怠”,你所需要知道的事
| 作者:Tara Gu | 编辑:王皓月 | 设计:朱亿钦 | 翻译:Paul Wang | 审稿:卫sir 今年早些时候,我出现了工作倦怠.凑巧的是,当时我正在研究"工作倦怠" ...
- 关于字符编码,你所需要知道的(ASCII,Unicode,Utf-8,GB2312…)
字符编码的问题看似很小,经常被技术人员忽视,但是很容易导致一些莫名其妙的问题.这里总结了一下字符编码的一些普及性的知识,希望对大家有所帮助. 还是得从ASCII码说起 说到字符编码,不得不说ASCII ...
- 关于 PHP 5.4 你所需要知道的
PHP 5.4来了,这是自5.3后的又一次主版本升级.此次升级改动较为显著,删除了一些过气儿的函数,带来了高达20%的速度提升和更少的内存使用. 新特性与改动 此次更新的关键新特性,包括:新增trai ...
- 关于字符编码,你所需要知道的
起源 字符编码的问题看似很小,经常被技术人员忽视,但是很容易导致一些莫名其妙的问题.这里总结了一下字符编码的一些普及性的知识,希望对大家有所帮助. 还是得从ASCII码说起 说到字符编码,不得不说AS ...
- 【转】关于字符编码,你所需要知道的
字符编码的问题看似很小,经常被技术人员忽视,但是很容易导致一些莫名其妙的问题.这里总结了一下字符编码的一些普及性的知识,希望对大家有所帮助. 还是得从ASCII码说起 说到字符编码,不得不说ASCII ...
- 触屏计算机显示器CDU,科技:关于电脑显示器你所需要知道的
导语:显示器可以说是笔记本电脑最重要的硬件.毕竟,这是您实际使用设备的方式.显示器也难以解释和理解.它们可以被测量,但大多数人不熟悉这些测量的含义或它们与自己的观看体验有何关系.对比.屏幕分辨率.黑色 ...
- 转载:关于 PHP 5.4 你所需要知道的
HP 5.4来了,这是自5.3后的又一次主版本升级.此次升级改动较为显著,删除了一些过气儿的函数,带来了高达20%的速度提升和更少的内存使用. 新特性与改动 此次更新的关键新特性,包括:新增trait ...
- 关于Mobile Web App你所应该知道的
Native App与Web App的争论从未停息过,尽管很多人在批判Web App的各种不是,但也阻止不了各种各样的Web App如雨后春笋般出现,尤其是伴随智能手机的普及而受到重视的Mobile ...
最新文章
- 关于viewport我自己的理解
- 各种组件的js 获取值 / js动态赋值
- php和mysql处理树状_分级_无限分类_分层数据的方法_PHP和MySQL处理树状、分级、无限分类、分层数据的方法...
- 关于Linux系统中的ext4文件系统制作命令的学习与理解,make_ext4fs 参数介绍。
- tomcat PermGen space 不足的解决方法
- 【leveldb】资料
- Docker应用基础
- Microsoft Outlook设置GMail谷歌邮箱
- 解除RAR和ZIP压缩包密码的不同方法
- prisma 连接不上Postgres
- 基于PHP和MySQL的奶茶网站,基于PHP和MySQL的网站设计与实现
- 【日常】有道云笔记markdown数学公式格式转换脚本
- AI热潮来袭||网友:AI会不会抢自己的饭碗啊~~~
- php实训表单验证的日记心得,php实训心得
- 微信小程序云开发学习笔记
- GB/T 28181国标2022版本变化
- 关于加入@RequestBody后请求报错:Required request body is missing:
- 计算机求职自荐信800字大学,计算机专业大学生求职自荐信
- MATLAB imwrite无法打开要写入的文件
- lisp 焊缝标注_德国图纸焊接符号
热门文章
- python和c语言的对比_类C语言与Python负数除法求值间的差异
- linux abs 和 屏幕 大小关系,观点|一个 Linux 菜鸟的回忆录
- vue3.0中使用计算属性时报错
- Time(sdutoj2272)_JAVA
- C++中的hash_map和map的区别
- 【c++】23.【函数指针】定义? 为什么不直接调用函数而要使用函数指针?
- Deep Learning(深度学习)学习笔记整理系列之(六)
- Java synchronized 详解
- [Google Guava] 7-原生类型
- Android开发者珍藏必备【学习资料篇】