CSCW领域的“老”词和“新”词

说来惭愧，虽然在协同工作行当里面也算待了好几年，一方面因为国内外研究的差异，有些老外总说的词汇总是不明其理，另一方面这两年因为网络技术的飞速发展，涌现出了不少新的协作方式和应用，也自然出了不少新词汇。趁着这次开会看材料的机会，索性简要整理一下。

Fieldwork

这算是老外文献和会议总常提到的一个词，网上的定义林林总总，实际上顾名思义，就大致是“现场调研”的意思。理解这个词有几个要点：

(1) 通常是走出去！不是在大学或者实验室中进行的；
(2) 不要主观色彩！去观察和收集第一手的信息，而非思考或评价；
(3) 现实而非人造！描述或观察对象是自然，现实的环境中实际的人类活动或者事务。

此外，调研人员可能包括老师，研究生，学生或其他志愿者。调研方式也很多，可以观察记录，采访交谈，问卷调查，甚至自身参与等等不一而足。

我觉得Colins CoBuild字典的解释还算中肯，供参考：“Fieldwork is the gathering of information about something in a real, natural environment, rather than in a place of study such as a laboratory or classroom.”

我又想，为什么这样普普通通的词汇，老外一用咱们就迷糊了么？老外也没有搞什么玄虚，毛老人家早就教导过我们“理论要从实践中来，到实践中去”，结果一看国际顶级会议都有Fieldwork的Session，自己就困惑起来了。究其原因估计一方面是国内对此类交叉学科，过于重理论轻实践，习惯在象牙塔里想象实际应用时怎么样的，闭门造车。而非系统的，正式的去调查研究。另一方面，CSCW研究国内一般挂在计算机系或者信息学院，那种有关社会性内容的研究被边缘化，文章写了也没地方发表（除了国外，不过好难。L）所以我们一看Fieldwork堂而皇之的在顶级刊物或会议上有一席之地，我们就认为它是什么高深莫测的东西。你说说，怎么理论联系实际的优良传统，怎么就没人当回事了呢。协作活动的社会性研究不足，用户界面，功能都是拍脑袋造出来，用户能喜欢用，好用，用好嘛！

Ethnography

别查字典，一查字典准晕菜。嘛叫个“民族志学, 人种学, 人种志”啊？咱又不是生物学家。你说说，难怪我们对这种曝光率超高的词（在CHI和CSCW领域内）理解不了，国内这些字典辞典完全没有恰如其分的解释嘛！

你可以define标签google一下，冒出N多定义，我简单整理一下：宏观来讲，Ethnography算是anthropology(人类学)的一个分支，专门研究和描述人类的不同文化的。文化这个词可就大了去了，包罗万象，可不仅仅是穿衣戴帽，吃喝拉撒。（国内对民族的教育有很大问题，我们对其他民族的了解似乎就剩下衣着打扮，能歌善舞否，所谓的专家估计也就多知道一个人家吃什么喝什么，嘛时候过节，咋个娶媳妇而已）。

WikiPedia定义稍多，大致如下，供参考：“Ethnography (from the Greek ?θνο? ethnos = nation and γρ?φειν graphein = writing) refers to the genre of writing that presents qualitative description of human social phenomena, based on fieldwork. Ethnography presents the results of a holistic research method founded on the idea that a system's properties cannot necessarily be accurately understood independently of each other. The genre has both formal and historical connections to travel writing and colonial office reports. Several academic traditions, in particular the constructivist and relativist paradigms, claim ethnographic research as a valid research method.”

如果嫌这个定义过于罗嗦，就还是看Colins CoBuild的“Ethnography is the branch of anthropology in which different cultures are studied and described.”

仅仅这样，实际上还不能很好理解Ethnography在CSCW中的意义，按照CSCW06的Tutorial，简单整理几个要点：

(1)    Ethnography是Fieldwork的一类，简单来说就是对人类现实活动或现象的现场调研。
(2)    Ethnography是基于现实的，而非人造或有其他主观干预的。(naturalistic)
(3)    Ethnography是一项较长期的工作，经年累月，而非蜻蜓点水。(prolonged)
(4)    Ethnography重在描述，描述工作是如何有效组织起来，从而达到目标的。
(5)    Ethnography表现了社会性因素的研究重要性，使turn to social的最佳注脚。

CSCP & CSCW

中药说“世间万物皆可入药”，武侠上也说，到了一定程度“飞花摘叶，亦可伤人”。我看研究到了一定境界，阳春白雪，花鸟鱼虫都可用来“格物致知，不分高下”。CSCW本来是指计算机支持的协同工作(Computer Supported Cooperative Work)，不过这里的CSCP是指计算机支持的协同游戏(Computer Supported Cooperative Play)，进而发挥一下，后面那个CSCW就成了计算机支持的协作XX了(Computer Supported Cooperative Whatever)。

之所以能从Professionalism的Work走向Playfulness，甚至人类生活的方方面面(whatever)，一方面说明了信息技术的飞速发展，另一方面证明了人类生产生活方式正在深度浸入数字化。1984年，CSCW提出伊始，信息技术那可是高精尖，也就企业能用得起，提高企业生产效率也就是CSCW的初衷。经过20年的发展，信息技术可谓是进入寻常百姓家，甚至我们的社会也会逐渐成为依赖于0/1码的数字社会。那么计算机就不再仅限于支持我们的生产活动-工作，还要更好的支持我们的生活，娱乐，购物，旅游等等等等。

网络游戏是一个非常有趣，而且很有代表性的研究主题。有关网游（比如WOW）的论文现在也屡见不鲜。我觉得主要是一个虚拟社会的趋势。现在人们在游戏中组成小的队伍，或者商会，工会，包括门派，帮会。在现实中都有实际的对应物。虚拟的游戏角色相互交户，为完成某个任务而协作，竞争或者厮杀(PlayerKill)。这是一个现实生活的微缩版。看过黑客帝国的人们不难有这样的推论，我们未来的社会，或许也是类似于网游这样的虚拟数字社会。这样看来，研究网络游戏确实是一个具有社会效益，具有前瞻性和挑战性的课题。由此及彼，会不会有计算机支持的协同购物，协同饮食评点，协同搜索（所谓的人肉Google），协同新闻报道，协同旅游等等，所以这个Whatever估计也不会是遥远的事情了。

Mash-up

Mash-up也算是Web2.0时代的带来的一个新应用。简单来说，它就是“Web Application Hybrid.”通过利用外部的信息或服务组合在一起，提供一个全新的服务。

Mashup本来是指流行于美国某些牙买加人社区的一种音乐流派，通常是用来自多个音乐歌曲的片断来拼接形成新的歌曲。（Mashup (music), a musical genre of songs that consist entirely of parts of other songs）在这里主要是指利用不同来源的信息或服务，相互组合从而创新出新的服务或应用。这类应用一句话：不怕做不到，就怕想不到。

比较有名的Mashup有：

(1)    ChicagoCrime.org 将Google Map和芝加哥警局数据库的犯罪记录结合起来，从而在地图上标出那些犯罪的高发区。甚至包括犯罪类型，趋势等等。随着以后开放Map API的公司越来越多，此类应用还会更丰富。
(2)    例如利用类似Flickr的API来共享图形或者交友。
(3)    购物和价格比对，MySimon，Google的Froogle等
(4)    新闻混合并拼凑出的个性报纸：Diggdot.us等等。

Folksonomy

同样，这也是一个生生造出来的词，一般字典查不到（好在我们还有Google，:D），是随着语义网和互联网的发展而诞生的一种新兴应用。望文生义：Folksonomy 算是Folks (人民群众)和taxonomy（分类学）组合起来的词。简单来说，就是按照一大群人打标签(tagging)的聚合结果来进行的分类。

我们先理一理，这样一个步骤

(1)    语义网研究(Semantic Web)可以让我们每个人为所关心的事物来做语义标签，当然是各做各的，个性十足。
(2)    但是当作语义标签的人很多时，而且这些人都很Open，将自己的语义标签公开出来(sharing)
(3)    那么被标注的事物(object)上就可能有很多很多的标签，我们用统计的方法处理一下，那些最本质最能说明问题的标签就会凸现出来，成为该事物的一个分类标志。
(4)    这样的过程就是一个Folksonomy，也属于社会学范畴，基于Internet或者说以Internet为中介的，信息获取和分类的方法论。

理解Folksonomy有几个要点：

(1)    人民群众的大量自发标注(tagging)，这算是Folksonomy的物质基础；
(2)    这些标签都是公开共享的，这提供Folksonomy的运作可能。
(3)    所谓的社会分类方法是基于统计的，也就是出现频率。不是什么高深的算法或者理论！

网上有材料说：“(Folksonomy) 是信息构架（Information Architecture）中一个重要部分。而Folksonomy是指“群众”自发性定义的平面非等级标签分类，我将它称为“分众分类”，也有人将之解释为Social Classification。”这个定义能理解个大致，不过不太懂嘛叫做“信息架构”，听起来挺悬乎的。我个人偏爱这个简单的定义：“The aggregation of those user-generated tags within a given system into a bottom-up taxonomic representation of user-defined categories has been called a folksonomy.”Wiki的定义bla-bla-bla，太罗嗦了。

最后，还是拿网上的一个例子说明一下，算是illustrative case study:
“举个例子，当我在收藏Sina.com时，自定义了“门户”，“中国”，“新闻”这3个关键词作为标签，而其他人在收藏Sina.com时也自定义了自己的关键词作为标签。而最后系统统计出来使用“门户”，“中国”，“新闻”这个3个关键词来定义Sina.com的频率最高，那么这3个词就是用户对Sina.com的分众分类 - Folksonomy。“

网上这段说的也很好，刚好有助于我稍后引出所谓的群体智能(Swarm intelligence)和长尾效应(long tail)：“分众分类使得传统分类法摆脱了固化的现象，并且跟大众的认知程度密切的结合起来，同时这种分类方法也为群体用户和信息之间建立了一个联系桥梁。这种分类是平面化的，没有等级层次的划分，虽然它相对不够严谨，缺乏准确度，但是在社会性软件中，这种平面延伸的分类方法却在无形之中成为形成了沟通的渠道和网络，而且方便，灵活，不受条件限制。所以这种以自定义标签形式的分众分类在现下流行的社会性网络服务中得到了广泛的应用，del.icio.us ，Flickr，43things等等。”

Facebook

“面孔之书”？什么玩意？说白了就是里面脱胎换骨，外面看只是换了马甲的5460校友录！理解Facebook的要点：

(1)    基于大学或者学校环境的社会网络网站。Social network的网站多了去了，但社会网络这东西，说到底只是个架子。君不见，朋友圈子（见我以前的Blog）也不少，大牌公司推的也那样，不温不火的。可是一旦找对应用，就像Facebook那样，一下子火的不得了。不就是把校友录的皮贴上去了么！
(2)    提供日志，通讯录，照片，相册，涂鸦板等等交友功能，注意与其他Web2.0应用的继承和结合，例如Flickr。
(3)    别的好像没什么好说了。国内也有个海龟照抄的校内网（xiaonei.net），号称中国版的Facebook。

你说说，国内一再抄袭国外的应用，是因为我们笨么？教育体制问题，大家都去发垃圾paper了，谁还会对技术带来的机遇敏感，为新技术可能的应用激动。喂~~~~，有这样的人么？~~~~（大山回答）木有人，木有人，木有人了~~~~~

Swarm Creativity / Collective Intelligence

群体智能，似乎没啥太多说了。这个概念估计也有20来年了。人工智能研究到八十年代，有人学习研究累了，观察花鸟鱼虫，发现蜜蜂，蚂蚁这样不起眼的小东西，竟然能造出那么精致的蜂巢蚁穴，不可思议。这就是群体智能的滥觞。

群体智能是指集体的智慧，中国有句老话：“众人拾柴火焰高”，就是这个意思。在人工智能领域，群体智能就是通过大量小个体（可能不是很聪明的小个体）之间的协作和竞争表现出来的。不过如果只谈人工智能的群体智能，未免落了下乘。如果将这个概念推而广之，放到社会层面上来看，那就牛了。人本来就厉害，那么一大票人通过协作活动表现出来的智慧，估计就算专家也要退避三舍了。

Web2.0以及其派生出来各种应用，体现的就是这个思想。人们不再是Internet信息的简单获取者，还是创造者。Web2.0之所以成功，就在于此，它就是数字社会草根阶层的狂欢。更何况，这个社区内很多的推动者本身就是大牛呢。不过一人计短，众人计长，社会性的群体协作，通过合适的应用和模式调动起来的智慧和力量，超乎想象啊。

网上找到这么一段话（http://www.lifegrowing.com/danny/catalog.asp?tags=CollectiveIntelligence），我觉得很有意思：“关于未来，有两个趋势非常吸引我：一个是“个性化（Individualization）”，个体将获得越来越多的尊重，将越来越能向整个世界表述思想展示形象，另外一个是，越来越注重“群体智慧（Collective Intelligence）”。

看似矛盾的两个趋势，似乎在走两极，但他们却是内在逻辑统一的。“群体智慧”的获得，必须建立在“个性化”的基础上，没有“个性化”的实现，智慧只能是少数精英的“智慧”，只能是少数主流群体的智慧，而无法成为真正的“群体”智慧。只有当“群体智慧”获得实现，才能够返哺“个性化”，使置身群体生活中的个人脱离无知和自我封闭，成为真正意义上开放的人。

… George把对未来的求索比喻成一次探索未来的远航。我们所赖以导航的，是个体内在的以及群体共同形成的导航力。每个人都在行动，每个人都在相互启发，每个人都在感悟着未来的方向，我们每一个人，都是这条未来航船的船长。”

说的多好。

Long tail

和上面的群体智能对应，就可以说说长尾(the long tail)了。注意不是重尾(heavy tail)，那个是统计学范畴的概念。第一次听到桂玲提及长尾，不明其理。搜索的时候误记作重尾，搜索出来一大堆东西，看得我云里雾里，竟然也连猜带蒙大致明白了。如果说歪打正着，也忒神奇了，所以我一直迷糊：“这两个东西到底是不是一回事？”或者说，发明长尾的人，偷用了重尾的部分概念？简直晕死！

做学问，尤其是做信息科学方面的学问，不考虑经济和社会性，会死。长尾压根就是一个经济学的名词。嘛意思？过去说20/80原则，说书店80%的利润来自20%的畅销书。长尾就是说现在世道变了，人民群众口味变了，林子大了，买啥的都有。那些垃圾书（与畅销书相对）买的加起来也了不得，说不定比畅销书还赚钱。不怕买的少，就怕数量多啊。我畅销书买100本，也顶不上50个垃圾书一个卖2，3本。反正信息社会了，网上卖东西，库存少资金压力小，客户是来自全球的，60亿啊！排除那些第三世界不能上网的，只上网不卖东西的，也有好几个亿吧。青菜罗卜各有所爱，那些原来那些看似卖不动的垃圾书也就被人收藏了呢。（你说什么选集，什么三卷的中国卖了多少本？国外卖了多少本？）所以说，long tail就是传统观念的一种颠覆现象。怎么来的啊？都是“Internet”这个潘多拉的盒子放出来的。嘿嘿。

那些更艰深或者更专业的定义，大家自己搜索一下就行。总之群体智能也好，大众分类也好，Web2.0的各种应用都好，都是这样一个过程：“技术创造了可能，社会实现了奇迹”。这里面的社会学，经济学研究，真是八辈子也学不完啊。呵呵。

附几个中文的小文供参考:

http://www.360doc.com/showWeb/0/1/283214.aspx
http://www.360doc.com/showWeb/0/1/273879.aspx

转载于:https://www.cnblogs.com/hillfree/archive/2006/12/11/589123.html

CSCW领域的“老”词和“新”词相关推荐

新广告法规定不能使用这些词汇，如果使用禁用词、违禁词、敏感词、极限词及限制词被罚，最高处罚100万
在投放广告,比如电视宣传.百度推广.360推广.淘宝推广.天猫推广.抖音推广.户外宣传.京东推广.拼多多推广等形式广告时,要特别注意,投放前要仔细审查广告文案或者官方网站内容,尽量避免出现以下禁用词. ...
8.词袋和词向量模型
1.非结构化数据转换为词袋和词向量模型文本数据(非结构化数据)转换成计算机能够计算的数据.有两种常用的模型:词袋和词向量模型. 2.词袋模型(Bag of Words Model) 词袋模型看起来好 ...
python_根据词库进行“词联想”
输入法中,当你输入一个字的时候,输入法就能猜出你要输入什么词.这就是词联想.现在,再python中简单实现类似这样的功能:根据制定好的词库,输入一个新的词,帮助实现词联想.其中分词用了jieba包. ...
bert获得词向量_词向量详解：从word2vec、glove、ELMo到BERT
目前,词向量(又叫词嵌入)已经成为NLP领域各种任务的必备一步,而且随着bert elmo,gpt等预训练模型的发展,词向量演变为知识表示方法,但其本质思想不变.学习各种词向量训练原理可以很好地掌握N ...
词向量与词向量拼接_中文字词向量和方面词向量联合嵌入情感分析方法与流程...
本发明涉及一种中文字词向量和方面词向量联合嵌入CNN-LSTM情感分析方法. 背景技术: 近年来,越来越多的用户习惯在网络上发自己对某一事物的看法与评论.如何快速,准确地从互联网海量评论信息中分析所包 ...
mysql读数据入库es_ES 实现实时从Mysql数据库中读取热词,停用词
IK分词器虽然自带词库但是在实际开发应用中对于词库的灵活度的要求是远远不够的,IK分词器虽然配置文件中能添加扩展词库,但是需要重启ES 这章就当写一篇扩展了其实IK本身是支持热更新词库的,但是需要 ...
NLP︱句子级、词语级以及句子-词语之间相似性（相关名称：文档特征、词特征、词权重）
每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 关于相似性以及文档特征.词特征有太多种说法.弄 ...
springboot基于Elasticsearch6.x版本进行ES同义词、停用词（停止词）插件配置，远程词典热加载及数据库词典热加载总结，es停用词热更新，es同义词热更新
前言:ES版本差异较大,建议跨版本的同学,可以先了解一下版本区别,建议不要跨版本使用插件或者进行项目调试. 本总结主要基于6.x版本的6.5.1(6.2.2实测可用),分词器为IK,下载地址:http ...
词向量与词向量拼接_nlp中的词向量对比：word2vec/glove/fastText/elmo/GPT/bert
本文以QA形式对自然语言处理中的词向量进行总结:包含word2vec/glove/fastText/elmo/bert. 2020年更新:NLP预训练模型的全面总结JayLou娄杰:史上最全!PTMs ...

CSCW领域的“老”词和“新”词

CSCW领域的“老”词和“新”词相关推荐

最新文章

热门文章