《数据可视化之美》(Beautiful Visualization)

Wordle是优秀的信息可视化吗?

如果你认为Wordle 是严格意义上的信息可视化工具,它在设计的某些方面存在误导或者干扰用户的潜在可能,有必要指出并加以批判。以下是我认为Wordle 存在的不足之处。

单词大小调整太初级

Wordle 在计算其字体大小时,并没有考虑单词的长度,或者它所绘制的文字的字形。其结果是,给定使用次数相同的两个单词,包含的字母越多的单词在屏幕上会占用更多的空间,这可能会给读者带来这样的印象:单词越长,其出现频度越高。

此外,据我所知,在关于单词大小和感知上的相对权重的关系上没有任何研究。更糟糕的是,常见的策略是把单词的权值根据其平方根进行缩放(为了体现单词拥有区域而不仅仅是长度这一事实),这只会使Wordle 显得很无聊。

颜色毫无意义

在你的电脑屏幕的中央提供了最宝贵的几个维度,令人吃惊的是,Wordle 在颜色使用上非常“散漫”。在Wordle 中,颜色是毫无意义的;它仅仅是用来提高单词边界的对比度和增加一些美感。

颜色可以用于对各个维度进行编码,如聚集(意味着这些单词通常是一起使用的)或者统计学意义(如图3-19 中的总统就职演说的单词云)。Wordle 还可以使用颜色在同一空间表示两种或者更多不同的文本。

值得一提的是,Wordle 并没有为色盲的读者做出什么特意安排,虽然人们总是可以通过应用小程序的色彩菜单栏创建一个定制的调色板。


图3-19 :这个演讲使用了很多“Government ”(政府)这个词,但是在其他演讲中该词用得更多;“pleasing ”(愉快)只被用了几次,但是它在语料库中是一个不寻常的单词;“people”(人民)被用了很多,其频率在该演讲中非同寻常。

字体是使人充满遐想的

Wordle 的很多字体都更倾向于美学和表现力,而不是可读性。这么做的原因一部分是因为Wordle 的Web 站点设计——如果缺乏形式多样的字体,画面将是单调的。最重要的是,Wordle 中的字体必须看起来很优美,这意味着它不一定很适合于正文文本。

对于易读性至关重要的应用,Wordle 提供了Ray Larabie 的Expressway 字体,该字体被美国运输部作为标准字母。

字数计数不够具体

Wordle 对《New Testament 》中的每一卷的页面中出现的“Lord ”(上帝)这个单词的次数进行了求和,但是它没有提供任何关于各个章节的区别的信息。仅仅简单地对单词计数并不能对相似的文本做出有意义的比较。比如有一个博客帖子,突出该帖子和该博客的其他帖子的不同之处,或者说明它和其他博客的在同一主题上的区别,甚至是说明该帖子和新闻报道文章的用语的不同,这些方面的说明可能是最具有启迪性的。

存在很多统计学方法,可以应用于一篇“样本”文章,来基于一些“范文”的正文来抽取“样本”中的特定字符,尤其注意一些单词的使用在统计上是更重要的。除了单词出现频度,还可以对单词权重进行更细致深入地探析,然后应用Wordle 布局算法来展示结果。

在分析每个总统就职演说时,我都探索了这个想法,把每个演说都和当时最接近的5个演讲、10 个最接近的演讲以及所有其他的就职演说进行了比较。这种分析的优点是可以揭示一些不可预见的单词。举个例子,图3-20 是哈里·杜鲁门在1948 年的就职演说的可视化。左侧是该就职演说中使用的单词的Wordle 形式的展现,右侧是他那个时代的其他总统所使用次数更多的单词的展现。该可视化展现说明了杜鲁门的演说强调的是对外政策。


图3-20 :哈里·杜鲁门在1948 年的总统就职演说:和他同时代的其他总统就职演说相比,杜鲁门的演说当中很明显缺乏那些红色标注的单词。

如何真正使用Wordle?

Wordle 不是为可视化专家、文本分析专家甚至是有经验的计算机用户而设计的。我试着把Wordle 做得尽可能像个工具。

在撰写本章时,人们在Wordle 画廊中已经创造、保存了超过140 万的“单词云”。这些单词云被用于:总结和修饰商务演示和博士论文,插图说明新的文章和电视新闻报道,提炼和抽象受害者个人痛苦的回忆。Wrodle 还发现形形色色的充满热情的教师社区,他们使用Wordle 来展示拼写列表、总结话题以及促使不识字的青年参与到享受文本的乐趣中。

如表3-1 的调查结果表明(Viégas、Wattenberg 和Feinberg,2009 ),使用Wordle 激发了人们的创造力,人们会觉得他们正在做创造性的事情。

表3-1 :人们创造Wordle时的感受

感受 赞成% 中立% 不赞成%
激发我的创造力 88 9 4
我感到一种情绪反应 66 22 12
从文本中我学到了一些新的知识 63 24 13
它证实了我对文本的理解 57 33 10
它勾起了我的回忆 50 35 15
Wordle 使我感到困惑 5 9 86

因此,通过对可视化效能应用传统的学术评估——“从文本中我学到了一些新的知识”——至少可以认为Wordle 是比较成功的。但是Wordle 真正闪光之处在于其交际作品的创作。使用Wordle 的人们感觉他们似乎创造了一些东西,它成功地表示一些有意义的事物,并准确地反映或增强了源文本。这种意义看起来主要是直观的,因为很多人并没有意识到单词大小和单词频度是相关的(相反地,猜测该大小表示“情感重视”甚至是“单词意义”)。

Wordle 的特性缘于文本的特性。只是简单地把一个单词放到屏幕上,其字体要么对单词本身的涵义进行补充,要么对其进行反衬,可以马上使读者产生共鸣(实际上,在公共画廊上保存了成千上万的单词)。当你把两个或者更多的单词并排展示时,一个有文化的人就会自然而然地去理解该序列化单词。Wordle 对单词的随机组合给人们创造了喜悦、惊喜、某种程度的认可,以及如诗般激发了人们的洞察力。

为传统的信息可视化使用Wordle

Wordle 的信息可视化分析用途当然可以为专业用户所用,更不用说Wordle 所具备的特定的情感和交际特性。为了满足那些使用Wordle 给“加权文本”创建可视化的用户,其权重不一定是基于单词的出现频度,Wordle 的Web 站点提供了“高级”用户界面,用户可以输入包含任意(可选)色彩的加权单词或短语的表格数据。

Wordle 的更高级的使用方式可能是通过“单词云生成器”控制台应用程序,可以通过IBM 的alphaWorks Web 站点进行查看。

ManyEyes 协作式数据可视化网站还把Wordle 作为文本可视化选项,其他的还有创新型的Phrase Net 和Word Tree 可视化(以及更传统的标签云)。

---------------------------
本文节选自《数据可视化之美》(Beautiful Visualization)第3章“Wordle”,作者Jonathan Feinberg。
更多本书相关链接,请点击:【华章官网】【互动网】【卓越网】【当当网】【京东网】【豆瓣网】

转载于:https://www.cnblogs.com/hzbook/archive/2011/06/29/2093436.html

Wordle是优秀的信息可视化吗?如何真正使用Wordle?相关推荐

  1. 交互设计、信息图、信息可视化、数据可视化技术资源汇总——设计师的领域,设计师说了算

    本文整理了设计师常逛的网站,这些资料信息网站包括交互设计.信息图.信息可视化,在线制图.数据可视化,本文大致的内容包括: <灵感--可以参看如下网站来寻找灵感网站汇总>. <信息图工 ...

  2. 20 款优秀的数据可视化工具,总有一款你用的到!

    今天给大家分享20款优秀的数据可视化工具,欢迎收藏! /01/ 入门级工具 01 Excel Excel的图形化功能并不强大,但Excel却是分析数据的理想工具,上图是Excel生成的热力地图. 作为 ...

  3. UI设计实用临摹素材|APP设计的信息可视化!

    手机APP界面为信息可视化提供更为有趣的交互体验,信息可视化也为手机APP界面提供了更为优良的视觉呈现效果和传播形式.在进行手机APP界面设计时,为了能更加有效及时的传达准确信息,将信息数据恰当合理的 ...

  4. 怎样做出一份优秀的数据可视化大屏| 推荐收藏

    ​近年来,数据可视化是一个热度比较高的词,数据可视化是指将数据以视觉形式来呈现,如图表或地图,以帮助人们了解这些数据的意义. 而数据可视化大屏是当前可视化领域的一项热门应用,通常可以分为信息展示类.数 ...

  5. 优秀的数据可视化设计

    优秀的数据可视化设计 聂永真可视化设计实验室 整理.等信息 好的设计师擅长从别人优秀的作品中获取灵感,这里就介绍一些非常优秀的数据可视化的设计(因为不支持 gif,推荐点击标题链接看动态效果): Am ...

  6. 干货满满的信息可视化设计大科普(小白白篇)

    干货满满的信息可视化设计大科普(小白白篇) 当下,随着互联网和新媒体的技术兴起,艺术门类又一次成为读大学的一个捷径.而这种情况造成的必然结果学生们的艺术基础薄弱和艺术修养亟需提高.很多同学在上大学前甚 ...

  7. 患者信息可视化及关联规则可视化

    源码链接:https://github.com/yemahei/test 患者信息可视化及关联规则可视化系统的实现 一.系统需求分析 藏医药学是我国传统民族医药学宝库中一颗璀璨的明珠,在藏族人民漫长的 ...

  8. 《信息可视化:交互设计(原书第2版)》——第2章基本概念

    第 2 章 基 本 概 念 一本关于信息可视化的书应该介绍哪些基本概念?本章将通过一个具体的例子来展示信息可视化工具应具有的基本功能.我们选择了一个很具代表性的任务并对其进行了深入的讨论.虽然我们只选 ...

  9. 数据可视化 信息可视化_可视化哲学的黎明

    数据可视化 信息可视化 Note: this is the foreword of the book Data Visualization in Society (Amsterdam Universi ...

  10. 数据可视化 信息可视化_动机可视化

    数据可视化 信息可视化 John Snow's map of Cholera cases near London's Broad Street. 约翰·斯诺(John Snow)在伦敦宽街附近的霍乱病 ...

最新文章

  1. 从零开始一起学习SLAM | 点云到网格的进化
  2. Docker安装zookeeper 单节点安装
  3. Tomcat 在mac上(Idea)端口冲突解决办法
  4. mysql先删后增并发时出现死锁_MySQL死锁案例分析一(先delete,再insert,导致死锁)...
  5. 你有结账时发现太贵的尴尬吗?
  6. 当数据处理做不到实时,应该怎么办?
  7. Android查看每个线程CPU占用情况,以及工作内容分析
  8. c的花体字_[转载]花体字~~漂亮~
  9. php 公众号多图文消息,微信公众号怎样群发多图文消息?
  10. 史上最全的Unreal Engine 4学习资料整理
  11. 一篇文章总结Java虚拟机内存区域模型
  12. 官方:2056名广西考生未按规定上传“软考报考材料”,逾期将取消资格
  13. ppt怎么转换成pdf
  14. opencv-python 小白笔记(3)
  15. Struts2实现URL伪静态
  16. 【java初学】static关键字和接口
  17. 启动不了argis的license manager
  18. java常用监控命令
  19. Diagonal distance in 23 dimensions
  20. avast! 5.0 中文正式版 - 免费强悍的杀软

热门文章

  1. 创建一棵二叉树(C++)以及遍历
  2. Git学习总结(1)——简介与基本操作
  3. 【RS|概念】辐射校正和几何纠正
  4. 凭实力蝉联第一!Flink 又双叒叕上榜啦
  5. Flink 1.11 Unaligned Checkpoint 解析
  6. 覆盖电商、推荐、ETL、风控等多场景,网易的实时计算平台做了啥?
  7. 上海GDD(谷歌开发者大会),第一天总结
  8. 初二生态系统思维导图_鑫讲堂:初二年级十一月微讲座汇报(二)
  9. 华为鸿蒙重磅更新,华为重磅官宣!鸿蒙系统升级机型遭曝光:多达55款产品支持升级...
  10. python设置很大的刻度_【Matplotlib】设置刻度(1)