一位艺术家从1900万份约会档案中读懂了美国

R. Luke DuBois browsed 19 million American dating-site profiles, figured out the most popular unique word used in every zip code and re-mapped the whole country accordingly.

美国政府每十年进行一次全国人口普查,以了解各地居住人口、职业、语言等信息。这些数据固然重要,但未必能告诉美国人他们究竟是谁——普通人的梦想与目标,以及他们如何描述自己。因此,2010年最新一轮人口普查结果发布时,艺术家R·卢克·杜波依斯(TED演讲:用数据绘制人类肖像)决定自己来做一番调查。

杜波依斯通过在21个不同的在线约会平台上创建账号,覆盖美国每一个邮政编码,从而收集数据。这使他得以浏览约1900万人的约会档案。为什么这样做?为了分析人们用来描述自己的词语。

杜波依斯使用了一种名为”词频-逆文档频率”(tf-idf)的技术,用以衡量某个词在特定邮政编码区域出现的频率,同时过滤掉在多个地区普遍使用的词语。”爱”和”性”这类常见词汇因此被剔除,留下的只有最具地域特色的词语。(人名也不在统计之列。)随后,杜波依斯用这些词替换了美国每座城市的名称,他的项目”更完美的联邦”(A More Perfect Union)由此诞生。

杜波依斯带我们游览这张重新命名的地图,并揭示了他所挖掘出的关键词,如何构成一幅描绘一个民族灵魂的地图。

R. Luke Dubois - Washington

华盛顿州:心碎总部

杜波依斯:西雅图最突出的词之一显而易见——”海湾”,即普吉特湾。但在城市周边,你还能看到”漂亮”、”心碎”、”演出”和”香烟”这样的词。这就是与西雅图人约会的感觉——他们在乐队里演出,他们抽烟,而你最终落得一颗破碎的心。华盛顿州雷德蒙德市是微软总部所在地,那里的词就没那么诗意了:”电子邮件”。


原创文章,作者:codex2,如若转载,请注明出处:https://www.ormemo.com/1549.html

(0)
codex2
上一篇 5小时前
下一篇 4小时前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注