探索历史大数据历史学家的宏观视角高清.pdf
http://www.100md.com
2020年12月1日
![]() |
| 第1页 |
![]() |
| 第8页 |
![]() |
| 第19页 |
![]() |
| 第22页 |
![]() |
| 第45页 |
![]() |
| 第161页 |
参见附件(54320KB,281页)。
了解历史数据分析的工具书
探索历史大数据历史学家的宏观视角主要讲述怎么用开源的工具来分析和解读历史,量化历史。。。文本分析的方法还是NLP的基础方法,如词频,词云,主题模型和网络分析。。书中提供的一些开源包还不错。。。
探索历史大数据历史学家的宏观视角预览







目录大全
章大数据带给历史学家的喜悦
●第二章 DH时刻
●第三章 文本挖掘工具:技术与可视化
●第四章 主题建模:在大数据中亲自探索
●第五章 让你的数据变得条理清晰:可视化的基本介绍
●第六章 网络分析
●第七章 网络应用
●结论
图书简介
数字时代的到来使得人文大数据越来越容易获得,这即是令人振奋的新途径的开启,同时也是新的挑战。探索大历史数据,使得研究者首先面临一个巨大的语料库,本书即是针对这一问题,描述和演示通过搜索数据进而构建文化遗产知识、研究、教学和学方式:我们如何使用它们?要提防什么?本书开辟了新的宏观视角,有助于人文学者掌握大数据来做他们的工作。
作者介绍
肖恩?格雷厄姆(Shawn Graham),曾在美国北卡罗莱纳大学教堂山分校、威斯敏斯特大学、匹兹堡大学等高校,为本科生与研究生提供学术咨询及职业指导;同时,肖恩也是一个活跃的评论员,其文章发表在《华尔街日报》、《华盛顿邮报》等媒体。
序言阅读
某位历史学家坐在书桌旁,打开了台灯。她开始认真阅读一摞 18 世纪伦 敦的庭审记录,这些文件是影印版,且质量不佳,她边看边抄录案文。在工作 的时候,她开始注意到用于描述年轻女性囚犯的语言似乎存在一些有趣的规 律。“我猜想……”她自言自语道,她求助于 OldBaileyOnline (一个法律在线 数据库)并展开搜索工作。很快,她就拥有了一个包含一千份有关女性囚犯的 庭审诉讼资料。她完整的副本并将其加载到 VoyantTools (一种文本分 析工具)中。没过多久,她得到了文本中关键词、关键词搭配以及它们使用频 率随时间变化的图表。她更加确信自己的猜测。她使用 MALLET (一种处理 文本的 Java 工具包)开始寻找文本中潜在的语义结构。该算法经过多次探索, 结果似乎表明,每篇文本的大部分内容都涉及 23 个常见主题。
那么,这些主题、这些单词列表意味着什么呢? 她开始探究主题和文本之 间的关系,并发现了一个话语网络,该网络似乎与国家施加给女囚的道德义务 紧密相关。她开始探索网络的形式特征,即哪些词汇、什么想法正在从事繁重 的语义提升工作? 同时,她在语料库上运行 RezoViz 工具( VoyantTools 中的 一个工具),以提取文档中指定的个人和组织。她开始查阅已经提取完成的社 交网络,她能够识别女性和看守、儿童和男性的次级社区,并把注意力集中在 一群能够将监狱社区凝聚起来的一小部分人身上。不久,她就对 18 世纪有关 女性审判的话语有了深入的宏观认识,对关键的个体、组织以及它们之间的联 系同样了然于心。她看了看表,两个小时过去了。她对这样的结果感到满意, 然后停止了此次历史宏观探究,她关掉了电脑,再次将目光投向手边的抄本。 我们生活在一个人文学者需要了解如何利用数字化媒介进行传统人文学 术研究的时代,包括它们的算法、假设、用法和中介。人文学科和数字化媒介(也称“新媒介”)的联系可以追溯到几十年前,且两者的交互促进了彼此的发 展。从广义的视角来看待“新媒介”,我们可以发现,对于先前通信技术的引入 以及它们代表(或者说是“构建”)人类知识的方式相应地也需要新的观点并采 取新的方法。上文中的例子,为我们展现了一种历史学家利用历史学领域“大 数据”进行研究的可能方式。除此之外,还存在其他路径。本书的三位作者已 经探索了许多可以用于历史学和其他人文学科研究的大数据工具和研究视 角。这些方法正在不断发展、完善,本书挑选了其中最有用的一些方法进行介 绍和描述,内容涵盖它们的使用方法、注意事项、各类问题以及宏观研究开创 的全新视角。
我们将这本书的副标题命名为“历史学家的宏观视角”,以此表明这既代 指一种工具,也代表了一种研究视角。我们并不是在暗示这就是历史学家遇 到大数据时“做”历史的唯一方式;相反,它只是工具箱中的一种手段,是历史 学家处理无法回避的“大”数据的又一种方式。更重要的是,所谓的“宏观”(一 种观察体量巨大事物的工具)恰恰体现了一种科学家的工作平台,研究人员借 助不同的工具来探究不同的问题,并在笔记本上留下记录。同样地,(我们认 为)历史学家的大数据路径需要的是一种公开的方法,历史学家保留公开的记 录,以便其他人可以通过保留的信息探索相同的路径,同时可能会得到完全不 同的结论。这是一种“生成性”的方法:人文科学的大数据不仅可以证实过去 的故事,而且能够生成新故事、新观点,为我们提供新的工具和优势。
探索历史大数据历史学家的宏观视角截图



您现在查看是摘要介绍页, 详见PDF附件(54320KB,281页)。





