当前位置: 首页 > 新闻 > 信息荟萃
编号:5207
数据科学入门.pdf
http://www.100md.com 2020年11月4日
第1页
第9页
第12页
第27页
第35页
第238页

    参见附件(13665KB,310页)。

     数据科学入门是一个蓬勃发展、前途无限的行业,有人将数据科学家称为“21世纪头号性感职业”。本书从零开始讲解数据科学工作,教授数据科学工作所必需的黑客技能,并带领读者熟悉数据科学的核心知识——数学和统计学。

    内容简介

    作者选择了功能强大、简单易学的Python语言环境,亲手搭建工具和实现算法,并精心挑选了注释良好、简洁易读的实现范例。书中涵盖的所有代码和数据都可以在GitHub上。

    通过阅读本书,你可以:

    学到一堂Python速成课;

    学习线性代数、统计和概率论的基本方法,了解它们是怎样应用在数据科学中的;掌握如何收集、探索、清理、转换和操作数据;深入理解机器学习的基础;

    运用k-近邻、朴素贝叶斯、线性回归和逻辑回归、决策树、神经网络和聚类等各种数据模型;探索推荐系统、自然语言处理、网络分析、MapReduce和数据库。

    内容提要

    本书基于易于理解且具有数据科学相关的丰富的库的 Python语言环境,从零开始讲解数据科学工作。具体内容包括: Python速成,可视化数据,线性代数,统计,概率,假设与推断,梯度下降法如何获取数据,k近邻法,朴素贝叶斯算法,等等。作者借助大量具体例子以及数据挖掘、统计学机器学习等领域的重要概念,详细展示了什么是数据科学本书适合有志成为数据科学工作者以及想了解数据科学的读者阅读。

    业界评论

    O' Reilly Radar博客有口皆碑。”

    Wired

    O Reilly凭借一系列(真希望当初我也想到了)非凡想法建立了数百万美元的业务。”

    -Business 2.0

    O Reilly Conference 7是聚集关键思想领袖的绝对典范。

    -CRN

    一本 O Reilly t的书就代表一个有用、有前途、需要学习的主题。”

    -Irish Tines

    Tim是位特立独行的商人,他不光放眼于最长远、最广阔的视野,并且切实地按照Yogi Berra的建议去做了:如果你在路上遇到盆路ロ,走小路(盆路)。回顾过去,Tim似乎每一次都选择了小路,而且有几次都是一闪即逝的机会,尽管大路也不错-Linux Joumal

    数据的威力

    生活中,数据无处不在。用户的每次点击,网站都会记录下来。你每时每刻的位置和速度,智能手机也会记录下来。“量化自我”生活方式的倡导者使用智能计步器记录心率、行动习惯、饮食习惯、睡眠方式。智能汽车记录驾驶习惯,智能家居设施记录生活习惯,智能购物设备记录购物习惯,等等。互联网是一个广袤的知识谱系,包括有无数交又引用的百科全书,电影、音乐、赛讯、弹球机、模因、鸡尾酒等各种专业数据库,以及许多政府发布的多得让人理不清头绪的统计数据(某些还是比较真实的)。

    在这些数据之中隐藏着无数问题的答案,这些问题从没有人提出过。让我们在这本书中起学习如何找出这些问题。

    数据科学入门截图

您现在查看是摘要介绍页, 详见PDF附件(13665KB,310页)