当前位置: 100md首页 > 电子书籍 > 资料下载2021 > 未分类2
编号:46545
机器学习基础从入门到求职.pdf
http://www.100md.com 2020年11月18日
第1页
第9页
第20页
第27页
第34页

    参见附件(5523KB,427页)。

    《机器学习基础:从入门到求职》的定位是帮助求职者快速入门并掌握机器学习相关的基础核心知识,降低学习成本,节省更多的时间。

    编辑推荐

    适读人群 :机器学习初级和中级读者,机器学习岗求职者

    《机器学习基础:从入门到求职》的定位是帮助求职者快速入门并掌握机器学习相关的基础核心知识,降低学习成本,节省更多的时间。

    但是《机器学习基础:从入门到求职》并未介绍如何求职、如何面试,而是把机器学习算法相关岗位的常见问题罗列在前言,读者可阅读前言后自行判断哪些方面需要提升,然后学习本书中的相关章节,带你走近机器学习求职的起点。

    内容简介

    本书是一本机器学习算法方面的理论+实践读物,主要包含机器学习基础理论、回归模型、分类模型、聚类模型、降维模型和深度学习模型六大部分。机器学习基础理论部分包含第1、2章,主要介绍机器学习的理论基础和工程实践基础。第3章是回归模型部分,主要包括模型的建立、学习策略的确定和优化算法的求解过程,最后结合三种常见的线性回归模型实现了一个房价预测的案例。第4至11章详细介绍了几种常见的分类模型,包括朴素贝叶斯模型、K近邻模型、决策树模型、Logistic回归模型、支持向量机模型、随机森林模型、AdaBoost模型和提升树模型,每一个模型都给出了较为详细的推导过程和实际应用案例。第12章系统介绍了五种常见的聚类模型,包括K-Means聚类、层次聚类、密度聚类、谱聚类和高斯混合聚类,每一个模型的原理、优缺点和工程应用实践都给出了较为详细的说明。第13章系统介绍了四种常用的降维方式,包括奇异值分解、主成分分析、线性判别分析和局部线性嵌入,同样给出了详细的理论推导和分析。最后两章分别是词向量模型和深度神经网络模型,其中,词向量模型详细介绍了Word2Vec和Doc2Vec模型的原理推导和应用;深度神经网络模型系统介绍了深度学习相关的各类基础知识。本书适合对人工智能和机器学习感兴趣的学生、求职者和已工作人士,以及想要使用机器学习这一工具的跨行业者(有最基本的高等数学、线性代数、概率基础即可),具体判别方法建议您阅读本书的前言。

    机器学习求职60问

    类型一:基础概念类

    问题1:过拟合与欠拟合(定义、产生的原因、解决的方法各是什么)。

    问题2:L1正则与L2正则(有哪些常见的正则化方法?作用各是什么?区别是什么?为什么加正则化项能防止模型过拟合)。

    问题3:模型方差和偏差(能解释一下机器学习中的方差和偏差吗?哪些模型是降低模型方差的?哪些模型是降低模型偏差的?举例说明一下)。

    问题4:奥卡姆剃刀(说一说机器学习中的奥卡姆梯刀原理)。

    问题5:模型评估指标(回归模型和分类模型各有哪些常见的评估指标?各自的含义是什么?解释一下AUC?你在平时的实践过程中用到过哪些评估指标?为什么要选择这些指标)。

    问题6:风险函数(说一下经验风险和结构风险的含义和异同点)。

    问题7:优化算法(机器学习中常见的优化算法有哪些?梯度下降法和牛顿法的原理推导)。

    问题8:激活函数(神经网络模型中常用的激活函数有哪些?说一下各自的特点)。

    问题9:核函数(核函数的定义和作用是什么?常用的核函数有哪些?你用过哪些核函数?说一下高斯核函数中的参数作用)。

    问题10:梯度消失与梯度爆炸(解释一下梯度消失与梯度爆炸问题,各自有什么解决方案)。

    问题11:有监督学习和无监督学习(说一下有监督学习和无监督学习的特点,举例说明一下)。

    问题12:生成模型与判别模型(你知道生成模型和判别模型吗?各自的特点是什么?哪些模型是生成模型,哪些模型是判别模型)。

    类型二:模型原理类

    问题13:线性回归(线性回归模型的原理、损失函数、正则化项)。

    问题14:KNN模型(KNN模型的原理、三要素、优化方案以及模型的优缺点)。

    问题15:朴素贝叶斯(朴素贝叶斯模型的原理推导,拉普拉斯平滑,后验概率最大化的含义以及模型的优缺点)。

    问题16:决策树(决策树模型的原理、特征评价指标、剪枝过程和原理、几种常见的决策树模型、各自的优缺点)。

    问题17:随机森林模型(RF模型的基本原理,RF模型的两个“随机”。从偏差和方差角度说一下RF模型的优缺点,以及RF模型和梯度提升树模型的区别)。

    问题18:AdaBoost(AdaBoost模型的原理推导、从偏差和方差角度说一下AdaBoost、AdaBoost模型的优缺点)。

    问题19:梯度提升树模型(GBDT模型的原理推导、使用GBDT模型进行特征组合的过程、GBDT模型的优缺点)。

    问题20:XGBoost(XGBoost模型的基本原理、XGBoost模型和GBDT模型的异同点、XBGoost模型的优缺点)。

    问题21:Logistic回归模型(LR模型的原理、本质,LR模型的损失函数,能否使用均方损失、为什么)。

    问题22:支持向量机模型(SVM模型的原理,什么是“支持向量”?为什么使用拉格朗日对偶性?说一下KKT条件、软间隔SVM和硬间隔SVM的异同点。SVM怎样实现非线性分类?SVM常用的核函数有哪些?SVM模型的优缺点各是什么)。

    问题23:K-Means聚类(K-Means聚类的过程和原理是什么?优化方案有哪些?各自优缺点是什么)。

    问题24:层次聚类(层次聚类的过程、原理和优缺点)。

    问题25:密度聚类(密度聚类的基本原理和优缺点)。

    问题26:谱聚类(谱聚类的基本原理和优缺点)。

    问题27:高斯混合聚类(高斯混合聚类的原理和优缺点)。

    问题28:EM算法(EM算法的推导过程和应用场景)。

    问题29:特征分解与奇异值分解(特征分解与奇异值分解的原理、异同点、应用场景)。

    问题30:主成分分析(PCA模型的原理、过程、应用场景)。

    问题31:线性判别分析(LDA模型的原理、过程、应用场景)。

    问题32:局部线性嵌入(LLE模型的原理、过程、应用场景)。

    问题33:词向量(Word2Vec模型和Doc2Vec模型的类别,各自原理推导、应用和参数调节)。

    问题34:深度神经网络(深度神经网络模型的原理,反向传播的推导过程,常用的激活函数,梯度消失与梯度爆炸问题怎么解决?说一下深度神经网络中的Dropout、早停、正则化)。

    类型三:模型比较类

    问题35:LR模型与SVM模型的异同点。

    问题36:LR模型与朴素贝叶斯模型的异同点。

    问题37:KNN模型与K-Means模型的异同点。

    问题38:ID3、C4.5、CART模型的异同点。

    问题39:PCA模型与LDA模型的异同点。

    问题40:Bagging方式和Boosting模型的异同点。

    问题41:GBDT模型与XGBoost模型的异同点。

    问题42:Word2Vec模型中CWOB模式与Skip模式的异同点。

    问题43:Word2Vec模型和Doc2Vec模型的异同点。

    类型四:模型技巧类

    问题44:模型调参(随便选一个上述涉及的模型,说一下它的调参方式与过程)。

    问题45:特征组合(常见的特征组合方式有哪些?各自特点是什么)。

    问题46:特征工程(结合实践解释一下你所理解的特征工程)。

    问题47:缺失值问题(说一下你遇到的缺失值处理问题,你知道哪些缺失值处理方式?你使用过哪些,效果怎样)。

    问题48:样本不平衡问题(你知道样本不平衡问题吗?你是怎样处理的?效果怎么样?除上采样和下采样外,你还能自己设计什么比较新颖的方式吗)。

    问题49:特征筛选(特征筛选有哪几种常见的方式?结合自己的实践经验说一下各自的原理和特点。)

    问题50:模型选择(你一般怎样挑选合适的模型?有实际的例子吗?)

    问题51:模型组合(你知道哪些模型组合方式?除了运用AdaBoost和RF等模型,你自己有使用过Bagging和Embedding方式组合模型吗?结合实际例子说明一下)。

    问题52:AB测试(了解AB测试吗?为什么要使用AB测试)。

    问题53:降维(为什么要使用降维?你知道哪些降维方法?你用过哪些降维方式?结合实际使用说明一下)。

    问题54:项目(你做过哪些相关的项目?挑一个你觉得印象最深刻的说明一下)。

    问题55:踩过的坑(你在使用机器学习模型中踩过哪些坑?最后你是如何解决的)。

    类型五:求职技巧类

    问题56:机器学习求职要准备哪些项?各项对应如何准备?

    问题57:机器学习相关的学习内容有哪些?学习路线应该怎么定?有什么推荐的学习资料?

    问题58:机器学习岗求职的投递方式有哪些?什么时间投递最合适?投递目标应该怎样选择?

    问题59:机器学习岗求职的简历最好写哪些内容?所做的项目应该如何描述?

    问题60:面试过程中自我介绍如何说比较合适?求职心态应该如何摆正?如果遇到压力该如何面对?面试过程中如何掌握主导权?怎样回答面试官最后的“你还有什么要问我的”问题?怎样面对最后的人力资源面试?

    机器学习基础从入门到求职截图