5 大常用机器学习模型类型总结

本文介绍了 5 大常用机器学习模型类型:集合学习算法,解释型算法,聚类算法,降维算法 ,相似性算法,并简要介绍了每种类型中最广泛使用的算法模型。我们希望本文可以做到以下三点:

1、应用性。 涉及到应用问题时,知识的普适性显然非常重要。所以我们希望通过给出模型的一般类别,让你更好地了解这些模型应当如何应用。

2、相关性。 本文并不包括所有的机器学习模型,比如Naïve Bayes(朴素贝叶斯)和SVM这种传统算法,在本文中将会被更好的算法所取代。

3、可消化性 。对于数学基础较薄弱的读者而言,过多地解释算法会让这篇文章的可读性变差,更何况,你可以在网上找到无数教我们实现这些模型的资源。因此,为了避免本文变得无聊,我们将会把目光放在不同类型的模型的应用上。

01 集成学习算法

(随机森林XGBoost, LightGBM, CatBoost)

什么是集成学习算法?

为了理解什么是集成学习算法,首先,你需要知道什么是集成学习。集成学习是一种同时使用多个模型,以达到比使用单一模型更好的性能的方法。

从概念上讲,可以参考下面这个比喻:

![b1cbdb843cf97377af948f3f9ab2ea41.png](https://img- blog.csdnimg.cn/img_convert/b1cbdb843cf97377af948f3f9ab2ea41.png)

我们向一个班里的学生提出一个数学问题。他们有两种解答方式:合作解答和单人解答。生活经验告诉我们,如果全班同学一起合作,那么学生之间可以互相检查,协作解决问题,并最终给出一个唯一的答案。然而单人作答就没有这种检查的福利了——即使他/她的答案错了,也没有人能帮他/她检验。

这里的全班协作就类似于一个集成学习算法,即由几个较小的算法同时工作,并形成最终的答案。

应用

集成学习算法主要应用于回归和分类问题或监督学习问题。由于其固有的性质,集成学习算法优于所有传统的机器学习算法,包括Naïve Bayes、SVM和决策树。 机器学习 | Sklearn中的朴素贝叶斯全解 机器学习|支持向量机1–线性SVM用于分类原理 机器学习|支持向量机2–非线性SVM与核函数 机器学习 | 决策树模型(一)理论 机器学习 | 决策树模型(二)实例

算法

随机森林: 随机森林由许多相互独立的决策树构成。 集成算法 | 随机森林分类模型 集成算法 | 随机森林回归模型

XGBoost: 类似于梯度提升(GradientBoost)算法,但添加了剪枝,Newton Boosting,随机化参数等功能,因而比梯度提升更强大。 XGBoost 与 LightGBM 哪个更胜一筹 信用卡欺诈检测|用启发式搜索优化XGBoost超参数

LightGBM: 利用基于梯度的单边采样(GOSS)技术过滤数据的一种提升算法,目前实验已经证实比XGBoost更快,且有时更准确。 机器学习|LightGBM原理及代码

CatBoost: 一种基于梯度下降的算法。

02 解释型算法

(线性回归、逻辑回归、SHAP、LIME)

什么是解释型算法?

解释型算法使我们能够识别和理解结果有统计学意义的变量。因此,与其创建模型来预测响应变量的值,不如创建解释性模型来帮助我们理解模型中变量之间的关系。

而从回归的角度来看,人们往往强调统计学上显著的变量,这是因为对于从一个整体中提取出的样本数据,如果想对样本做出结论,首先必须确保变量拥有足够的显著性,并由此做出有把握的假设。

![6a9cf3d408e06a00a48891d89d763274.png](https://img- blog.csdnimg.cn/img_convert/6a9cf3d408e06a00a48891d89d763274.png)

应用

解释性模型通常用于需要作出解释的场景。比如展示 「为什么 」做出某个决定,或者解释两个或多个变量之间「如何」相互关联。

在实践中,你的机器学习模型的可解释性与机器学习模型本身的性能一样重要。如果你不能解释一个模型是如何工作的,那么这个模型就很难取信于人,自然也就不会被人们应用。

算法

基于假设检验的传统解释模型:

线性回归: 如果 2 个或者多个变量之间存在“线性关系”,就可以通过历史数据,建立变量之间的有效“模型”,来预测未来的变量结果。例如,y = B0

B1 * x。 机器学习 | 简单而强大的线性回归详解 机器学习|线性回归中的多重共线性与岭回归 机器学习 | 多项式回归处理非线性问题

Logistic回归: 逻辑回归主要解决二分类问题,用来表示某件事情发生的可能性。 机器学习 | 逻辑回归算法(一)理论

解释机器学习模型的算法:

SHAP: 即来自博弈论的沙普利加和解释,实际是将输出值归因到每一个特征的shapely值上,依此来衡量特征对最终输出值的影响。 用 SHAP 可视化解释机器学习模型实用指南(上) 用 SHAP 可视化解释机器学习模型实用指南(下)

LIME: LIME算法是Marco Tulio Ribeiro2016年发表的论文《“Why Should I Trust You?” Explaining the Predictions of Any Classifier》中介绍的局部可解释性模型算法。该算法主要用于文本类与图像类的模型中。

03 聚类算法

(k-Means,分层聚类法)

什么是聚类算法?

聚类算法是用来进行聚类分析的一项无监督学习任务,通常需要将数据分组到聚类中。与监督学习的已知目标变量不同,聚类分析中通常没有目标变量。

![fea5c891edeffd1567bac703f65ae829.png](https://img- blog.csdnimg.cn/img_convert/fea5c891edeffd1567bac703f65ae829.png)

应用

聚类算法可以用于发现数据的自然模式和趋势。聚类分析在EDA阶段非常常见,因为可以得到更多的数据信息。

同样,聚类算法能帮你识别一组数据中的不同部分。一个常见的聚类细分是对用户/客户的细分。

算法

K-means聚类: K均值聚类算法是先随机选取K个对象作为初始的聚类中心。然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。 机器学习 | KMeans聚类分析详解

层次聚类: 通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。

04 降维算法

(PCA, LDA)

什么是降维算法?

降维算法是指减少数据集输入变量(或特征变量)数量的技术。本质上来说降维是用来解决“维度诅咒”的。(维度诅咒:随着维度(输入变量的数量)的增加,空间的体积呈指数级增长,最终导致数据稀疏。)

![1d21a6c85377ce66a2f4493a898e41e7.png](https://img- blog.csdnimg.cn/img_convert/1d21a6c85377ce66a2f4493a898e41e7.png)

应用

降维技术适用于很多情况,比如:当数据集中的特征很多而实际需要的输入变量很少时,或者当ML模型过度拟合数据时,都可以使用降维技术。

算法

主成分分析(PCA) :一种使用最广泛的数据降维算法。PCA的主要思想是将n维特征映射到k维上,这k维是在原有n维特征的基础上重新构造出来的,全新的正交特征。 机器学习|这次终于彻底理解了PCA主成分分析

线性判别分析(LDA): 用于在有两个以上的类时进行线性分类。

05 相似性算法

(KNN、欧几里得距离、余弦、列文斯坦、Jaro-Winkler、SVD…)

数据科学中 17 种相似性和相异性度量(上) 数据科学中 17 种相似性和相异性度量(下)

什么是相似性算法?

相似性算法是指那些计算记录/节点/数据点/文本对的相似性的算法。所以相似性算法包含许多种类,例如有比较两个数据点之间距离的相似性算法,如欧氏距离;也有计算文本相似性的相似性算法,如列文斯坦算法。

![ac0e2fa3555a74ef728b4c90b83456d5.png](https://img- blog.csdnimg.cn/img_convert/ac0e2fa3555a74ef728b4c90b83456d5.png)

应用

相似性算法也可以用于各种场景,但在与“推荐”相关的应用上表现尤为出彩,比如用来决定:

根据你之前的阅读情况,Medium应该向你推荐哪些文章?

你可以用什么原料来替代蓝莓?

网易云应该根据你已经喜欢过的歌曲来推荐什么歌曲?

亚马逊应该根据你的订单历史推荐什么产品?

……

算法

K邻近: 通过在整个训练集上搜索与该数据点最相似的 K 个实例(近邻)并且总结这 K 个实例的输出变量,从而得出预测结果。

欧几里德距离: 一个通常采用的距离定义,指在m维空间中两个点之间的真实距离,或者向量的自然长度(即该点到原点的距离)。

余弦相似度: 利用向量空间中两个向量夹角间的余弦值衡量两个个体之间差异的大小,余弦值接近1,夹角趋于0,表明两个向量越相似,余弦值接近于0,夹角趋于90度,表明两个向量越不相似。

列文施泰因算法: 指两个字串之间,由一个转成另一个所需的最少编辑操作次数。

Jaro-Winkler算法: Jaro–Winkler distance 适合于较短的字符之间计算相似度。0分表示没有任何相似度,1分则代表完全匹配。

奇异值分解(SVD)(不完全属于相似性算法,但与相似性有间接关系): 定义一个m×n的矩阵A的SVD为:A=UΣVT ,其中U是一个m×m的矩阵,Σ是一个m×n的矩阵,除了主对角线上的元素以外全为0,主对角线上的每个元素都称为奇异值,V是一个n×n的矩阵。U和V都是酉矩阵,即满足UTU=I,VTV=I。这次终于彻底理解了SVD奇异值分解

以上就是对当前主流的机器学习算法的总结,希望本文能帮助你更好地了解各种ML模型以及它们的应用场景。当然,纸上得来终觉浅,如果本文使你有所收获,那就请开始你的应用之路吧,看看你能用ML解决什么问题!

参考链接: https://towardsdatascience.com/all-machine-learning-algorithms-you-should- know-in-2022-db5b4ccdf32f

- END -

对比Excel系列图书累积销量达15w册,让你轻松掌握数据分析技能,可以在全网搜索书名进行了解选购:

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

一、大模型全套的学习路线

学习大型人工智能模型,如GPT-3、BERT或任何其他先进的神经网络模型,需要系统的方法和持续的努力。既然要系统的学习大模型,那么学习路线是必不可少的,下面的这份路线能帮助你快速梳理知识,形成自己的体系。

L1级别:AI大模型时代的华丽登场 L2级别:AI大模型API应用开发工程 L3级别:大模型应用架构进阶实践 L4级别:大模型微调与私有化部署 一般掌握到第四个级别,市场上大多数岗位都是可以胜任,但要还不是天花板,天花板级别要求更加严格,对于算法和实战是非常苛刻的。建议普通人掌握到L4级别即可。

今天只要你给我的文章点赞,我私藏的大模型学习资料一样免费共享给你们,来看看有哪些东西。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

四、AI大模型商业化落地方案

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

大模型 AI 能干什么?大模型是怎样获得「智能」的?用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例:向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示(Embeddings)向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

为什么要做 RAG什么是模型什么是模型训练求解器 & 损失函数简介小实验2:手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身:基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例:如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】