# 机器学习
-
概率图模型--因子图
这篇文章介绍了因子图在概率图模型中的应用。首先,简单回顾了概率图模型的基本概念,并回顾了贝叶斯网络和马尔可夫随机场(MRF)。接着,介绍了因子图的概念及其在表示贝叶斯网络和马尔可夫随机场中的应用。最后,总结了因子图在概率图模型中的作用,展示了其在简化和统一表示复杂概率关系中的优势。
-
概率图模型--马尔可夫随机场
这篇文章介绍了从贝叶斯网络过渡到马尔可夫链的过程。首先,简单回顾了贝叶斯网络的基本概念。接着,解释了如何通过head-to-tail方法导出马尔可夫链,并讨论了马尔可夫随机场(MRF)及其与马尔可夫链的关系。 文章通过简单实例说明了MRF的应用,并介绍了加入节点势函数以改进MRF的方法,特别是成对马尔可夫随机场。然后,讨论了如何将图像处理问题转化为定义在MRF上的最大后验概率推理问题,并详细解释了最大后验概率的改写过程。最后,总结了贝叶斯网络、马尔可夫链和马尔可夫随机场的联系及其在推理任务中的应用。
-
概率图模型--变量消元法与团树传播算法
这篇文章简单回顾了概率图模型的推理任务,详细介绍了变量消元算法及其在MRF和贝叶斯网络中的应用。讨论了不同的消元顺序,说明了算法的步骤及其复杂度分析。接着,介绍了团树传播算法,解释了聚类图的概念,并说明了如何由变量消元法导出团树传播算法。文章进一步探讨了聚类图的构造及其满足的性质,并解释了新因子即消息传递的含义。最后,介绍了如何通过团树传播算法求得概率图所有节点的边缘概率。
-
概率图模型--贝叶斯网络
这篇文章介绍了概率图模型及其核心概念。首先,解释了什么是概率图,并介绍了概率图模型的三要素:表示、推理和学习,以及它们之间的联系。接着,详细讨论了贝叶斯网络和朴素贝叶斯模型,解释了条件独立的概念,并深入探讨了独立与条件独立的区别。 文章进一步说明了如何将联合概率表示为局部条件概率表的乘积,并详细解析了边权值的含义。最后,解释了为什么朴素贝叶斯被称为“朴素”,全面展示了概率图模型在统计学习中的重要性和应用。
-
概率图模型--HMM
这篇文章介绍了概率图模型中的隐马尔可夫模型(HMM)。首先,简要介绍了马尔可夫链的基本概念。接着,详细解释了HMM的基本假设,包括两个状态空间(隐藏状态和观测状态)和三组参数(初始状态概率、转移概率和观测概率)。然后,讨论了HMM的三个基本问题:概率计算问题(即评价问题),预测问题(即解码问题)和学习问题,全面展示了HMM在处理序列数据中的应用和解决方法。
-
Adaboost 算法与集成学习
这篇文章详细介绍了Boosting方法中的Adaboost算法。首先,解释了如何生成基本分类器。然后,讨论了Adaboost中的数据权重及其目标,详细说明了在每一轮迭代中更新数据权重的方式,并介绍了合并生成最终分类器的过程。 文章总结了Adaboost的全局过程,并描述了Adaboost在回归问题中的算法流程。接着,通过代码示例展示了如何实现Adaboost,并介绍了Adaboost类库的调用方法,特别是AdaBoostClassifier和AdaBoostRegressor框架参数及其弱学习器参数。通过这些内容,全面展示了Adaboost算法在分类和回归问题中的应用和实现方法。
-
随机森林算法与集成学习
这篇文章介绍了随机森林算法与集成学习的相关内容。首先,讨论了聚合模型,包括同权重和不同权重的模型,解释了如何生成g(x)。然后,介绍了Bagging(一袋子模型)和Boosting(提升模型)的基本概念和区别。 文章详细讲解了随机森林算法,并讨论了OOB(Out of Bag)问题。接着,通过鸢尾花数据集进行实战,展示了多种模型结合Bagging的方法,以及随机森林在处理OOB问题中的应用。通过这些内容,全面展示了随机森林算法与集成学习在实际中的应用及其优势。
-
经典决策树CART、ID3与C4.5
这篇文章介绍了决策树模型的理论与实践。首先,解释了决策树的数学表达,包括整体表达式和迭代表达式。然后,讨论了决策树的分裂指标,介绍了Gini系数与CART算法的应用,其中CART用于分类和回归目标。接着,介绍了信息增益与ID3算法,以及信息增益率与C4.5算法,比较了ID3与C4.5的区别,并讨论了何时停止分裂决策树。 文章总结了决策树的优缺点,并比较了CART、ID3与C4.5。接着,通过鸢尾花数据集进行实战,绘制不同超参数对应的决策树模型图形,并实现回归树,展示不同超参数下决策树模型的回归效果。通过这些内容,全面展示了决策树模型的理论基础及其在分类和回归任务中的应用。
-
实战音乐分类项目
这篇文章介绍了一个实战音乐分类项目,详细解析了音乐结构及傅里叶分析在音频结构中的应用。首先,解释了时域与频域的预备知识,并介绍了傅里叶级数,通过图示展示傅里叶级数(以3项为例)。接着,详细讲解了音乐分类项目的步骤,包括查看歌曲的时域和频域,进行傅里叶变换以提取特征,将特征转化为x,标签转化为y。然后,介绍了读取模型进行预测的方法,并通过贝多芬的《月光曲》进行示范,展示了音乐分类的实际应用。最后,强调了项目的完整性,确保有始有终。
-
偏最小二乘回归(PLS)
这篇文章介绍了偏最小二乘回归(Partial Least Squares, PLS)的适用场景、基本原理和计算步骤。PLS回归适用于自变量多重共线性或样本数少于自变量数的情况。文章详细讲解了标准化数据、计算协方差矩阵、提取潜在变量和构建回归模型的四个步骤。还介绍了交叉有效性检验用于评估模型的预测能力。最后,通过Python代码示例展示了PLS回归的具体实现方法,全面展示了PLS回归的应用及其在解决多重共线性问题中的优势。