机器学习 - 分类

近在录制Excel vba网抓教程，弄了一个网抓百度搜索结果的例子，分享一下。（注意：网抓是有时效性的，如果下面代码无法生效，请评论回复提醒我一下，谢谢。）百度搜索的url参数，主要有

《机器学习实战》书中第5章讲的是逻辑回归（Logistic回归）。满怀鸡冻放开书本，结果读了好几遍都没弄明白其原理。弄不懂逻辑回归实现代码为什么要那么写！至少我已经先学过斯坦福大学教授Andrew

这本《机器学习实战》第1个算法是k-近邻算法，也叫KNN。该算法简单容易理解，十分适合入门。 k-近邻算法是用于分类。分类问题是监督学习算法的一个研究方向。既然是属于监督学习的，就需要1个训练数据集作

上一篇博文讲了朴素贝叶斯的理论知识。有了理论基础，就可以实践应用了。机器学习有个重要的应用是对文档自动分类。例如电子邮件、新闻报道、用户留言、博客文章等等各种文档。每一种文档类型都

上篇博文详细讲解什么是逻辑回归(Logistic回归)：机器学习09：逻辑回归详解文中每次拟合的时候，使用全部训练集的数据。计算量大，有可能训练集的样本有成千上百万。而且可能出现拟合不足或拟合过度，

这段时间在啃《机器学习实战》，准备通过这本书入门机器学习。（图片来源：亚马逊 https://www.amazon.cn/）但这本书著作时间有些早，部分代码用法老旧，逻辑不够清晰，命

看懂该篇需要先看如下博文，本文大部分知识和代码会使用到前面如下博文： 1）机器学习06：朴素贝叶斯理论知识 2）机器学习07：朴素贝叶斯应用(词集模式) 在机器学习07：朴素贝叶斯应用(

《机器学习实战》书中还讲了一个实例。该实例讲如何数字识别。 k-近邻算法也不太适用运用到该场景(文章后面会总结说明)。不妨可以借鉴一下，拓展我们的思路。尤其是特殊的问题如何处理和计算等等。 &nbsp

上次写了一篇k-近邻算法的简单分类使用方法，包括什么是k-近邻算法以及基本的实现代码。这次看《机器学习实战》2.2的实例，讲解修正数据和如何计算错误率以及把数据图形化。该实例大致意思

上一篇文章讲如何创建决策树，创建结果不够直观清晰。所以这次讲如何通过matplotlib绘制决策树。先给大家看看效果，调调胃口。可以更复杂些，根据决策树来绘图：《机器学习实战》书中