近在录制Excel vba网抓教程,弄了一个网抓百度搜索结果的例子,分享一下。(注意:网抓是有时效性的,如果下面代码无法生效,请评论回复提醒我一下,谢谢。) 百度搜索的url参数,主要有
《机器学习实战》书中第5章讲的是逻辑回归(Logistic回归)。 满怀鸡冻放开书本,结果读了好几遍都没弄明白其原理。弄不懂逻辑回归实现代码为什么要那么写! 至少我已经先学过斯坦福大学教授Andrew
这本《机器学习实战》第1个算法是k-近邻算法,也叫KNN。该算法简单容易理解,十分适合入门。 k-近邻算法是用于分类。分类问题是监督学习算法的一个研究方向。既然是属于监督学习的,就需要1个训练数据集作
上一篇博文讲了朴素贝叶斯的理论知识。有了理论基础,就可以实践应用了。 机器学习有个重要的应用是对文档自动分类。 例如电子邮件、新闻报道、用户留言、博客文章等等各种文档。 每一种文档类型都
上篇博文详细讲解什么是逻辑回归(Logistic回归):机器学习09:逻辑回归详解 文中每次拟合的时候,使用全部训练集的数据。计算量大,有可能训练集的样本有成千上百万。而且可能出现拟合不足或拟合过度,
这段时间在啃《机器学习实战》,准备通过这本书入门机器学习。 (图片来源:亚马逊 https://www.amazon.cn/) 但这本书著作时间有些早,部分代码用法老旧,逻辑不够清晰,命
看懂该篇需要先看如下博文,本文大部分知识和代码会使用到前面如下博文: 1)机器学习06:朴素贝叶斯理论知识 2)机器学习07:朴素贝叶斯应用(词集模式) 在机器学习07:朴素贝叶斯应用(
《机器学习实战》书中还讲了一个实例。该实例讲如何数字识别。 k-近邻算法也不太适用运用到该场景(文章后面会总结说明)。不妨可以借鉴一下,拓展我们的思路。尤其是特殊的问题如何处理和计算等等。  
上次写了一篇k-近邻算法的简单分类使用方法,包括什么是k-近邻算法以及基本的实现代码。 这次看《机器学习实战》2.2的实例,讲解修正数据和如何计算错误率以及把数据图形化。 该实例大致意思
上一篇文章讲如何创建决策树,创建结果不够直观清晰。所以这次讲如何通过matplotlib绘制决策树。 先给大家看看效果,调调胃口。 可以更复杂些,根据决策树来绘图: 《机器学习实战》书中