国民大可爱、

Book思议在划水


  • Home

  • Archives

朴素贝叶斯之实际应用

Posted on 2019-01-18 |
前言这里我们完成两个任务,一个是垃圾邮件过滤,一个是新浪新闻分类。垃圾邮件过滤用上一节学习的朴素贝叶斯来完成,新闻分类用sklearn中的朴素贝叶斯来完成。 垃圾邮件过滤收集数据我们已经有了一个电子邮件数据集,有两个文件夹ham和spam,spam文件下的txt文件为垃圾邮件。选取其中一份其内容如下 ...
Read more »

机器学习实战(3)-朴素贝叶斯

Posted on 2019-01-17 |
朴素贝叶斯这是一种有监督的机器学习算法,以自变量之间的独立(条件特征独立)性和连续变量的正态性假设为前提。 贝叶斯决策理论核心思想是计算待测数据在各个类别的概率,选择高概率的决策。 条件概率公式:P(A|B) = P(A) \frac{P(B|A)}{P(B)}其中$P(A|B)$称为后验概率,$P ...
Read more »

决策树之预测隐形眼镜类型

Posted on 2019-01-16 |
实验目的利用决策树预测患者需要佩戴的隐形眼镜类型 这里用了两种方法,方法是用上一节我们自己写的决策树;第二节是调用了sklearn库。 方法1隐形眼镜数据集是一个公开且著名的数据集,包含患者眼部状况的观察条件以及医生推荐的隐形眼镜类型,数据来源UCI数据库,这里用到的数据集格式如下图:第一列是年龄, ...
Read more »

机器学习实战(2)-决策树

Posted on 2019-01-14 |
决策树概述决策树决策树(decision tree)是一种基本的分类与回归方法,类似于下图的形式:决策树由结点(node)和有向边(directed edge)组成。结点有两种类型:内部结点(internal node)和叶结点(leaf node)。内部结点表示一个特征或属性,叶结点表示一个分类。 ...
Read more »

kNN之手写数字识别系统

Posted on 2019-01-12 |
实验目的使用kNN构造手写数字识别系统,这里只识别0-9,并且需要识别的数字以及使用图像处理软件处理过了。 实验过程准备数据:将图像转换为测试向量数据集分为训练集和测试集,分别包含大约2000个和900个例子,样例如下所示:这里需要将图像转换为向量。每张图像都是3232像素的,所以我们用numpy建 ...
Read more »

机器学习实战(1)-k近邻算法

Posted on 2019-01-09 |
k-近邻算法概述工作原理存在一个样本数据集合(称作训练样本集),并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。当输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。一般只选取样本集中前k ...
Read more »

拉勾网招聘职位爬取实战

Posted on 2018-12-13 |
实验目的  本次实验的目的是以北京的Python职位为例,爬取拉勾网相关职位的招聘信息。 实验环境python3主要用到requests、pyquery、pandas等库 爬取分析  以北京地区的Python职位为例,其URL为:https://www.lag ...
Read more »

爬取58租房房源信息+地图展示

Posted on 2018-12-11 |
实验目的  本次实验的目的是爬取58租房信息,并调用高德地图API,将房源在地图上标记,使得在找房的过程中更直观。 实验环境python3主要用到pyquery、requests等库调用了高德API 爬取分析  本实验以北京市海淀区的房源为例,筛选了价格为20 ...
Read more »

爬虫实战之北京空气质量年度数据

Posted on 2018-12-09 |
实验目的  本实验的目的是爬取中国空气质量在线监测分析平台,按年份抓取某城市的空气质量历史数据。 实验环境Chrome+ChromeDriverpython3主要用到selenium、pyquery、pandas等库 爬取分析  本次实验以北京为例,点开该城市 ...
Read more »

爬虫学习(8)

Posted on 2018-12-09 |
之前都是爬取Web网页的内容,这章学习一下App的爬取。如果要在App端查看各个网络的请求和响应过程,一般要使用抓包软件,常用的有WireShark、Filddler、Charles、mitmproxy、AnyProxy等,通过设置代理的方式将手机处于抓包软件的监听之下,方便查看App在运行过程中发 ...
Read more »
12…4
Chen Zhaoyun

Chen Zhaoyun

33 posts
8 tags
© 2019 Chen Zhaoyun
Powered by Hexo
|
Theme — NexT.Pisces v5.1.4