周志华《机器学习》笔记一

Posted by 共田君的博客 on August 8, 2017

周志华《机器学习》笔记一

闲说一下

亚马逊上淘了一本书,还没看,在网上找到本书的pdf,85M,一入此门深似海的感觉,有种畏难情绪,因为之前看过coursera.org上面的一些吴恩达纯英文视频,在本书上想找到点慰藉,未曾想也是各种公式和密密麻麻看不懂的概念和语句,虽然是中文还是有点畏缩不敢去,但是还是硬着头皮看了几章,怕忘记,现总结记录出来。

感想: 之前掌握到的一点技能,看书最重要的是掌握概念,把概念掌握清楚,概念的关联和分支脉络搞清楚,一本书就可以基本上搞清楚。

废话少说现在开始!!

本书从头到尾讲了了一个如何挑西瓜看天气的故事,如何教机器识别怎样的是好西瓜。

傍晚小街路面上沁出微雨后的湿润,和熙的细风吹来,抬头看看天边的晚 霞7 嗯,明天又是一个好夭气.走到水果摊旁,挑了个根蒂蜷缩、敲起来声音浊 响的青绿西瓜,一边满心期待着皮薄肉厚瓢甜的爽落感,一边愉快地想着,这学 期狠下了工夫,基础概念弄得清清楚楚,算法作业也是信手拈来,这门课成绩一 定差不了!

以下是个人理解,如果需要准确的描述请查看书本

什么是机器学习

根据人的经验告诉机器什么是好西瓜,并多次教授它,机器下次见到西瓜了自己去判断那个西瓜是不是好西瓜。用四个字描述就是:举一反三

模型

从数据中学习到的结果,看到西瓜就调用之前学到的知识认出来了,那些知识就是认瓜的模型

数据集

对于一个事件或对象的描述/样本/示例的集合,这里是对西瓜的描述的集合

示例/样本

西瓜

属性/特征

反映事件或对象在某方面的表现或性质的事项,例如”色泽” “根蒂” “敲声”

属性空间

属性张成的空 间称为”属性空间” (attribute space)、 “样本空间” (samp1e space)或”输入空间。

如我们把”色泽” “根蒂” “敲声”作为三个坐标轴,则它们张成 一个用于描述西瓜的三维空间,每个西瓜都可在这个空间中找到自己的坐标位置

标记

好瓜模型的标记。例如” ((色泽:青绿;根蒂二蜷缩; 敲声=浊响),好瓜)” .这里关于示例结果的信息,例如”好瓜”,称为”标记” (labe1);

测试

学得模型后,使用期进行预测的过程称为“测试”,被预测的样本叫做测试样本

泛化能力

没在训练集中出现的样本.学得模型适用于新样本的能力

监督学习

有样本标记的,包括分类和回归

无监督学习

没有样本标记,试卷没有参考答案、标准答案,包括:聚类

假设空间