0%

PCA可以将数据从原来的向量空间映射到新的空间中。由于每次选择的都是方差最大的方向,所以往往经过前几个维度的划分后,之后的数据排列都非常紧密了, 我们可以舍弃这些维度从而实现降维

Read more »

SVM真的是很复杂的算法,原本以为原理看懂了实现就会很简单,然而事实并不是这样
sklearn中对于支持向量机提供了很多模型:LinearSVC, LinearSVR, NuSVC, NuSVR, SVC, SVR

Read more »

外面的天气很好,秋意浓浓。心情很差,还真是应景

Read more »

搬运来的步骤

一. 数据分析

  1. 下载并加载数据
  2. 总体预览数据:了解每列数据的含义,数据的格式等
  3. 数据初步分析,使用统计学与绘图: 由于特征没有特殊的含义,不需要过多的细致分析
Read more »

数据处理很多需要用到pandas,有两个基本类型:Series表示一维数据,DataFrame表示多维。以下是一些常用方法的整理:

Read more »

  • x.ravel()x.flatten() : 将多为数组降维到1维.ravel()返回元素的引用(对象不一样,但是元素是引用),flatten()返回新的元素。

  • np.meshgrid(x, y) : 返回两个矩阵(X,Y),由这两个矩阵可以将xy定义的空间中的所有点描述出来。所有的点就是网格中的一个个焦点。

    Read more »

出现过拟合时,使用正则化可以将模型的拟合程度降低一点点,使曲线变得缓和。

L1正则化(LASSO)

正则项是所有参数的绝对值的和。正则化不包含theta0,因为他只是偏置,而不影响曲线的摆动幅度。
$$
J(\theta)=\operatorname{MSE}(y, \hat{y})+\alpha \sum_{i=1}^{n}\left|\theta_{i}\right|
$$

Read more »