本文共 1021 字,大约阅读时间需要 3 分钟。
机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测。
Scikit-learn(sklearn)是机器学习中常用的第三方模块,对常用的机器学习方法进行了封装,包括回归(Regression)、降维(Dimensionality Reduction)、分类(Classfication)、聚类(Clustering)等方法。当我们面临机器学习问题时,便可根据下图来选择相应的方法。Sklearn具有以下特点:
eg:
注:有些数据集可以没有目标值,对于每一行数据我们可以称之为样本。
广泛共识:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。
特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程。
直接影响到模型的预测结果
pip3 install Scikit-learn==0.19
如果已经安装NumPy和SciPy,安装scikit-learn可以使用:
pip install -U scikit-learn
安装好之后可以通过以下命令查看是否安装成功
import sklearn
注意:
安装scikit-learn需要Numpy、Pandas、Twisted、scipy、Microsoft Visual C++ 14.0等库转载地址:http://ssili.baihongyu.com/