Deep learning is a specific kind of machine learning. In order to understand deep learning well, one must have a soild understanding of the basic principles of machine learning.

学习算法

A machine learnign algorithm is an algorithm that is able to learn from data. A computer program is said to learn from expreience E with respect to some class of Tasks T and performance measure P, if its performance at tasks inT, as measured by P, improves with expreience E.

机器学习理论

查准率和召回率

预测数据/实际数据 实际恶性肿瘤 实际良性肿瘤
预测恶性肿瘤 TruePositive FalsePositive
预测良性肿瘤 FalseNegative TrueNegative

True/False表示预测是否正确, Positive/Negative表示预测的结果类型(即是否预测是恶心肿瘤)

查准率定义如下:

$$ Precison = \frac{TruePositive}{TruePositive+TruePositive} $$

召回率定义如下:

$$ Recall = \frac{TruePositive}{TruePositive+FalseNegative} $$

定义F1 Score如下:

$$ F_1Score = 2\frac{PR}{P+R} $$

其中P表示查准率, R表示召回率. 使用F1 Score可以综合评价一个算法的效果

流行的数据库

以下是一些关于机器学习的数据集, 各个数据集和说明如下:

数据库名称 说明
UC Irvine Repository 除了数据集, 还提供相关的论文链接, 比较学术
Kaggle datasets 数据集比较新, 更加多样
Registry of Open Data on AWS 提供一些关于AWS的数据集
阿里云 天池大数据竞赛 提供学习资料, 数据集, 以及基于GPU的notebook服务

如何选择算法

可以参考如下的流程来选择合适的算法

如何选择合适的算法

最后更新: 2024年03月28日 23:43

版权声明:本文为原创文章,转载请注明出处

原始链接: https://lizec.top/2019/01/07/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E4%B9%8B%E5%9F%BA%E7%A1%80%E6%A6%82%E5%BF%B5/