Deep learning is a specific kind of machine learning. In order to understand deep learning well, one must have a soild understanding of the basic principles of machine learning.
学习算法
A machine learnign algorithm is an algorithm that is able to learn from data. A computer program is said to learn from expreience E with respect to some class of Tasks T and performance measure P, if its performance at tasks inT, as measured by P, improves with expreience E.
机器学习理论
查准率和召回率
预测数据/实际数据 | 实际恶性肿瘤 | 实际良性肿瘤 |
---|---|---|
预测恶性肿瘤 | TruePositive | FalsePositive |
预测良性肿瘤 | FalseNegative | TrueNegative |
True/False表示预测是否正确, Positive/Negative表示预测的结果类型(即是否预测是恶心肿瘤)
查准率定义如下:
$$ Precison = \frac{TruePositive}{TruePositive+TruePositive} $$
召回率定义如下:
$$ Recall = \frac{TruePositive}{TruePositive+FalseNegative} $$
定义F1 Score如下:
$$ F_1Score = 2\frac{PR}{P+R} $$
其中P表示查准率, R表示召回率. 使用F1 Score可以综合评价一个算法的效果
流行的数据库
以下是一些关于机器学习的数据集, 各个数据集和说明如下:
数据库名称 | 说明 |
---|---|
UC Irvine Repository | 除了数据集, 还提供相关的论文链接, 比较学术 |
Kaggle datasets | 数据集比较新, 更加多样 |
Registry of Open Data on AWS | 提供一些关于AWS的数据集 |
阿里云 天池大数据竞赛 | 提供学习资料, 数据集, 以及基于GPU的notebook服务 |
如何选择算法
可以参考如下的流程来选择合适的算法
最后更新: 2024年03月28日 23:43
版权声明:本文为原创文章,转载请注明出处