炼丹!炼丹!
我们不知道具体进行预测的算法是怎样的,但我们有的是数据:我们希望机器能够自动提取算法。哪怕不能识别整个过程,也可以得到一个好用的近似,我们借此来发现某些规律——这就是机器学习的定位(至少埃塞墓·阿陪丁如是说)。
机器学习使用实例数据以及过往经验来优化某种性能:模型可以是预测性的,用于预测未来;也可以是描述性 的,用于从数据中提取信息;当然,也可两者皆有之。在构建模型时,使用了统计学理论,计算机科学在其中角色是双重的:
- 训练时,面对海量数据的高效算法
- 习得模型后,表示和用于推理算法解也须高效
某种程度,算法准确性与复杂度同样重要
监督学习 & 非监督学习 & 增强学习
监督学习是学习从输入到输出的映射关系,提供输出的正确值。
非监督学习没有输出的正确值,只有发现输入结构的规律。
增强学习中,系统输出的并非单个动作,而是策略:动作的序列比如游戏
机器学习目录
学习资料
黑皮书《机器学习导论》
期刊
《机器学习》《Machine Learning》
《机器学习研究》《Journal of Machine Learning Research》
《神经网络》《Neural Networks》
《IEEE 神经网络和学习系统汇刊》《IEEE Transactions on Neural Networks and Learning Systems》
《统计学年鉴》《The Annals of Statistics》
《美国统计协会杂志》《Journal of the American Statistical Association》
《IEEE 模式分析和机器智能汇刊》《IEEE Transactions on Pattern Analysis and Machine Intelligence》
会议
数据集网站
加州大学欧文分校机器学习存储库UCI