1. 为什么是机器学习策略?
Last updated
Last updated
机器学习是数不尽的重要应用的基础,包括网页搜索、反垃圾邮件、语音识别、产品推荐等等。我假设你或你的团队正在做一项机器学习应用,并且你想做快速进步。本书将会帮助你做这些事情。
假设你正在建立一个启动项目,这个项目将会给猫爱好者提供无尽的猫图片流。
为了检测这些照片中的猫,你使用神经网络建立了一个计算机视觉系统。
但是悲惨的是,你的学习算法的准确率不够好。你在顶着巨大的压力下去提高你的猫检测器。你会怎么做呢?
你的团队有很多的想法,比如:
获取更多的数据:收集更多猫的图片。
收集更多样化的训练集。比如,猫在不寻常位置的图片;有着不寻常颜色的猫;使用各种各样拍摄设备下的猫的图片...
跑更多轮的梯度下降迭代,使得训练的更久。
尝试一个更大的神经网络,带有更多的层数/隐藏单元/参数。
尝试更小的神经网络。
尝试增加正则化项(比如L2正则项)。
改变神经网络结构(激活函数、隐层数量等)。
...
如果你从这些可能的方向中选择得当,你将会建立一个领先的猫图片检测平台,并且带领公司取得成功。如果你选择的不好,你可能会浪费数月的时间。你将如何继续呢?
本书将会告诉你如何做。大多数机器学习问题都留有线索,这些线索告诉你什么是有用的尝试,什么是没用的尝试。学习如何去阅读这些线索将会帮你节省数月甚至数年的开发时间。