维数约简假如你负责一项机器学习项目,最开始你需要收集数据集,也许把收集任务下发给各部门后,收集上来的数据特征有上千个,你是全部用呢?还是只用一部分呢?如果只用一部分,应该如何选择呢?
首先我们肯定是不能全用的,因为特征太多会拖慢训练速度。
2017-11-30