泡在机器学习研(ju)究(keng)里的你,可能遇到过以下问题:
- 这个问题能不能用机器学习方法解决?
- 特征的选取标准怎么定?哪些特征要保留?哪些特征该弃用?
- 模型在训练时表现还不错,为什么到了应用环境就挂了?
今天,谷歌开发者推特账号终于上线了《机器学习规则(Rules of Mahchine Learning)》的中文版(撒花.gif)。
这本“葵花宝典”可是汇聚了谷歌大脑高级科学家Martin Zinkevich开发Yoututbe、Google Play、Google Plus等谷歌重磅级产品后的血泪,总共包含43条规则,全文干货满满。
总的来讲,这篇总结的结构大概是这样:
第一部分帮助大家了解,构建机器学习系统之前要明确可实现的目标如何设计;
第二部分介绍了机器学习工程的第一个的阶段:如何部署第一个管道。保证易用的同时,还要单独进行测试,选择一个可观察可归因的简单指标;
第三部分谈到了新特征的添加发布、迭代、如何评估模型,以及如何应对训练-应用偏差;
最后一部分介绍了当大家达到稳定阶段时该怎么做。
文章特别特别强调了做机器学习的工程项目的一个核心理念:
要打造优质的产品,就请把自己看成是一位出色的工程师,而不是一位机器学习专家。
以后再遇到什么问题,回来翻翻这本机器学习工程实践就好。相信你到时会有打通六脉的感觉。
附上《机器学习规则(Rules of Mahchine Learning)》中文版原文:
https://developers.google.com/machine-learning/rules-of-ml/#before_machine_learning
p.s.友情提示:全文一万六千多字,建议先收藏,找个月黑风高没人打扰的夜晚,到PC端上慢慢研读:)
— 完 —
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ’ᴗ’ ի 追踪AI技术和产品新动态
“