找到你的机器学习部落
机器学习是一个充满算法和数据的迷人而强大的研究领域。
问题是,有这么多不同类型的人对机器学习感兴趣,每个人都有不同的需求。重要的是要了解你想要从机器学习中得到什么,并根据这些需求调整你的自学。
如果你不这样做,你很容易就会陷入困境,迷失方向,失去兴趣,得不到你想要的东西。
找到你的部落!
在这篇文章中,你将发现对机器学习感兴趣的10个主要群体。我称他们为机器学习部落。
你将发现每个部落最有价值的一般需求和资源类型。
重要的是,你可以回顾这10个部落,找出你适合的地方,发现还有其他像你一样的人,并对你的下一步行动有一个想法。
你适合放在哪里?请留下评论,让我知道。
避免部落不匹配,这是很常见的
你对机器学习感兴趣。你四处打听一下,就会推荐一门具体的课程或书。
几个小时后,你会感到沮丧,但你不确定为什么。
这在你身上发生过吗?
这是因为你选择的资源很棒,只是可能不适合你的具体情况。
这是一个常见的问题,我称之为不匹配问题。
开发人员和教科书的经典示例
一个典型的例子是开发人员对解决一次性问题感兴趣。他们被推荐了一本机器学习教科书。
他们买了这本书,开始阅读,但从来没有读过第一章。
对于最近上过4年数学课的研究生来说,一本教科书是完美的。
对于职业生涯10年的开发人员来说,将机器学习视为交付结果的工具几乎毫无用处。
这就是为什么了解对机器学习感兴趣的不同组以及你属于哪个组是至关重要的。这样你就可以找到其他和你一样的人,并开始使用资源,这些资源实际上会帮助你获得你想要的解决方案。
10个机器学习部落
在这一部分中,我们列出了对机器学习感兴趣的10个不同的人群。
我已经给出了每个人的名字,强调了他们的主要目标和兴趣,并列出了该小组中的人在下一步可以使用的资源。我还按照商业、学术、工程和数据等一般主题对小组进行了分组。
在这些组中可能有一些重叠。你也有可能属于其中的一个或多个。这很好(我很乐意在评论中听到这一点)。
此外,我们在这里将我们的兴趣限制在机器学习上,而不是所有的数据科学,后者是更广泛的。
我们开始吧。
部落概述
以下是这10个部落的概要:
- 商业部落
- 1)具有普遍利益的商人。
- 2)对交付项目感兴趣的经理。
- 学术部落
- 3)本科生或研究生班的机器学习学生。
- 4)对影响该领域感兴趣的机器学习研究人员。
- 5)对问题建模感兴趣的一般研究人员。
- 工程部落
- 6)对实现算法感兴趣的程序员。
- 7)对提供一次性预测感兴趣的开发人员。
- 8)对开发更智能的软件和服务感兴趣的工程师。
- 数据部落
- 9)对更好地回答业务问题感兴趣的数据科学家。
- 10)对更好地解释数据感兴趣的数据分析师。
商业部落
通常,这些人对在其组织中有效地利用机器学习感兴趣,但不一定对算法或工具的细节感兴趣。
商务人士可能会使用诸如商业智能或预测分析之类的术语,这两者都是可以利用机器学习技术的更一般的领域。
1、具有普遍利益的商人
这可能是任何人,从高管到顾问,他们都听说过机器学习,并希望从战略上利用它,可能是在即将到来的项目或倡议中。
2、对交付项目感兴趣的经理
这是一个正在使用机器学习的项目的项目经理或类似的领导职位。它可能是项目的一个利基特征,也可能是项目的核心。
有用的资源将是该领域的高级观点,这些观点将各种类别的问题和算法联系在一起,而不涉及太多细节。
学术部落
一般来说,这些人是从学术角度对机器学习感兴趣的人。他们可能是学生(本科生或研究生),也可能与大学有其他联系。
其他的例子还有博士后、研究助理和各种讲师。
学术团体可能会在研究论文中花费大量时间研究特定的机器学习算法。你可以在“如何研究机器学习算法”一文中了解更多关于研究算法的信息。
3、本科生或研究生班的机器学习学生
机器学习的学生很可能正在上课,并且对与技术和算法相关的超特定问题感兴趣。
学生有集中注意力的结构,也有时间更深入地钻研材料。
4、对影响该领域感兴趣的机器学习研究人员
机器学习研究人员感兴趣的是深入理解机器学习的一个方面,以至于做出一些微小的补充来扩展该领域。
研究人员对研究论文、期刊以及随之而来的组织和网络感兴趣。
教科书不行,它们是二手资料,而且已经过时了。
5、对问题建模感兴趣的一般研究人员
一般研究人员可能对机器学习感兴趣,但将其作为一种工具。他们很可能对使用自己的数据构建描述性或预测性模型感兴趣。
例如,一位来自客户研究、地质学或生物学领域的科学家拥有自己的数据集,并希望创建一个模型,以便做出预测和/或更好地理解潜在问题。
他们通常对模型的准确性不太感兴趣,而对模型的可解释性更感兴趣。因此,倾向于借用统计学中更简单、更容易理解的方法,如线性回归和Logistic回归。
然而,良好的系统化过程是需要的。
工程部落
通常,是一群开发人员,他们习惯于交付软件问题的解决方案,并希望结合机器学习。
我推荐给希望进入机器学习领域的工程师的一个很好的一般性帖子是“程序员的机器学习”。
工程师部落可以在机器学习社区中获得很多帮助和支持,比如在问答网站上的帮助和支持。欲了解更多信息,请查看“机器学习社区”一文。
6、对实现算法感兴趣的程序员
程序员发展机器学习技能的一个很好的方法是利用他们现有的编程技能,从头开始实现机器学习算法。
我在我的博客文章“通过从头开始实现机器学习算法来理解机器学习算法”中谈到了很多关于这种方法的内容,并给出了很好的提示和资源。
7、对提供一次性预测感兴趣的开发人员
开发人员不一定是伟大的程序员,开发和交付准确可靠的预测模型也不需要编程。
在商业环境中可能需要一次性预测模型来获得它可以提供的一组预测。它也是一个强大的自学模型,用于处理练习数据集,甚至是机器学习比赛。
通过系统地处理问题并交付独立的模型,你可以学到很多东西。
8、对开发更智能的软件和服务感兴趣的工程师
对将机器学习添加到他们的软件项目感兴趣的工程师需要一些算法知识,一些如何端到端处理问题的知识,以及如何使算法在操作环境中可靠运行的知识。
这组人是在前面描述的两个组的基础上成长起来的,最合适的描述可能是机器学习工程师。他们希望使用快速算法,提供可靠和准确的结果,平衡这些担忧。
该小组还大量使用机器学习库和基础设施。
数据部落
通常,这是一组主要担任数据角色但可能需要利用机器学习的人员。
9、对更好地回答业务问题感兴趣的数据科学家
当你是一名数据科学家时,学习不会停止。
你必须了解最新的数据流、技术和算法。这包括描述数据和创建预测性模型所需的机器学习技术。
数据科学家可以从“工程部落”下列出的更多应用资源,以及“学术部落”下列出的更多理论资源中获取他们需要的东西。
10、对更好地解释数据感兴趣的数据分析师
数据分析师主要感兴趣的是在商业利益的背景下解释数据。有时,机器学习算法对于提供更强大的模型很有用。大多数是描述性的模型,但有时也是预测性的。
与“总研究人员”这一群体一样,这一群体在统计和统计推断方面可能有很好的基础。此外,考虑到他们最有可能对描述性模型感兴趣,像线性回归和逻辑回归这样的经典方法可能就足够了。结果模型中的可解释性超过准确性。