数据科学和机器学习的 11 大资源

数据新时代:机器学习的崛起

有人说,数据是当代的石油,而机器学习则是点燃它的火焰。 掌握这两者的人,仿佛就拥有了驾驭世界的力量。

这不是科幻小说中虚构的场景,而是一个正在发生的现实。

如今,新的世界秩序正在形成,它建立在对海量数据的收集和处理之上,并将数据转化为可操作的洞见。这是人类历史上前所未有的能力。 这种技术赋予一个国家超越其他国家的优势,甚至最终可能主导全球。

因此,世界各地的先进国家都对此给予了前所未有的重视。

炙手可热的职业选择

抛开地缘政治的考量,数据科学和机器学习正成为一个充满机遇的蓬勃发展的新兴领域。 市场需求之大令人难以置信,而合格的数据科学家却严重短缺。 即使是水平一般的从业者,也供不应求。

这就像我们突然发现了许多适宜居住的新行星,却没有足够的人去探索和开拓它们。 我们可以一直谈论下去,但这幅信息图也许能更清楚地说明情况:

数据来源:insidebigdata.com

正如我们所见,这个行业的起薪就已超过 5 万美元,而管理人员的年薪甚至可以达到 25 万美元以上。

更令人惊讶的是,地球上平均每人每秒产生 1.7 MB 的数据。 这意味着,每个人在一生中将产生超过 3500 TB 的数据。这个数据量远远超过我们目前所能处理的范围,更不用说分析了。 因此,说未来充满光明,这片广阔的新领域前途无量,绝不为过。

数据科学和机器学习难吗?

这是一个非常好的问题!

以我的经验来看,答案是“既是又不是”。

如果你热衷于研究,并渴望挑战极限,那么人工智能(包括机器学习)无疑是一项极具挑战性的工作。 即使是计算机科学和数学领域的博士学位,在应对这类工作时也可能捉襟见肘。 然而,大多数人并没有这样的野心,也没有足够的时间去追求如此深入的钻研。

另一方面,还有一种我称之为“应用数据科学和机器学习”的领域。

它指的是利用现有的工具、技术和算法来解决实际问题。 这部分工作需要投入、洞察力和创造性思维(以及一些基本数学概念的理解,这些概念通常可以很快掌握)。但是,与软件工程师相比,它对“硬核”技术知识的要求相对较低。

换句话说,这绝非易事,但从回报与付出的比例来看,它无疑是目前最值得投资的领域之一。

既然你已经下定决心成为一名数据科学家或机器学习工程师,那么让我们开始探索最佳的学习途径吧!

机器学习(谷歌)

可能很多人都不知道,谷歌提供了一个广泛且高度实用的 机器学习免费课程。 据谷歌称,这是他们致力于推动人工智能和机器学习技术发展,并保持知识公开的承诺的一部分。

这门课程最大的优点是它没有先决条件,但你可能需要花费一些额外的时间来学习统计学概念。

当然,这不是硬性要求,但如果你在高级统计学方面毫无基础,那么课程中的讲解可能还不够深入。 此外,该课程通过 TensorFlow 来介绍机器学习,这是一款由谷歌开发的机器学习实现工具。 因此,从某种程度上来说,谷歌的目的是推广其用于机器学习的API。 但考虑到这门课程提供的价值,我认为这不应该成为学习的障碍。

事实上,TensorFlow 是进入机器学习领域的一种较为简单的方式,而且非常受欢迎(关于人工智能框架的比较,请参阅相关资料)。

数据科学

哈佛大学的名声令人敬畏,这门课程也是如此。

首先需要明确的是:这并非一门速成课程,你可以通过编写一些代码片段或脚本来浅尝辄止地了解机器学习。 这门课程是一场严峻的考验,需要艰苦的努力和大量的时间投入。

该课程 配有免费视频、代码(托管在GitHub上)以及实验练习的解决方案。 实际上,如果你想全身心地投入学习,没有任何东西可以束缚你。

理想的受众是谁呢?

就是你,我不是在开玩笑。

我想说的是那些受过良好数学教育的在职专业人士,即使他们可能不再热爱数学(拥有严密的推理和证明习惯至关重要)。 但请再次注意:你或许认为自己很优秀,但这门课程会让你感觉像在吃硬化的指甲——练习题的难度足以让你抓狂。 但这也可能正是你重新找回学习乐趣的方式!

机器学习

如果你走进一个挤满了数据科学家的酒吧,问他们谁是吴恩达,你很可能会被大家围住。

在数据科学和机器学习领域,吴恩达是一位受人尊敬的传奇人物,这主要归功于他在 Coursera 上开设的精彩课程—— 机器学习

如果你对吴恩达的资质有所怀疑,那么以下信息足以说明问题:

这是一门付费课程,属于 Coursera 的定价计划。 但金钱和决心并非唯一的先决条件。 这门课程内容十分深入,吴恩达将深入探讨机器学习背后的所有数学原理,并剖析流行的算法。 但幸运的是,这是一门全面的课程,你会一步步地被引导深入到最深奥的领域,然后再被带回来。

我强烈推荐这门课程,主要是因为能够炫耀这门课程的结业证书已成为当今的一种潮流!

应用数据科学

Coursera 的专业化课程包含一系列课程,旨在让你从零基础精通特定概念。 如果你正在寻找一门完整、严谨且友好的 Python 数据科学和机器学习课程,那么我极力推荐这门 专业课程

完成课程后,你将获得一份证书。

数据营

DataCamp 提供了大量数据科学课程,其中包括多种技能和职业发展路径。 从数据处理到机器学习,你将学习使用 Python 和 R 语言,掌握成为一名成功的数据科学家所需要的技能。

DataCamp 的课程内容以短小精悍的形式呈现,你可以按照自己的节奏进行学习。 这些课程为你提供实践经验,让你逐步提高数据科学技能。

你可以从免费版本开始,并通过查看第一章来评估课程。

edX

你可以通过 edX 平台向 MITx、Harvardx、IBM、RICEx、UCSanDiegox 和 GTx 等知名机构学习。

这些机构都提供了全面的课程,可以帮助你掌握成为数据科学家所需的技能。 这些课程最适合那些拥有统计学或计算机科学背景的人。

如果你不想参加完整的课程项目,可以选择单项课程。 在 edX 上,你可以找到 200 多门与数据科学相关的课程,涵盖 Python、R、Excel、概率、统计学、机器学习、数据可视化等主题。

码学院

Codecademy 是另一个优秀的平台,它提供了最好的在线编程学习系统之一。 他们秉持“边做边学”的理念,在平台上提供了大量的实践项目和测试。

Codecademy 提供的 数据科学课程 包括 SQL、Python 3、NumPy、Pandas、Matplotlib、Scikit-learn 等多种库。

整个职业发展路径包含 26 门课程,足以帮助你成为一名成功的数据科学家。

该数据课程:

  • 让你深入了解数据科学
  • 提供易于遵循的学习路线图
  • 通过提供足够的实践经验,让你为工作做好准备

优达学城

Udemy 无需过多介绍。

Udemy 上的 “Python数据科学和机器学习训练营” 是最受欢迎的课程之一,评分超过 85000+,平均评分为 4.6 分,全球已有超过 370000 名学生报名参加。

以下是该课程涵盖的主题:

以下是本课程的特点/交付成果:

  • 25 小时点播视频
  • 终身访问
  • 13 篇文章和 5 个可下载资源
  • 可在手机和电视上访问
  • 结业证书
  • 30 天退款保证

因此,如果你更喜欢价格实惠的课程,这门课最适合你入门。

谷歌人工智能

你有兴趣向谷歌的机器学习专家学习吗?

那么,你需要关注 谷歌人工智能的课程。

该平台为学生、软件工程师、数据科学家甚至研究人员提供机器学习和数据科学课程和资源。 这些课程都是免费的。

首先, 机器学习速成课程 应该作为你的首选课程。 这是一门快节奏的课程,包含了使用 TensorFlow API 的实用介绍。 以下是本课程的详细信息:

该平台还提供关于重要机器学习主题的特定课程,例如 聚类推荐系统机器学习中的测试和调试机器学习中的数据准备和特征工程。 如果你已经掌握了机器学习的基础知识,这些课程将为你提供额外的价值。

优达学城

Udacity 也是一个非常受欢迎的在线学习平台,提供大量关于热门技术的课程。 它拥有多个业界领先的项目,并获得了全球顶级公司的认可,例如 AT&T、AWS、Google、IBM 等。

Udacity 的其中一个项目是数据科学—— 数据科学学院。 该项目旨在帮助你胜任数据分析师、数据科学家、数据工程师和商业分析师等工作。 该项目中的数据科学家课程是涵盖机器学习、深度学习和软件工程概念的关键课程。 你需要具备机器学习的基本知识才能选择本课程。

如果你已经掌握了 Python 编程但对机器学习并不熟悉,Udacity 还提供了另一个项目——人工智能学院。 该项目中的课程从机器学习基础知识开始。

深度学习

这门课程 对于程序员来说绝对是一份厚礼,也是我在此列表中最喜欢的推荐。

我再说一遍:如果你是一名程序员。

因为这门课程不会花时间教你编程的基础知识。 课程描述非常明确地指出(重点是原有的):

我们假设所有参加这门课程的人都至少有一年的编程经验。 本课程使用 Python 作为教学语言,因此如果你还不了解 Python,我们假设你会花时间学习——对于有经验的程序员来说,你应该会发现 Python 是一门很容易学习的语言。

因此,如果你已经掌握了 Python 知识(如果没有,请在此学习),或者可以很快适应,那么对于那些想要构建真实、可用的系统,而不是过多担心算法的理论基础的实用主义者来说,这门课程是完美的。

我甚至可以说,这门课程是为那些讨厌繁文缛节和单调的、不耐烦的修补匠们准备的(就像我一样!)。

哦,我有没有提到它是 100% 免费的,并且拥有一个很棒的社区?!

结论

哎呀!

这是一个很难整理的列表。 不是因为没有足够好的资源,而是因为资源太多了!

机器学习是一个真正蓬勃发展的领域,它正在优雅地解决难题。 因此,有数百个在线课程,免费的和付费的,其中大多数都非常好。 但这也可能造成混乱,所以我试图根据不同类型学习者的经验水平将其总结为 11 个。

我希望这能对你有所帮助!