这是 NLP 课程和专业的列表,可帮助您开始自然语言处理之旅!
自然语言处理 (NLP) 位于计算机科学和计算语言学的交叉点。 从客户评论的情绪分析到推动营销决策再到机器翻译和聊天机器人,NLP 正在为所有行业提供动力。
如果您有构建机器学习模型的经验,则可以将 NLP 添加到您的工具箱中以解决各种问题:文本摘要、问答、自然语言生成等。
我们将查看 NLP 角色的广泛技能要求,然后继续查看精选资源列表以开始自然语言处理。
目录
NLP 职业道路:NLP 工程师、NLP 开发人员等
研究的进步推动了现代 NLP 技术的发展。 NLP 工程师和开发人员的平均工资超过 117,000 美元,最近越来越受欢迎。
技能集是多种多样的,从下游 NLP 任务的数据收集和语言学概念的应用知识,如依赖解析和词性 (POS) 标记,到转换器模型的应用知识。
要进入 NLP,需要精通编程和机器学习。 您还应该具有深度学习框架(如 PyTorch 和 TensorFlow)以及 NLP 库(如 spaCy 和 HuggingFace)的经验。
自然语言处理 (NLP) 课程
接下来,让我们回顾一下流行学习平台上提供的一些最佳课程。 我们还将说明充分利用这些课程所需的先决条件。 👩🏫
CS224n:具有深度学习的 NLP
CS224n:NLP with Deep Learning 由 Chris Manning 教授授课,斯坦福大学提供,是学习自然语言处理的最佳课程之一。 这些讲座可在 YouTube 上找到,课程网站上免费提供当前和以前提供的讲义和练习笔记本。
📋 先决条件
- Python编程
- 数学:统计、概率、微积分、线性代数
- 机器学习基础
这是一门为期一个学期的课程,涵盖广泛的 NLP 主题:
- 词向量
- 递归神经网络
- 注意力和子词模型
- 变压器及应用
💲 定价:免费 ✅
NLP 专业:Coursera
DeepLearning.AI 在 Coursera 上的自然语言处理专业化是一种流行的学习资源。 该专业旨在通过四门课程教授传统的 NLP 技术以及最新的进展,例如 transformer 和 reformer 模型。
📋 先决条件
- 中级 Python
- 机器学习和深度学习框架知识
- 微积分、线性代数、统计学
以下是该专业的课程:
专业化中的每门课程都需要 30 多个小时才能完成,并且需要几个月的时间才能完成整个专业化。
👩🏽💻 以下是您在完成此专业化过程中将构建的一些项目:
- 文本自动完成模型
- 使用 BERT 进行问答
- 文本摘要
- 使用改革者模型的聊天机器人
TensorFlow 中的自然语言处理:Coursera
如果您已经熟悉 TensorFlow,可以通过 Coursera 上的 DeepLearning.AI 学习 TensorFlow 中的 NLP,使用 TensorFlow 构建 NLP 模型。
📋 先决条件
- Python 和数学
- TensorFlow 的应用知识
该课程涵盖以下内容:
- 使用 TensorFlow API 进行文本标记化和预处理
- 词嵌入
- 自然语言生成
序列模型:Coursera
DeepLearning.AI 在 Coursera 上的深度学习专业课程的序列模型课程旨在让学习者在 4 周的时间内掌握 NLP 的工作知识。
📋 先决条件
- Python
- 机器学习和线性代数
该课程涵盖 NLP 的序列模型,重点关注以下内容:
- 用于语言建模的字符级递归神经网络 (RNN)
- 注意力机制介绍,自注意力和多头注意力
- 使用 Hugging Face 转换器进行问答
NLP:拥抱的脸
Hugging Face 团队发布了一个免费的 NLP 课程,涵盖了从基础到高级的概念,重点介绍了如何使用 Hugging Face 生态系统。
📋 先决条件
- 精通Python
- 深度学习的工作知识
- 使用 PyTorch 和 TensorFlow 的经验(有帮助但不是必需的)
该课程有 12 章,分为三个部分,涵盖以下内容:
- 使用 Hugging Face 变形金刚
- 了解数据集和分词器库
- 变压器的高级应用,优化生产模型
您可以访问简短的视频讲座、基于文本的概念部分和 Colab 笔记本。
💲定价:免费🤗
Google Cloud 上的自然语言处理:Pluralsight
Google Cloud 上的 NLP 向学习者介绍如何在 Google Cloud 平台上使用 Vertex AI 构建 NLP 解决方案。
先决条件:GCP 的应用知识
本课程向学习者介绍以下内容:
- 文本表示
- 使用 DialogFlow API
- 构建神经网络、循环神经网络 (RNN)、长短期记忆 (LSTM) 网络和门控循环单元 (GRU)
- 使用顶点人工智能
- 注意力机制和大型语言模型
使用 Azure 构建 NLP 解决方案
使用 Microsoft Azure 构建 NLP 解决方案是 Pluralsight 上基于项目的课程。 在这个基于项目的课程中,您将学习通过处理客户评论的推文数据集来构建 NLP 解决方案。
📋 先决条件
- Python编程
- 熟悉 Azure 门户
您将在此过程中执行的关键任务包括:
- 语言检测
- 命名实体识别
- 关键词提取
- 情绪分析
NLP 与 PyTorch:Pluralsight
NLP with PyTorch on Pluralsight 将帮助您开始使用 NLP。 本课程不涵盖最近的转换器架构,但涵盖了使用 PyTorch 进行自然语言处理的大量基础知识。
先决条件:熟悉 PyTorch
本课程涵盖以下内容:
- 递归神经网络 (RNN)
- 二进制和多类文本分类
- 词向量嵌入
- 使用词向量进行情感分析
- 用于语言翻译的序列到序列模型
成为 NLP 专家:Udacity
Becoming a NLP Expert 是优达学城 AI 学院提供的官方自然语言处理纳米学位。 这个纳米学位课程将帮助您学习传统和现代 NLP 技术,例如通过构建项目来关注注意力。
📋 先决条件
- Python编程
- 统计数据
- 机器学习和深度学习
Udacity 的课程包括视频讲座、编码练习和顶点项目。 在此自然语言处理课程中,您将构建以下项目:
- 词性标注(词性标注)
- 端到端机器翻译模型
- 语音识别模型
NLP 的代码优先介绍
如果您想熟悉 NLP 领域,那么 Fast.ai 的 NLP 代码优先介绍是一门很棒的课程。 本课程由 Rachel Thomas 教授,涵盖自然语言处理的传统方法和神经网络方法。
📋 先决条件
- Python编程
- 机器学习概念
- 使用 PyTorch 的神经网络(有帮助但不是必需的)
以下是课程内容的概述:
💲定价:免费
NLP 与机器学习:教育
这个 NLP with Machine Learning,由 Educative 着重于让学习者熟悉 NLP 中的重要概念。 从编码面试准备和系统设计到机器学习,Educative 是流行的在线学习平台之一。
该课程涵盖以下内容:
- 词嵌入
- 语言模型
- 文本分类
- Seq2seq模型
Python 中的 NLP:DataCamp
Datacamp 的 Python 自然语言处理是包含六门课程的结构化技能课程。 这些课程向学习者介绍自然语言处理的不同方面。
📋 先决条件
- 精通Python
- 对机器学习的理解
该课程包括以下课程:
NLP课程:Lena Voita
NLP 课程是作者 Lena Voita 在 Yandex 数据分析学院教授的自然语言处理课程的延伸。 该课程分为几个部分,包含互动课程和博客文章。 此外,还有笔记本和研究论文摘要。
- 文本分类(传统和神经网络方法)
- 词嵌入
- 语言模型的评估
- Seq2seq模型和注意力
- NLP 的迁移学习
💲定价:免费
结论
我希望您觉得这份学习资源清单对您有所帮助。 根据先决条件和时间承诺,您可以选择最符合您兴趣的课程或专业。 一旦您获得了基础知识,请务必在真实世界的数据集上构建项目以补充和加强您的理解。 编码愉快!👩🏽💻
接下来,查看可用于下一个 NLP 项目的数据科学笔记本列表!