如何自学人工智能？

Question

如何自学人工智能？

零基础自学人工智能，希望能推荐下学习路径。基础只有兴趣，不要说不可能。兴趣为解决人类智能缘起的问题。

关注者

19,393

被浏览

4,279,000

437 个回答

更新一下~为大家推荐新上线的微软人工智能教育与学习共建社区~

这是一个免费的AI学习干货平台。

该社区由微软亚洲研究院人工智能教育团队创立，集合了微软与高校教师、开发者共享的人工智能教学大纲和课件、案例资源、开发工具与环境搭建教程等，更有微软顶级工程师互动答疑，是最酷的AI教育学习第一站！

GitHub一周标星 2300+

部分内容如下：

这么干货的平台，还不点进来愉快滴学习吗？

对于想学习人工智能的同学，我们墙裂为大家推荐——微软AI Lab，适合有基础的同学着手做AI应用开发。

AI Lab是微软在Build 2018大会上发布的人工智能开放项目平台，展示了微软最新AI技术的使用案例。我们希望AI Lab能帮助大家用微软丰富的开放资源和平台来探索自己的第一个人工智能项目。

AI Lab目前开放了五个人工智能项目，展示了微软自定义视觉服务（Custom Vision Service）、AttnGAN、Visual Studio Tools for AI、Cognitive Search、机器阅读理解等最新技术的使用。在每个项目中，你都可以访问GitHub上的开源代码，尝试Demo演示，还可以观看清晰的介绍视频，从而获得对人工智能潜在的商业问题和解决方案的深入理解。

绘画机器人

绘画机器人（DrawingBot）是由微软研究院人工智能实验室的研究人员开发的，能根据文本信息绘制出相应图像的模型。DrawingBot的核心技术是GAN网络（Generative Adversarial Network），其中包含两个机器学习模型，一个模型根据文本描述生成图像，另一个模型用文本描述去鉴别生成图像的真实性。如果生成的图像和文字描述相差甚远，就无法通过鉴别模型的检测，因此GAN网络通过两个模型的合作，能够使生成的图像越来越接近本文所描述的内容。然而，GAN网络对“一只蓝色的鸟”、“一棵常青树”这样比较简单的文字描述能生成效果较好的图像，而对于“一只绿冠红腹、黄色翅膀的鸟”这样复杂的描述，生成的图像还不那么尽如人意。

想象一下，如果让我们来根据一段描述画一幅画，我们会怎么做？通常来说，我们会在这个过程中不断地参考文本描述，尤其是正在绘制的区域所对应的那部分文字。基于这个启发，研究人员将GAN网络改进为AttnGAN网络（attentional GAN），用数学表达来模拟人类的这种注意力特征，将输入的文本分解为单个的单词，将单个单词与待生成图像的特定区域相匹配。根据CVPR上的一篇研究论文的测试结果，这种方法使生成图像的质量提高了近三倍。

项目链接：

Microsoft AI lab

JFK文件演示

为了帮助用户更好地了解美国总统肯尼迪被暗杀的整个事件，微软的研究人员利用Azure搜索服务和微软认知服务开发了一个应用程序，能够自动分析与暗杀有关的所有解密文件，并将原始文档整理成结构化的信息。

JFK文件演示背后的核心技术是Cognitive Search，这是微软在Build大会上发布的一项基于AI的内容理解技术，由内置认知服务功能的Azure搜索提供支持，能从任何内容资源中提取数据，并运用可组合的认知功能从数据中提取需要的知识。这些知识将被整理和存储在索引中，优化搜索数据的体验。Cognitive Search能方便快捷地利用云和AI的强大力量处理数据，当我们第一次将它应用于JFK文件演示系统时，效果令人惊叹，我们提出的许多有趣的问题不仅可以获得回答，还可以在原始文件中看到答案和问题之间的关系。JFK文件演示系统能使我们的客户轻松将其应用到自己的领域、回答他们所需要的问题。

项目链接：

Microsoft AI lab

风格迁移

风格迁移(Style Transfer)是一种对图片风格进行转换的技术，能从一张图片中提取出风格并应用到另一张图片中，也就是我们常见的“滤镜”功能。这个项目展示了如何训练和部署深度学习模型，开发一个简单有趣的风格迁移应用。

风格迁移项目使用Visual Studio Tools for AI来训练和部署深度学习模型。Visual Studio Tools for AI能让开发者在本地开发机器上轻松部署Keras + Tensorflow模型的训练代码，然后上传到Azure VM上，利用强大的Nvidia GPU来训练模型，大大提高工作效率。我们在提高模型训练速度的同时，在生成图像中保留了与原始图像的语义相似性。此外，Visual Studio Tools for AI还能直接从训练好的TensorFlow模型生成C＃代码，无需再手动重新编写。使用全新的Microsoft.ML.Scoring库，开发者可以便捷地在应用中使用TensorFlow或ONNX模型，在设备端或者云端运行。

风格迁移只是采用训练机器学习模型方法的应用之一，在应用中使用机器学习技术的过程本质上是相同的。开发者可以使用Tensorflow或CNTK等框架自行训练模型，也可以使用Azure认知服务等预先训练的AI模型。

项目链接：

Microsoft AI lab

机器阅读理解

机器阅读理解（MRC）是让计算机根据给定的上下文来回答问题，需要对上下文和问题之间的复杂交互进行建模。微软的研究人员采用新的神经网络ReasoNet（Reasoning Network）来模仿人类阅读时的推理过程：ReasoNets会带着问题反复阅读文档，每次关注文档的不同部分，直到给出令人满意的答案。

同时，微软亚洲研究院的研究人员也提出一种独特的R-NET算法，使机器阅读理解能力在SQUAD数据集上超越了人类平均水平。R-NET是一个端到端的深度学习模型。模型分为四层，最下面一层给问题和文本中的每一个词做一个表示，即深度学习里的向量；第二步，将问题中的向量和文本中的向量做一个比对，找出与问题接近的文字部分。接下来，将结果放在全局中进行比对。这些都是通过注意力机制（attention）达到的。最后一步，针对挑出的答案候选区中的每一个词汇进行预测，哪一个词是答案的开始，到哪个词是答案的结束。这样，系统会挑出可能性最高的一段文本，最后将答案输出出来。

当我们将这些机器阅读理解算法用于由沈向洋和Brad Smith撰写的《未来计算：人工智能及社会角色》一书时，机器阅读理解回答了大量有趣的问题。机器阅读理解技术能够应用于企业级数据处理，帮助客户回答特定领域的问题。

项目链接：

Microsoft AI lab

Drones + AirSim

Drones + AirSim是一项有趣的模拟“搜索与拯救”的任务。我们先在AirSim中创建了一个3D环境来模拟微软园区中的足球场，将各种动物放置在球场中；创建了一个Python脚本模拟无人机，它可以在球场中自由拍摄照片。然后我们将无人机拍摄的图像上传至Azure自定义视觉（Custom Vision）服务，训练模型来识别图像中的动物，利用Azure IoT Edge将训练好的模型部署到无人机上。于是，无人机能够在足球场中飞行、拍照，并实时识别出画面中的动物。这一项目能够让用户了解实时自定义的AI如何在无人机这样的边缘设备上运行。

项目链接：

Microsoft AI lab

另外，AI Lab即将开放社区申请，我们期待你的参与！

本账号为微软亚洲研究院的官方知乎账号。本账号立足于计算机领域，特别是人工智能相关的前沿研究，旨在为人工智能的相关研究提供范例，从专业的角度促进公众对人工智能的理解，并为研究人员提供讨论和参与的开放平台，从而共建计算机领域的未来。

微软亚洲研究院的每一位专家都是我们的智囊团，你在这个账号可以阅读到来自计算机科学领域各个不同方向的专家们的见解。请大家不要吝惜手里的“邀请”，让我们在分享中共同进步。

也欢迎大家关注我们的微博和微信 (ID:MSRAsia) 账号，了解更多我们的研究。

编辑于 2019-07-24 16:21

量子位 2020 年度新知答主 · Accepted Answer

GitHub上，有个新发布的深度学习教程，叫PracticalAI，今天刚刚被PyTorch官方推荐，已经收获2600多标星。

项目基于PyTorch，是从萌新到老司机的一条进阶之路。这条路上每走一步，都有算法示例可以直接运行。

新手可以从基础的基础开始学起，不止线性规划和随机森林，连笔记本怎么用，NumPy等重要的Python库怎么用，都有手把手教程。

到中后期，可以学着搭高级的RNN，厉害的GAN，这里还有许多实际应用示例可以跑。毕竟，这是一个注重实践的项目。

这里的算法示例，可以用Google Colab来跑，免费借用云端TPU/GPU，只要有个Chrome就够了。没梯子的话，就用Jupyter Notebook来跑咯。

内容友好，持续更新

PracticalAI里面的内容，分为四个部分，并将持续更新：

基础 (Basics)，深度学习入门 (Deep Learning) ，深度学习高阶 (Advanced) ，以及具体应用 (Topics) 。注：此处非直译。

· 基础部分，除了有Python指南、笔记本用法，以及Numpy、Pandas这些库的用法，还有线性规划、逻辑规划、随机森林、k-means聚类这些机器学习的基本技术。

有了这些，可以走进深度学习的世界了。

· 深度学习入门，包括了PyTorch指南、多层感知器 (MLP) 、数据与模型、面向对象的机器学习、卷积神经网络 (CNN) 、嵌入，以及递归神经网络 (RNN) 。

· 深度学习高阶，会涉及更高级的RNN、自编码器、生成对抗网络 (GAN) ，以及空间变换网络 (Spatial Transformer Networks) 等等。

· 最后是应用。计算机视觉是个重要的方向。除此之外，还会涉及时间序列分析 (Time Series Analysis) ，商品推荐系统，预训练语言模型，多任务学习，强化学习等等示例可以运行。也可以修改示例，写出自己的应用。

细心的小伙伴大概发现了，表格里的有些话题还没有加链接 (如上图) 。项目作者表示，这些部分很快就会更新了。

另外，表上还有没填满的格子，作者也欢迎大家前去添砖加瓦。

食用说明，无微不至

项目作者用了三点来描述这个项目：

一是，可以用PyTorch来实现基础的机器学习算法，以及神经网络。
二是，可以用Google Colab直接在网页上运行一切，无需任何设定 (也可以用Jupyter跑) 。
三是，可以学做面向对象的机器学习，与实际应用联系紧密，不止是入门教程而已。

那么如何上手？笔记本跑起来啊：

(步骤几乎是针对Colab写的。Jupyter用户可忽略。)

第一步，项目里进到notebooks目录。
第二步，用Google Colab去跑这些笔记本，也可以直接在本地跑。
第三步，点击一个笔记本，把URL里的这一段：
https://github.com/
替换成这一段：
https://colab.research.google.com/github/
或者用Open In Colab这个Chrome扩展来一键解决。
第四步，登录谷歌账号。
第五步，点击工具栏里的COPY TO DRIVE按钮，就可以在新标签页里打开笔记本了。

第六步，给这个新笔记本重命名，把名称里的Copy of去掉就行。
第七步，运行代码，修改代码，放飞自我。所有改动都会自动保存到Google Drive。

开始学吧，不然等到内容更新了，要学的就更多了。

项目传送门：
https://github.com/GokuMohandas/practicalAI/

— 完 —

欢迎大家关注我们的知乎号：量子位

编辑于 2018-12-12 19:51