谷歌AI中国中心_百度百科
收藏
0有用+1
0

谷歌AI中国中心

北京成立的组织机构
谷歌AI中国中心在北京成立。该中心将由李飞飞和Google Cloud研发负责人李佳博士共同领导。
中文名
谷歌AI中国中心
外文名
Google AI China Center
成立时间
2017年12月13日
机构地址
北京市

产品服务

播报
编辑
谷歌AI中国中心的重点会是基础 AI 研究,同时会与充满活力的中国学术界建立持续发展的合作关系。为更广大的学生及研究人员提供高质量的 AI 及机器学习教育支持。 [1]

发展经历

播报
编辑
谷歌AI中国中心
2017年12月13日,Google中国开发者大会召开。会上,Google Cloud人工智能和机器学习团队首席科学家李飞飞宣布,谷歌AI中国中心在北京成立。 [2]

管理团队

播报
编辑
谷歌AI中国中心
谷歌AI中国中心由李飞飞和Google Cloud研发负责人李佳共同领导,李飞飞除了负责中心的研究工作,也会统筹Google Cloud AI,Google Brain以及中国本土团队的工作。 [2]

AI 历程

播报
编辑

定义目标

目标
这个 AI 的历程通常是从最初的问题定义开始,比如图像分类识别。如果想从这个图里面识别出有个毛线团,这个问题的表达形式有很多种,它的解决方案也有各种各样的。 [3]
目标

收集数据

收集数据
这里就有一个例子,在自动驾驶技术中我们根本没有办法去训练算法如何应对交通事故,或者比较罕见遇到的交通情况,因为没有这样的数据。这种情况是否能有替代做法呢?我想提下这个模拟器的技术。这样我们可以自由生成各种各样的数据,来表现这些复杂的情况。
这个技术经常被用在迁移学习里面,我们可能在原有领域有很多数据,但很难在新的领域收集同样多的数据;这是其中一个问题。还有很多其它问题,比如说我们在谷歌云上面遇到的很多问题,它们通常是没有已知的解决办法的,它们也没有办法找到这样大量的数据。
我们这里要解决的是一个小数据的问题,不是大数据的问题。在这个过程中,迁移学习、模拟器技术都是非常值得去研究去探索的,在能够真正的解决实际问题之前,能够达到我们希望的能够处理任何情况之前,先用这样的技术让模型快速成长。
我们同时也能挖掘出一个很大的宝藏,机器人技术。比如说用模拟器的方法解决机器人技术的问题。

设计算法

我刚才谈到一些有关模拟器生成数据的探索,实际上算法也对这个领域至关重要,其中包含了怎么样有效让我们人指导机器来进行学习。当然,让机器学习也还有各种不同的办法。
我刚才谈到了机器人方面的很多问题,另外一个大的方向是自然语言。大家看到有很多的好玩的聊天机器人,是一种为了好玩的、随意的聊天。但是在我们人和人之间,我们聊天的双方或者是多方是有不同的背景的,整个聊天的过程是有一个希望达成的目的的。对话的目的的理解、利用和算法更新都做得不多。所以很多问题,很多聊天的问题是有一个目标需要完成的,这样才能让机器和人类的交流更有价值。我们非常感兴趣将来继续探索这方面的问题。

形成整体解决方案

在谷歌云,我们有非常非常多的传统的行业跟我们进行合作,我们在跟他们交流的过程或者沟通的过程,发觉有好多的问题,我们整个 AI 领域还没有给予特别多的关注,比如说其中一个就是 AI 医疗。
我们知道医疗技术里面,实际上有很多非常非常有意思的问题,比如说我们的医生资源非常少,特别是中国,一个医生一天看上百人的病人,我觉得这对医生来说是非常繁重的劳动,而且病人也没有得到足够的关照。如果有更多的、足够的时间去探讨和理解他的疾病的话,应该会非常有帮助。在很多发展中国家,甚至都没有很多的医生来帮助这些病人解决问题。所以,我们想看看 AI 能怎么样帮助解决这些问题。
这里我想给一个比较简单的例子,我们自己在这上面做了一些小的、比较新的探索,实际上就是让 AI 识别胸部 X 光片。
通常人类医生做这个过程、判断疾病的严重程度非常花时间,而且它对医生的要求也非常高。假设我们如果有一个基于 AI 的 X 光疾病识别算法,就可以极大地减少人类医生的工作量。但这里也有一个悖论:一方面,我们想做这样的 AI 去帮助医生做一些判断,帮助医生对疾病形成更好、更深的理解;而通常技术就是深度学习,如果我们要做这个问题的话,深度学习会需要大量的标注数据才能做出一些成果。这样就回到了我们开始想要解决的问题:我们本来是想帮我们的人员减少他们的工作量,减少他们对数据的处理,结果我们做这些事情,反而要让他们处理更多的数据。
X光图像
我们这里就开始在看怎么样去解决这个具体问题。通常来说,如果我们要去获取这种标注数据,对做标注的医生要求是非常高的。不过其实我们有很多的 X 光图像都是带有医学的报告的,这些医学的报告来自于以往积累的真实诊疗记录。我们合作研究的医院有十多万张 X 光图像,然而在这么大量的图像里面只有小于一千张有这种带边界框的数据标注。我们最近一段时间对这个问题进行了一些探讨,去考虑如何用深度学习的方法来解决这个问题。中间我们的 Wang Chong 博士也是对这个项目的学习算法贡献非常大,我们想的是怎么用半监督学习,和这些小量的数据,用一个算法来极大地提高了这些少量数据的有效性。这样的结果我们就可以不但有对这个疾病的类别的判定,同时还能给我们的一些建议,怎么样解决这个问题。
这是一个简单的例子去怎么看从我们如何去设计算法。在我们这个里面,我们还有做很多的尝试,中间包括数据收集和总体解决方案的建立。我刚才介绍到对 AI 医疗的领域,我们整个团队也是非常感兴趣。因为有很多的行业的这种合作,所以我们也会用开放的态度积极参与。用 AI 改善人们的生活是我们非常关注的问题,我们想用 AI 来对相关行业做出更多的贡献。 [3]