欲加入创客群请加微信:cool-smiler ,备注:入群

关于机器学习的问题解答

六项精进 JackLeon 2年前 (2018-01-27) 34次浏览 0个评论 扫描二维码

对很多人来说,机器学习技术似乎很超前。但近年来,机器学习技术已经越来越多地出现在我们的生活中 – 无论是 Google 计算机在围棋比赛中的精彩表现,还是 Inbox by Gmail 创建自动回复的功能,都是该技术的实际应用。虽然这些都令人无比振奋,但有些人仍不清楚机器学习技术究竟是什么。为什么这种技术如此重要?为什么识别出照片中的狗并非听起来那么容易?因此,我们采访了 Google 负责机器学习技术的科研人员玛雅·古普塔 (Maya Gupta),请她来为大家详细介绍一下。

我们先从基本概念说起。机器学习技术究竟是什么呢?
机器学习技术就是收集大量示例,找出能够解释这些示例的模式,然后利用这些模式对新示例进行预测。

以电影推荐为例。假设有十亿人分别告诉我们十部他们喜欢的电影。这样,计算机就可以利用这大量的示例来了解人们喜欢的电影有哪些共同点。然后,计算机会归纳出一些模式来解释这些示例,比如“喜欢恐怖片的人通常不喜欢爱情片,但人们喜欢由相同演员出演的电影。”如果您告诉计算机您喜欢杰克·尼科尔森 (Jack Nicholson) 主演的《闪灵》,那么它就会猜测您是否会喜欢他主演的爱情喜剧片《爱是妥协》,并推断要在 YouTube 上为您推荐哪些其他的视频。

哦,明白了。那么,在实际运用中是怎样的呢?
事实上,机器学习的模式可能会非常复杂,很难用语言解释清楚。以 Google 照片为例,您可以在其中将全部有狗的照片分拣出来。Google 是怎么做到这一点的呢?首先,我们会收集大量带“狗”标签的示例照片(这要归功于互联网!)。我们还会收集大量带“猫”标签的照片,以及数百万带其他标签的照片,这里就不一一列举了 :)

然后,计算机会找出像素模式和颜色模式,以便猜测照片中是猫还是狗(或是…)。一开始,计算机只是随机猜测哪些模式可以很好地识别出狗。接着,它会观察一张有狗的示例图片,看看当前的模式能不能准确地识别出这条狗。如果误将猫认成了狗,计算机就会对所用模式进行一些细微的调整。接下来,它会观察一张有猫的图片,并再次对模式进行微调,以便准确地识别出这只猫。计算机会将此过程重复大约十亿次:观察某个示例,如果判断有误,则对所用模式进行微调,以便针对该示例做出更准确的判断。

最后,这些模式会形成机器学习的模型(例如,深度神经网络),该模型在大多数情况下都可以准确识别出狗、猫、消防员以及许多其他事物。

听起来好超前啊。目前还有哪些 Google 产品在使用机器学习技术?
借助机器学习技术,Google 正在不断推出大量全新的功能。例如,Google 翻译可以将采用某种语言书写的路牌或菜单拍成照片,识别出其中的字词和语言,然后神奇地将内容实时翻译为您使用的语言。

您还可以对着 Google 翻译说出任何内容,采用机器学习技术的语音识别功能会随即自动识别并翻译您所说的内容。大量其他产品中也使用了语音识别功能,例如,在“Google”应用中利用该功能识别语音查询,利用该功能使 YouTube 视频更易于搜索。

机器学习技术和人工智能是一回事吗?
事实上,这两个词对不同的人来说含义可能不同,但基本上,人工智能 (AI) 是计算机程序方面一个非常宽泛的术语。如果某个计算机程序会尝试解决对人类来说非常简单的问题(例如,看图讲故事),我们就可以说该程序采用了人工智能技术。人类还可以轻松做到很多神奇的事情,其中一件就是从示例中学习。这正是机器学习程序也要试图做到的:教导计算机从示例中学习。

非常棒的一件事是,当我们弄清楚如何开发这些计算机程序后,有时可以扩展它们的功能,以便快速处理大量数据,从而解决非常棘手的难题,例如:下围棋、同时为每个人规划交通路线、优化全国范围内的能源利用,当然还有我非常喜欢的一项功能,就是让您在 Google 中找到最理想的搜索结果。

Google 现在为什么如此重视机器学习技术?
机器学习并不是一项新技术,它最早出现在 18 世纪的统计学中。但您说得没错,近年来这项技术确实很热,原因有三个。

首先,我们需要大量的示例来教导计算机如何做出准确的预测,哪怕是对你我来说非常简单的事情(例如,找出照片中的狗)。得益于互联网上的各种活动,我们现在有丰富的示例来源可供计算机学习。例如,目前全球范围内各种语言的网站上有数百万张带“狗”标签的狗照片。

但拥有大量示例还不够。您不能只是把一大堆狗照片摆在摄像头前,就期望计算机能够学习到些什么 – 计算机还需要使用学习程序。近来,这一领域(以及 Google)取得了一些振奋人心的重大突破,这些机器学习程序更臻完善,功能更强大。

但我们的程序仍不够完美,计算机也不够智能,因此我们需要观察大量示例并多次进行大量微调,最终达到我们的要求。这些都需要强大的计算能力和出色的并行处理能力。当然,软件和硬件的最新发展也是这一切得以实现的原因。

还有什么是计算机目前无法做到,但借助机器学习技术有望在不久的将来能够做到的呢?
仿佛就在昨天,当您通过电话读出信用卡号时,语音识别功能还只能勉强识别出 10 个不同的数字。而在过去的五年间,得益于先进的机器学习技术,语音识别功能取得了惊人的进展。现在,您可以利用该功能进行 Google 搜索。不仅如此,该功能将会变得越来越完善,识别速度会越来越快。

我认为,机器学习技术甚至可以让我们更好地穿衣打扮。不知道大家是怎样想的,反正我是很讨厌试衣服!如果发现适合自己的牛仔裤品牌,我会一口气买五条。但机器学习技术可以根据适合我们的品牌示例来推荐可能适合我们的其他品牌。这个问题有点超出了 Google 的工作范围,但我希望有人从事这方面的研究!

机器学习技术在十年后会是什么样呢?
目前整个领域都在攻克的一个难题是,如何从更少的示例中更快速地学习。其中一种方法是让机器掌握更多常识(在该领域中,我们称为“正则化”),Google 正在努力进行这方面的研究。

对机器来说,什么是常识呢?一般来说,常识意味着机器不应该因为示例的细微变化而完全改变其认知。例如,照片中戴着牛仔帽的狗仍然是狗。

我们通过降低机器学习技术对不重要的细微变化(例如,戴牛仔帽)的敏感度,在学习程序中贯彻这种常识。这说起来容易,但如果出现差错,则会导致机器对重大变化不够敏感!因此,我们仍在摸索如何实现平衡。

机器学习技术最让您感到兴奋的地方是什么?促使您从事相关工作的动力是什么?
我在西雅图长大,听过很多美国西部早期探险者的故事,例如路易斯 (Lewis) 和克拉克 (Clark) 的探险故事。研究机器学习技术也是同样的探险 – 探索新鲜事物,然后披荆斩棘开创美好未来。

如果要为 Google 的机器学习技术想一个车尾贴标语,您觉得应该是什么?
第一次失败没关系,还可以再试十亿次。


温馨提示:若在升级会员或付费后阅读过程中遇到问题,请加客服微信号(cool-smiler)沟通解决,祝您生活愉快。
转载请注明原文链接:关于机器学习的问题解答
喜欢 (0)
[1186664388@qq.com]
分享 (0)
关于作者:
创享视界(creativeview.cn)是一个带动全民颠覆八小时工作制,通过投稿把自己的创意智慧变现的方式创造被动收入,从而实现财务自由的平台。我们相信,创新思维不仅有助于打造更出色的产品,还可以让世界变得更美好,让人人受益。
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
%d 博主赞过: