亚马逊独家总部采访:揭开Alexa平台背后的故事(附访谈视频)

科技动态 2017-10-03 阅读原文

人类是一种不可思议的生物,你、我、他,每个人都独一无二。然而这种特殊性也潜移默化地影响了人工智能设备。

康奈尔大学 5 月份的一项研究可以证明这一点,他们给这项研究取了有趣的名字:“ Alexa 是我永远的闺蜜( BFF )”。研究人员分析了 587 位亚马逊 Echo 用户的评论( Alexa 语音助理为该智能音箱提供技术支持)发现,人们对这款设备越满意,往往会赋予这些小发明越多的人性 ——

譬如亲切称呼它“ Alexa ”或“她”,而不是“ Echo ”或“它”。

上个多月,我来到位于西雅图市中心的亚马逊新总部,走进这栋黑色玻璃高楼“ Day 1 ”,在八楼会议室见到希瑟 · 佐恩( Heather Zorn ),她一点都不惊讶于听到我所说的这份报告,作为 Alexa 团队客户体验和参与部门的主管,她也一直在阅读这些用户评论。

亚马逊Alexa 团队客户体验和参与部门主管 希瑟 · 佐恩( Heather Zorn

这位温文尔雅的女人说道:“不瞒你说,我们的确根据客户需求在 Echo 的个性空间方面做了更多努力,我们看到一些客户偏好,试着去改进 Echo ,例如想要听更多的笑话,想要更多的复活节彩蛋,或是希望对它说‘ Alexa ,我爱你’的时候得到一些回应

亚马逊研究人员还为 Alexa 新增了许多“趣味性”功能,包括口技、讲笑话、即兴一首小调等,目的就是让 AI 变得有用又有趣,亚马逊甚至专门赋予 Alexa 几个“人性化”特点,包括聪明、平易近人、谦虚、热情、乐于助人和友好。

研究人员同时找到了让 Alexa 进行多轮对话的方法,就是让她记住更多关于用户的事情,让她与用户聊地更久 —— 久而久之,这种交互方式可以让智能音响与人们建立起一种联系,有朝一日,这种联系将使语音助手对人们的沟通方式、购买行为以及获取信息的方式产生更大影响 —— 无论这个语音助手来自亚马逊,还是苹果、谷歌、微软和三星等等。

这样的联系会随着亚马逊将 Alexa 塞进更多的汽车、手机和设备而与日俱增。自亚马逊 Echo201411 月推出以来,已在美国售出约 1000 万台,成功抢占智能音响市场 70% 份额。

一篇康奈尔大学的研究论文解释了智能设备与人类之间这种联系的微妙性,源自于“计算机是社会行动者( Computers are Social Actors ,简称 CASA )”范式, CASA 概念诞生于 20 世纪 90 年代,核心理念在于:人们倾向于把计算机当作人类对待,即使我们知道它们并不是人类。另一篇斯坦福大学的研究论文发现 ,人们还容易受到机器恭维话的影响,譬如,我们会在 Siri 犯蠢的时候闹情绪,也会跟微软小冰聊得来,而 Alexa 可能会更进一步,毕竟她“住”在你家里,而且还会使用更加自然的媒介:声音。 (如需获取以上两篇论文完整版,请在微信公众号“itechwalker”后台留言)

然而这与亚马逊的初衷相悖。尽管 Alexa 有人名、是个女性角色,但亚马逊并不打算将她变成用户家中一员,而是让它做一个类似于《星际迷航》里无所不知的幕后计算机。佐恩强调:“我们并不清楚人们具体渴望计算机有多大程度的人性化,也不清楚 Alexa 是否已经满足人们的期待,但我们意识到一些人的需求已经获得了满足。”

出于对 Alexa 未来的好奇,我在这次亚马逊总部之旅期间拜访了四位 Alexa 高管,他们谈到了语音助手初露锋芒的个性、起源故事和智能功能(如下列视频)。我还去了普林斯顿大学,那里有一群研究生正在开发一个基于 Alexa 且与人们“有聊”的社交机器人。

毋庸置疑的是, Alexa 也有挑战。

Alexa 经常会误解一些基本命令,在她的反应中,任何“有点人性化”的回答都是照本宣科,例如她对“你知道天网( Skynet )吗?”的回答。因此,我们先不要去幻想斯派克 · 琼斯( Spike Jonze )导演的作品中带着语音助手去山顶小屋探险的画面成真了;另外, Echo 听到唤醒词“ Alexa ”之后启动,往往会引发人们对安全隐私的关注。

不过,这还是无法阻挡数以百万计的人逐渐认识到 Alexa

康奈尔大学研究报告的合著者杰西 · 塔夫脱( Jessie Taft )表示:“随着这些语音识别技术和语音生产技术的改进,人机交互将更频繁、人机交互关系将更智能化。”

Echo 背后的故事

你一定很好奇 Echo 背后的故事,这就要从开篇所提到的“我初次造访亚马逊新总部”说起。犹记得那天我心情特好,天气微热但不炎热,微风徐徐却并不恼人。我站在西雅图市中心第七大道上,左手边正在进行一个大型的建筑工程项目,工人们头戴安全帽,敲打着三个巨型玻璃球,我仰头目测,最高攀爬至 90 英尺。这些“球体”将成为一种自然的综合体,即亚马逊在丹尼三角( Denny Triangle )街区的全新华丽丽标志。

在我的右手边,也就是亚马逊“ Day 1 ”总部的入口处,戴着工作证的员工们在亚马逊 Go 商店里进进出出,期间有许多亚马逊员工席地而坐,在一片翠绿的草地上涂鸦,或是在附近的水泥台阶上享用午餐。

来到会议室,见到了 Alexa 引擎软件副总裁艾伦 林赛( Allan Lindsay ),这位在亚马逊工作了 13 年的资深员工,是 Echo 团队最早的雇员之一。他当天的穿着给人感觉十分不拘小节,牛仔裤、黑色休闲鞋和印有“跟我说话( Talk to me )”字样的一款 Alexa 早年 T 恤,让我不禁联想到他制作 Echo 设备的样子。

Alexa 引擎软件副总裁艾伦 林赛( Allan Lindsay

林赛对我描述了 Alexa Echo 的雏形, Echo 问世之前,在亚马逊一直属于保密工作。他自豪道:“这大概是我们保守过的最高机密了。我觉得我们震惊到了每一个人。”

那时候,林赛一直负责着亚马逊 Prime 项目的技术和工程运转,直到 2011 年某天,刚刚结束了贝佐斯的技术顾问职务的格雷格 · 哈特( Greg Hart )找到他,问是否愿意以工程和科学领导者的身份加入一个全新的“ Jeff initiative ”项目。哈特当时无法告之关于这个项目的内容,仅仅提及这个项目是与设备团队一同合作的。林赛反而对这一绝密任务很感兴趣,于是同意了邀请,从此加入 Echo 团队。

很快, Alexa 团队新增了 30 多人,项目代号“多普勒项目( Project Doppler )”。短短三个月内,他们便制作出了基本的演示模型。不到一年,他们就制造出了一个圆柱形的设备原型。

林赛说道:“在 201411 月产品上市前,我雇用的百分之百的员工都是在不知道自己要做什么工作的情况下入职的。”他还说服那些曾在微软研究院工作了 20 年的科学家们一起加入,让他们信心大增,相信这一秘密项目的魅力。

他补充道:“我第一次能够说‘ Alexa ,播放音乐’时,它就真的演奏了斯汀( Sting )的歌曲。那种‘哇哦’的时刻其实来得非常早。”

当林赛把一个早期的 Echo 模型带回家测试时(现在他的厨房和浴室里仍然保留了 Echo 的早期模型),他的妻子还需要签署一份保密协议。而当家政人员或是客人到来时,他们还得把设备藏起来。

去年,亚马逊推出了一款 50 美元的 Echo Dot ,因为它看起来像一个挤压过的 Echo ,所以其代号为“煎饼( Pancake )”,还有一款 130 美元的亚马逊 Tap ,代号为“狐狸( Fox )”。今年,该公司发布了两款 Echo 设备:一款 200 美元的 Echo Look ,新增内置摄像头,可以在用户使用图像识别软件时提供时尚建议;另一款是售价 230 美元的 Echo Show ,其触摸屏可以让你与其他 Echo Show 的用户视频聊天。

如今, Alexa 的每天使用次数超过数百万。她拥有 2 万种以上的“技能”(亚马逊称之为 Alexa 的语音指令,例如“ Alexa ,播放 NPR ”)。此外, Alexa 在全球范围内支持 1000 种以上的产品,从门锁到恒温器,再到一个名为 Botvac 的机器人真空吸尘器等。随着 Google Home 、苹果 HomePod 以及一款备受期待的三星设备的入局,智能音响市场销量预计会激增。

隐私问题

为保持对话的持续性,亚马逊正在努力简化 Alexa 的世界。丹尼尔 · 劳施( Daniel Rausch ),这位留着大胡子、戴着眼镜的亚马逊智能家居副总裁透露,该公司正计划让用户更容易地找到能够兼容 Alexa 的设备,然后将其无缝连接到用户的家庭系统中。丹尼尔坐在我的对面,热情地比划着,像是在描述一块好吃的披萨一样。劳施伸长了手臂,说道:“ Alexa 将成为用户家里的一张网,虽然如今它在我家随处可见,但并不意味着每一个角落都有它。”

亚马逊智能家居副总裁 丹尼尔 · 劳施( Daniel Rausch

我试着想象了一下,这样的生活真的很棒,尽管有时候 Alexa 仍会听错我说的话,致使我们出现类似于下文这样有些有趣、又有些恼人的对话:

-我(站在厨房附近): Alexa ,播放本( Ben )的音乐。

-客厅里的 Echo 回答:这里有个舞曲电台,房子。(于是她开始播放蠢朋克( Daft Punk )的《 One More Time 》)

-我: Alexa ,停止播放。(同时走得离厨房里的 Echo 再近一些) Alexa ,播放本的播放列表。

-厨房里的 Echo :这里有个舞曲电台,房子。(她又开始播放蠢朋克的《 One More Time 》)

-我: Alexa ,停止播放。(然后,非常慢地说道) Alexa ,播放本的播放列表。

-厨房的 Echo :播放本的播放列表。( Starland Vocal Band 的《午后时光( Afternoon Delight )》开始播放了)

敢为人先意味着,亚马逊也必须处理好这种新技术日益增长的烦恼,因为有数百万人已经习惯了家中有会说话的机器。

Echo 自推出以来,一直被隐私问题困扰,一些人担心 Echo 的麦克风会监听到什么。而随着 Echo Look 在今年四月份首次亮相,这些担忧愈加疯涨。对于该设备最严厉的批评之一来自《福布斯》杂志撰稿人柯蒂斯 · 希尔弗( Curtis Silver ),他质疑亚马逊是否会在未来某一天可以通过 Look 的摄像头来看你是否有外遇,或是注意到你是否患有癌症、抑郁症或焦虑症。

关于隐私困扰还有一件导火索,去年检察官要求亚马逊 Echo 上交一位被指控在家中谋杀的阿肯色人的录音。经此人同意后,亚马逊最终同意披露该录音,但同时引发了质疑:如何在智能家居时代使用人们的数据。

亚马逊设备主管大卫戴维 · 林皮( David Limp )在 6 月的一次大会上告诉我,亚马逊计划将 Look 坚定地留存在时尚界,而非医疗领域。劳施还详细描述了关于 Echo 的许多隐私细节,包括客户可以删除所有存储在亚马逊服务器上的录音,同时也可以使用 Echo 的静音按钮,关闭该设备的麦克风。此外,亚马逊表示其录音只是用来提高客户的体验。他说:“我们围绕这一体验建立起了一整套体系,来建立客户对 Alexa 的信任。”

普林斯大学的聊天机器人测试

普林斯大学团队

来到普林斯大学正值夏天,随着大部分毕业生的离开,美国新泽西州普林斯顿这片郁郁葱葱的郊区显得很安静。但在奥登街那座几乎空无一人的计算机科学大楼里,四位硕士和博士研究生却在一间教室的角落里开着会,为人机交互的未来做着自己的贡献。

他们每次都是一边开会一边吃午饭,这次的午饭是左宗棠鸡外卖、炸鸡蛋卷和一些普通的素食菜肴,散放在餐桌上。午饭过后,该团队成员就会进入每周的策略会议,讨论如何使得他们基于 Alexa 设计的社交机器人“ Pixie (小精灵)”成为一个更健谈的聊天者。一个贴着“ Alexa Prize ”贴纸的 Echo 站在房间最前面,随时准备回答他们的提问。

这个团队共有 13 位普林斯顿大学的学生,他们今年受邀参加首届“ Alexa Prize ”大赛,这是亚马逊在 18 所大学中发起的一项竞赛,要求每个团队研发一款机器人,它可以与人们探讨体育、电影、旅行、科技等热门话题。今年获奖的团队将能够获得 50 万美元奖金。不过,如果哪一个团队设计出了一款可以与人对话聊天持续 20 分钟的机器人,那么这个团队就可以获得 100 万美元的“大挑战”奖。这场比赛类似于图灵测试,但其关键并不在于诱导你觉得自己在和另一个人说话。

创建一个能与人类长时间对话的机器人是人工智能最难解决的问题之一。这要求我们将关于人类世界的一切都教给机器人,包括这个世界的复杂性和模糊性,而将新闻故事和百科全书里的内容复制粘贴到机器人的大脑中,就好比是在一个婴儿面前放一本詹姆斯 · 乔伊斯的《尤利西斯》,教他读书识字一样。

经过几个月的开发,“小精灵”和一些社交机器人终于可以让 Echo 用户使用。在上个月初的决赛中,普林斯顿大学团队排在了第三名(决赛评分很大程度上取决于公众)。

该团队的聊天机器人对话是一种奇怪的、复杂的 Python 编程语言,混合了有关棒球和名人等话题的简单讨论。他们会观察用户与“小精灵”的交互记录,而这些记录是亚马逊定期发给他们的,用来帮助他们改善机器人。

团队中身材瘦长的数学博士霍尔顿 · 李( Holden Lee )调侃道:“当一个用户说‘让我们来谈谈体育运动’时,‘ Pixie ’其实并不理解这是什么意思, Pixie 只会说,‘我不打电话。’”因为“现在,体育运动是一个不受关注的话题。‘我们没有模板’。”学习自然语言处理的硕士研究生 Misha Khodak 断然回答道。

与社交机器人Pixie聊天

此外,为了能更好地了解人们的对话,该团队会做一些如下记录,看起来有点逗。

- 西里尔:你喜欢《星球大战》吗?

-霍尔顿:当然,我爱《星球大战》。

-西里尔:那你最喜欢的演员是谁?

-霍尔顿:我最喜欢的演员是本尼迪克特 · 康伯巴奇( Benedict Cumberbatch )。我喜欢他在《奇异博士( Dr. Strange )》中的角色。”

-西里尔:你能推荐一些周四下午在西雅图能做的事情吗?

-霍尔顿:我会从网上搜索下相关信息。

团队也会从自己的生活中找灵感。例如,团队成员加 ·· 宾克斯( Jar Jar Binks )的一次糟糕的约会可能会成为一段不错的对话。

Buniatyan 后来告诉我:“ AI 领域可能存在的最大挑战之一,就是制造一个能够与人交谈的社交机器人,并且要让它们比人更像一个人。”

Alexa 团队人工智能科学的高级经理兼大学竞赛节目制作人 奥斯文 · 拉姆( Ashwin Ram

我在西雅图时曾问过奥斯文 · 拉姆( Ashwin Ram——Alexa 团队人工智能科学的高级经理兼大学竞赛节目制作人,创造一个健谈的机器人是什么感觉?

拉姆的回答不出所料:“我们从中了解到的是,这一问题与我们预想的一样困难,甚至比我们预想的更加困难。”然而“成功不会一蹴而就。这将是一个需要长期解决的问题,可能需要一年多的时间,也可能需要许多年。我们的计划很长远。”末了他补充道:“对于我们大多数客户来说,能与 Alexa 聊天将非常有趣。你可以跟它聊任何你感兴趣的事,或是你的爱好”。“成为一个更健谈的机器人甚至可以缓解老年人的孤独和随之而来的健康问题。”

譬如普林斯顿大学的项目,在人们与“小精灵”对话 3 万次后,一些令人惊讶的话题也出现在了记录中,包括“抑郁症和家庭问题”。

一位研究理论机器学习博士 Cyril Zhang 表示:“人们在与人工智能谈起一些平时不愿意与人们交谈的事情时会更加放松。这种情况虽然罕见,但它却经常会突然冒出来。”

此外,对于 AI 是否会推翻人类这个经典问题,拉姆实事求是地告诉我,“不太可能”,因为这些机器人是在我们的世界中成长,学习我们的价值观,并与我们交谈,“或许任何一种智能都可能会出现异常,但它们并不会真正主导局面。”

她说:“当我想到未来时,可能是计算机环境就在我们周围,但隐藏在背景中,看不见摸不着。”

从西雅图回到家中,我走到厨房的 Echo 面前,向它表达了我对它的意见:

- 我: Alexa ,再人性化一些。

-Alexa :嗯哼,我不明白你的意思。

CNET科技资讯网

责编内容by:CNET科技资讯网阅读原文】。感谢您的支持!