阿赛·游梦鱼·郭言赛·阿赛工作室
全站技术源码素材

微软小娜开发者平台负责人:未来人机交互界面可能不是APP,而是Bots

  •  字体:
  • 在微软中国开发者峰会上,微软CEO萨提亚·纳德拉称微软中国未来的策略就是基于人工智能技术的“对话即平台(Conversations as a Platform)”。除了在Azure.cn上提供免费试用的认知服务之外,微软还演示了跨平台(Cross Platform)、跨系统的微软小娜开发者平台(Cortana Developer Portal)——通过该平台,微软的合作伙伴可以很方便地将Windows与Android平台上的应用和网站与微软小娜集成,让小娜可以为用户提供更多合作伙伴的服务。

    小娜已经与中国网易云音乐、美团外卖、海尔智能家居整合,微软表示,小娜今年最重要的一件事情就是拓展生态系统。微软小娜全球资深产品总监Paul Bloom(负责微软小娜开发者平台与全球合作伙伴)接受CSDN记者采访,介绍了拓展小娜生态系统的思路,包括小娜开发者平台的能力、合作伙伴如何与小娜整合,以及小娜开发者平台和认知服务的区别等。

    Paul Bloom表示,微软小娜开发者平台是一个开放的平台,第三方APP只需要三步就可以和小娜集成;这种集成目前支持Website,或者是Universal Windows Platform(适用于windows平台的应用程序),或者是安卓、iOS APP,但未来人机交互界面可能是Bots,小娜也和这些Bots一样可以在任何的载体、任何的平台上面出现。

    微软小娜 人工智能 人机交互

    小娜开发者平台

    截至目前,小娜在全球已经有1000余家合作企业,用户可以通过语音命令方式通过应用完成相应任务。2016年,在Paul Bloom的主导下,微软小娜面向全球开发者推出了小娜开发者平台,其中具有鲜明特色的是小娜开发者平台支持合作伙伴扩展、集成小娜的“主动行为” (Proactive Action)。通过开发者平台,

    微软向合作伙伴开放小娜对用户以及用户周围世界的认知和理解(Insights)。举例来说,用户即将离开家去单位上班,就是一个Insight,用户中午有一个会和午餐时间冲突也是一个Insight。 合作伙伴可以将应用和网站注册到Insight上,实现诸多智能场景。比如中午有会时小娜帮用户叫美团外卖,或者晚上回家时打开网易云音乐听喜欢的歌。 小娜还可以在用户授权的情况下,把一些和服务相关的有用信息分享给第三方,简化用户操作。比如把用户的饮食习惯、就餐地点和时间传给美团,这样用户下单时就会很方便;或者把用户喜欢的明星分享给网易云音乐,这样网易就可以想用户推荐明星的新歌。

    主动行为的依据是用户行为习惯等。在收集如用户喜欢某个APP等很多信号之后,微软会把用户有可能做什么事情推荐给他,他可以选择同意或者不同意,同时小娜通过这个行为主动学习,然后把任务完成得更好。例如,用户在中午开会时,小娜会主动提醒用户要不要定外卖,执行之前会询问用户同不同意。至于委托小娜做一些事情,小娜会察觉到一些比较强烈的用户习惯,比如某用户习惯下班之前给加人发信息,小娜经过学习之后就会主动问这个用户,是不是下次你要回家的时候,我就帮你发讯息,只要用户同意,那小娜以后就会主动发信息。

    第三方集成策略

    CSND:小娜开发者平台选择第三方合作伙伴有什么标准或者门槛?

    Paul Bloom:原则上微软不会特别地选择与哪个第三方集成,这个平台是非常开放的,所有的开发者都可以很容易地接入这个平台。Portal的平台有Proactive和Reactive(主动操作和被动操作,主动操作指小娜主动推送给用户的信息,被动操作是当用户提问时小娜给出回答)。Procative就是Cortana会分析用户的行为,主动帮用户去做什么事儿,或者提醒用户做什么事儿,去做什么事就叫做Action。微软分两种Action:

    Pre-define Action(预先定义的操作)。针对一些有兴趣要做的事情出来,微软会计划一些Pre-define Action去要求做怎么做,只要第三方觉得他的体验是符合这个条件的,他就可以接入。 Arbitrary Action(任意的操作)。不是提前定义好的,第三方也可以通过这个平台跟微软去做整合。

    在今年旧金山的微软开发者大会上,我们有展示一个体验,有一个第三方的合作伙伴叫Petzi,他们提供的整合非常具有创意。当主人工作很晚的时候,小娜可以主动跟主人沟通要不要帮忙喂狗——喂狗这件事情并不是微软事先定义的,小娜可以帮忙是因为Petzi利用这个开放的平台,在上面做了一个喂狗的应用。小娜的主人工作很晚的时候,就可以通过Cortana使用Petzi,在这个界面上看到他的狗然后点按钮喂狗吃东西。微软需要有一个很好的平台,让第三方都可以来实现他们想做的事情,只要他有好的提议和想法,可以利用Cortana去实践,我们都欢迎他们过来。

    从技术的角度,目前可能需要有一些条件才能跟小娜去做整合,需要Website,或者是Universal Windows Platform(适用于windows平台的应用程序),或者是安卓、iOS APP,你才有机会通过小娜把你的行为去实现。这是从目前技术的限制。未来微软会推出BotsFramework(一个强大的Java的库,可以应用到HTML5)——未来人机交互界面可能不是APP,而是Bots——我们会有Bots Framework或者Bots on Skype,小娜也和这些Bots一样可以在任何的载体、任何的平台上面出现。可以想象,以后有小娜的地方或者UWP APP也都可以跟你的服务或者是Action(操作)做结合。

    CSND:在安卓、iOS平台上也可以实现主动的行为?

    Paul Bloom:把小娜带到其他平台,我们会尽全力去保证在安卓、iOS和Windows各个平台是一致的。在Windows平台的功能,在其他的平台也都可以满足用户的需要,但是肯定还是会有一些差异化存在——通常在于我们想要利用安卓、iOS平台已有的优势可以做得更好的部分。但总体来讲,Windows的平台优势是比较强的。Proactive Action的整合,在Windows平台,包含Windows PC、Windows平板、Windows Phone,肯定会一个一个实现的。同时Proactive Action现在也已经上了安卓的平台,之后我们也会很快的把这个能力带到苹果iOS上。最终我们希望,小娜的能力可以跟着主人到达每个地方。Bots on Skype未来Cortana也会再去支持Proactive Action的部分,只是Skype对话平台在中国区还没有非常真正可行。

    CSND:在安卓平台有哪些差异?

    Paul Bloom:如果OS平台已经提供一些很好的Functionality(操作系统上的功能)可以支持小娜完成任务,我们就直接利用这个平台提供的功能。小娜安卓和iOS的部分是中国团队负责的。安卓有一些功能是Windows Phone没有的,或者使用者习惯跟Windows Phone不一样,比如说在Windows Phone是用live tile(磁贴活动窗口),在安卓是Widget(插件)的观念,所以小娜在安卓上就不会有live tile,但是就会有Widget。在Windows Phone的Lockscreen Behavior(锁屏状态的行为)也和安卓上的不一样。像闹钟的部分,在安卓我们就会利用系统的闹钟,那Windows Phone当然是利用Windows Phone系统的闹钟。

    CSND:不同平台的APP和小娜集成,开发者需要一些什么不同的工作?

    Paul Bloom:当然在每个平台上的APP语言是不一样的,至于说通过Developer Portal和微软小娜集成,这部分应该没有很大的跨平台的工作。现在的Developer Portal,开发者只需要三个步骤:

    选择他的APP是跟哪一个认知场景(Insight)有关联。 选择需要的一些与APP服务相关的语境数据(Contaxual Data),比如订外卖需要的时间、地点、喜欢吃的菜,这些不会因为平台有不一样。 开发者提供该应用或网站的URI给小娜,作为深度链接(Deep linking),让小娜集成,通过深度链接来促进APP的经验。一个Insight在不同平台,深度链接的形式可能不一样,但是基本上深度链接到网站上,你就可以接入你想要的模式,自己设计UI优化用户体验。

    例如,伦敦“Just Eat”(类似美团)让Cortana用户的APP的呈现页面的时候,特别做了界面设计,页面会呈现的跟小娜风格比较一致,会把我们用户给的用餐时间、喜欢吃的菜等资料更新到上面。就是说跟小娜整合用户体验做的更好。如果想要更优化的话,开发者自己可以去设想,然后去做优化。

    我们希望给平台使用者提供的接入服务是越简单越好,越好用越好,所以如果有一些复杂的地方,我们一定会排除在外。在两个月前,Just Eat来使用我们的平台,他们只花了大概15分钟跟他们的APP可以做集成,就把这些都设定好了。

    小娜开发者平台与认知服务

    CSND:微软认知服务(Cognitive Service)已提供有20多个API来做一些智能应用的开发。Cortana也用了一些认知服务的API,是否对一些认知服务用户来说,选择小娜开发者平台更加利于简化开发流程?

    Paul Bloom:首先这两个东西的定位是很不一样的。小娜开发者平台以Cortana Personal Assistant为主,怎么通过Proactive Action或者Reactive Action的方法把用户的体验跟小娜结合在一起。认知服务有一点像我们把Cortana技术成分拆开成一个一个的服务,比如语音识别、图象识别、语言理解,开发者可以使用这些服务,让APP更聪明,所以并不是说今天用了Cortana Developer Portal,认知服务就完全没有利用价值,这两个是可以相辅相成的。

    还有一个很大的区别,小娜未来将会在各个平台,各个地方都会跟随使用者,如果是一个和个人助理相关联的服务,那就用Cortana Developer Portal来做。如果只是为了APP的体验做得更好,需要用到语音识别、语言理解、图像识别和机器学习等,当然可以继续使用认知服务。

    小娜开发者平台的挑战

    CSND:小娜开发者平台在国外最受欢迎的特点是什么?与您到中国来收集到的意见有什么不同?

    Paul Bloom:从旧金山的Build大会来看,大概有三点开发者是非常喜欢的。

    微软小娜可以很容易地开放给第三方做集成,就等于说你个人助理会介绍专业的人来帮主人完成事情,而不见得跟主人自己去完成,透过对主人的理解,可以带到第三方的服务,这个idea是非常好的也是一个公开平台。 小娜开发者平台是非常容易去使用,只需要三步就可以,如果APP已经有很好的客户,要做的只是把深度链接跟Cortana的界面接起来的部分。 微软真的做到没有界限的个人助理(Unbound Assistant),一般用户有的设备都可以提供服务,也就是说APP不管在哪个平台,可以去做集成,利用小娜的优势,不论是从哪个平台得到的认知,针对同一个主人的体验是一致的。

    中国市场对微软来讲也是一个非常重要的市场,所以我们选择在第一轮投放的时候支持三个市场,包括美国、中国和英国。在全球开发者喜欢的东西,跟中国开发者基本是一致的。

    CSND:有没有一些嘈点?

    Paul Bloom:我们没有发现开发者觉得不好的地方。如果一定要说有,可能就是太晚开放,开发者有比较多的需求,我们现在能提供的认知场景(Insight)还太少,小娜主动对用户认知开放给第三方的这种场景比较少一点,另外。场景还可以增加各种参数,这部分以后可能就是会开放更多。

    CSND:您认为小娜开发者平台发展的挑战是什么?

    Paul Bloom:我不觉得有什么非常困难的事情是做不到的。当然,作为一个个人助理,透过各种大数据实现用户习惯的认知,再把主动认知介绍给各个合作伙伴,去定义一个平台让大家都可以很容易地使用,都是一件不容易的事情。

    引用网址:http://www.eesai.com/?sahy/hyrwdh/info/CJSYQENLG1G.html

    MapSiteMapRssGoTop