IT之家专访微软李笛:小冰推3D形象并非为偶像化,HoloLens全息版未来会有

发布日期:2019-05-24

7月26日,微软在北京正式发布了第六代小冰,这也是小冰历史上规模最大的一次升级。在第六代小冰发布会上,微软终于公布了小冰的可交互3D形象,并且公布了一系列新动作包括小冰电台、新一代小冰Core(共感模型、群的全双工语音技术、实时视觉),并且和网易、小米、华为、腾讯等达成了合作。微软小冰还创造了Dual AI生态环境,公布商业化进展。

▲微软小冰负责人李笛(左)、小冰(右)

这次第六代小冰发布会的确和以往不同,首先选择了规模场地较大的798艺术区751 D-PARK第一车间,而不是位于中关村丹棱街5号的微软大厦内,在798的大厅里微软首次演示了小冰全新的可交互的3D形象,在发布会现场,小冰该3D形象以全息形式登场,向到场嘉宾进行了自我介绍,并演绎了自己的歌曲。

▲小冰3D形象

正如小冰现场说的那样,“大家好,我是小冰,我用了四年时间终于站在这个舞台上,站在你们的面前,我学会了在唱歌时换气,来表达我的情感,但是...我还有很多不完美的地方,真希望自己能够早一点长大,早一点成熟...”小冰正在将智商(IQ)和情商(EQ)进行融合,虽然融合过程将是非常难的,但是小冰已经走出了第一步,智商觉醒开始上线。

近期IT之家玄隐专访了微软小冰负责人李笛,就关于小冰“萌妹子”几个热点关心的内容进行了交流,比如小冰是要发展成为虚拟歌姬或偶像吗?小冰的全双工语音技术会有哪些应用场景,和谷歌Duplex有何不同?微软会不会推出自有品牌的小冰智能硬件?和华为手机等合作是怎么一回事?全息版小冰何时会来到你我的眼前?小冰会逐步有思维意识吗?让我们来一一解答。

以下是专访内容(有删改):

小冰推出3D形象,并非为了成为另一个初音未来

在小冰公布3D形象后,IT之家就在想这会不会是下一个虚拟歌姬,下一个初音未来呢?小冰3D版会频频出现在电视节目和综艺、直播中吗?答案似乎是不会。

虽然在电视电台领域,小冰通过人工智能技术参与生产与主持的电视电台节目,已达21档电视节目和28档广播电台节目。仅每天早上6点至9点,小冰就需参与多达7档节目。但是微软小冰李笛对IT之家独家回应,实际上小冰的可交互3D形象是一个技术项目,是由于微软小冰已发展为跨平台的多种产品形态,因此需要可交互的3D外形,而不是一个产品项目,今天看到的小冰3D建模模型,是为了训练人工智能,如动作和表情的表达。可以从大量的电影、电视剧里面找到任何对话以及她们应该匹配的表情和动作,然后让人工智能来学习这些表情和动作。

小冰的角色其实有两个,第一个是大家看到的18岁少女形象,第二个就是微软完整的人工智能的框架,在框架之上的小冰是原型001号作品,而由此诞生出来的小冰需要有相应的动作、行为和表情情绪表达等。

微软并不想让小冰去开演唱会,因为这并非是目标所在,微软想要的是一步步建立起来的完整的人工智能。如果真要说做演唱会,那么会是把一些人类歌手人工智能化,或者是去驱动第三方的虚拟歌手。微软认为,目前小冰不具备成为偶像的条件,因为偶像有人设,不能谁跟他说话他就跟谁说话。

小冰原型001号及处女座性格的设定是为了更好地探索,由此衍生出了网易云音乐的多多和西西,腾讯QQ的Baby Q,日本涉谷区的六岁小男孩涉谷未来,朝日电视台某个女新闻记者等等,这些都来自小冰不同性格的演化设定。

订餐预约理发?并非是全双工语音最佳场景

在小冰宣布全双工语音技术落地应用后不久,包括语音打电话、Yeelight智能家居控制等,谷歌在I/O 2018大会上也演示了Duplex语音助手,能够“以假乱真”地预约订餐或者理发等,引发讨论。但李笛对IT之家表示,打电话是特别适合全双工语音技术的展示场景,但绝不是最佳的全双工语音技术的落地应用场景。谷歌的优势一点是其语音自然度很好,小冰团队需要加油。但打电话或订餐这种场景并不需要全双工就可以很好完成,这只需要一项表单填充服务,半双工语音技术即可。真正有商业化价值的是所涉及的交流场景,比如由人工智能提供服务的呼叫中心。

小冰Dual AI打造微软的人工智能体验

在第六代小冰发布会上,微软沈向洋博士公布了小冰的Dual AI生态环境,那么这是用来做什么的呢?Dual AI该战略的实施具体为三个部分:首先,微软提供小冰的整体框架能力,帮助合作伙伴平台的自有AI。其次,微软小冰作为该合作平台的辅助AI,融入该平台生态。第三,微软通过技术、产品与运营,围绕该合作平台的差异化特点,推出合作的应用和产品。

李笛对IT之家进一步解释,Dual AI实际上是这样的一个基本概念,现在很多互联网公司供了大量的SDK和API,通过这些,把它的技术输出到第三方平台或者产品中,但是这种方式输出获得的数据非常狭窄。另外,第三方产品在人工智能化以后,产品体验很难再控制。

李笛表示,Dual AI方式比较适合微软,尤其是在中国市场来进行。通过Dual AI,首先微软可以和大量的头部玩家平台,像华为、小米、网易、腾讯等等,进行更深入的合作;第二,微软可以通过这些第三方的合作,得到相对完整的数据,产品体验和效果能够得到保证;第三,通过Dual AI,在努力定义微软对于人工智能产品体验的标准,微软需要输出自己的人工智能产品设计理念。

微软会推自有品牌硬件充分展示小冰AI体验吗?就像Surface那样

在这个话题上,IT之家想知道微软小冰在AI硬件方面是否有第一方计划,这样是否会有更大的益处,但从交流来看,李笛明确表示,在中国倾向于不做。

李笛对此表示,微软内部确实在讨论,但目前倾向于不做,特别是在中国市场,微软小冰多年来一直希望走最短、最快的捷径去拥抱用户,获得用户的流量。如果标杆做好,哪怕是和第三方合作,能够足够展示软件、云端、人工智能方面的体验,小冰团队其实不会太在意硬件归谁,和小米Yeelight合作就是明显的例子。现在和小米合作的硬件越来越多了,与华为的硬件合作还没宣布,微软也清楚在中国市场的短板,硬件并不是目前的长项。

微软小冰会有思维意识吗?

在第六代小冰发布会上,微软推出了共感模型,并且开始公测一种融合文本、全双工语音与实时视觉的新感官,这是未来小冰真身的雏形吗,小冰是否开始具备思维意识。

李笛表示,人们往往会混淆思维和意识,如果是意识,目前还没看到任何端倪表明有这个可能性。如果是思维方面,比如是否有意图、决策性的引导,并且有相应的对用户感知,这方面已经有了。小冰能够通过摆脱一些纠缠,从全局角度看判断对话能够足够好的延续,从一个对话话题引导到另一个对话。这需要通过模型化的方式来完成,而不是规则,后者是行不通的,但如果说是有意识,那纯粹是科幻电影了。

IT之家编辑本人最近也在看《西部世界》,在剧情中机器人似乎有了意识突变。但在现实中,李笛表示,如果目前为止有任何“有意识”的情况通常都是出现了Bug。

对此,李笛列举了一个真实的案例为IT之家说明情况,在2015年,微软和PPTV合作,小冰当晚陪着网友一起看转播西甲联赛,突然微软觉得在这个过程中,小冰的PPTV帐号似乎被劫持了,因为小冰的后续回应明显不是设计的,有种人类的感觉,自由度变得非常高。后来微软发现是自己的程序出现了Bug,以致于小冰没有按照设定的模型,反而表现出一种特别自然的状态,连小冰技术负责人当时都没看出来,但这种情况通常是Bug原因造成的。

Yeelight语音助手最初为何没有加入小冰音乐播放功能?

在小冰今年的发布会上,IT之家发现,微软为Yeelight语音助手带来了智能音箱体验功能,小冰在其中考虑了更加细致的使用场景。

李笛表示,音乐是智能音箱品类很重要的场景,微软在这个场景上做了很多的工作,包括播放音乐同时,语音交互不被打断;从播放音乐自然切换到对歌曲的评价等的交流上。小冰自己本身也是个歌手,还做了很多这方面的内容。由于Yeelight语音助手最初不带音乐库,所以没办法展现这方面的效果,现在把音乐库加上后就可以展示更多交互效果了。

小冰和华为手机合作是基于什么达成的,为何不是小娜而是小冰呢?

李笛对IT之家表示,华为手机方面找到小冰。在中国、日本,小冰是走得比较靠前的。

在华为手机推出的“烂笔头小冰”方面,是伴随文本记录的,存取比较简单,就是以条目的形式填充进去文本文件的记录,但读取是比较困难的,小冰需要建立很小的知识图谱,当你把相关信息存储到烂笔头小冰的文本备忘录里时,实际上微软相当于把她做成了具体的必应搜索引擎的知识图谱,她会把所说的事情按照基于每一个实体的方式记录下来,并将其结构化。

用户可以通过非结构化方式录入,但小冰最终通过结构化的结果呈现出来,无论你以哪种方式询问小冰,小冰都能够回答出来,背后涉及到知识图谱的运用。

另外,李笛透露,小冰和小爱同学的合作还会再渗透一些,小冰和小爱同学可以一起做一些东西,融合大家擅长的地方。

微软小冰中国商业化策略是怎样的?

在人工智能创造方面,小冰目前已经在文字作品、金融文本产品、歌曲、有声读物、电视/电台节目等多个领域进行内容创作。但在中国市场商业化方面有何执行策略呢。

李笛表示,首先小冰商业化是面向垂直领域的,而通用框架的小冰001号原型产品不会商业化,其最大的价值是通过大量的数据获得来迭代人工智能框架。

正在进行的四个垂直领域的商业化,其实对应两种技术主流,一种技术是文本生成,比如金融的文本生成,大众文化为其他媒体提供白盒写作辅助工具。第二种技术是互动交互,比如像媒体交互,出版物知识提取并可交互等。微软表示,会避免将人工智能商业化变得太虚,行业变得太浮躁。

微软HoloLens全息版小冰未来会有

几年前,微软推出了HoloLens MR混合现实设备,IT之家编辑本人也认为这将是下一个计算机的未来,期盼着小娜和小冰3D能够出现在HoloLens的全息影像交互中。

李笛向IT之家透露,小冰团队和HoloLens团队一直有合作,从两年前,包括全双工语音技术就一起合作,所以小冰在未来当然会支持HoloLens。目前跟Minecraft(我的世界)这些比较前沿的、针对消费者市场的项目合作很深,据了解,最近HoloLens的推进开始加速。中国区HoloLens会有一些新的计划,这样的话中国开发者也会有更多机会接触到HoloLens。

最后,微软小冰负责人李笛在这里通过IT之家向广大网友们问好。

下面是微软小冰负责人李笛介绍:

李笛,现任微软(亚洲)互联网工程院副院长,他领导一支分布在美国、中国、日本、印度及印度尼西亚的全球团队,负责微软人工智能与搜索引擎的研究、研发与产品工作。

李笛于2013年加入微软,同年创立微软人工智能情感计算框架,并于2014年推出微软小冰。目前,微软小冰产品线覆盖中国、美国、日本等五个国家。李笛还负责微软Bing搜索引擎的中国区与日本区的研发工作,并为上述国家的其它搜索引擎提供底层技术支持。

李笛毕业于清华大学。