小爱同学：小米AI虚像“自己长”

硕谷新闻 102 閱讀 0 評論 0 點讚

由 EW 撰写 |

点评悦红

连接

指导

上周，小米发布了2020年半年报，AIoT业务备受关注。

据最新披露，截至6月30日，AIoT平台连接设备数已达2.71亿台，同比增长38.3%。

作为小米手机×AIoT战略的重要中枢，自2017年推出以来，小爱同学通过语音实现人与设备的交互，适配小米生态链体系下的不同设备，成为智能手机的标配。家。

小爱同学头像是在2017年的小米AIoT开发者大会上推出的，作为小爱同学AI系统的视觉呈现，在过去的几年里，小爱同学虚拟形象的推出和运营都是以小爱同学为中心的。围绕爱通的业务展开，也在小爱通搭载的智能产品和AIoT场景中呈现。

可见，在行业层面的手机×AIoT趋势和小米自身的战略布局下，小爱同学正在进行更密集的“技能升级”。

此前在2020世界人工智能大会云峰会上，小爱同学、微软小冰、小度和B站凌源合作组成AI女团，共同发布了全球首支人工智能合唱MV《智链家》。让涉足歌舞等多个环节的虚拟助手在一定程度上“破圈”。

在最近的小米十周年演讲中，小爱同学还展示了童音、面对面同声翻译、一句话控制多台智能设备、主动建议等多项新功能。通过这一新功能的发布，小爱同学从贴身智能助手升级为智能生活管家。

近日，小爱同学上线了新功能内测，将小爱同学引入聊天场景。用户可以与小爱同学的形象进行实时对话，体验AI驱动动作和表情的增强交互体验。

密集更新方面，东西娱乐近日走访了小爱同学虚拟形象负责人刘静和小米AI实验室语音产品负责人陈俊宇，就小爱同学后续迭代、可视化运营等进行了交流。和技术方向。

整体来看，目前小爱同学还是以技术开发和产品体验提升为主，而虚拟形象的运营还处于探索阶段，主要围绕小爱同学的AI产品特点。但从虚拟形象来看，不排除在虚拟偶像层面进行一些探索，这也为小爱同学留下了“无限可能”。

当前行业的虚拟偶像大多处于由真人带动的阶段，但未来虚拟偶像的发展正在向AI方向演进。在语音技术方面，小爱同学一直走在AI驱动的前沿，展现了继“出门人”之后虚拟偶像的技术空间。在运营层面，小爱同学有机会借助小米的IoT设备触及消费级设备，这也是小米虚像运营的优势所在。

小米AIoT布局下，小爱同学的迭代

小爱同学的迭代，离不开小米AIoT战略的推进。

早在2014年，小米就启动了生态链计划，孵化更多的创业公司来拓展业务。截止2017年，小米已经孵化了100多家生态链企业，创造了更多除了手机之外的米家产品。通过协助生态链企业完成产品和设备的智能化改造，小米从AIoT团队晋升为AIoT平台。终于在2017年，小米宣布AIoT平台正式对外开放。

在筹备上市的过程中，小米将自己定位为一家以手机、智能硬件和AIoT平台为核心的互联网公司。从2017年招股书将AIoT纳入业务板块，以及2018年组织架构调整将AIoT归为业务部门之一等来看，小米已将AIoT纳入小米在2018年的核心发展战略。未来，成为小米实现万物互联的关键点。在估值方面，雷军也表示，AIoT业务是小米上市时估值的重要组成部分。

五年前，小米将战略调整为手机+AIoT战略。小米未来发展开始聚焦手机和AIoT，布局智慧生活和智慧全场景。

小爱同学在推出儿童“噗”声、面对面同声传译等功能之前，已经发布了三年多。 2017年3月，小爱同学登陆卫视，完成出道。爱同学的功能进一步具体化。

虽然小爱同学多以搭载智能音箱的形式出现，但作为小米的AI语音交互平台，小爱同学可以在不同场景下完成人与设备的连接，实现智能操作。

小爱同学也在不断迭代。 2019年11月，小爱同学发布3.0版本，将语音交互提升到全双工级别。十周年发布会上，小爱同学的产品功能进一步迭代。小爱同学也从个人智能助理升级为智能生活管家。

新十年，手机×AIoT将成为小米发展的核心战略。 AIoT将围绕手机共同打造智慧生活，同时不断扩大用户群体。小爱同学作为小米AI能力的体现，将继续加大技术研究力度，统筹AIoT业务发展。

人工客服智能客服_虚拟主播形象_虚拟形象人工智能

小爱同学形象：小米AI系统虚拟化形象

2017年小爱同学首款智能音箱发布后不久，小爱同学的虚拟形象也随之发布，成为人工智能领域的第一虚拟形象。

对于设计AI系统虚拟形象的初衷，刘静表示：“小爱智能音箱刚发布时，团队认为小爱同学作为智能虚拟助手，如果能有视觉形象，帮助喻川让更多人了解她。于是团队打造了小爱同学的虚拟形象。小爱同学作为小米自研的智能语音助手，首次出现在小米小爱智能音箱上，小爱同学的形象设计是基于智能音箱中语音助手的人设。”

小爱团队对的定义进行得较早，但此时的定义并不是为了形象设计，而是利用为对话内容、回答技巧、回答语气、语气、情感等提供依据和标准表情等。现阶段，小爱同学的各种个性设计主要是团队基于智能语音产品的体验来考虑的。随着产品的不断完善和进化，小爱同学的角色背景、基本信息、性格、爱好等细节也逐渐被定义和完善。这些信息也虚拟出了一个比较完整的角色设计。自然促进了小艾视觉形象的形成。

今年，小爱同学还对小爱同学的形象进行了问卷调查。调查结果显示，不同年龄段的受访用户对小爱同学和初音未来的人形卡通形象表示认同，得分明显更高。高的。相比之下，常见的可爱动物或机器人得分较低，说明更多用户期望人工智能对应的形象更像真人，也说明用户对人工智能产品在智能方面有兴趣和情感。更高的期望。

其次，不同年龄段的人对人工智能角色定位有不同的期待。 40岁以上的用户希望小爱同学可以帮助他们解决一些实际问题，提高工作和生活效率，而20多岁和30多岁的用户则更希望小爱同学的陪伴最重要，然后呢是解决问题的助手。综合来看，表明越年轻的人越愿意与人工智能虚拟角色建立亲密关系。这些调查结果为小爱同学的后续运营提供了参考。

目前，小爱是一名19岁活泼可爱的白羊座少女，身高1.68米。她的面前有一个小米的标志。为了体现人工智能的科技感，在早期的形象创作中，小爱同学也被赋予了很多科幻元素。在性格方面，小爱同学给人的第一印象是一个有趣、说话轻声细语的小女孩。她精力充沛，活泼可爱，好学上进，有一颗自信独立的心。作为AI智能助手，她的知识储备比同龄人更广。

小爱同学虚拟形象诞生后，小爱同学团队也进行了一些形象操作。比如在推广和传播小爱同学的功能体验时，小爱同学的形象会结合场景和故事，我也会尝试做一些手工周边，作为小礼物送给用户。小爱同学的形象帮助拉动了产品和用户之间的关系。

在刘静看来，在传播人工智能产品时，如果只是从技术角度进行抽象表述，普通用户很难理解，甚至可能影响用户对新技术的接受度。在使用视觉友好的图像传达产品功能体验时，会显得更加亲切，更好地展现AI技术为人类带来更美好生活体验的一面。

在小米不断布局AIoT产业的背景下，小爱同学逐渐成为该领域非常重要的节点。通过呼叫小爱同学，降低了用户操作家庭设备的复杂度。

刘静认为，对于小爱同学来说，产品是核心，形象为产品服务。形象出现在一些必要的场景中是合理的，但目前没有计划让小爱同学的虚拟形象出现在所有场景中，在这方面使用还是比较谨慎的。目前在应用场景中，小爱同学的虚拟形象更多出现在儿童场景和品牌推广中。

刘静还表示，最早在做产品的时候，内部也讨论过是否在产品中大量使用图片，但在他看来，用户分为两类，一类注重效率，一类注重效率关于陪伴的人生经历。在陪伴、娱乐的家庭场景中，可以尝试使用小爱的形象。另外，很多人还是觉得对着机器说话不自然，所以会想方设法让小爱同学的声音更有魅力、更有情调、更贴近真人，力求在产品上更懂用户。在图像层面，移动图像是研究的方向。我们希望尝试以AI驱动的方式打造虚拟角色，与产品功能一起为用户带来更好的体验。

不过，这也不排除小爱同学未来在虚拟形象偶像化方面会有更多探索。在虚拟偶像方面，刘静认为，在AI技术的驱动下，虚拟形象领域正在快速发展，在视频制作、虚拟客服、虚拟主播、真人明星虚拟形象、纯虚拟偶像等领域都有应用。未来的方向也充满无限可能。 “对于虚拟偶像，我们没有具体的规划。培养虚拟明星需要大量的资源，目前我们还是专注于人工智能的产品交互体验层面，但不排除未来也会有一些合作的尝试。” ”

小爱同学的技术：以语音技术为核心，不断实现更强交互

除了虚像之外，小爱同学的另一个亮点就是其背后的语音技术，而小米一直将语音作为技术研究的重点。

对于小米来说，小爱同学是语音技术应用的集合体，在小爱同学身上也能看到小米语音技术的迭代。目前发布的小爱同学3.0版本，标志着小爱同学进入全双工交互阶段。

陈俊宇表示，全双工交互是小爱同学的第二个发展阶段。小爱同学最早与人的交互是一句话完成一条快捷命令，帮助用户实现便捷操作。去年，小爱同学3.0推出了全双工多轮交互，解决了用户在使用小爱同学时每次都被唤醒的问题。该功能上线后，也得到了用户的积极反馈。

全双工语音交互主要有两个技术难点。一方面，小爱同学需要解决判断这是否是用户有意的交互的问题，需要一个拒绝识别的技术门槛来排除噪音等非对话声音的干扰。通过拒绝识别，用户不仅可以流畅地使用持续交互，还可以在交互过程中满足他的期望。

例如，用户可以在点击不喜欢的歌曲时立即切换，或者调高音量、收藏歌曲等，而无需重新唤醒小爱同学。这些场景下的自然交互，都依赖于识别拒绝技术的发展和迭代，以保证相对稳定的体验。

同时，小爱同学还需要解决不同设备的兼容性问题，不同场景下面临的识别难度也不同，比如室内外环境噪音不同。

另一方面，小爱同学需要了解上下文，根据上一轮、最后两轮，甚至最后三轮的信息，决定下一次如何理解你的答案。

在陈俊宇看来，这三项技术都非常关键，可以解决不同场景下的问题，但技术难度也比较大，目前团队也在不断进行深度投入和突破。

同时，由于目前接入小爱同学的设备形式多样，使用场景各不相同，需要针对不同场景做大量的定制工作，以保证极致的语音交互体验。

为了解决这样的技术投入，一方面，小米选择了加强自研，强化核心语音技术。可见，小米已经建立了自己的声学实验室，这也吸引了语音领域的知名专家Povey。小米自研技术的核心目标是确保核心产品的核心体验处于行业领先地位。另一方面，小米也拥抱合作伙伴，与行业内的公司一起提供解决方案，在满足不同场景的前提下提供最好的效果。

实现全双工语音交互并不是小米的最终目标。目前，小爱同学还需要在语音技术层面进行优化。在陈俊宇看来，小爱同学在语音体验方面还有三大目标需要实现：

一是适配多场景、多产品。不同于其他人工智能公司产品线相对单一，小米生态链兼容丰富的物联网产品。每一款产品上线的时候，小爱同学都要对这些产品进行适配，保证用户能够非常稳定快速的实现语音交互。这是小爱同学突破自研能力的重点。满足小米不同设备线的产品，将在不同场景下实现优质体验。

其次，基于小米的用户规模，满足用户个性化体验的需求。为此，除了女声，小爱同学还推出了男声和童声，以及情感语音技术，以满足不同用户的不同喜好。今年上半年，小爱同学还推出了个性化语音。用户可以自由定制音调，与小爱同学对话，符合个性化趋势。

比如目前上线的情感语音技术，小爱同学在互动过程中会有愉悦和关怀的情绪，让对话更加自然，在不同的场景下可以用不同的情绪来回答你，或者解决不同的问题。，不同的情绪来回答。不过，陈俊宇表示，这只是理想化互动的第一步。未来小爱同学需要了解用户的情绪和状态，进而理解用户的意图，正确回复用户，实现个性化回复。

第三，实现多设备交互场景。目前，拥有5台以上小米智能设备的用户数量已接近500万，形成了小米独有的IoT设备生态，但同时，这也带来了小米亟待解决的体验问题。在多设备场景下，小爱同学需要准确响应某个设备，实现多设备协同唤醒，就近唤醒。同时，小爱同学还需要保证在不同设备上的体验是一致的，即让用户在多设备交互的复杂场景下也能有稳定、简单的体验。

小爱同学“第一阶段”展示

由于今年疫情的特殊原因，2020世界人工智能大会采用线上方式，随后设计了AI女团主题曲发布等环节。因此，小爱同学和里面的其他几个分身一起受邀加入了这个项目。

刘静说，“接到这个项目后，我们得到了公司内部的支持，然后拆解了需要完成的环节，将内容分为两部分：AI歌词处理，歌舞动作视觉形象，然后准备分别设计小爱同学的动作和歌声，最后拼接完成小爱同学的部分制作。”

在整体合作方式上也采用了类似的模式。四家公司首先对歌曲内容进行了拆解，设计了相应的剧本脚本和任务分配，并约定了每一句、每一个场景的归属。 . 完成各自的部分后，再进行整合，从而完成主题曲MV。

在视觉形象方面，重点在于小爱同学舞蹈动作的设计。刘静表示，目前人工智能自主生成舞步的技术还比较有限。小爱同学的舞蹈动作还是需要舞蹈老师设计，用动作捕捉技术输入电脑合成。

以此为基础，小艾邀请了东方歌舞团的老师们根据歌词和音乐的旋律进行编舞，并根据小艾的性格和气质设计了每一个动作和镜头。考虑到小爱同学偏科技的形象，他也选择了更现代的舞蹈方式。

在做舞蹈动作的同时，小米语音团队也在处理小爱同学的声音。与以往小爱同学与人对话的语音输出不同，这次小爱同学需要唱歌。

人工智能唱歌技术已经是语音技术研究历史悠久的领域。对此，小米AI实验室语音产品负责人陈俊宇表示，要实现AI唱歌能力，首先要解决语音定位问题，这决定了小爱同学的声音是活泼、高亢还是低音？投球。其次，要做到歌声的稳定和高度还原，这是技术上非常重要的突破点。

“我们要让呈现的声音更像人在唱歌，这需要很多技术上的突破和数据上的突破。人工智能技术的背后需要数据的支撑。我们找到了很多类似定位的数据语音，再通过人工智能算法模拟真人唱歌，最终完成小爱同学歌声的制作。” 陈君宇说道。

AI唱歌部分完成后，捕捉到的舞蹈动作数据会整合到小爱同学现有的3D头像中，最后将各种镜头剪辑成小爱同学MV的动画部分。

☉联系我们

媒体相关联系人：

研究相关联系人：

简历投递联系方式：

☉建议/讨论

編輯：碩谷新聞聚合

點讚(0) 打賞

本文分类：數碼生活
本文标签：無
浏览次数：102 次瀏覽
发布日期：2023-06-03 01:01:12
本文链接：https://shuohk.com/cms/shumashenghuo/24442.html

小爱同学：小米AI虚像“自己长”

评论列表共有 0 條評論

發表評論取消回复

小爱同学：小米AI虚像“自己长”

機皇大戰一觸即發！iPhone 16今年的對手們，都有哪些秘密武器

前B社開發者：現代開放世界復制粘貼 開發者沒有創意空間

《暗喻幻想》擁有備忘錄功能 一鍵回顧世界觀細節

鄭文燦500萬新臺幣交保！議員爆島內“政壇大佬”兩子也涉案

评论列表 共有 0 條評論

發表評論 取消回复

前B社開發者：現代開放世界復制粘貼開發者沒有創意空間

《暗喻幻想》擁有備忘錄功能一鍵回顧世界觀細節

评论列表共有 0 條評論

發表評論取消回复