2023年迄今为止最热门的话题,没有什么是。 大语言模型和由此产生的 AIGC 技术将带来技术平等和知识平等。 人工智能技术将不再是人工智能公司和行业巨头的专属。 5月9日,宇视科技CEO张鹏国在乌镇的一次演讲中将此比作繁体字向简体字的转变。 在AIoT合作伙伴峰会上,宇视发布行业模型“悟通”。

为什么一家不是互联网大公司,但在物联网行业以摄像头等硬件设备着称的公司,也将AIGC技术作为其业务的试验场? AIGC是否会改变物联网行业,进而改变我们在社会生活中的社交管理、交通管理等诸多场景中的面貌和格局?

带着这些疑问,观察者网与 AI首席科学家李聪廷聊了聊AIGC对物联网和社会生活的影响。

《流浪地球2》中的宇视装备

观察者网:如何理解“小模型+大样本”向“大模型+小样本”转变的趋势? 是否有业务场景的用户因为数据标注和算法训练成本更低,可以用更低的价格使用? 能负担得起 AI 解决方案吗? 比如我们的媒体想用一个大的模型来做AIGC的业务,比如辅助新闻写作,识别假新闻等等,但是我们的资金很少,能喂的行业数据也有限。 是不是应该挂一个“大模型”基地,真正需要根据我们的业务特点重新调整的成本是很低的,是不是意味着?

李从亭:对。 回顾以往“小模型+大样本”的开发模式,对于一个高精度模型来说,训练参数数以百万计,训练样本数以十万计,可能高达数十万百万。 几千几万也可以生成模型,但是精度不够高,场景适应性不够好。 总的来说,“小机型+大样本”的开发模式研发门槛高、成本高、周期长。

通用大模型本身是基于海量数据进行训练的,数据量远大于小模型的训练数据量。 通用模型可以做很多事情,尤其是在创意领域。 但是在我们AIoT行业,大部分的应用都需要精度,而不仅仅是“全能”,而一般大模型的精度有限,会很难在AIoT行业应用。

为此,我们创新性地提出了规模化产业模型。 所谓大型行业模型就是“通用大型模型+行业场景+训练调优”,扬长避短。 大产业模型将开启“大模型+小样本”新模式。 从行业场景中学习少量的小样本后,可以获得相对较好的准确率; 同时,由于应用场景有限,模型参数数量会高于一般模型。 大型模型要小得多,这意味着边缘部署是可能的。

你提到的辅助新闻写作和识别假新闻的应用,理论上可以通过这种方式来完成。 因此,未来可能会有很多垂直行业的大公司来解决行业应用问题。

科技巨头产生通用大模型,垂直行业公司基于通用大模型提供全行业大模型。 这将是未来更加务实和普遍的方式。 无需重新发明轮子,全新的AI模型开发和应用模型将降低AI应用落地成本。

观察者网:如果这个趋势持续下去,用户能够以极低的成本接入大模型的基地,享受其服务,确实会掀起一场AI平权的革命,很多新的业态将会涌现。 从我们媒体行业的角度来看,很多角色身份和生产关系可能会发生变化。 例如,机构和个人的内容生产力可能会逐渐拉平。 AIoT行业可能出现什么特点,会不会更加碎片化,这对你来说是好事吗?

李从亭:AIoT行业的特点是碎片化。 过去只有不到 10% 的 AI 需求得到满足,有的是因为技术难以实现,有的是因为实施成本太高,业务没有关闭。

行业大模型“大模型+小样本”的新开发模式,一是因为大模型涌现出超强的理解力和逻辑能力,使得以往难以实现的需求得以实现; 其次,降低了需求的实现门槛,提高了效率,大大增加了商业闭环的概率。 因此,预计未来AIoT行业50%的需求将被实现,其中只有20%将由像宇视这样的方案和设备商实现,剩下的30%将由合作伙伴实现。

人工智能技术的平等权利是参与公司的机会。 可以做的需求和应用更多,合作伙伴可以有差异化的控制点,更好地满足客户需求。

相信这样的变革不仅会发生在AIoT行业,也会发生在传媒行业,乃至各行各业。

人工智能制作特朗普被捕的假照片

观察者网:AI平权,AI生成内容的泛滥,肯定会带来一些问题,比如代写论文和作业,编造假新闻……在物联网行业,面临着伪造实物或生物信息。 对长矛和盾牌的需求将同时增长。 在反AIGC方向,目前技术储备如何? 盾能跟得上现在长枪的飞速发展吗?

李从亭:不管是恶意的还是无意的,AIGC确实有“打假”的副作用,对我们“打假”的技术手段提出了更高的要求。

对于“无意”的“造假”,我们更多的是从行业模型本身来优化改进。 比如,当我们让这么一款通用的大型机型推荐一款看娃相机时,它给出的答案就有些误导。 AIoT行业场景训练调优的大行业模型,可以给出更“准确”的答案。

对于“恶意”“造假”,这就需要我们的防AIGC技术来识别、鉴别、防伪。 例如,AIGC技术可能通过二维照片生成动态面部表情,从而欺骗金融场景中的人脸验证环节,带来安全风险。 现阶段有人在研究抗AIGC技术,但还是一个比较小的市场。 但随着AIGC技术的普及和反AIGC需求的增长,必将带动反AIGC技术的迭代。 更多的科研机构和制造商参与其中。 从辩证的角度来看,枪与盾的攻防促进了两类技术的快速迭代,技术水平呈螺旋式上升。

观察者网:您在本次发布中提到了智能视频博客。 你能解释一下业务逻辑吗? 是不是意味着AIGC业务也可以用你们的梧桐树大模型?

李从亭:很多年轻人去景区、公园,希望记录下亲身游览的精彩瞬间,融入景区的沉浸式视觉体验,形成一个很酷的小视频,最后分享给朋友,发帖朋友圈、微博等。

的VLOG产品很好的满足了这个需求。 它本身是基于人工智能自动编辑景点和公园场景。 AIGC大模型技术带来的变化是,未来我们可以在其中融入一些更有趣、更炫酷的生成特效。

比如一家三口去旅游,我们可以融入米老鼠等动漫明星; 再比如,如果一个人去旅行,我们可以无形中融入遗憾不能去旅行的女朋友。 梧桐的多模态产业模式,首先落地的产品是VLOG。 未来,用户将有更多的玩法和更好的体验。 当然,对于合作伙伴来说,更多的流量,更多的收益分成。

观察者网:因为我们是媒体,可能也有这方面的需求。 比如你可以学习主持人过去说过的所有内容,然后生成他的数字孪生体。 下次我们只需要输入文字,你就可以生成一个host,用他的 twin来播放内容,呈现图片和声音,这样可以吗?

李从亭:虚拟人数字孪生的概念出现得比较早。 过去几年“”的兴起带动了虚拟人数字孪生的发展。 市场上有许多类似的产品。 但坦率地说,目前的技术效果总体上还不够好,还有很多地方需要改进。 此外,还需要降低生成数字孪生的成本。 AIGC大模型将大大提升数字孪生体的体验和效果,这只是时间问题。

观察者网:是的,但是我们的媒体可能有很多可视化文字的需求。 比如我已经有了文字,不需要生成,但是我需要把这些文章变成视频。 我可能需要一个虚拟的人来说话。 对于这样的企业,您是否考虑过与媒体合作? 媒体用户有很多这样的需求。

李从亭:市场上已经有一些类似的产品,但效果还不够好,AIGC大尺度模型技术还没有应用。 随着AIGC大模型技术的逐步产业化,未来效果肯定会越来越好。 我们不是媒体创作领域的专家,直接进入并交付最终产品的挑战很大。 目前来看,专注于自己的AIoT赛道更为务实。 未来可以考虑拓展媒体创作领域的机会。

观察者网:物联网可以采集的信息形态非常丰富,包括物理的声、光、热、电信息,以及各种化学、生物、地理信息。 因为我们生活的场景本身就是一个多模态环境。 过去,人工智能只能解决一些标准化的问题,比如人和车的识别。 而通过大模型,如果把这些沉寂​​的多模态数据盘活起来,是否意味着未来可能会落地更复杂的业务? 你能想象出几个过去无法想象的案例吗?

李从亭:我觉得未来肯定会有一些复杂的业务会变现。 比如GPT-4给的例子就很典型。 可以理解“VGA端插在手机充电口上的笑话”,这在以前是做不到的。 我们可以通过大量的训练学会识别VGA终端和手机,但是我们很难有“VGA不能插手机”的常识。 对大模型的理解是惊人的,这意味着一些过去难以实现的需求可能会实现。

多模态,更多的信息的引入,这个信息的引入在过去大部分时候是无效的,准确的说是“力不从心”。 因为以前AI无法理解视频中的内容,只是对视频中的人和车进行检测和识别,更谈不上多模态理解的应用。 比如跌倒检测,人躺在地上,人靠墙站着,在摄像头画面中,很难通过人本身来区分。 他们都是头朝上,脚朝下。 但是引入大尺度模型技术后,我们可以通过判断桌椅摆放等周围环境,来区分一个人是趴在地上还是靠墙站着。 多模态引入了更多的信息,意味着未来能够以更高的精度实现更复杂的AI需求。

观察者网:由于各种安全和隐私限制,物联网数据不像互联网数据那样容易公开获取。 需要唤醒沉寂的行业数据,让越来越多的企业张开双臂拥抱人工智能。 目前,在顶部设计中还需要解决哪些问题?

李从亭:首先,合法合规是所有业务和产品落地的前提。 在顶层设计方面,国家乃至国际都出台了相应的数据安全保护法。

二是数据隐私分级。 人、车牌等信息属于高度机密信息,厂商无法轻易获取和留存。 但是,一些数据,例如行为动作、对象识别和缺陷检测,可以在合规性评估之后使用和训练。

人工神经网络+算法_人工鱼群算法matlab_人工智能 算法模型

第三,我们前面提到的梧桐产业这个大模型是有能力开放的。 对于安全和隐私场景的设计,我们会留给客户去定义算法。 数据在客户手里,我们只提供能力。

观察者网:物联网还有一个特点就是边缘的计算能力是有限的,计算放在云端有延迟。 这会不会限制AIoT+多模态大模型? 最终会不会匹配到一款不大但更适合行业的“大机型”?

李从亭:现阶段大量的AI应用是在云、边、端实现的。 在分工上,普通AI任务主要在边缘端和端端实现,比较经济; 一些复杂的人工智能任务是在数据中心端实现的。

AIoT行业大部分AI应用的时延都在可接受范围内。 随着AI算力的提升,延迟会越来越小。

AIGC大模型一开始主要在数据中心侧实现,本身计算量比较大,一定程度上会增加延迟。 在大多数情况下,这种延迟是可以接受的。 毕竟不是像自动驾驶这样对延迟极其敏感的场景。

另一方面,行业大模型的参数量没有一般大模型那么大,边缘侧的部署应该很快就会到来。 相比数据中心侧,延迟会进一步降低。

一般来说,在AIoT行业应用的大部分场景下,时延并不是关键问题。

观察者网:您预计各方面都会升级吗?

李从亭:从长远来看,肯定会升级换代。 但是这个循环不会一蹴而就,因为AIoT行业比较分散,有几千甚至几万款。 我认为这个周期将与之前的 10 年周期非常相似,从 12 年到 22 年。 比如深度学习是如何第一次彻底改变这个行业的。 预计10年后,几乎所有的AIoT产品都会或多或少的使用AIGC行业模式的能力或技术。

观察者网:现在大家都在推广模型的参数,尤其是语言模型。 从AIoT行业的应用来看,模型的参数是不是越大越好?

李从亭:这个需要结合场景和应用来看。 对于传统的人、机、非检测识别、周界行为分析,小模型已经非常成熟和充分,短期内没有必要使用大模型。 对于其他长尾人工智能需求,大型模型是有意义的。 然而,大型模型不一定与参数数量一样大。 AIoT 行业可以使用自己的大规模行业模型,该模型具有数十亿个参数。 不需要千亿参数规模的通用大型模型。 最后还是效果为王,并不是参数个数越大越好。 此外,成本始终是影响产业落地的重要因素,产品和应用的定义必须结合成本。

观察者网:如果选择不同的大型模型基地,将它们串联起来,你会从什么角度去判断和选择?

李从亭:结果说话,实验数据说话。 现在的“千模大战”,整个环境比较混乱,大家很难看清真相。 原本通用的大型机型主要掌握在少数科技巨头手中。 前面说了,算力、算法、数据的门槛很高,大部分公司都比不上。 因此,也有很多公司在通用大型模型的基础上制作大型行业模型。 是AIoT行业第一家提出并发布大规模行业模型的厂商。 当然,也有一些应用可能是基于插件或者开源模式的。 不管是哪种模式,最终考虑的是谁能提供最好的产品和服务,谁能最先落地。

观察者网:在AI的应用中,容错率是一个关键的考虑因素。 如果说99%的车辆识别准确率是可以接受的,技术上是成立的,那么实现起来就容易多了。 人工智能帮助我们口述一篇文章,然后生成一个大纲。 80%的正确率可能更容易被用户接受,80%的水平可能会有很多潜在的应用。 许多东西可以取代机器中最笨重的部分。 用户可能 20% 的错误率是可以接受的,因为检测这些错误的额外努力仍然是值得的。 而80%将大大增加技术上的可行性。 互联网的思路一直是寻找更多这样的应用场景,让技术先用起来,在使用过程中迭代提升体验,但是物联网的容错率一直很严格,很难做到要用这种思路去实施。 AIGC+AIoT所产生的新生态能否改变这一现状?

李从亭:很好的问题。 精度越高越好,这个没问题。 但这并不意味着只有 99% 或更高的准确率才能实现和商业化。 在很多场景下,AI作为人工智能的辅助工具和提升效率的工具也是非常有意义的,也可以实现商业化。 尤其是我们AIoT这个行业,很多场景对精度的要求没有这么高,不像自动驾驶应用那么苛刻。 当然,如果精度太低,那不是提高效率的工具,而是制造麻烦的工具。

技术提升,一是提高效率,二是创造更多商机。 回顾车牌识别的应用,早期应用于交通违章,即使违章抓获率只有30%,对于交警人工现场执法来说也是巨大的效率提升。 后来应用于公园、商场的出入口,识别率98%,已经很高了,但还是离不开人工,因为每100辆车就有2辆车需要人工处理异常. 如今识别率可以达到99.9%,很多出入口场景已经无人值守,偶尔有几个异常可以通过远程调用解决。 这是一种效率增益。 在商机方面,之前没有进出口产品、解决方案、配套运维、服务等,是因为AI车牌识别工具的出现造就了这个市场。

AIGC大尺度模型技术也不例外。 工具的改进带来了效率的提升,创造了更多的商机。

編輯:碩谷新聞聚合

點讚(0) 打賞

评论列表 共有 0 條評論

暫無評論

微信小程序

微信扫一扫體驗

立即
投稿

微信公眾賬號

微信扫一扫加關注

發表
評論
返回
頂部