今天,2022世界人工智能大会在上海开幕; 就在10天前,2022世界机器人大会刚刚在北京落下帷幕。 人工智能AI持续火爆,今天就来聊聊这个话题。
感谢您阅读本文,感谢今日头条AI推送给您。
现在的人工智能其实是“特殊用途的人工智能”,是专门针对特定专业领域的问题。 那种与人类接近并能适应各种环境的人工智能,即“通用人工智能”,除了在科幻小说和电影中,还没有在现实世界中出现过。
为什么? 因为人脑是我们所知道的宇宙中最复杂的东西,模拟人脑的工作已经超出了当代科学的极限,所以我们只能务实地教人工智能一次做一件事,让它们成为“专家” ” 而不是“通才”。
听、听、读、写是人类最基本、最重要的能力。 人工智能也是如此。 为了融入人类世界,他们必须学习这些能力。 那么他们是怎么学习的呢? 请前来“点评”。
01 人工智能的“听”
“听”是语音识别。 你一定用过微信语音的“文字转文字”功能吧? 那天去买电脑,售货员卖给我一个鼠标,说“鼠标在手,告别打字”,用嘴说,文字就出来了。 这些是语音识别。
语音识别是目前人工智能最成功的分支。 因为起步很早,随着数据、计算能力、算法的发展,现在语音识别的准确率已经相当高了。 其中,移动互联网和智能手机带来的海量语音数据功不可没。 例如,微信每天的语音聊天量超过4亿,为语音识别模型的训练和优化提供了丰富的素材。
还有很多语音识别产品。 除了语音转录,还有语音翻译、声纹识别、智能音箱等,给我们带来了很多便利。
02 人工智能的“说话”
“说话”是人机对话。 智能客服就是一个典型的例子。 大部分对话都是文字,所以口语和阅读必须同时解决。 如果人工智能想要与你交流,它必须首先理解你在告诉它什么。
人机对话背后的技术是什么? 自然语言处理技术。 什么是自然语言? 就是我们人类在日常交流中使用的语言,即人类语言。
人工智能说人类语言并不那么令人满意。 调查显示,智能客服存在问题,超过50%的受访者抱怨沟通障碍。
比如你打几个错别字,它就会挂掉。 不像你在微信上和朋友聊天,打几个错别字完全不会影响聊天,因为人脑有很强的容错能力,而AI却没有; 还有你的话前后有关系,也可以聊死,因为缺乏逻辑推理能力; 而且,AI总是用同样的语气和节奏说话,单调乏味,不像人类交流,有自己的感受和情绪。
此外,语言本身的复杂性,也让AI更难实时正确理解和交流。 你知道,语言不是一门科学。 它是人类在几千年的使用过程中形成的一套习惯规则体系。 没有公式可以推导,也没有那么精确。 有许多例外和变化。
看下面这句话,为人工智能心疼一秒……
所以,自然语言处理技术位列人工智能技术难度榜第一,你不会感到意外吧?
然而,人工智能一直在努力加强说人类语言的练习。 更名为“”的美国META公司最近开发了一种“生成式口语模型”,大大改善了AI语音的细节,比如语气、语调、呼吸变化、夹杂着笑声等,和它聊天舒服多了,真是温柔又温馨的进步。
03 人工智能的“看见”
“看”主要是指理解图像,包括看电影、看视频。
举一个简单的看图说话的例子,孩子是通过看图说话来学习写文章的。 给AI一张图片,让它用一段文字描述图片的内容,会发生什么? 目前,用世界上最好的会说话的图片模型训练出来的AI,准确率很难超过60%,也就是说,你给它看100张图片,至少有一半是在胡说八道。
但在某些特定情况下,它可以比人类表现得更好。 什么情况? 要知道,人脑很擅长抽象和归纳,但是往下沉就会遇到困难。 什么意思? 让我区分猫和狗不会出错,但是让我区分是波斯猫,加菲猫,英国短猫还是暹罗猫。 给我20种猫,我肯定会死,但人工智能不会。
如果训练样本标注的足够精细,它就能学会区分各种猫,而且一旦学会了就不会忘记,永远固定在那里。 不像人头,你花了两个月的时间教我认识50只猫,三个月后,我基本上会还你一半以上。 这是它比人脑有优势的地方。 别小看这个优势,它能发挥很大的作用。
比如在安防领域,人工智能在简单环境的监控上,对写字楼或某个固定路段的人、车、物的监控、跟踪、定位,都可以做得比我们好。 因为人的记忆力不如它,视觉和大脑还是会疲劳。 盯着单调的监控画面大约半小时后,人的大脑就会变得麻木,根本无法放松警惕。
人工智能不能忘记,也不能放松,保持“头脑清醒,眼睛明亮”,时刻守望。 现在有了高清系统,结合人脸识别,人工智能还可以实时完成身份认证,时刻警惕可疑情况。 精湛的辨别力+专业性,AI成为当之无愧的安全帮手。
04 人工智能之“文”
“写”即创作,包括文学创作和艺术创作。
清华大学开发了名为“九歌”的人工智能诗歌写作系统。 给它一个关键字,很快就会写出一首诗。 它还会写杂技、歌词和对联。 这套系统“熟读”了从魏晋南北朝到近代的90万首诗词。 它被教导了平、韵和对偶的规则。 有风格等等。
《九歌》首页
下面是我输入关键词“中秋节”20秒后“写”出来的五言绝句:
风吹树叶的声音,
其中就有万年城。
歌舞梁园之夜,
楼上蓄月光。
第一句话正确地指出了季节,对吧? 最后一句“月明”加“中秋节”是不是也合适? 也可以“用典”。 “梁园”为西汉梁孝王所建。 孝王曾邀司马相如等赋人到园中赏花赏月吟诗。 这个典故平添了几分雅致。
在你看来,《九歌》深浅不一的诗意,是否足以获得作协资格?
除了写诗,两三百字的短新闻AI也是个问题。 现在大多数中外主流媒体都有自己的智能写作系统。 新华社有“快笔小新”,第一财经有“DT选秀王”,美联社有“快笔小新”,今日头条有“看体育”。 不过他们写的题材都是财经、体育、天气预报等,文笔比较简单。
《今日头条》智能写作系统“看体育”生成文章截图
让我们来看看AI的艺术创作。
2021年,谷歌和华为相继扩大动作,推出基于文本生成图像的AI系统。 的Disco率先出圈,一炮走红:输入一段文字描述你想要的图片的元素和风格,它就可以生成一张图片。
请欣赏这幅混搭科技感的梵高《向日葵》。
Disco:《星空下的向日葵,梵高风格》@阿文
不过很快,DALL-E2的DALL-E2系统就横空出世,惊艳了所有人,堪称2021年AI技术的第一个激动人心的突破。欣赏它的画像,有没有被震撼到?
DALL-E2:《戴珍珠耳环的少女》
不过,距离DALL-E2引起足够的关注才一个多月,谷歌又派出新玩家“踢馆”。 觉得看热闹没什么大不了的网友立马组织PK:命题创作“猫绊人像”。 左边是参赛者的作品,右边是DALL-E2参赛者的答题纸。 你给哪位选手打高分?
网友议论AI绘画是否会继续威胁画廊网站的生存?
先不说会不会构成威胁,AI绘画的真正商业化应用已经开始。 双11期间,用心打造,助你买手。
平时网购看到的广告,店家可能三五天就换一次,但是双11为了刺激你的视觉系统促进销售,两分半钟就换一批。 丢了几亿张,哪个人类设计师能画得这么快?
而AI画师,一键搞定。 阿里巴巴有一个名为“鲁班”的人工智能系统可以做到这一点。 “鲁班”大师还可以利用商家原有的静态广告页面,自动生成短视频投放到抖音上,为商家引流。 他真的是一个很好的营销人员。
05 写在最后
跟大家汇报完后,大家有没有觉得,近几年,AI确实变得“能干”了,他们比以往任何时候都更深入地进入了我们的生活。
说起来,人工智能的概念是1956年在美国达特茅斯会议上正式提出的,到现在也不过60多年的时间,中间的发展也是跌宕起伏。 千禧年后,它的发展进入了快车道,《深蓝》《阿尔法狗》让我们更加关注它。
未来,AI肯定会变得更能干。 7月29日,科技部等六部门联合印发《关于加快人工智能场景创新和高水平应用促进经济高质量发展的指导意见》。 看完你就会知道,随着基础能力的不断提升,AI会发展出更多的能力,更频繁地出现在我们生产生活的各个场景中,为我们服务,帮助我们。 迎接更好的AI,就是迎接更美好的未来。
“人类想要未来更美好,就应该采取行动让未来变得更美好”,蓝图已经画好,刚刚开始。
资料参考:
1.肖军,《人工智能及其产业应用》
2. 拜伦赖希的人工智能哲学
3. 许玲《抢头条科技前沿》
部分图片来自百度和知乎。
編輯:碩谷新聞聚合
發表評論 取消回复