最近沉迷于各种AIGC工具的探索。 本来想等探索的差不多了再写一篇,但是越探索内容越复杂,应用越广泛。 学习笔记。
本期先来讨论一下,什么是AIGC? 它的发展路径是什么?
1.什么是AIGC?
所谓AIGC,即AI-,是指利用人工智能生成内容。
更专业的说法是:基于人工智能技术,是一种通过现有数据发现规律,通过适当的泛化能力生成相关内容的技术。
简单来说,就是利用AI技术自动生成文字、图片、音频、视频、虚拟人物等。
2022年8月,在美国科罗拉多州的一场艺术比赛中,一件名为《太空歌剧院》的作品获得了比赛的“数字艺术”冠军奖。 没想到获奖后,作者艾伦宣布这幅画是用AI绘图工具生成,然后润色的。
2022 年 11 月底在美国推出后,凭借出色的语言理解和文本生成能力迅速走红。
此后,在资本的推动下,短短半年时间席卷全球,掀起一场人工智能革命,各种大型模型和AIGC工具相继涌现。 第一波预言鸭卖账号、卖课程、炒概念,充分感受到了春江的温暖。
二、AIGC的发展历程
AIGC的发展目前各有说法,没有统一的口径。
例如,京东探索研究院认为,AIGC技术的发展经历了智能数字内容孪生能力、编辑能力和创作能力三个阶段。 这个观点主要是从技术角度来划分的。
百度CEO李彦宏在“2022百度世界大会”上给出观点,第一阶段是“辅助阶段”,AIGC用于辅助人类进行内容生产; 第二阶段是“协作阶段”,AIGC与虚拟现实共存,虚拟人形出现,形成人机共生的局面; 第三阶段为“原创阶段”,AIGC将独立完成内容创作。 这个观点是从AIGC能力的角度来划分的。
也是从大模型数据量的高低来划分的。 2016年初,大模型的参数还不到1亿个参数。 2019年年中,GPT-2的参数达到15亿。 近期,GPT-3模型的参数在2020年达到了1750亿。目前GPT-4还没有公布参数量,但据说会达到100万亿级别。
鉴于我之前探索过web1.0、web2.0和web3.0,我倾向于划分如下:
第一阶段:PGC,全称:,指专业制作内容,对应web1.0时代。 我们之前讨论过,在web 1.0时代,信息主要是由专业人士生产的,比如报纸、门户网站、搜索引擎等。
这个阶段谈不多人工智能,更多的是信息化阶段,主要是信息发布,主要靠网络浏览器。
以图片为例,PGC阶段的大量美图由网站自行发布,来源可能是他们从大量摄影师手中购买的专业拍摄图片。
这个阶段各种应用都是以读为主,写为辅; 服务提供商提供网站服务并通过点击赚钱。 这个时候手机还停留在2G看小说,3G听音乐的阶段。
第二阶段:UGC,全称:User,指用户生成的内容,即用户生成的内容。 对应web2.0时代。 前面我们讲过,在web 2.0时代,信息主要是用户产生的,比如你的朋友圈、短视频、公众号文章等等。
这个阶段主要是逐步进入数字化阶段。 有了一定的人工智能启蒙,通过OCR、NLP、RPA和各种算法的加持,软件可以开始辅助用户完成一些基本的动作。
仍以拍照为例,这一阶段大量用户开始发布自己拍摄的照片,网站或APP发布的专业照片淹没在大量用户图片中。 用户的照片处理,如美化照片,以用户自己的PS为主要执行动作,如磨皮、拉长腿、调节亮度等。
总之,在这个阶段,用户开始写阶段,不再局限于web1.0的读。 服务提供者不再局限于网站,更多的是各种向移动运营商转移的APP。 他们通过流量变现赚钱,通过流量收取手续费、广告费,或者讲故事、融资、割韭菜,甚至衍生网络诈骗、网络赌博。
第三阶段:AIUGC,全称:AI-,指AI- ,即AI辅助用户原创内容。 这是一个过渡阶段,我个人更倾向于这是从web2.0到web3.0的探索阶段。
这一阶段大量探索AI自动化技术,逐步从数字化进入智能化阶段。 这个阶段的信息是由AI和人类共同完成的。 人工智能已经能够帮助用户完成很多工作,比如视频中的自动翻译和加字幕,智能交通中的违章车辆和违章智能识别,投标中匹配条件的自动推荐等。 招标信息及投标建议等
还是以拍照为例,现阶段用户只需要拍照,剩下的美颜、拉长腿、换背景等都由AI自动完成。 用户甚至不需要去感知AI的动作过程。 美照拍多了,不照镜子,慢慢就会觉得自己真的有一张网红脸。
在AIUGC阶段,用户的创造能力在AI的加持下得到了极大的提升,但此时的AI还只是一个工具,真正的创造者还是人。 这个阶段赚钱的方式更多了,比如精准广告、智能客服、工业4.0的定制化生产。 当然,目前最赚钱的方式就是利用这个概念割韭菜,比如炒虚拟货币、炒NFT、炒元宇宙概念等。
我个人的看法是现在(2023)这个阶段,还没有真正进入web3.0时代。 别的不说,这个阶段还没有形成统一的认识,我也无法给出这个web3.0的典型描述。
第四阶段:AIGC,全称:AI-,指AI- ,即AI辅助用户生成的内容。 与AIUGC不同的是,AIUGC强调人与AI的合作,而AIGC则强调AI的自主性和自主生成内容的能力。
这是目前最热门的探索方向,也是未来最有可能的发展路径。 这个阶段可以进一步提高智能化水平,进入数字智能化阶段。 信息内容的生成不再依赖人工,通过机器实现文字、图片、音视频等多模态优质内容的自动生成。
在用户感知方面,AIGC正逐步向认知智能发展,可以根据用户的个性化需求生成个性化内容。 例如,AIGC+搜索引擎可以推送更精准的定制化答案; 在交互界面方面,AIGC技术支持多模态内容生成,可实现视听等多感官自然交互,提供沉浸式体验。 例如AIGC+数字人可以实现人机智能交互。
从个性化服务中赚钱,从虚拟世界中赚钱,以及许多其他可能的创新赚钱方式。 当然,现在的赚钱方式还是卖课、讲故事、炒股、割韭菜。 非法AI骗局也出现了,不仅可以模仿你的文笔,还可以模仿你的声音,甚至可以模仿你的视频通话,防不胜防。
三、AIGC的应用现状
AIGC在文本、图像、音频、视频和虚拟数字人等方面取得了一定的成果,并具有一定的典型应用。 比如等等,下一步的探索就是多找几个产品亲身体验一下,然后做应用介绍,推荐比较靠谱的应用。
編輯:碩谷新聞聚合
發表評論 取消回复