世界正在经历新一轮科技革命和产业变革,人工智能技术正在加速演进。 当今的人工智能已广泛应用于交通、通信、娱乐、安防、国防、教育、农业、工业生产等各个领域,对科技、经济和社会产生了深远的影响。 展望未来,人工智能已成为推动人类发展进步的主力军。
随着世界科技强国不断加强人工智能战略布局,以人工智能为核心的集成技术创新成为焦点。 人工智能与各行业、各细分领域的深度融合,已经使人工智能引领人类社会变革成为全球共识。 以人工智能为核心的产业链颠覆我们的认知,比几次工业革命来得更快、更猛烈。
什么是人工智能?
普通人对人工智能的认识还停留在科幻电影的形态,比如《终结者》中的T-800系列机器人,《钢铁侠》电影中的贾维斯和幻视,《流浪地球2》中的550W及其第二代人工智能MOSS。
事实上,人类目前所能掌握的人工智能技术是数学、计算机科学、控制科学、脑与认知科学、语言学等交叉学科的产物。 它的主要内涵是研究和模拟人类智能的理论、方法、技术和应用系统,赋予机器类人智能的模拟、延伸和扩展,实现听、看、说、说等能力的一门技术科学。 think, and learn, can act 等功能,本质是模拟人的意识和思维过程。
也就是说,现在的人工智能并不具备人类想象中的“自我意识”,只是通过很多跨学科的研究成果,让机器拥有了人类的数据、信号处理方式,以及对人类思维的“模拟”。
人工智能史
1956年8月,在美国小镇哈诺斯的达特茅斯学院,约翰麦卡锡(John)、马文明斯基(人工智能和认知专家)、克劳德香农(信息论专家)、艾伦纽厄尔( Allen,计算机科学家), Simon(西蒙,诺贝尔经济学奖得主)等科学家讨论了用机器模仿人类学习的可能性。
这是人类第一次对人工智能的概念进行了深入的讨论,随后世界各国的科学家基于这一概念开发了计算机和神经网络软件。
1980年后,第一代人工智能程序以其更加人性化、智能化的操作方式被全球企业所采用。 第一代人工智能的知识库系统和知识工程解决了人类信息存储和信息处理的问题。 困难,让信息检索和信息查询不再消耗大量时间。 于是,整个人类进入了互联网时代,人类文明的知识和信息传播从此进入了一个新时代。
2006年后,人工智能的“深度”学习理论被提出,机器学习、深度学习、类人脑计算被认为是现阶段的主要发展方向。 并催生了云计算、5G、大数据等技术。 人工智能已经开始出现井喷式增长。 专注于不同方向的人工智能正在百花齐放,并逐渐显露出在某些领域超越人类的能力。
2016年,()战胜了人类围棋顶尖选手李世石。 由此看来,人工智能确实让人类重新审视了它存在的巨大潜力。
2023年的今天,围绕人工智能已经形成了完整的三层产业链。
第一层产业链包括芯片、传感器、大数据、云计算等基础层;
第二层产业链包括机器学习、类人脑智能、计算机视觉、语言、语音处理、生物特征识别等技术层面;
三级产业链包括智能终端、智慧城市、智能制造、智慧医疗、教育等应用层
全球人工智能产业现状
据相关统计,全球人工智能产业规模已从2017年的6900亿美元增长到2021年的3万亿美元,到2025年有望突破6万亿美元。2017年至2025年,预计增长速度为复合率超过30%。 增长率正在迅速增加。
在全球范围内,美国仍然是人工智能的全球领先者。 人工智能企业数量占全球41%,中国以22%紧随其后。 欧洲的英国、德国、法国,亚洲的日本、韩国,北美的加拿大等国家也有较好的基础。
随着技术的不断迭代,全球人工智能已经解决了大部分基础层问题。 例如:2021年5月,IBM首款2nm制程工艺芯片每平方毫米可容纳3.3亿个晶体管,几乎已经达到硅基。 芯片的极限。
在算法层面,Cafe框架和CNTK框架收集整合了不同的新兴人工智能算法模型,可以大大提高算法开发场景的适用性。 同时,人工智能与5G、云计算、大数据、工业互联网、物联网、混合现实(MR)、量子计算、区块链、边缘计算等新一代信息技术相互支撑。
但泛人工智能时代仍然受制于其二线产业链的发展,其中最关键的是机器学习、视觉、语言、生物识别等技术方面。 要完成人工智能二线产业链的发展,需要依赖人工智能的大量数据、图片、视频和训练。 于是,一个至关重要的新兴职业——AI数据标注师诞生了。
人工智能数据注释器的重要性
人工智能领域有一句话叫“AI有多聪明,背后就有多少人”。
目前的人工智能还远没有达到程序“自主识别”和“自主学习”的水平。 人工智能与人类的所有交互都是通过大量数据的支持来实现的。
比如,你想让人工智能和人类进行正常的问答,你必须把人类可能会问的所有问题和答案都输入进去,然后人工智能就会根据这些数据进行回答和交互。
再举个例子,如果想让AI识别“狗”,就需要找到至少1000张标记为“狗”的图片,以及更多不包含“狗”的图片作为训练对比,然后将“狗”与其他图片相加的物体图片。 让人工智能从学习中获得模型,从而顺利识别“狗”。
这些标注“狗”标识的工作,只能由人工智能数据标注者手动完成。 可想而知,这项工作将是枯燥而艰巨的,但只有“人”才能准确完成。 只有 AI 数据标注者不断地为 AI 提供标注图片来“喂养”它,AI 才能“足够聪明”。
人工智能数据标注者的职业前景
IDC近日发布《2021 V2全球人工智能支出指南》,预测2021年全球人工智能市场支出将达到850亿美元,2025年将增至2000亿美元。2025年,全球8%的人工智能相关支出将来自中国市场,使其成为全球第三大市场。
毫无疑问,AI数据标注器将成为继大规模制造、房地产之后又一劳动密集型产业链的重要一环。
目前AI数据标注者的主要任务包括:
听力:人工智能语音识别、说话人语音识别、机器翻译、真人语音翻译、同声传译等语音标注。
思考:识别和标注需要大量数据才能做出决策的数据,如基本定理、人机交互、医疗诊断、医疗方案制定等。
学习:识别和标记与机器学习方法和知识表达应用相关的相关数据。
视觉:对图像识别、文字识别、车牌识别、生物识别等数据进行识别和标注。
语音:识别并标注语音合成、人机对话的相关数据。
:识别和标注环境识别、交通信号、路况、运动方向预测、自动驾驶、无人机等数据。
2018年至今的五年间,数据标注行业由小变大,呈现出规模化的特征。 这份工作不再是受过高等教育的人的专属,而是因为门槛低、可重复性强而成为新一代的“流水线”。
相应的,贴标师的招聘标准也比较低。 基本上只要是无色盲、无脸盲、有一定稳定性、年轻、会用电脑即可。 薪资结构一般为底薪加计件制的模式。 贴标师的月薪通常在5000-7000元,最高的可达10000多元。
4 月 5 日,Meta AI Labs 发表了一篇关于这个计算视觉模型和数据集的论文。 论文中提到,需要人工标注的图片多达12万张,平均每张图片44层,每层标注时间需要14秒。 综合计算,人工标注耗时20533小时。 如果你雇一个十个人的团队,每天工作 9 个小时,还是需要 1 年的时间。
2022年,工信部统计全国人工智能企业超过60万家,粗略估计人工智能数据标注器将缺口约5000万台。
从全国AI数据标注师招聘情况来看,目前行业“用工荒”严重。 为大力发展这一新兴职业,推动我国人工智能产业链的发展,“人工智能训练师”(AI标注员/人工智能标注员)正式成为新职业并列入国家职业分类目录,成为许多劳动类型。 种类。
与此同时,全国AI数据标注师教育实践企业如雨后春笋般涌现。 AI数据标注师行业正朝着规模化、标准化、系统化方向发展。 不难想象,在未来10到15年,AI数据标注师会越来越受欢迎,成为最常见的工种之一。 在此之前,AI数据标注者的红利将由早期从业者独享。
編輯:碩谷新聞聚合
發表評論 取消回复