辰汐の小站

AI

AI:开启智能时代的新钥匙


avatar
辰汐 2024-09-30 30

一、AI 的概念与起源

 

人工智能(Artificial Intelligence,简称 AI)是一门综合了计算机科学、控制论、信息论、神经生理学、心理学、语言学、哲学等多种学科互相渗透而发展起来的交叉学科。它通过计算机去模拟人的思维和行为,其核心是机器学习算法。

1956 年,美国汉诺斯小镇宁静的达特茅斯学院,约翰・麦卡锡、马文・闵斯基、克劳德・香农等学者聚在一起,共同讨论着机器模拟智能的一系列问题。他们为讨论内容起了一个名字:人工智能。自此,人工智能开始出现在人们的视野,1956 年也就成为了人工智能元年。

在达特茅斯会议前,不得不提到英国数学家艾伦・图灵。1950 年,图灵发表论文《计算机器与智能》,提出并尝试回答 “机器能否思考” 这一关键问题。他详细介绍了 “模仿游戏”,也就是后来更为熟悉的图灵测试。如果猜测者无法根据回答判断哪个是人,哪个是计算机,那么可以判断计算机具有人类智能。图灵测试自诞生以来产生了巨大影响,图灵也被冠以 “人工智能之父” 的称号。

达特茅斯会议标志着 “人工智能” 这一概念的诞生。会议的主要发起人约翰・麦卡锡提出了 “人工智能” 的概念,他对于人工智能的兴趣始于 1948 年参加的一个名为 “脑行为机制” 的讨论会。当时在哈佛大学的明斯基,1951 年建造了世界上第一个神经网络模拟器 Snare。塞弗里奇是模式识别的奠基人,纽厄尔和西蒙提出了物理符号系统假设,成为人工智能三大学派之一 —— 符号主义的主要依据。信息论的创始人香农,1950 年发表论文《Programming a computer for playing chess》,为计算机下棋奠定了理论基础。

达特茅斯研讨会进行了两个月,纽厄尔和西蒙公布的程序 “逻辑理论家” 引起参会者极大的兴趣,这个程序模拟人证明符号逻辑定理的思维活动,并成功证明了《数学原理》第 2 章 52 个定理中的 38 个定理,被认为是用计算机探讨人类智力活动的第一个真正成果,也是图灵关于机器可以具有智能这一论断的第一个实际证明。此外,逻辑理论家开创了机器定理证明这一新的学科领域。

二、AI 的发展历程

 

(一)起伏之路

人工智能的发展历程充满了波折。在达特茅斯会议后,AI 迎来了快速发展的黄金时期(1956 – 1974),大量资金投入到这个新兴领域,人们对其充满了期待。这一时期,通用问题求解器以及最早的聊天机器人 ELIZA 等有影响力的研究纷纷涌现。然而,由于之前的乐观断言并未兑现,到了第一次寒冬(1974 – 1980),各种批评之声涌现,国家也不再投入更多经费。

但 AI 的发展并未就此停滞。到了专家系统时代(1980 – 1987),人工智能专家系统得到了广泛应用,如卡耐基梅隆大学为日本 DEC 公司设计的 XCON 专家规则系统,一年可为该公司节省数千万美金。不过,由于专家系统通用性较差、未与概率论和神经网络进行整合、不具备自学能力且维护成本高等原因,人工智能再次进入第二次寒冬(1987 – 1993)。

随后,机器学习时代(1993 – 2011)来临。随着计算机处理能力的提升和大数据的出现,机器学习,特别是神经网络,重新引起了人们的关注。统计学习理论的发展和 SVM 等工具的流行,使得机器学习进入稳步发展的时期。

(二)技术突破

随着计算机算力的不断提升、大数据的出现以及算法的不断进步,AI 在图像识别、语音识别等领域取得了重大突破。例如,上世纪八九十年代神经网络虽然通过非线性激活函数解决了理论上的异或问题,而反向传播算法也使得训练浅层的神经网络变得可能。但是,由于计算资源和技巧的限制,当时无法训练更深层的网络,实际效果并不比传统的 “浅度” 机器学习方法好。直到 2006 年,Hinton 提出了 Deep Belief Nets (DBN),通过 pretraining 的方法使得训练更深的神经网络变得可能。2009 年 Hinton 和 DengLi 在语音识别系统中首次使用了深度神经网络 (DNN) 来训练声学模型,最终系统的词错误率有了极大的降低。2012 年的 ILSVRC 评测让深度学习在学术界名声大噪,AlexNet 首次在比赛中使用了深层的卷积网络,取得了 16% 的错误率。之后每年都有新的好成绩出现,2014 年是 GoogLeNet 和 VGG,2015 年是 ResNet 残差网络,目前最好系统的 top5 分类错误率在 5% 以下。真正让更多人了解深度学习进展的是 2016 年 Google DeepMind 开发的 AlphaGo 以 4 比 1 的成绩战胜了人类世界冠军李世石。在图像识别领域,深度学习技术使得计算机能够自动学习图像中的特征,无需手动提取。如今,AI 已经被广泛应用于语音识别、自然语言处理、图像识别等领域,为人们的生活带来了极大的便利。

三、AI 的初步认识

 

(一)AI 的特点

AI 具有计算速度快的特点,能够在短时间内处理大量的数据和复杂的计算任务。例如在图像识别领域,AI 可以快速分析大量的图像数据,准确识别出图像中的物体、场景等信息。同时,AI 的精准度高,经过大量数据的训练和优化,能够在各种任务中达到很高的准确性。以语音识别为例,AI 系统可以准确地将语音转换为文字,错误率极低。

此外,AI 还具有强大的人工智能特性,能够模拟人类的思维和行为,进行学习、推理、决策等活动。例如,机器学习算法可以让 AI 系统从大量的数据中自动学习规律和模式,不断提高自身的性能。

AI 还可与其他 Adobe 软件协作,如与 Adobe Photoshop(PS)结合,可以将图形在 PS 中进行图像处理后,再在 AI 中进行组图和排版;与 Adobe Bridge 结合使用,提升工作效率;在 Illustrator 中还可以导入 Adobe PDF 文件进行编辑等。AI 适用于平面设计等多种工作,在平面设计中,AI 提供了优质的绘图工具,使图案复制、光影绘画、图形制作、网页图片切割更加快速方便。层叠式工具面板增添了灵活性,操作灵活多样,为用户提供很多功能选项设定,执行速度快,图像绘制更加出色,色彩更加丰富,在插画设计上更加优质。

(二)AI?人工智能?

AI 就是人工智能(Artificial Intelligence)的英文缩写,本质上它们是一回事。人工智能是让机器像人一样思考、学习和解决问题的技术。例如,手机上的语音助手,可以听懂用户说的话,帮用户查天气、放音乐;还有那些可以自己开车、下棋的机器人,都是人工智能的应用。

(三)AGI 概述

通用人工智能(AGI)是指能执行人类各种智能任务的人工智能系统,具备广泛的知识与学习能力。与目前普遍应用的专用人工智能(ANI)不同,专用人工智能在特定任务上表现出色,如图像识别或语言翻译,但缺乏跨领域的学习能力。AGI 具备自适应学习能力,能从经验中学习并适应新环境;具备跨领域推理能力,能将一个领域的知识应用到另一个领域;具有自我意识,能理解自身的行为和决策;还能识别和模拟人类情感,与人类进行自然交流。目前,我们仍处于 AGI 的初级探索阶段,人工智能领域的研究主要集中在机器学习、自然语言处理、计算机视觉、强化学习等方面。AGI 的潜在应用领域极为广泛,包括医疗诊断、教育个性化、智能助手、科学研究等。但 AGI 的发展也面临着技术难题、伦理问题、安全性问题等一系列挑战。

(四)关于 AIGC

AIGC 从 20 世纪 50 年代开始发展,其兴起源于深度学习技术的快速突破和日益增长的数字内容供给需求。AIGC 可以在对话、故事、图像、视频和音乐制作等方面,打造新的数字内容生成与交互形式。可以应用于媒体、电商、影视、金融、医疗等多个行业。

例如,一本由 AI 绘制的图书登上了微信读书新书榜,该书名为《卡皮巴拉的自我修养》,一度排在微信读书新书榜第 5 名。在游戏领域,网易利用人工智能技术在语音生成、原画生成、视频动态捕捉、模型生成等多个关键生产环节提升工作效率。在视频创作领域,首部中国原创文生视频 AI 系列动画《千秋诗颂》在 CCTV – 1 综合频道播出,制作周期缩短至 4 个月。

(五)人工智能和物联网的结合应用(AIoT)

AIoT 融合 AI 技术和 IoT 技术,通过物联网产生、收集来自不同维度的、海量的数据存储于云端、边缘端,再通过大数据分析,以及更高形式的人工智能,实现万物数据化、万物智联化。

AIoT 落地有三大趋势:一是孙正义在未来一年中,愿景基金计划支持数十家新的 AI 驱动的初创公司,投资方向包括房地产、运输出行和零售三大场景;二是视觉未来视频是核心,视频将来必须要智能化,否则时间不够用且眼睛很累;三是边缘计算,纯云、纯端不行了,边缘服务器、计算盒子、MEC 移动的边缘计算等边缘计算方式兴起。

AIoT 有三个核心竞争力:智慧家居、智慧零售、智慧出行。经过两年多时间,小蚁科技被评为潜力独角兽,9 亿多美金,落地的三个场景包括智慧家居、智慧零售、智慧出行,已经推出了各种各样的服务。例如,在智慧家居方面,推出了摄像头等产品,还推出了教育服务;在智慧零售方面,为品牌方提供智慧零售解决方案;在智慧出行方面,也有相关的产品和服务。

四、AI 的应用领域

 

(一)自然语言生成

自然语言生成是人工智能的一个重要分支,它致力于将数据转化为人类可读的文本。在客户服务领域,自然语言生成技术可以自动回复客户的咨询,提高服务效率和质量。例如,一些电商平台利用自然语言生成技术为客户提供快速准确的产品信息和解答疑问。此外,自然语言生成还可用于报告生成和市场概述,为企业决策提供有力支持。据统计,自然语言生成技术在客户服务领域的应用,能够减少约 30% 的人工客服工作量,大大降低了企业成本。

(二)语音识别

语音识别以 Siri 为典型代表,目前已经广泛应用于转录系统。通过语音应答交互系统和移动应用程序,能够对人类语言进行准确转录。在日常生活中,语音识别技术为人们带来了极大的便利,例如在智能助手、车载系统等方面的应用。据相关数据显示,全球语音识别市场规模预计在未来几年将持续增长,到 2025 年有望达到数百亿美元。

(三)虚拟助理

虚拟助理包括聊天机器人等形式,广泛用于客户服务和智能家居管理。在客户服务方面,虚拟助理可以快速响应客户需求,提供个性化的服务。在智能家居领域,虚拟助理能够控制各种智能设备,实现家居的智能化管理。例如,小米的小爱同学、百度的小度等虚拟助理,已经成为很多家庭的智能管家。

(四)机器学习平台

机器学习平台通过提供算法、API、开发和训练工具包等,提升计算机的学习能力,解决预测和分类任务。企业可以利用机器学习平台对大量数据进行分析,从而更好地了解市场趋势和客户需求。Adext 是世界上第一个也是唯一的观众管理工具,它将人工智能和机器学习应用于数字广告,精准投放广告给目标受众。

(五)人工智能硬件优化

人工智能硬件优化用于运行面向人工智能的计算任务,是经过专门设计和架构的 GPU 和 CPU。未来,基于人工智能优化的硅芯片将直接嵌入到便携设备和生活各处,为人工智能的发展提供更强大的硬件支持。例如,NVIDIA 的 GPU 在人工智能计算中发挥了重要作用,大大提高了计算速度和效率。

(六)决策管理

决策管理智能机器能够向 AI 系统引入规则及逻辑,协助或进行自动决策,实现企业收益最大化。在企业应用中,决策管理可以根据市场数据和客户需求进行智能决策,优化企业运营。例如,通过数据分析预测市场趋势,调整产品策略,提高企业竞争力。

(七)深度学习平台

深度学习平台包含多层人工神经网络,能够模拟人类大脑,处理数据并创建决策模式。目前主要被用于基于大数据集的模式识别和分类。深度学习平台在图像识别、语音识别等领域取得了显著成果,为人工智能的发展提供了强大的技术支持。

(八)生物信息

生物信息技术能够识别、测量、分析人类行为以及身体的物理结构和形态。它赋予人类和机器之间更多的自然交互能力,目前被广泛用于市场研究领域。例如,通过生物信息识别技术,可以了解消费者的行为和偏好,为企业制定营销策略提供依据。

(九)机器处理自动化

机器处理自动化使用脚本和其它方法实现人类操作的自动化,以支持更高效的商业流程。目前被用于人力成本高昂或效率较低的任务和流程。机器处理自动化能够将人类的才能最大化地展示出来,让职工更加具有创造性和战略性,对公司的发展至关重要。

(十)文本分析和自然语言处理

文本分析和自然语言处理利用统计和机器学习方法理解句子的结构、含义、情绪和意图,广泛应用于欺诈探测和信息安全等领域,同时还可用于非结构化数据的挖掘。在金融领域,文本分析和自然语言处理技术可以检测欺诈行为,保护客户资产安全。

(十一)数字孪生 / AI 建模

数字孪生 / AI 建模是一种软件架构,搭建起物理系统和数字世界的桥梁。通用电气公司利用数字孪生技术对飞机引擎、机车、燃气轮机进行监控和故障预测。数字孪生技术能够提高设备的可靠性和安全性,降低维护成本。

(十二)网络防御

网络防御专注于预防、检测以及在基础设施和信息受到攻击和威胁时进行及时响应。人工智能和机器学习将网络防御带入了新的发展阶段,例如递归神经网络能够处理输入序列,与机器学习技术相结合创建出监督学习技术,能够发现可疑目标,并检测出高达 85% 的网络攻击。

(十三)合规

将人工智能应用于合规工作中,自然语言处理技术能够扫描文本并且将其模式与关键字相匹配,以识别与公司有关的变动。具有预测分析功能和场景构建器的资本压力测试技术能够帮助公司遵守监管资本要求。此外,深度学习的使用,能有效减少被标记为潜在洗钱活动的交易数量。

(十四)知识工作辅助

AI 科技能够在很大程度上帮助人们出色地完成自己的工作,特别是在知识工作领域。例如,在科研领域,人工智能可以帮助科研人员快速检索文献、分析数据,提高研究效率。

 

暂无评论

发表评论

日历

2024 年 10 月
1234567
891011121314
15161718192021
22232425262728
2930  
wpChatIcon
辰汐の小站