with azbil
A to Z通过A to Z,涨知识啦! Keyword
- NEW
生成式AI
是基于学习过的数据,能够自动生成文章、图像、音乐、视频、程序代码等的人工智能。传统AI是对给定的数据进行整理和分析,并进行信息的识别或预测,而生成式AI则是学习非结构化数据的模式和关系,并能够用于创造新的内容和产生创意。

© 林 宏之
普通人可以使用的生成式AI已在第四次AI热潮中出现
近年来,被称为“生成式AI”的AI(人工智能)技术取得了飞速发展,逐渐成为我们日常生活中熟悉的一部分。许多服务都已经开始应用生成式AI技术。例如,一些智能手机和智能音箱的语音助手已经集成了生成式AI技术,能够对提问提供更加自然的回答。
AI的历史悠久,1956年美国计算机科学家约翰·麦卡锡将“人工智能(Artificial Intelligence)”一词定义为“旨在模拟人类智能功能的计算机程序”。最初的AI热潮出现在1960年代,美国和英国开发出了能够玩迷宫和国际象棋等游戏的程序。到了1980年代,第二次AI热潮兴起,开展了关于通过输入大量知识来解决问题的专家系统的研究与开发。第三次AI热潮始于2000年左右,AI开始利用包括互联网信息在内的海量数据进行学习,通过深度学习捕捉目标对象的特征,并可以基于这些特征进行推理。这使得以往基于规则的AI难以做到的高级识别和预测得以实现。
而从2022年开始的第四次AI热潮的导火索正是生成式AI的出现。这种生成式AI与传统AI不同,其特点在于能够基于学习过的数据自动生成文章、图像等原创内容。在此之前的AI的主要功能是信息分析和预测,而生成式AI则通过深度学习进行训练,生成新的内容或答案。此外,自从美国OpenAI*开发的ChatGPT在2022年问世以来,AI不再仅限于专家使用,普通人也能在无需专业知识的情况下使用。

通过熟练运用,可以减少工作量并推进业务的自动化
生成式AI包括主要生成文本的AI,此外还有生成图像、生成视频、生成音频、生成程序代码等多种类型。有些工具可以实现这些多种生成任务。
这种生成式AI在日常工作中可以应用于各种场景。例如,通过运用文本生成式AI,可以撰写会议记录、修改提交的报告、完善企划书、进行广告语的创意构思以及头脑风暴等。
图像生成式AI可以扩展照片的背景,音频生成式AI可以为视频自动添加旁白,而能够生成程序代码的AI则只需给出具体的指令就能立即自动生成可直接使用的程序源代码。例如,只需给出“我想制作一个简易的计时器应用程序”之类的指示,几秒钟内源代码就会显示在屏幕上。还可以对现有的源代码进行修改,当怀疑存在缺陷时,只需发出“请告诉我这段源代码中错误的部分”等指示,还能定位出可能存在错误的部分。
关键在于给出恰当的提示词和信息交互的方式
生成式AI的特点之一是,即使不具备IT技能,只需用语言发出指令即可使用。但要想熟练运用,如何恰当地给出被称为“提示词”的指令至关重要。在处理复杂任务时,某些生成式AI(例如:ChatGPT)能够运用被称为“思维链(Chain of Thought)”的逻辑步骤来推导出解决方案。为了让这种“思维链”恰当地运作,需要通俗易懂地指示AI需要实现什么目标以及要做什么,并对生成的内容进行进一步指示,从而逐步得到更接近预期、完成度更高的答案。
另一方面,也有一些需要注意的事项。信息泄露与事实的真伪性问题,以及在图像生成式AI和音频生成式AI中涉及的知识产权侵权。
例如,如果在提示词中包含了公司内部机密信息或个人信息等高度机密的信息,用于模型优化或改进,并有可能在提供给其他用户的回答中被泄露。为了防止发生这种情况,可以在设定阶段采取措施,例如指定不得用于学习数据。关于事实的真伪性,由于AI可能会生成看似合理但实际上不准确的信息,这被称为“幻觉(hallucination)”现象,因此在使用时必须意识到输出的信息并不一定总是正确的,使用者自身核实信息的真伪至关重要。
生成式AI在商业领域的应用也在迅速推进。例如,基于电商网站上的评论内容推荐商品,或者将与客户的面谈记录转录为文字,然后提取必要信息并整理成报告提交给相关部门,这些应用已经得到了实际运用。未来,诸如医疗记录的解析与治疗计划的生成、城市规划的模拟等多方面的应用都可望得以实现。它将不再局限于提升工作效率的工具,还将进化为能够补充和拓展人类创造性工作的助手。

- *OpenAI, Inc.
- *ChatGPT是OpenAI OpCo, LLC的商标。