
1.1 AI原生应用的形态
ChatGPT让人们感受到大语言模型的强大能力,进而对其产生了极高的期望。然而,大语言模型的应用远不只聊天机器人这一领域,它正在以更广泛、更多元的形态渗透各个领域,并已在内容创作、辅助助手、能力引擎、智能体等方面展示出巨大潜力。
1.1.1 内容创作
在引入大语言模型之前,内容创作主要由人工完成,这种方式尽管能赋予内容独特的情感和深度,但也存在诸多限制:人工创作耗时耗力,难以应对需要迅速响应或大量产出的场景;人工创作受限于创作者的个体知识和想象力,难以持续产出高度创新和多样化的内容;在多人协作或多语种环境下进行内容创作时,保持语言风格和文本质量的一致性尤为困难。
大语言模型可以利用其庞大的数据知识库、卓越的语言生成和理解能力,轻松创作出高质量、富有创意的文本内容,如诗歌、故事等。大语言模型创作的内容不仅语法正确、逻辑清晰,且常常蕴含令人意想不到的创意和观点,为内容创作注入了新的活力。此外,大语言模型还能根据用户的需求和偏好定制内容,确保语言风格的统一,满足个性化的创作需求。
这种从人工创作到人工智能生成内容的转变,不仅优化了内容创作的流程,还提升了内容的多样性和创新性,无疑是一场深刻的内容创作变革。
1.1.2 辅助助手
辅助助手是一种崭新的交互模式,它为用户带来了更加自然、高效和个性化的交互体验,并改变了人与计算机的交互方式。这种交互模式允许用户通过简单的自然语言与计算机进行交互,无须遵循复杂的预设规则和流程。辅助助手能够理解用户的需求和意图,然后进行思考并做出相应的行动,这与以往必须遵循预设的规则和流程来操作图形用户界面(graphical user interface,GUI)的产品的交互模式,形成了鲜明对比。同时,它还能整合各种产品功能与AI的多元能力(如语音识别、图像生成、视频处理、文字处理等),从而为用户提供更全面、高效的服务,如图1-1所示。

图1-1 辅助助手可连接一切服务
例如,在日常办公场景中,用户只需对辅助助手发出简单指令,如“请在我今天的日程中添加一个下午两点的会议,主题是项目进展讨论”,它便会即刻将会议添加到日程表,并设定相应的提醒;当用户想要休假时,只需告知辅助助手“我计划下周三休假一天,请帮我提交休假申请”,它便会自动填写并提交休假申请表格。
1.1.3 能力引擎
随着大语言模型的广泛应用,自然语言处理(natural language processing,NLP)领域正经历着一场深刻的变革。传统的NLP方法往往需要针对不同的任务设计特定的模型算法,这既增加了开发成本,也限制了系统的灵活性和可扩展性。
大语言模型的崛起改变了这一局面。其具有卓越的语言生成和理解能力,展现出作为能力引擎的巨大潜力。这种模型能够在统一的框架下游刃有余地处理各类NLP任务,如文本生成、文本分类及信息抽取等,如图1-2所示。
通过精心设计的提示,我们可以将大语言模型封装为易于调用的服务,从而构建能力引擎使开发者能够轻松地将强大的NLP能力集成到自己的应用系统中,极大地提升应用系统的智能化水平和用户体验。这种能力引擎的出现不仅可大幅度降低系统开发成本,更使得现有系统的革新成为可能。

图1-2 能力引擎可应对各类NLP任务
1.1.4 智能体
在大语言模型出现之前,智能体(agent)主要依赖预先设定的规则和基于强化学习技术来处理各项任务,尽管取得了一定的效果,但在自然语言的理解和复杂任务的处理方面存在明显的局限性。
大语言模型与智能体技术的融合,为我们提供了一种新的、目标导向的问题解决策略。在这种策略下,大语言模型是智能体的“大脑”,为智能体赋予了卓越的语言理解和生成能力,还增强了其任务推理和规划能力。这使得智能体能够更深入地洞察问题背景,更准确地把握问题核心,从而生成既具逻辑性又富创意性的解决方案。
向智能体提出问题后,它便能自主分析、分解问题,并调用适当的工具来解决这些问题,如图1-3所示。在大语言模型的加持下,智能体在通用问题的自动化处理方面更具优势,为通往更高级别的通用人工智能(artificial general intelligence,AGI)打下了坚实基础。

图1-3 自主分析、解决问题的智能体