GEO——从「提示词工程」到「上下文工程」

GEO——从「提示词工程」到「上下文工程」

过去两年,大模型的使用范式正悄悄从「提示词(Prompt)工程」过渡到「上下文(Context)工程」。前者解决“如何向模型下达一次性指令”的问题,后者关注“如何在整条信息管道里持续喂养模型最有价值的内容”。本文结合一线实践,对两种范式的异同与演进做一次梳理。

二、大模型真的有“记忆”吗?

  • 短期“记忆”=上下文窗口 笔者应该算是国内比较早的一批开始使用ChatGPT的从业者,第一次的使用可以用“惊掉下巴”来形容都不过分,用过“智能音箱”的朋友应该都有体会,一个问题如果描述的不准确,“智能音箱”秒变智障音箱,根本听不懂你想表达的意思,但是ChatGPT太强了,他完全能理解你的意思,还能多轮对话,简直像个真人。 当然如果我们深入了解过ChatGPT这类ChatBot的技术原理后,我们会发现一个扎心的事实,就是背后的大模型其实没有“记忆”。 现在的 ChatGPT、元宝、『豆包』、『DeepSeek』 等聊天『机器人』️之所以能连贯对话,并不是模型主动记住了你,而是工程层提前把历史对话拼接在每次请求里。模型能“看到”的字数由其 上下文窗口 决定。早期 ChatGPT 只有约 4 k tokens,如今 OpenAI GPT‑4.1 已在研究环境下把上限推到 100 万 tokens(官方实验数据)(OpenAI),Anthropic Claude 3.5 Sonnet 也提供了 20 万 tokens 的商用窗口(Anthropic)。 参考折算:1 token ≈ 0.75 个汉字,100 万 tokens 约合 75 万汉字(近 500 页 A4)。
  • 窗口再大也是有限值当对话轮数激增、附件动辄上 MB,超出上限后就会触发截断或报错。这也是为什么有时模型忽然“忘记”前文。

三、普通用户的两条小贴士

3.1 一次只聊一个主题——把“旅行攻略”和“写周报”拆成两条会话,可显著减少上下文污染。

3.2 对话质量下降就“刷新”——发现回答跑偏,不妨新开窗口重问,常有意想不到的提升。

四、『工程师』视角:从“单节管道”到“多节管道”

4.1 「提示词工程」:单点优化

下面是一个提示词的例子:需要提取『抖音』短视频的文案,用于后续的爆款短视频分析,这个需求可以用自然语言写,例如:

“我需要提取短视频标题、作者、视频文案,并且需要通过JSON格式输出,其中视频文案需要原始内容,不要总结”

这个提示词本身没有问题,但是如果我自己尝试的话,会发现每次使用总会有这样那样的问题,提取的不够稳定,但是如果我们使用的是如下这种XML+JSON的格式,提取对的结果就会非常稳定,并且很方便后续的代码对数据进行进一步处理。

<outputs> { "title": "{text}", "author": "{string}", "video_script": "{text}" }</outputs>

https://www.douyin.com/user/MS4wLjABAAAAjb1juHnK9tygA0nuoGgSEMW7ZuJzXNnTMx9XwaQh19k?from_tab_name=main&amp;modal_id=7429767354541788468

『抖音』视频链接

当然,这种语言已经非常偏向于伪代码了,写起来有一些挑战。

自然语言是简单的,但是往往不够精简和准确,代码语言足够简洁也足够精准,但是不容易写,算是有利有弊。

如果是个人使用,使用自然语言就够了,但是如果是放在系统工程里,稳定性就至关重要的,所以「提示词」也非常重要。

4.2 「上下文工程」:系统级优化

当业务链路不止一步、甚至需要多轮调用 LLM 时,仅靠单条提示不可持续。

  • 多节管道:每个环节(检索 → 摘要 → 过滤 → 生成)既可以串行也可以并行;下游节点看到的是多个上游产物的「拼装上下文」。
  • 全局视角:要判断哪些步骤让 代码来做(如正则清洗、批量重排),哪些必须 让大模型发挥推理或文本生成优势。
  • 迭代闭环:复杂需求通常拆成多次调用+结果回写,再交给后续步骤复用。

学术界已把这套方法论正式命名为 Context Engineering,并给出了“检索‑处理‑管理”三层框架(Mei et al., 2025)(arXiv)。业内文章也普遍强调:有效上下文管理能显著降低幻觉率与 token 成本(Medium)。

五、结语与展望

  • 提示词工程 解决“把问题说清楚”(推荐一本很好的书:《关于说话的一切》);

  • 上下文工程 则关注“让整条流水线始终喂给模型最有价值的信息”。

随着 100 万 token 级窗口逐渐普及,信息筛选与组织的重要性只会上升。这篇文章对于「上下文工程」的具体实现先不做具体展开了,后续我们可以专门拿一篇文章来讨论下GEO工程中的一些「上下文工程」的实现方式,抛砖引玉给到大家一些参考,希望今天的一些思考能给到大家一点启发。

特别声明:[GEO——从「提示词工程」到「上下文工程」] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

战争大片《1840》,『陈坤』演林则徐,能超越当年的鲍国安版本吗?(战争大片《巴斯塔》)

当吴刚饰演的邓廷桢展现官僚体系中的良知挣扎,当于震版关天培用《中国兄弟连》的硬汉底色诠释&quot;炮台即坟墓&quot;的誓言,我们或许不再只看见历史课本的铅字,而是触摸到有温度的民族基因。 从谢晋&quot;不忘

战争大片《<strong>1840</strong>》,『陈坤』演林则徐,能超越当年的鲍国安版本吗?(战争大片《<strong>巴斯塔</strong>》)

老手艺+新口味 今年你期待哪款月饼 老醋月饼成新宠(老手艺叫什么)

中秋节即将来临,各地月饼生产开始忙碌起来。在山西省太原市,一些月饼工坊将传统手艺与新口味结合,推出了特色老醋月饼。在太原市晋源区的一家月饼工坊里,工人们正在制作老醋月饼。房间里弥漫着醋香、饼香和坚果香

老手艺+新口味 今年你期待哪款月饼 老醋月饼成新宠(老手艺叫什么)

43岁伊万卡亮相派对,“像贝索斯新妻”,公开维护父亲盟友惹争议(伊万卡近期)

有人认为她金发披肩的造型光彩照人,但也有批评者指出她的着装风格不尽如人意,甚至有人觉得她在模仿亚马逊创始人贝索斯的新婚妻子劳伦·桑切斯的穿衣风格。 虽然伊万卡表示不想被过度关注,但她却经常在『社交媒体』上晒生活,…

43岁伊万卡亮相派对,“像贝索斯新妻”,公开维护父亲盟友惹争议(伊万卡近期)

文佳煐机场“内衣风波”:一场关于穿衣自由与公众审美的激烈碰撞

照片中,她身着Dolce &amp; Gabbana 2025秋冬系列黑色蕾丝吊带裙,外搭一件宽松长外套🧥,整体造型被品牌定义为“睡衣风外穿”,却因细肩带与蕾丝装饰的视觉效果,被部分网友误读为“穿内衣走机场”。她所穿的…

文佳煐机场“内衣风波”:一场关于穿衣自由与公众审美的激烈碰撞

“华为系”切入旅行车市场 打破固有认知

多功能旅行车在国内汽车市场长期被视为小众产品,因为消费者普遍认为其空间利用率不及SUV,场景适配性弱于轿车。近年来,随着『新能源』转型的推进,旅行车市场开始显现增长潜力

“华为系”切入旅行车市场 打破固有认知