直播回放,点击观看:
[通往AGI之路]社区在10月8日发起全国AIPO校园创投活动
(AIPO:校园AI创投活动,开放报名!)
点击下方图片, 开启AI之路
两周内已经有170所高校报名参与活动,10月8日-18日共11场共学课,几千名同学参加课程并完成作业,包括手搓智能机器人、从0学习文生图等,详细课表如下
以下是[Prompt(提示词)的道和术]课程内容精选总结,由张梦飞整理。
看的时候频频感叹李继刚老师对提示词的理解之深刻,思路之清晰,多处的总结都让我有一种茅塞顿开,醍醐灌顶之感。
顿感此等分享如不整理为文稿,让更多人看到,简直是藏之名山,却未传其人。
建议学习!!张梦飞 | Equity AI 公众号
全文约14000字,阅读大约需要25分钟,建议先关注和收藏,以防丢失~
大家好,我是梦飞。
今天补听了@李继刚Arthur老师在AIPO共学中的直播,本次是李继刚老师第一次的直播分享,颇为难得。因此,我斗胆自己动手整理了全篇分享。整场直播约2小时,原分享文本约32000字。因为是直播,所以原文本表述中有非常多的口语化和一些评论交谈。为了保持全文通畅,尊重继刚老师分享和方便大家阅读,我对整个文稿内容进行了纯人工整理,尽量保留了原话,全篇没有用到任何AI处理。以此保证在做了些许调整和精简的情况下,保留原汁原味的阅读体验。本篇全文约14000字,阅读大约需要35分钟,建议先关注和收藏,以防丢失。
金句:读书多,脑海中有很多方法论,把那些方法论一封装就是一个场景,所以写起来就有源源不断的想法会冒出来。read in. prompt out. 因在前边,果在后边。事物当前的本质,它不是客观的,而是取决于当时的社会的对它的意义的诠释。提示词写不好就在外边去找,不断地试词,不断地调,那是跑偏了,真正的效果不好的时候,要回退,先回到自己脑海中,去想脑海中那个东西。虽然只写了这三个字,但是哲学家这三个字是一个大的压缩包。因为你措辞的足够精准,那个词在大模型向量与embedding那个向量空间中足够精准,相当于一支箭直接射在点上。我觉得写提示词是有味道的一件事情,这个提示词,一看就是你的味道。
以下是分享整理稿:大家好,我是李继刚,自诩是一个读书人。ChatGPT最早出来的时候开始学着去使用提示词跟大模型做交互,大概学了有一两个月,把网上能找着的提示词都给翻了一遍。接触到了结构化提示词,然后就开始疯狂地去写各种场景下的提示词。因为跟之前的读书多有关系,所以就会脑海中有很多方法论,把那些方法论一封装就是一个场景,所以写起来就有源源不断的想法会冒出来。然后就基于这个想法就去年写了大概有七八十个不同场景的提示词。最近这半年有了一个新的收获。今天就和大家分享一下。
一、Prompt之道:清晰表达
如果让我用一句话来总结去年写的七八十个提示词,我浓缩一句话就是:清晰表达。就是你和大模型对话时只要能清晰地把你真正想要的那个东西给表达出来这件事就成了。至于说你用了什么语法、用了什么框架那都是次要的只要你能表达清楚你就赢了这是根本。然后使用的框架它使用的哪个词其实去复制、去传词包这种往提示词上堆叠是没有意义的。这个方法就是在“模其形未得其意”这个意就是清晰表达这是我去年一整年总结下来的心得。那么“清晰表达”怎么清晰表达?什么是清晰表达?这就是两个问题了表达什么如何清晰表达想清晰地表达首先得有一个内核你想表达什么东西这个事得先有然后才有的写。当大家都面对同样一个东西比如说都是写《金字塔原理》的提示词那金字塔原理就是那一本书大家都看了脑海吸收完之后都有思路了内核就是他了。那这时候怎么办?就是开始把你脑海中的那个印象、那个认知、那个框架给写出来写成提示写给大模型。你可以用自然语言一段一段地写也可以用结构化提示词这个事情我理解怎么写不是那么的本质框架是一个好用的工具但它不是那个本质本质是通过这些工具框架帮你去把你脑海中的东西清晰呈现出来。只要做到这两步我理解提示词这个事你就成功了这就是我去年的理解。我们具体来看“表达什么?”这个事情怎么做经历了一段时间的抽象总结我最终总结出了这么一句就是 read in. prompt out.也就是要输出首先你得有输入。比如你要写一个商业分析的Prompt如果没有读过《商业模式新生代》你不知道商业模式画布这个事的话你琢磨了半天你都是在外围打转你没有进到那个内核。而你一旦读了它这个商业模式画布这几个字符你输进去直接就出一个非常惊艳的效果因为大模型也学了它。大模型是知道所有通用的知识但是不同的人去用跟他对话去交流针对同样一个场景去拿到的结果是不一样的有些非常惊艳有些很一般为什么?根源在于不同人给模型的输入。编程界有一句话叫 garbage in garbage out 垃圾进去垃圾出来如果你的输入是一个没有信息量的全是一些片汤话进去的我想写商业计划书你给我一个那他一定给你一个中庸的40分、30分的东西。就是你你说它不是计划书它也是你说它是但他压根就不能用所以就大家会觉得大模型很鸡肋但其实是没用好它。大模型智商已经在了怎么让他输出很惊艳呢?同时他又不是很长的描述就能写好这一块就是要求你脑海里得有那个概念那个概念来自于哪?只能是先输入也就是说你想写好提示词这个结果不来自于这个结果的1234而来自于源头这是果不是因因在前边在读上这个读当然是泛指的read.你跟别人交流行业经验、你读书、你出去旅游去看看不同的人文环境包括你去刷短视频其实都是输入再内化一遍这一些东西再抽象一下这个read就是说你的大脑在跟这个世界做交互这个世界的信息过你的脑这时候只要你留心观察这个交互其实它就是一个输入。举一个很简单的例子大家会觉得比如我之前写的一些搞笑的段子什么的很有意思会问我你怎么会想到这个东西呢?其实那不是我写的那是在刷抖音的时候我心里边有一根弦我刷到的一个短视频我刷到之后我笑了这时候我就停一下我为什么会笑?就这个东西它一定是有东西的这视频跟别的视频不一样我别的都是2秒钟划走了为什么它能让我笑停下来?看完它了它一定是有东西了就开始停下来琢磨他明明就说了两句话怎么就能让我笑出来呢?它里边的结构是什么是它的措辞还是那个反讽呢?还是什么呢?开始研究它就这个研究绕着它去打磨的时候你就开始有那个read in的内核开始形成了然后这时候你就可会有一个冲动这一套东西我能不能封装一下?我批量地生产?我也不知道第二个角度、第三个角度会写出什么但你就可以封装就可以写出一个idea.所以就你每天都在与世界交互所有人都在跟世界交互每天是有大量的输入的只是很多这种想法大家就脑子里过一下心里笑一下或乐一下就过去了其实就放过了很多这种启发.其实只要有这根弦去抓住它就会有源源不断的想法脑海中我现在每我积压的有十几个待写的而且我随时拿起一本书读完之后可能中间有两个概念引起兴趣了马上就又想写了永远写不完.我是真的可以不断地输入不断地思考不断地输出这个循环是转起来非常之顺畅了但这个起点就在于输入这一部分同时你心里有那根弦我觉得这个地方真的是根本上的根本.提示词的技巧以及别人写得很好你复制过来粘贴过来去使用它是一种就是模拟别人的形象那个词是怎么来的?这个词很管用它写得很好但是你用别的场景还用这个词就已经偏颇了这个词的来源它是怎么提炼出来的?那个过程是值得大家去学习、总结、提炼的而不是那个结果当然结果我们需要学习但它不是我们真正要去做的.因此我回答表达什么这个问题就是要有输入有积累.如果说让我来说写提示词有什么经验分享的话这是我最想分享的内容.提示词不在于如何写而在于如何输入以及如何感知这个输入以上是关于表达什么.那我们就假定你有一个内核在了你现在就想写一个场景有一个很清晰的场景需求你也有一个方法论那这时候就会涉及到第二个环节了就是如何清晰地表达出来.我觉得有两个身份的人应该是有优势的一个是文科生他们对于文字的那个细微差异会下功夫去学他们系统性地学过他们应该是对文字很敏感的这一波人写提示词应该是有优势的.第二波应该是学哲学的人他们对于词的那个压缩的语义这些的那个浓缩程度的理解和思考的深度对于一些提示词跟大模型交互一定是有优势的.他们只是需要一个契机进到这个门里跟大模型能做交互这个事就会起飞.当然那心理学可能也是别的学科当然有别的学科的一些特点和优势就但是文科和哲学我觉得是比较特殊的两个学科.去年整个提示词圈演进的过程其实出来的是结构化提示词但结构化再往上走一层其实是一个框架.大家可以来感觉一下我尝试着在大家的脑海中植入这个画面大家来跟着我一起感受一下这个画面.你脑海中有一个东西你别管它是方的、圆的就是有一个东西.然后围绕着这个东西你想把这个东西的形状、颜色等等的特质把它传达给大模型.现在你准备怎么传达?你从正面看是一个形状从背面看是一个形状从上面看从下面看各个角度去看都有不同的形状.那请问你怎么描述来把它讲述给大模型?这个事我是去年一整年都在想的一个问题我用了各种框架来尝试完整传达.因为我没办法用一个东西一句话、一个词、一个意念就把它给表述好.所以我就不得不借助于语言来表达那我用语言来表达的时候我就需要线性的输出因为字是一个一个来的这个线性的输出其实就是一个角度就你一定是贴着一个角度过去的.那这个角度一旦发射出去它就是偏颇的因为角度不是那个脑海中那个东西的本体对吧?它是某个角度的看见的一个画面所以它一定是片面的它是错的它不是全部.那怎么去解决这个问题呢?就开始有人提出各种框架了这个框架是来干什么的?其实就是预置了某几个角度比如说我内置了5个角度内置了7个角度来描述它然后大家你不用每次都现想.你描述任何场景都来填这个框架的7个空6个空就能解决.提示词框架本质上是在干这事.而这事是个退而求其次不得已的事情就是因为我没有办法把我脑海的东西直接给传达进去所以我不得已去借助一个框架来搞.大家理解一下这个事情很有意思前阵子读了一本书叫《尼采与哲学》然后它里边讲尼采看待事物.他是怎么看一个事件这段话我觉得挺有意思的大家可以给读一下.无论是事件还是现象、词语、观念无一不富有丰富多彩的含义.事物有时表现为这样有时表现为那样有时呈现更复杂的情形——这一切都取决于占有事物的力《尼采与哲学》就是无论是一个事件还是一个现象还是一个词语还是一个观念就是脑海中那个有一个东西对吧?有一个物它都含有丰富多彩的含义就它有时候表现这样有时候表现那样但它为什么会这样呢?是因为有很多力在决定着它而这个力是变化的在某个时间它是左上角那个力占主导地位这个力的角度就是事物当前的本质.过了一段时间右下角的力占了上风它就成为了这个事物的本质.尼采的视角是说这个事物当前的本质它不是一个客观的东西而是取决于当时的社会的对它的意义的诠释.就包括比如说唐朝审美觉得以胖为美那胖真的是美还是瘦真的是美?其实在尼采看来是没有的就是都美只是说在唐朝的时间点社会喜欢胖那个维度的而已.这个解释是基于时代的流变当时社会的那个观念去解释它的其实这句话在我读完之后我脑海里的那个东西然后这个东西现在变成什么呢?它是个物体上边长满了各种刺每个刺就是决定它的各种力量而这个这个刺呢长短不一有人胖、有人瘦、有人高有人矮就是这一套东西就决定着他他就长这个样子了.那他这个事就很有意思了这个事物在这了你看见他了你基于你的学历你的教育背景你的工作背景你看见了这个物体你看见了这个方法论你理解了它现在你要阐述它你要把你脑海中那个东西阐述出来这时候就是去年我们整个提示词圈都在用的各种框架.我们可以看一下这里有两个扩展阅读大家可以读一下这是AJ去年收集的拓展阅读: Prompts(提示词)| 社区内prompt框架课程收录按使用场景导览| 各个场景提示词收录这里边是一个一个的框架你看这个框架得告诉什么?就是把脑海中的一个事情、一个方法论它通过这四个角度来描述出来.其实各种框架都大同小异就是你要做什么事情?现在有什么背景?我有什么目标?我有什么任务?有什么数据?有什么输出?期望大概就这些东西就大家换不同的词在弄而已.那这些框架有没有用确实有用它能帮助你很快地以某些角度给把你脑海中的那个东西给弄出来所以它比你完全从0到1或者是空想是要快的是要高效很多的.我去年用langGPT的框架写了一整年的时间大概就这么个意思大家用不同的这个框架去写在用这些框架的时候可以换着不同的预设角度去描述同样一个物体我在用langGPT的时候出发点是说我需模拟一个老师他能以很好的、很善解人意的方式来讲任何一个概念你输入任何学科的它都能以很好的东西来输出.那你看这也写的时候比如说我定义一个角色首先命名它到底是你模拟是个什么人然后会有一些基本信息.然后描述一下这个提示词是做什么事情的然后会有一个目标.那这个老师会有什么风格呢?就我脑海中开始想象这么一个人我想要我许什么愿我要什么然后我就会说:使用简单的语言给人开放性想象惜字如金模仿费曼的教学风格这是会要求他的这个技能.那这样就塑造好一个人物了那这个人物是怎么干活的呢?那用户输入一个问题他就开始思考和输出他首先用比喻的方式然后给那个概念下一个科班的定义然后讲述这个概念的历史介绍这个概念的属性再举一些例子来证明它再站在大模型的角度来说哲学的角度来说等等的角度这里说的是什么意思呢?就是这些东西这一整块东西其实我是说我脑海中能想到的其实就是我读书都读了哪些书最终是从我喜欢从这几个角度来看那换一个人完全可以从你自己的视角来出发你可能是完全不一样的那个视角完全不一样的要求你不是通过历史的角度你是通过现象学的角度你是通过哲学发展的角度.anyways就是通过你自己的视角来约束他它是可以约束大模型按这个约定的视角往下去走的你不约束的时候它走哪条路是随机的不知道的但有了这个角度你就可以约束它按照你指定比如说我这里列了10个角度那它就会按照这十个角度一个一个地来描述最终输出的就是那个你想要的这10个角度的结果我的角度的也不是一次成型的当然也迭代了好多次了应该也有几十次的不断地想比如一个概念看完之后我懂了这个概念吗?我没懂那我为什么没懂呢?我觉得是缺少案例那我就加一个案例有了案例我懂了吗?就觉得太浅了跟wiki一样有没有再拔高一些的?然后就开始加哲学你思考一下本质思考本质之后有的时候发现太简略了那好那你再连续追问三次所以每一句话其实都是针对一个一个效果的不好的改进去做的迭代所以这里边东西不是去ctrl c、ctrl v去抄别人的而是提示词的每一句都是基于你的理解你对这个事情的认知你的read in然后去跟大模型做交流你在交流过程中你觉得效果哪里不好改哪里所以这个提示词的链路过程其实就这么过来的这是写的当时我觉得写得最成功也是最复杂的一个总结一下首先表达要有东西有东西之后就开始要清晰表达那就可以用框架来帮助你清晰表达法无定法大家要把握住那个本质只要做到了清晰表达我脑海中那个东西那就是成功的.提示词写不好就在外边去找不断地试词不断地调那是跑偏了你是被大模型被随机的东西给牵扯走了真正的效果不好的时候要回退先回到自己脑海中去想脑海中那个东西你看见那个东西再看清楚一些它到底长什么样然后那个样和你现在用文字描述出来的这个东西契合吗?相关吗?大概率是不相关的大概率是有偏差的想办法你减弱那个偏差我去年最大的心得就在这最终结果词的变化是由内大脑内部的那个形象和描述的偏差决定的而不是说找一个词不断地试这个词是不是好词然后收集它其实这就留为下层了模型是每天都在调的场景也在变大模型能力也在变学它是你永远学不完的而且你没有抓住根换一个场景你又得从0到1开始所以回到根本上回到大脑里你脑海中有一个清晰的画面大概率是不清晰的很多时候都是从模糊开始的然后通过跟提示词对话看见结果之后我反向倒逼我脑海中的东西慢慢变得清晰所以我觉得我跟大模型在对话这两年对我最大的感受有两个第一个是对我帮助最大第一个是当我脑海中有一个清晰的画面我知道那个东西的形状我看见它了这时候我跟大模型对话大模型基本上往往都能带着我往更深一层去理解因为理解是分层次的如果我现在在第三层的理解非常之清晰我跟他对话我能进到第四层这个事情是非常有意思的能帮助你深度思考第二个事情是当我脑海中是个模糊的东西比如说战略我读了四本书每本书讲了一个方法论但我感觉这四本书都没有讲到战略的本质但每本书都有个方法论都能够直接套用就能形成一个战略但是让我说战略是个什么的时候我说不出来我脑海中朦朦胧胧的一个东西然后这时候就可以跟大模型做各种对话结构性也好什么也好其实都无所谓刚才讲的那一套框架是框架真正的内核是你清晰表达把脑海中已经学到的知识跟他交流跟他对话不断地往深了钻他是能帮你把脑海中的那个东西慢慢地变清晰的这二者我觉得对我日常使用是有非常之大帮助的思考这件事上帮到大家我觉得这个事就已经非常之牛逼了就是他应该是成为你身边的伙伴你日常有任何想法就可以跟他聊所以我整个去年的一个感受就是清晰表达我要表达东西我脑海中得有个东西我脑海中没有东西空空如也当然就写不出来当你脑海中有一个东西非常之清晰的时候你是迫不及待的那个字是追着你的手指往外蹦的这个感觉非常之鲜明所以不知道写什么的时候就去读吧往往脑子里灌东西把那个脑子里的东西给弄出来让他清晰起来让他立得住那么我去年得到的提示词之道就是:清晰表达而清晰表达的根就在:read in prompt out 因在前边果在后边 那大家要从0到1开始上手那我要清晰表达我脑海中有东西了比如说上了一门课这门课的知识方法论已经非常之清晰了我已经学完了我现在就想把它封装起来去跟大模型对话那怎么封装呢?框架有十几个有二十几个我是随便选一个还是怎么地呢?有没有一些最核心的东西有没有一些最通用的东西这一部分就是想跟大家去聊一下我提炼总结分享了好半天最终我选择了三个我叫做三板斧:分配角色给出示例(few-shots)思维链(Chain-of-Thought)我觉得这三个是所有写提示词都绕不过去的如果你是从0到1开始去学我认为你应该是在这三个地方去下功夫去研究它的我们先来说第一个分配角色在提示词最早期的时候这个技巧是所有人被show到的大家都很惊艳的你只要跟他说你是一个什么家你是一个什么身份的人他的输出就明显好于没有说这句话这是去年刚提示词刚出来的时候大家非常惊艳的一点这一点大概的我自己提炼了一下比如我不说你是一个哲学家就是我问你什么是生命的本质什么是生命生命的意义是什么类似于这种的哲学问题你跟他讨论和你加上你是一个哲学家的提示词去讨论是不一样的那这个不一样到底在哪不分配角色:(做事情) ⇒ 动作指令分配角色:(做事情) and (角色 行为模式) ⇒ 角色模式行为模式 = (知识域 语言风格 决策倾向…))我自己总结了一下就不分配这个角色的时候其实你是让他去做一个事情就是个动作就是你来给我解释一下什么是生命他就去解释去了但是你分配角色的时候是个什么事情呢?分配角色的时候其实是一个且的关系你注入了一个信息量进去信息熵变低了就是他除了知道他要做什么事情以外这时候你额外指定了一个哲学家虽然只写了这三个字但是哲学家这三个字是一个大的压缩包哲学家会有什么行为模式隐含的被带进去了他就以那个哲学家的行为模式来做你想让他做的事情也就是说他从单纯的动作执行变成了角色模式这个行为模式当然包含很多了就是这个身份的人他会有什么知识他是怎么表达的语言的风格怎么做决策的做判断等等的一堆的东西其实都包含了包含在你指定的这个身份里边很巧妙很微妙很神奇我的理解是这个词它是一个超级浓缩词它代表着很多哲学家的人他们会怎么思考事情他们会怎么想事情他们表达语言是不是有一些风格就类似于所有的这些东西其实都囊含在这一个小小的词里了也就是说你在指定他的时候你可以把这个东西给丰富化当然你有一些东西比较知名的比如哲学家比如你是个作家这个东西可能就可以但如果你是一个细分的比如你是写教育的作家就过于宽泛了你就要细化到你那个领域里边而这里边就会有一个潜在的问题会冒出来就是大模型你怎么知道他是经过哪个语料训练的你说哲学家的时候大模型脑海中已经有这个哲学家形象了你说你是你们公司的一个运营专员的时候大模型压根没有这个形象那个形象