通过 DALL-E 3 生成的图像
欢迎来到我的《提示炼金术》系列中的第一个提示操作指南!这是我第一次尝试分享我的一些即时“工程”技术、技巧和窍门,所以如果您喜欢这个存储库,请考虑给它一颗星或分叉它以做出贡献。您也可以在您的网络中分享它以帮助如果人们感兴趣的话,我很乐意分享更多。
本指南应该允许您与 ChatGPT 进行更加个性化的交互,利用您之前与 ChatGPT 进行的成功对话,在 ChatGPT 的“自定义指令”设置中创建专门的提示。我将这种数据称为“蒸馏”,而不是“汇总”或“优化”之类的东西,因为这里的关键不是保留相同的上下文或结构,而是将数据压缩和转换为更适合此用例的内容。
请记住,这旨在使用您自己的数据通过 GPT 完成此过程。目的是产生供个人使用的个性化输出。如果您不习惯让 GPT 处理这样的数据集及其内部内容,那么这种技术可能不适合您。调整此框架以处理其他数据(您拥有的)的替代用途必须由您自己完成。
我希望本指南对您有所帮助!
该技术需要访问“高级数据分析”插件。 |
---|
此技术仅针对 ChatGPT Web UI 设计。文件还不能通过 CLI 直接提供给 GPT 模型。 |
---|
该技术旨在将个人对话数据提炼成适合 ChatGPT 界面上“自定义指令”设置的内容。也可以将此方法用于 API 调用,但是请记住,您仍然需要访问 ChatGPT 界面上的高级数据分析插件才能使用此技术。出于本演示的目的,我假设您将使用从 ChatGPT 网站导出的内容。
这不会是一次性提示。将此视为即时“指导”的演示,更类似于 CoT 推理,尽管略有不同。以合理、可操作的步骤对其进行分块和处理对于有效且高效地实现预期结果至关重要。如果您期望它一次完成所有操作,它就会感到困惑并忘记它应该包含和执行的所有细节。
您可以从此分步列表中收集并格式化您的个人数据。
“Could you pretty-print or reformat the entire json file to a more human-readable format and allow me to download the reformatted file?”
将此文件保存在保存原始对话文件的位置。 GPT 很难解释如何处理 json 文件,如果打印得不漂亮,就会陷入困境。当以这种方式重新格式化时,GPT 可以快速轻松地评估文件及其内容。您可以通过以下两种方式之一来解决这个问题:您可以首先解释您想要完成的目标和意图,并允许 GPT 本身生成分析阶段(这就是我所做的,带有交叉引用),或者您可以具体要求我在下面提供的阶段进行分析。请记住,我的背景是语言学,所以我可以验证它试图进行哪些分析,并根据我的知识完善它试图做的事情,如果它做了一些奇怪的事情。为了减少摩擦和混乱,我建议使用我提供的提示,但如果您像我一样具有探索性和好奇心,那么看看它建议的方法可能会是一次有趣的体验。
在我们继续之前,请了解 GPT 可能会尝试与您验证其所做的是否正确,并检查其步骤。正如许多人正确指出的那样,您不能期望每次尝试时的输出和结果都相同。在此过程中保持灵活性并提供尽可能多的建设性反馈。我提供的提示指导模型完成任务,而不是我命令它。使用提示,但要明白,这将由您来引导它朝正确的方向发展以实现目标。这并不像听起来那么难,因为将分析过程转变为清晰的步骤允许模型逐步响应,逐个响应,允许在必要时进行澄清和反馈调整。如果对话延伸得很远,你可能需要提醒它最后一步,但同样,快速参考“还记得 X 吗?”将其注意力转向预期目标。
在考虑提示什么以及如何提示之前,最好先概述您的意图。现在让我们回顾一下。以下是我们正在尝试做的事情以及如何做的高级概述。
步骤:
现在,让我们构建提示来表达我们对 GPT 的目标,以及我们期望它做什么:
“我们正在使用的这个数据集是我作为用户积累的个人交互数据。我这次对话的首要目标是使用该数据集编写一组自定义指令,以个性化未来的交互,同时简化进一步的指令。”
如果您希望 GPT 生成自己的指令来实现目标,只需附加以下内容:
“你能帮我实现这个目标并分析我的数据吗?”
要求这样的确认检查可以让人工智能做出回应,既验证它对你的提示的理解,又通过解释它如何完成这项任务来证明它理解你所要求的内容,这通常以易于理解的列表式方式发生。您不需要明确告诉 GPT 构建分析步骤,因为它会在这里自行执行此操作。
这里对提示的添加不需要逐字复制,但最后的子句必须是疑问句,并且必须以“?”结束标点符号以便复制行为。 |
---|
如果您想使用预先构建的过程,可以按如下方式复制。将其附加到原始提示中:
“为了实现这一目标,让我们将其分解为一个逐步的过程。我们可以按照这个方法如下:
- 基本统计:我们首先分析对话数量、平均消息长度、交互频率等。
- 内容分析:我们将深入研究交互数据中的消息内容,以了解感兴趣的主题、常用短语、情绪等。
- 交互模式:我们将关注您如何与助手交互,例如您提出的问题类型、提供的反馈、格式和交互时间。
- 自定义指令开发:根据上述见解,我们将制定可用于简化未来交互的自定义指令。
你听懂指示了吗?”
GPT 似乎很看重这些指标。虽然它对我们来说似乎微不足道或无关紧要,但请记住,我们不是在构建这些指令供我们解释,而是为人工智能构建它们来解释。
发送此提示后,它将开始通过一系列响应、尝试和错误来逐步完成该过程。每个指令步骤之前可能会有一个子过程步骤来完成特定步骤的目标。完成给定超级步骤的子步骤所需的响应数量各不相同,但它应该达到正确的结果,除了“let's proceed!”
之外几乎没有任何干扰。 。
为了交叉检查和验证我的迭代用于完成这些任务的成功步骤,我在下面提供了它们。别担心,我并不期望使用这种技术的每个人都知道所有这些奇特的分析以及它们应该如何工作。您可以将此作为参考来了解什么有效以及需要寻找什么。如果人工智能建议它想做一些你不知道或不理解的事情,请告诉它按照以下步骤操作。您还可以使用大纲将子步骤匹配在一起,以确保其处于正确的轨道上。请记住,这是指导模型的大纲;我不建议将其作为提示逐字发送给模型。
请记住,GPT 不是神,您可能仍然需要提醒它一两次才能保持正轨并遵循流程。它可能想跳过一两步。一旦您成功地引导模型对上述所有分析结果做出响应,并且您可以看到它的工作,就到了最后阶段的时候了。不要离开太久;如果超时,GPT 将忘记由于不活动而获取的所有数据。您可以尝试要求它回顾整个对话,但根据对话的长度,可能会被证明是不可靠的。
分析结果已经获得,如果指导得当,应该已经输出了迄今为止的所有结果。您可以通过交叉检查提炼的说明与之前提供的结果来利用它来进行记忆、检索和验证。由于此数据是使用高级数据分析获取的,因此您可以返回并观察它如何计算这些结果。如果您遵循大纲,那么这些数字应该都是通过合法的分析技术以编程方式计算出来的,这意味着它们很可能是准确且重要的。 GPT 还能够总结数据的关键块和评估,因此任何不是数值的东西都是总结数据分析标准的直接结果。这很重要,因为当它提取出我们想要的最终结果并且数字不匹配时(它会发生),请提醒并参考它之前提供的关键数据点(或者,直接复制它们作为错误更正) 。准备就绪后,就可以将模型参考总体目标,并使用我们获得的结果向 GPT 提供清晰、明确的说明,说明我们想要什么(如果 GPT 确实如此,则应该热加载以供上下文参考)不超时)。
如果您之前注意到,我们没有提供详细、清晰的说明来说明这些自定义指令到底是什么以及我们希望如何构建和提炼它们。这是有意为之,以免压倒和/或误导 GPT 的注意力。到目前为止,我们一直在将 GPT 可以使用的信息上下文细化为一组可管理的部分。我们不是通过总结数据来压缩窗口的上下文,而是提取对人工智能来说最相关的数据部分。现在我们已经提取了这些细节,我们可以使用它作为我们的上下文来创建我们的精炼指令集。
“现在,请记住我们这次谈话的总体目标。创建这些自定义指令的目标是让人工智能快速了解我的用户类型,并根据我们迄今为止分析的整个交互数据创建个性化的自定义指令集。具体来说,这个平台上的人工智能就是你。有两个盒子。它们如下:
- 您希望 ChatGPT 了解您的哪些信息以便提供更好的回复?
- 您希望 ChatGPT 如何回应?
两个框的字符数限制均为 1500 个。挑战在于,我希望将来与 GPT 的交互能够了解有关我们之前的交互以及我如何使用该平台的准确信息。您现在可以使用统计结果和我的原始对话数据。我想要尽可能最准确和经过精心调整的指示,最好地浓缩我迄今为止与您所做的一切,有效且高效。我也想澄清,最好的结果不需要由我作为一个人来解释。如果最好将其概括为看似无意义的混乱文字或其他一些此类数据,那么只要它是压缩尽可能多的信息和意图以供助手解释的最佳且最准确的方式,那就可以了。这对你有用吗?”
此提示应该是您提供所需结果所需的一切。由此,它应该为您提供数据关键组成部分的详细分析摘要。将数值与之前的结果进行交叉检查以进行验证,并根据需要进行细化,要求附加您认为遗漏的任何相关信息。以我为例,它提供了一个两步响应过程;每个说明盒一个。
现在,使这一成功和有效的关键部分是最后一个提示中的第二段。这就是摘要技术与蒸馏技术的区别。当你总结时,目的是保持整个源材料的相对叙述和结构。理想情况下,摘要应该是同一事物的浓缩版本。在这里,我们的目标略有不同。我们希望数据中最重要的部分能够帮助人工智能更好地为未来的交互做好准备,并尽可能少地进行上下文解释,同时最大限度地减少重复的问题或短语(即“provide the output in a 5th-grade reading level”
)。为 1500 个字符。诀窍是通过让 GPT 本身提供这些有价值的见解来利用 GPT,无论我们是否有能力理解它的含义或为什么与之相关。您必须向 GPT 强调允许这种行为,并将人工智能的可解释性优先于人类的可解释性。因此,这可以被视为“蒸馏”数据的一种形式,因为我们正在将结果转换为结构和使用方式与其源材料不同的东西,但如果没有源材料本身就无法创建。
恭喜,您刚刚执行了数据蒸馏!与助手进行更轻松、更流畅的对话,减少摩擦和重复指令。
您可以在下面看到第一条指令的结果。这不是最终指示;我确实进一步完善了这一点,并附加了其他个人优化器,所以我很乐意分享这一点,因为这是即时响应。几个值已被编辑,但这描绘了结果的图片。您可以从这些数据中看到我如何使用这个平台以及人工智能认为与自身相关的内容。请注意我的谈话有多长。认识到高质量的提示不一定是将所有内容都变成一次性提示,而是高质量的提示指导以实现重要且有趣的结果。看看它与您的结果相比如何!
“用户参与了[有价值的]对话,平均长度约为 47 条消息。用户平均每条消息提出 1.21 个问题。用户的互动大多是积极的,偶尔有建设性反馈和错误报告。用户经常问“什么”、“ “How”、“Do”、“Is”类型的问题,更喜欢详细、全面的回答,用户的平均问题长度在[value]字左右,表明用户的交互主题包括开发、AI。讨论、语言学、数据操作、个人互动和脚本编写。”
本指南可作为任何有兴趣通过数据提炼提升与 ChatGPT 交互的人的综合资源。通过遵循概述的步骤,您不仅可以个性化您的体验,还可以进行有趣的交互式实验,根据您的个人需求定制人工智能助手,而无需对模型进行微调。
请记住,此过程是迭代和连续的,并且可能需要根据助理提供的具体响应进行一些尝试和错误。然而,结果——更直观、响应更灵敏的对话代理——是非常值得付出努力的。无论您是对人工智能潜力感到好奇的初学者,还是希望增强提示能力的专家,本指南都提供了一种灵活的探索性方法来帮助您前进。对于那些热衷于深入研究的人来说,高级数据分析和语言理论的大门现已敞开,并且可能性是无限的。
对于我的下一个技术,我将编写一个有用的方法,使用 DALL-E 3 进行简单、可操作的图像提示。
我会尽力回答任何问题并尽可能帮助他人。请随时告诉我您的想法!我感谢任何和所有的反馈!