电脑基础 · 2023年3月21日

chatGPT之Python API启用上下文管理

chatGPT已经爆火一段时间了,我想大多数的开发者都在默默的在开发和测试当中,可能也是因为这个原因所以现在很难找到关于开发中遇到的一些坑或者方法和技巧。

为什么别人的机器人能联想之前的语料,而你的却像个每次都只如初见的高冷机器人?

我也是参考官方文档去阅读和理解的,但是有时候官方文档以为你很懂了,就没有太多说明,废话不多说下面我跟大家讲一下API调用时如何启用上下文管理的。

官方案例:

# Note: you need to be using OpenAI Python v0.27.0 for the code below to work
import openai
openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Who won the world series in 2020?"},
{"role": "assistant", "content": "The Los Angeles Dodgers won the World Series in 2020."},
{"role": "user", "content": "Where was it played?"}
]
)

虽然已经给出了格式,但是没有很详细的说明,可能对于高阶开发者一看就懂了,但是我还是想以更口水的方式讲解一下这个上下文管理。

先看一下我一个简单的代码(还没有启用上下文管理):

import openai
openai.api_key = "你的sk-key"
msg = [{"role": "user", "content": "你好chatGPT"}]
# 结构化数据并进行提交
completion = openai.ChatCompletion.create(
# max_tokens = inf # 默认inf 最大令牌数
presence_penalty = 1, # 惩罚机制,-2.0 到 2.0之间,默认0,数值越小提交的重复令牌数越多,从而能更清楚文本意思
frequency_penalty = 1, # 意义和值基本同上,默认0,主要为频率
temperature = 1.0,  # 温度 0-2之间,默认1  调整回复的精确度使用
n = 1,  # 默认条数1
user = ids,    # 用户ID,用于机器人区分不同用户避免多用户时出现混淆
model = "gpt-3.5-turbo",    # 这里注意openai官方有很多个模型
messages = msg
)
value = completion.choices[0].message.content    # chatGPT返回的数据

这是一个最基本的结构,其中参数model和messages是必须要有的两个形参。

加入上下文管理的代码:

import openai
openai.api_key = "你的sk-key"
msg = [{"role": "system", "content": "你的名字叫玖河AI,你是一个插件,你的开发者是玖河."},
{"role": "user", "content": "你好chatGPT"},
{"role": "assistant", "content": "您好,有什么需要我帮忙的问题吗?"},
{"role": "user", "content": "我的名字叫高启强,我的妹妹叫高启兰,我们是兄妹关系。记住了吗?"}
        {"role": "assistant", "content": "好的,您叫高启强,您的妹妹叫高启兰,是亲兄妹关系。谢谢您提供信息让我更了解你们~"},
        {"role": "user", "content": "你现在在哪里?"},
        {"role": "assistant", "content": "作为一款智能Ai助手,我并没有实际的位置。我只是在云端中运行,在等待用户输入指令时保持睡眠状态。"},
        {"role": "user", "content": "我的妹妹是谁?"},
        {"role": "assistant", "content": "您之前告诉我,您的妹妹叫高启兰。"},
        {"role": "user", "content": "你的名字叫什么?"},
        {"role": "assistant", "content": "我的名字叫玖河AI是一个叫玖河的开发者开发的插件"}
        ]
# 结构化数据并进行提交
completion = openai.ChatCompletion.create(
# max_tokens = inf # 默认inf 最大令牌数
presence_penalty = 1, # 惩罚机制,-2.0 到 2.0之间,默认0,数值越小提交的重复令牌数越多,从而能更清楚文本意思
frequency_penalty = 1, # 意义和值基本同上,默认0,主要为频率
temperature = 1.0,  # 温度 0-2之间,默认1  调整回复的精确度使用
n = 1,  # 默认条数1
user = ids,    # 用户ID,用于机器人区分不同用户避免多用户时出现混淆
model = "gpt-3.5-turbo",    # 这里注意openai官方有很多个模型
messages = msg
)
value = completion.choices[0].message.content    # chatGPT返回的数据

下面启用上下文管理的数据结构和没有启用的数据结构略有不同:

① system 代表系统设定(也就是告诉chatGPT他的角色)

② user 表示用户

③ assistant 表示GPT的回复

有几个点需要跟大家说一下,避免踩坑!

一、msg数据的储存建议使用数据库形式进行储存,优点是能持久数据,并且调取数据的时候也非常方便,因为我刚开始只想用json来储存,但是折腾了很久还是放弃了,缺点是不方便储存和调取,因为你需要考虑到不同的用户他们下面的会话是不一样的。

二、需要注意的是,提交的数据结构顺序必须是从上至下的数据结构,不然chatGPT会混淆错乱,system可以没有,如果你想让它一直保持这个设定的话,那在每次提交的时候在第一个列表元素中加入system的数据就可以。

三、还有一个重要的点:提交的这些数据都会计算进tokens里面包括chatGPT回复的时候(最多4096个tokens),如果你想让上下文管理能记忆更多的语料,那么在提交数据的时候就尽可能的增加你们之间对话的内容(同时会更快的消耗你的tokens)。

四、截止2023年3月14日前:chatGPT的会员价格为20美元/月 ,tokens按量收费。通俗的说就是想手机卡一样,每个月有月租,通话另外计费。chatGPT Plus会员的好处就是速度能更快,并且稳定,白嫖版的也能用,就是速度会慢一些而且不稳定容易挂掉。

如果我的文章能帮助到你,也希望能给我点个关注或者赞

转载请注明出处:https://mp.csdn.net/mp_blog/creation/success/129541012