当前位置：首页 > news >正文

JavaScript项目集成OpenAI API：从环境搭建到生产部署全指南

news 2026/6/1 5:36:44

1. 从零到一：在JavaScript项目中接入OpenAI API

如果你是一名JavaScript开发者，最近肯定没少听说OpenAI和它那些能写代码、能聊天的模型。你可能在想，这种听起来很“未来”的技术，离我的日常项目到底有多远？答案是：比你想象的要近得多。OpenAI提供了一套非常成熟的API，让你能像调用任何一个第三方服务一样，在你的Node.js后端或者浏览器前端（通过代理）里，轻松集成强大的语言处理能力。这不再是大型科技公司的专属玩具，而是每个开发者工具箱里都能拥有的一件利器。

我最初接触OpenAI API时，也以为会涉及复杂的机器学习部署和庞大的计算资源。但实际用下来发现，它本质上就是一个设计良好的RESTful API服务。你发送一段文本（我们称之为“提示”），它返回一段模型生成的文本。基于这个简单的核心，你可以玩出无数花样：从给你的博客CMS加一个自动摘要功能，到做一个能回答产品问题的客服聊天机器人，甚至是创建一个帮你起代码变量名的IDE插件。门槛并不高，核心在于你如何设计“提示”来引导模型为你工作。接下来，我会带你从注册账号、拿到密钥开始，到写出第一个能跑通的代码，并深入聊聊如何在实际项目中用好它，避开我当初踩过的那些坑。

2. 前期准备与环境搭建

在开始写代码之前，我们需要把“战场”准备好。这包括一个能运行JavaScript的环境、一个OpenAI的账户，以及最基本的项目结构。别担心，每一步都很直接。

2.1 核心工具与账号准备

首先，确保你的电脑上安装了Node.js。这是运行JavaScript服务端代码的引擎。去Node.js官网下载最新的LTS（长期支持）版本安装即可。安装完成后，打开终端或命令行，输入node -v和npm -v，如果能显示出版本号，说明安装成功。npm是Node.js的包管理器，我们待会儿就要用它来安装OpenAI官方库。

接下来是最关键的一步：获取OpenAI API密钥。这相当于你使用这项服务的通行证和计费凭证。你需要访问OpenAI的官方网站进行注册。注册过程就是常规的邮箱验证、手机号验证（部分地区可能需要）。完成注册并登录后，点击页面右上角的个人头像，在下拉菜单中找到“View API keys”选项。

进入API密钥管理页面后，点击“Create new secret key”按钮来生成一个新的密钥。这里有一个非常重要的注意事项：页面会弹出你的密钥字符串，并且明确提示你务必立即复制并保存好它，因为这个密钥只会完整显示这一次，关闭弹窗后就再也无法查看完整密钥了，只能重新生成。我建议你将其粘贴到一个临时的安全文档或密码管理器中，因为我们稍后会在代码里用到它。不用担心，这个密钥目前有免费试用额度（具体额度以OpenAI官方最新政策为准），足够你完成本教程和进行大量实验。

2.2 初始化项目与安装官方SDK

有了密钥，我们就可以创建项目了。打开终端，找一个合适的目录，执行以下命令来创建一个新的项目文件夹并初始化：

mkdir my-openai-project cd my-openai-project npm init -y

npm init -y命令会快速生成一个默认的package.json文件，里面记录了项目的基本信息和依赖。

现在，安装OpenAI官方提供的Node.js库。这个库封装了所有API调用细节，让我们能用更简洁的JavaScript对象和方法与API交互，而不用自己去手动构造HTTP请求。

npm install openai

安装完成后，你的package.json文件里dependencies部分就会多出一行"openai": "^x.x.x"。至此，最基本的环境就搭建好了。我建议你立即创建一个.gitignore文件，并在第一行就加上node_modules/和.env。node_modules是依赖包目录，不需要上传到代码仓库；.env是我们接下来要用来安全存储API密钥的环境变量文件，它绝对不能被公开。

3. 编写你的第一个AI交互程序

理论说得再多，不如一行代码来得实在。让我们从一个最简单的例子开始，感受一下API的魔力。我们将创建一个脚本，让AI帮我们生成一段关于“如何学习编程”的简短建议。

3.1 安全地管理API密钥

在写业务逻辑之前，我们必须先解决密钥安全问题。绝对不要将你的API密钥硬编码在代码文件里，尤其是如果你打算将代码上传到GitHub等公开平台。一旦密钥泄露，别人就可以用你的额度进行调用，可能导致不必要的费用。

行业通用的做法是使用环境变量。我们安装一个叫dotenv的包来简化这个过程：

npm install dotenv

然后在项目根目录下创建一个名为.env的文件，内容如下：

OPENAI_API_KEY=你的_真实_API_密钥_粘贴在这里

请将你的_真实_API_密钥_粘贴在这里替换成你之前保存的那一串以sk-开头的字符。注意，.env文件已经被我们排除在Git版本控制之外了。

3.2 基础文本补全代码实现

现在，在项目根目录创建一个index.js文件。我们将在这里编写主要的逻辑。

// 1. 加载环境变量配置（必须在其他模块引入前执行） require('dotenv').config(); // 2. 引入OpenAI库 const { Configuration, OpenAIApi } = require('openai'); // 3. 创建配置实例，从环境变量读取密钥 const configuration = new Configuration({ apiKey: process.env.OPENAI_API_KEY, }); // 4. 创建OpenAI API客户端实例 const openai = new OpenAIApi(configuration); // 5. 定义一个异步函数来生成文本 async function generateAdvice() { try { // 6. 调用API的“补全”接口 const response = await openai.createCompletion({ model: "text-davinci-003", // 指定使用的模型 prompt: "用简单易懂的语言，给一个想学编程的初学者三条核心建议。", // 给AI的指令 max_tokens: 150, // 限制生成文本的最大长度（约等于单词数） temperature: 0.7, // 控制创造力的参数，范围0-1，越高越随机 }); // 7. 从响应中提取生成的文本 const generatedText = response.data.choices[0].text.trim(); console.log("AI生成的建议：\n"); console.log(generatedText); } catch (error) { // 8. 错误处理 console.error("调用API时出错：", error.response ? error.response.data : error.message); } } // 9. 执行函数 generateAdvice();

让我们拆解一下这段代码的关键部分：

第1步：dotenv库读取.env文件，将其中的变量注入到process.env对象中。
第3步：创建配置时，我们使用process.env.OPENAI_API_KEY来引用密钥，这样密钥就不会出现在源代码中。
第6步：openai.createCompletion是核心方法。我们传递了一个配置对象：
- model: 这里用的是text-davinci-003，这是当时功能非常强大的一个通用文本生成模型。请注意，OpenAI的模型在持续更新，后续可能会有更优或更经济的模型（如gpt-3.5-turbo-instruct或gpt-4系列），使用时请查阅最新文档。
- prompt: 这是你与AI对话的“开场白”。提示词的质量直接决定生成结果的好坏。这里我们给了一个清晰、具体的指令。
- max_tokens: 令牌数，可以粗略理解为生成文本的长度上限。一个英文单词约等于1-2个令牌，中文汉字也差不多。设置上限可以控制成本。
- temperature: 这是一个非常重要的参数。它控制输出的随机性。设置为0时，模型每次都会对相同的提示给出最确定、最一致的答案（可能很枯燥）。设置为1时，创造性最高，但可能偏离主题。0.7是一个常用的平衡值，既有新意又不至于太离谱。
第8步：良好的错误处理是必须的。API调用可能因为网络、密钥无效、额度不足、参数错误等原因失败。这里我们尝试打印出服务器返回的具体错误信息，便于调试。

保存文件后，在终端运行：

node index.js

如果一切顺利，几秒钟后你就能在终端看到AI生成的、独一无二的三条学习编程的建议。恭喜你，你已经成功完成了第一次AI API调用！

4. 深入核心：参数解析与高级应用

第一次调用成功只是开始。要真正把API用活，必须理解每个参数背后的含义，并知道如何组合它们来实现不同的效果。此外，补全（Completion）接口只是起点，Chat completions接口才是目前构建对话应用的主流。

4.1 关键参数深度解读

在上面的例子中，我们接触了model,prompt,max_tokens,temperature。实际上，可调节的参数远不止这些。理解它们能让你从“能用”变成“会用”。

模型（Model）的选择与演进：text-davinci-003是一个优秀的“补全”模型，但它属于较早期的GPT-3系列。目前，OpenAI更推荐使用Chat Completions API及其对应的模型（如gpt-3.5-turbo,gpt-4）。这些模型经过专门优化，用于处理多轮对话，并且通过“消息”数组的格式来组织输入，更符合人类交互习惯，成本也往往更低。例如，完成同样的任务，gpt-3.5-turbo的成本可能只有davinci-003的十分之一。在开始新项目时，建议优先查阅官方文档，选择推荐的最新聊天模型。
提示工程（Prompt Engineering）入门：prompt是你与模型沟通的唯一方式。它的写法是一门艺术，被称为“提示工程”。一些基本技巧包括：
- 明确指令：不要说“写点关于狗的东西”，而要说“写一段吸引人的宠物店广告文案，重点突出金毛寻回犬友善、聪明的特点，面向家庭客户，字数在100字左右。”
- 提供示例（Few-shot Learning）：在提示中给出输入输出的例子，能极大地引导模型风格。
```
将中文翻译成英语，并保持专业语气。 示例1： 输入：这个项目的截止日期是下周。 输出：The deadline for this project is next week. 示例2： 输入：请确保代码质量。 输出：Please ensure the code quality. 现在请翻译：我们需要优化数据库查询性能。
```
- 角色扮演：让AI扮演一个特定角色，如“你是一位经验丰富的Python开发工程师”、“你是一位严厉的英语老师”。
创造性（Temperature）与稳定性（Top_p）：
- temperature（温度）：如前所述，控制随机性。对于需要确定性结果的场景（如代码生成、事实问答），可以设低（0.1-0.3）；对于创意写作、头脑风暴，可以设高（0.7-0.9）。
- top_p（核采样）：这是另一种控制随机性的方法，通常与temperature二选一。它表示从概率质量最高的令牌中采样，直到累积概率超过top_p。例如，top_p=0.9意味着模型只考虑概率累积到90%的那些最可能的单词。它通常能产生更集中、更一致的结果。
停止序列（Stop）与频率惩罚（Frequency Penalty）：
- stop：一个字符串数组，告诉模型在生成这些字符串时停止。例如，如果你在生成一个列表，可以设置stop: ["\n\n", "###"]，这样当模型连续输出两个换行或三个井号时就会停止，防止它一直说下去。
- frequency_penalty（频率惩罚）：介于-2.0到2.0之间。正值会根据令牌在文本中的现有频率对其进行惩罚，从而降低模型重复相同内容的可能性。对于长文本生成，设置一个较小的正值（如0.1）有助于避免啰嗦。

4.2 升级到Chat Completions API

让我们将之前的例子升级为更现代的Chat Completions格式。修改index.js文件：

require('dotenv').config(); const { Configuration, OpenAIApi } = require('openai'); const configuration = new Configuration({ apiKey: process.env.OPENAI_API_KEY, }); const openai = new OpenAIApi(configuration); async function chatWithAI() { try { const response = await openai.createChatCompletion({ model: "gpt-3.5-turbo", // 使用聊天模型 messages: [ // 输入是一个消息数组 { role: "system", // 系统消息，用于设定AI的“人设” content: "你是一位耐心且幽默的编程导师，擅长用比喻向初学者解释概念。" }, { role: "user", // 用户消息，即我们的问题 content: "用比喻的方式解释一下，什么是JavaScript中的‘异步编程’？" } ], max_tokens: 300, temperature: 0.8, }); // 响应结构略有不同 const aiReply = response.data.choices[0].message.content; console.log("AI导师的回答：\n"); console.log(aiReply); } catch (error) { console.error("出错：", error.response ? error.response.data : error.message); } } chatWithAI();

关键变化：

model: 换成了gpt-3.5-turbo。
messages: 取代了单一的prompt。这是一个对象数组，每个对象都有role（角色）和content（内容）属性。
- role: "system": 这条消息在对话开始时设定上下文和行为指令。它是“幕后”的指导，用户通常看不到。在这里，我们定义了AI的角色。
- role: "user": 代表用户说的话。
- role: "assistant": 代表AI之前的回复。在多轮对话中，你需要将历史对话按顺序放入这个数组，模型才能理解上下文。

这种格式天生支持多轮对话。如果你想进行连续对话，代码逻辑需要维护一个不断增长的messages数组，每次将新的用户问题和AI的回复都追加进去。

5. 构建一个简单的AI应用实例

理解了基础调用和参数后，我们来动手构建一个稍微有点实际用处的工具：一个命令行下的“代码解释器”。你给它一段代码片段，它用通俗的语言解释这段代码做了什么。

5.1 项目结构与核心逻辑

创建一个新的文件codeExplainer.js。我们将使用Node.js的readline模块来创建一个简单的交互式命令行界面。

require('dotenv').config(); const { Configuration, OpenAIApi } = require('openai'); const readline = require('readline'); // 用于读取命令行输入 const configuration = new Configuration({ apiKey: process.env.OPENAI_API_KEY, }); const openai = new OpenAIApi(configuration); // 创建readline接口实例 const rl = readline.createInterface({ input: process.stdin, output: process.stdout }); /** * 向OpenAI API发送请求，解释代码 * @param {string} codeSnippet - 需要解释的代码片段 * @returns {Promise<string>} - AI返回的解释文本 */ async function explainCode(codeSnippet) { // 构建一个更精确的提示词 const prompt = ` 请扮演一个资深的软件开发工程师，为初学者解释以下代码。 你的解释需要： 1. 用一句话概括这段代码的主要功能。 2. 逐行或按逻辑块解释关键语句的作用。 3. 指出代码中可能重要的编程概念或技巧。 4. 语言保持简洁、友好、鼓励。 代码： \`\`\`javascript ${codeSnippet} \`\`\` 解释： `; try { const response = await openai.createChatCompletion({ model: "gpt-3.5-turbo", messages: [ { role: "system", content: "你是一位善于教学、讲解清晰的资深软件工程师。" }, { role: "user", content: prompt } ], max_tokens: 500, temperature: 0.5, // 解释代码需要较高的准确性，温度设低一些 }); return response.data.choices[0].message.content.trim(); } catch (error) { console.error('API请求失败：', error.message); return `抱歉，解释生成失败：${error.message}`; } } /** * 主函数，启动交互式循环 */ function main() { console.log('=== AI 代码解释器 ==='); console.log('请输入一段JavaScript代码（输入“exit”退出）：\n'); // 递归函数，用于持续对话 function askForCode() { rl.question('> ', async (input) => { if (input.toLowerCase() === 'exit') { console.log('再见！'); rl.close(); return; } if (input.trim().length === 0) { console.log('输入不能为空，请重新输入。\n'); askForCode(); return; } console.log('\nAI正在思考...\n'); const explanation = await explainCode(input); console.log('--- 解释如下 ---'); console.log(explanation); console.log('----------------\n'); console.log('请继续输入代码，或输入“exit”退出：\n'); askForCode(); // 继续下一轮询问 }); } askForCode(); } // 启动程序 main();

5.2 运行与效果测试

在终端运行这个脚本：

node codeExplainer.js

程序启动后，你可以粘贴一段JavaScript代码进去。例如，输入：

const numbers = [1, 2, 3, 4, 5]; const squared = numbers.map(num => num * num); console.log(squared);

稍等片刻，AI可能会返回类似这样的解释：

=== AI 代码解释器 === 请输入一段JavaScript代码（输入“exit”退出）： > const numbers = [1, 2, 3, 4, 5]; const squared = numbers.map(num => num * num); console.log(squared); AI正在思考... --- 解释如下 --- 这段代码的主要功能是计算一个数组中每个数字的平方，并将结果打印出来。 1. `const numbers = [1, 2, 3, 4, 5];` - 这行代码声明了一个名为 `numbers` 的常量，并用一个包含数字1到5的数组对其进行初始化。`const` 意味着这个变量不能被重新赋值。 2. `const squared = numbers.map(num => num * num);` - 这是核心的一行。它在 `numbers` 数组上调用 `.map()` 方法。 - `.map()` 方法会遍历数组中的每一个元素（这里是 1, 2, 3, 4, 5）。 - 对于每个元素（我们临时称它为 `num`），它执行箭头函数 `num => num * num`，即计算 `num` 的平方。 - `.map()` 会收集每次函数调用的结果（1, 4, 9, 16, 25），并**返回一个新的数组**。这个新数组被赋值给常量 `squared`。 - **重要概念**：`.map()` 是函数式编程中常见的“转换”方法，它不修改原数组，而是生成新数组。 3. `console.log(squared);` - 这行代码将 `squared` 这个新数组的内容输出到控制台。你会看到 `[1, 4, 9, 16, 25]`。 **技巧**：使用 `.map()` 是处理数组转换非常简洁和声明式的方式。箭头函数 `num => num * num` 是ES6语法，让代码更简洁。 ---------------- 请继续输入代码，或输入“exit”退出：

这个简单的例子展示了如何将API集成到一个有交互逻辑的应用中。你可以在此基础上扩展，比如增加支持多种编程语言的选择、将解释保存到文件，甚至做一个带前端界面的网页版工具。

6. 生产环境考量与常见问题排查

当你准备将基于OpenAI API的功能部署到真实的生产环境时，有几个至关重要的方面需要考虑，这直接关系到应用的稳定性、成本和用户体验。

6.1 性能、成本与限流策略

速率限制（Rate Limiting）： OpenAI API对所有用户都有速率限制，通常以RPM（每分钟请求数）和TPM（每分钟令牌数）来衡量。免费用户和付费用户的限制不同。如果你的应用突然收到大量请求，很容易触发限流，导致API返回429错误。解决方案：
- 实现请求队列与重试：在客户端或服务端，对API请求进行排队，并加入指数退避策略的重试机制。例如，第一次失败后等待1秒重试，第二次失败后等待2秒，以此类推。
- 使用官方推荐的批处理：对于非实时性的任务，可以将多个独立的文本生成请求合并为一个批处理请求发送，这比逐个发送更高效。
- 监控使用情况：定期检查OpenAI仪表板上的使用量统计，接近限制时进行预警或降级处理。
成本控制： API调用按令牌数计费。不同模型价格不同。控制成本的黄金法则是精细化管理max_tokens参数。不要为了省事而设置一个非常大的值。根据你预期的回答长度，设置一个合理的上限。例如，对于一个摘要功能，max_tokens=150可能就够了；对于长文生成，可能需要max_tokens=1000。同时，对用户输入（prompt）的长度也要有所限制，因为输入的令牌也是计费的。

超时与错误处理：网络请求总有可能失败。你的代码必须要有健壮的错误处理。

async function robustAPICall(prompt) { const maxRetries = 3; let lastError; for (let i = 0; i < maxRetries; i++) { try { const response = await openai.createChatCompletion({ model: "gpt-3.5-turbo", messages: [{ role: "user", content: prompt }], max_tokens: 150, temperature: 0.7, }); return response.data; // 成功则直接返回 } catch (error) { lastError = error; console.warn(`API调用失败，第${i + 1}次重试...`, error.message); // 如果是速率限制错误，等待更长时间 if (error.response && error.response.status === 429) { const waitTime = Math.pow(2, i) * 1000 + Math.random() * 1000; // 指数退避 await new Promise(resolve => setTimeout(resolve, waitTime)); } else if (error.code === 'ETIMEDOUT' || error.code === 'ECONNRESET') { // 网络超时或连接重置，短暂等待后重试 await new Promise(resolve => setTimeout(resolve, 1000 * (i + 1))); } else { // 其他错误（如认证失败、参数错误），通常重试无意义，直接跳出 break; } } } throw lastError; // 重试多次后仍失败，抛出最后的错误 }

6.2 安全与内容审核

API密钥安全：重申一遍，永远不要在前端代码（浏览器JavaScript）中硬编码或直接暴露API密钥。恶意用户可以通过浏览器开发者工具轻松窃取它，然后用你的密钥疯狂调用API，导致巨额账单。正确的做法是构建一个后端服务（如Node.js + Express的API服务器）。前端将用户输入发送到你的后端，后端使用密钥调用OpenAI API，再将结果返回给前端。这样密钥就安全地保存在你的服务器上。

内容安全护栏（Moderation）： OpenAI的模型是基于海量互联网数据训练的，理论上可能生成任何内容，包括有害、偏见或不当的信息。OpenAI提供了免费的Moderation API，你可以在将AI生成的内容展示给用户之前，先发送给这个API进行检查。

async function checkContentSafety(text) { try { const moderationRes = await openai.createModeration({ input: text, }); const results = moderationRes.data.results[0]; if (results.flagged) { console.warn('内容被标记为不安全:', results.categories); return false; // 内容不安全 } return true; // 内容安全 } catch (error) { console.error('内容审核API调用失败:', error); // 审核失败时，根据你的策略决定是否放行。通常为了安全，选择不放行。 return false; } } // 在返回AI生成的内容给用户前调用 const isSafe = await checkContentSafety(aiGeneratedText); if (!isSafe) { return "抱歉，生成的内容未能通过安全检查。"; }

用户输入净化：永远不要盲目信任用户输入。用户可能会输入非常长的提示词来消耗你的令牌，或者输入恶意指令试图让AI泄露系统提示词（一种叫“提示词注入”的攻击）。对你的后端接口进行输入验证，限制输入长度，并对敏感关键词进行过滤。

7. 实战经验与进阶技巧

经过多个项目的实践，我积累了一些在官方文档里不一定能找到的经验和技巧，这些能帮你少走很多弯路。

7.1 提示词设计的艺术

好的提示词是成功的一半。除了之前提到的明确指令和角色扮演，还有一些高级技巧：

思维链（Chain-of-Thought）：对于复杂推理问题，在提示词中要求模型“一步一步地思考”或“让我们先分析一下问题”，可以显著提高答案的准确性和逻辑性。

用户： 一个篮子里有5个苹果，我拿走了2个，又放进去3个梨，最后篮子里有多少个水果？ 系统： 请逐步推理。 助理： 首先，开始时篮子里有5个苹果。拿走2个苹果后，剩下 5 - 2 = 3个苹果。然后，放进去3个梨。现在篮子里有3个苹果和3个梨。水果的总数是 3 + 3 = 6个。所以，最后篮子里有6个水果。

在你的系统提示中，可以加入“请逐步推理，并在最后给出答案”这样的指令。

输出结构化：如果你希望AI返回JSON、XML或特定格式的列表，直接在提示词中说明。

请将以下会议纪要的要点提取出来，并以JSON格式返回，包含`topic`（主题）、`action_items`（行动项，数组）、`next_meeting_time`（下次会议时间）三个字段。 会议纪要：...

这样，你就可以直接用JSON.parse()来解析AI的返回结果，方便后续程序处理。

迭代优化：不要指望一次就写出完美的提示词。将AI的输出与你期望的输出进行对比，找出差距，然后不断修改和细化你的提示词。这是一个实验过程。我通常会为每个功能维护一个“提示词版本库”，记录下哪些提示词效果更好。

7.2 处理长文本与上下文限制

所有GPT模型都有上下文窗口限制，即它们能“记住”的输入+输出的总令牌数是有限的。对于gpt-3.5-turbo，通常是4096或16384个令牌（具体看版本）。如果你要总结一篇很长的文档，或者进行一场很长的对话，很容易超出限制。

解决方案是“分而治之”：

文本分割：将长文档按段落、章节或固定字符数分割成多个片段。
分步处理：对每个片段分别调用API进行处理（如总结、提取关键词）。
结果聚合：将每个片段处理后的结果再组合起来，如果需要，可以对这个组合后的摘要再进行一次概括。

例如，总结一本电子书：

async function summarizeLongDocument(longText, chunkSize = 3000) { // 1. 简单地将长文本按字符数分割（更优的方法是按句子或段落分割） const chunks = []; for (let i = 0; i < longText.length; i += chunkSize) { chunks.push(longText.substring(i, i + chunkSize)); } const summaries = []; // 2. 对每个分块进行总结 for (const chunk of chunks) { const prompt = `请用一句话总结以下文本的核心内容：\n\n${chunk}`; const summary = await callOpenAI(prompt); // 假设这是你封装的API调用函数 summaries.push(summary); } // 3. 将所有分块的总结合并，再生成一个最终总结 const finalPrompt = `以下是某文档各个部分的摘要，请基于这些摘要，生成一段完整的、连贯的总体摘要：\n\n${summaries.join('\n')}`; const finalSummary = await callOpenAI(finalPrompt); return finalSummary; }

这个过程虽然增加了API调用次数，但它是处理超长文本的唯一可行方法。记得在成本和效果之间取得平衡。

7.3 调试与日志记录

当AI的输出不符合预期时，如何调试？我的建议是建立完善的日志记录。

记录完整的请求和响应：在开发阶段，将每次发送给API的messages数组和收到的完整响应对象（至少是choices[0].message）记录到日志文件或控制台。这能让你清晰地看到“对话”是如何进行的。
为每次调用添加“会话ID”：如果你的应用同时服务多个用户，为每个对话线程生成一个唯一的ID，并记录所有相关的API调用。这样当某个用户反馈结果很奇怪时，你可以通过会话ID回溯整个交互过程，精准定位问题。
监控令牌使用：API响应里通常包含usage字段，里面有prompt_tokens（输入令牌数）、completion_tokens（输出令牌数）和total_tokens（总令牌数）。记录这些数据，可以帮助你分析成本分布，并优化那些消耗令牌过多的提示词。

将OpenAI API集成到JavaScript项目中，开始可能只是几行代码的好奇心尝试，但深入下去，你会发现它背后涉及的系统设计、提示工程、成本优化和安全考量同样充满挑战和乐趣。从今天起，不再只是使用AI工具，而是开始创造由AI驱动的新功能，这或许是你作为开发者迈向下一个台阶的起点。

查看全文

http://www.gsyq.cn/news/1438652.html