当前位置：首页 > news >正文

Qwen-code Web界面：从终端焦虑到优雅交互的实践指南

news 2026/7/3 22:59:11

1. 项目概述：为什么一个Web界面能真正缓解“终端焦虑”

“优雅永不过时”不是一句空泛的审美口号，而是对开发者日常体验的一次精准诊断。我用Qwen-code已经快一年了，从最初在VS Code里敲qwen-code --help查参数，到后来写脚本自动加载模型、批量处理代码补全请求，再到最近开始调试多轮对话状态管理——整个过程里，最常打断心流的，从来不是模型响应慢，而是终端本身：窗口被误关、命令输错要重来、想对比两次输出得开三个tab、同事远程协作时还得截图发命令、甚至Mac上按错Ctrl+C把整个会话干掉，得重新激活虚拟环境再加载模型……这些不是bug，是终端作为纯文本交互范式的天然局限。

而“终端焦虑”这个词，我是在和五位不同背景的开发者聊完后确认的：前端同学说“每次配环境都要截图发给测试，怕ta输错路径”；AI研究员抱怨“实验记录全靠手写notebook，终端里跑十次实验，结果散落在不同窗口，合并分析像考古”；运维同事直接甩出截图——他用tmux分屏跑Qwen-code服务+日志+curl测试，但新来的实习生根本不敢碰。这不是能力问题，是交互成本太高。

所以这个项目的核心，不是“给Qwen-code加个网页壳”，而是重构人与代码生成模型的交互链路。我们选Web界面，是因为它天然解决四件事：跨平台一致性（Windows/Mac/Linux打开同一地址就能用）、状态可沉淀（历史请求自动存、可搜索、可导出）、协作零门槛（分享链接即共享上下文）、操作可收敛（输入框+按钮+下拉菜单，比记--temperature 0.7 --max-tokens 512友好太多）。registry-ui这类工具之所以火，本质是大家终于意识到：CLI是给机器写的，UI才是给人用的。Qwen-code本身足够强大，缺的只是一个不增加认知负担的“翻译层”。

你不需要是全栈工程师也能上手——整个方案基于Python生态，核心依赖只有Flask + Jinja2 + Qwen-code SDK，部署后就是一个单页应用，没有数据库、不依赖云服务、本地运行无外网调用。适合三类人直接抄作业：刚接触Qwen-code想快速试效果的新手；团队内部需要统一接入点的中台同学；以及像我这样，受够了终端里反复source venv/bin/activate的老兵。

2. 整体架构设计：为什么放弃Streamlit/Gradio，坚持手写Flask

很多人看到“Web界面”第一反应是Streamlit或Gradio——毕竟它们三行代码就能起页面。但我实测了七种方案，最终砍掉所有“一键生成”工具，选择从零搭Flask，原因很实在：可控性、可维护性、可扩展性这三点，直接决定这个界面是“能用”还是“敢用”。

先说Streamlit的问题。我用它跑了三天Qwen-code demo，表面丝滑：st.text_input接输入，st.button触发调用，st.write输出结果。但当需要加一个“保存当前会话为JSON”功能时卡住了——Streamlit的state管理是单向的，每次button点击都会重跑整个脚本，之前输入的历史记录全丢。想持久化？得硬接SQLite，但Streamlit官方文档明确警告：“不要在生产环境用内置缓存做状态存储”。更致命的是调试：Streamlit把所有逻辑塞进一个.py文件，当你要加请求日志、错误熔断、模型切换下拉框时，代码迅速变成意大利面条。

Gradio稍好，组件化清晰，gr.Dropdown切模型、gr.Slider调temperature都很直观。但它默认把所有输入输出序列化成JSON传给后端，而Qwen-code的streaming响应（逐字吐token）在Gradio里要额外写yield逻辑，且前端无法控制流速——用户按住“停止生成”按钮，后端可能还在吐token，导致UI卡死。我抓包发现Gradio的WebSocket协议层封装太深，想加自定义header（比如透传用户ID做审计）得改源码。

最终选定Flask，不是因为它多酷，而是它足够“薄”。整个架构就三层：

前端层：纯HTML + Bootstrap 5 + vanilla JS，不引入React/Vue，避免打包构建流程。所有交互逻辑写在<script>里，比如点击“清空历史”直接操作DOM，不走AJAX来回。
路由层：Flask的@app.route只做三件事——接收POST请求、调用Qwen-code SDK、返回JSON。没有中间件、没有ORM，每个endpoint对应一个明确动作。
模型层：用Qwen-code官方Python SDK（qwen_code包），通过QwenCodeClient(model_name="qwen2.5-coder-32b-instruct")初始化，所有参数透传，不封装黑盒。

这个设计带来两个关键收益：
第一，调试像呼吸一样自然。终端里flask run --debug启动，Chrome按F12看Network，每个请求的request payload、response body、耗时一目了然。某次遇到中文乱码，直接在Flask route里加print(repr(request.json.get("prompt")))，发现是前端没设Content-Type: application/json;charset=utf-8，两分钟定位。
第二，扩展毫无阻力。上周团队提需求：“希望支持上传.py文件让Qwen-code自动写单元测试”。我只新增一个/api/generate-test路由，前端加个<input type="file">，后端用request.files['file']读取二进制，转成字符串传给Qwen-code——全程没动其他代码，也没重启服务。

有人问为什么不选FastAPI？它异步性能确实好，但Qwen-code SDK本身是同步阻塞的（调用client.chat()会等模型返回完整结果），强行套async反而增加复杂度。Flask的同步模型在这里反而是优势：代码线性执行，出错堆栈直指问题行，新人接手三天就能改功能。

3. 核心细节解析：从零搭建Web界面的七个关键决策点

3.1 前端交互设计：为什么用Bootstrap而非Tailwind

选Bootstrap 5而不是当下更火的Tailwind，纯粹出于“降低协作门槛”的务实考量。我们团队有三位前端，一位主攻Vue，一位专精React，还有一位是Python后端兼简单页面。如果用Tailwind，光是配置tailwind.config.js、搞清楚@layer components怎么用，就得花半天。而Bootstrap的class名全是语义化的：btn btn-primary就是按钮，form-control就是输入框，alert alert-success就是成功提示——连那位Python后端同事都能看懂并修改样式。

更重要的是，Bootstrap的栅格系统（Grid System）完美匹配Qwen-code的典型使用场景。比如用户需要同时看“原始代码”、“Qwen-code改写建议”、“diff对比”三块内容，我用<div class="row">包住三个<div class="col-md-4">，在桌面端平分宽度，手机端自动堆叠。而Tailwind要实现同样效果，得写grid grid-cols-1 md:grid-cols-3 gap-4，对非专职前端来说，记忆成本高且易出错。

实际开发中，我做了两个关键定制：

禁用所有JavaScript插件。Bootstrap默认带modal、tooltip等JS组件，但我们不需要。在base.html里只引入CSS CDN，JS部分完全删掉，避免和自定义JS冲突。
重写表单验证逻辑。原生Bootstrap的:valid/:invalid伪类依赖<form>提交，而我们的交互是AJAX，所以用vanilla JS监听input事件，实时检查prompt长度是否超过2000字符（Qwen-code的推荐上限），超长时动态添加is-invalid类并显示提示文字。代码就12行，比学Bootstrap的JS API快得多。

提示：别迷信框架的“高级功能”。很多所谓“现代化”工具，其复杂度90%是用来解决它自己制造的问题。Bootstrap的“土”，恰恰是它在小团队快速落地的护城河。

3.2 模型调用封装：如何安全透传Qwen-code所有参数

Qwen-code SDK的参数远不止prompt和model，官方文档列了17个可选参数，比如temperature（控制随机性）、top_p（核采样阈值）、max_new_tokens（最大生成长度）、stop_words（停止词）。如果前端只暴露一个输入框，等于把专业能力锁死了。

我的方案是：前端用折叠面板（Accordion）分组展示参数，后端1:1透传，不做任何默认值覆盖。具体实现分三步：

参数分类：把17个参数按用途分四组——基础控制（temperature/top_p）、长度限制（max_new_tokens/repetition_penalty）、高级功能（stop_words/seed）、调试相关（logprobs/echo）。每组一个Bootstrap Accordion Item。
前端渲染：用Jinja2模板循环渲染参数。例如temperature是slider，stop_words是textarea（换行分隔），seed是number input。关键点在于：所有input的name属性严格对应SDK参数名，如<input name="temperature" type="range">。
后端透传：Flask route里用request.json接收全部数据，过滤掉空值和非法类型，然后解包成**kwargs传给client.chat()。重点来了——不设任何默认值。如果用户没动temperature滑块，request.json里就没有这个key，**kwargs自然不包含它，Qwen-code就用自身默认值（0.8）。这样既保证灵活性，又避免“前端设了0.5，后端又覆盖成0.7”的混乱。

实测发现一个坑：stop_words参数必须是list类型，但前端textarea提交的是字符串。我的解法是在后端加转换逻辑：

if "stop_words" in data and data["stop_words"].strip(): data["stop_words"] = [word.strip() for word in data["stop_words"].split("\n") if word.strip()]

这样用户在textarea里写：

def return pass

后端自动转成["def", "return", "pass"]，符合SDK要求。

3.3 历史会话管理：为什么用localStorage而非后端存储

Qwen-code Web界面的核心价值之一，是让每次对话“可追溯、可复现”。但要不要把历史存到后端数据库？我花了两天压测对比，结论很明确：纯前端localStorage足够，且更安全、更快、更简单。

理由有三：

数据敏感性低：用户和Qwen-code的对话内容，本质是代码片段和自然语言指令，不涉及密码、身份证号等高敏信息。localStorage虽是明文存储，但仅限本机浏览器访问，风险可控。
性能碾压：localStorage读写是毫秒级，而HTTP请求+数据库查询至少50ms起步。我模拟100条历史记录，localStorageJSON.parse(sessionStorage.getItem('history'))耗时0.3ms，而fetch('/api/history')平均127ms。对于追求即时反馈的代码补全场景，这差距肉眼可见。
离线可用：网络中断时，用户仍能查看历史、重新发送旧请求——这对经常在高铁、咖啡馆工作的开发者是刚需。

实现上，我用sessionStorage而非localStorage，因为前者在关闭标签页后自动清理，避免历史记录无限膨胀。结构设计成数组，每项是对象：

{ "id": "sess_abc123", "timestamp": "2024-06-15T14:23:01Z", "prompt": "把这段Python代码改成异步版本：def fetch_data():...", "response": "import asyncio\nasync def fetch_data():...", "params": {"temperature": 0.3, "max_new_tokens": 1024} }

前端JS用sessionStorage.setItem('qwen_history', JSON.stringify(historyArray))存，用JSON.parse(sessionStorage.getItem('qwen_history') || '[]')取。唯一要注意的是sessionStorage容量限制（通常5MB），所以我加了自动清理：当数组长度超50条，删除最旧的10条。

注意：别被“必须上数据库”的思维绑架。很多场景下，浏览器自带的存储机制，就是最优雅的解决方案。

3.4 错误处理机制：如何把Qwen-code的报错翻译成开发者能懂的语言

Qwen-code SDK抛出的异常，对开发者很友好，但对普通用户就是天书。比如QwenCodeConnectionError，底层可能是网络超时，也可能是API Key无效，还可能是模型服务宕机。如果前端直接显示ConnectionError: HTTPConnectionPool(host='localhost', port=8000): Max retries exceeded...，用户第一反应是“我的电脑坏了”。

我的处理策略是：后端做错误归因，前端做友好降级。

后端归因：在Flask route的try...except里，针对不同异常类型返回结构化错误码：
- QwenCodeConnectionError→{"error_code": "CONNECTION_FAILED", "message": "模型服务未响应，请检查是否已启动"}
- QwenCodeAuthenticationError→{"error_code": "AUTH_FAILED", "message": "API Key无效，请检查配置"}
- QwenCodeRateLimitError→{"error_code": "RATE_LIMIT_EXCEEDED", "message": "请求过于频繁，请1分钟后重试"}
- 其他未分类异常 →{"error_code": "UNKNOWN_ERROR", "message": "服务内部错误，请重试或联系管理员"}
前端降级：JS收到错误响应后，不弹alert，而是在输入框下方显示Bootstrap Alert：
```
<div class="alert alert-danger mt-2" role="alert" id="error-alert"> <strong>出错了！</strong> 模型服务未响应，请检查是否已启动 </div>
```
并且自动聚焦到输入框，方便用户立刻重试。更关键的是，所有错误都记录到console，附带完整stack trace，方便调试。

实测效果：之前用户反馈“点按钮没反应”，现在能看到明确提示，80%的问题用户自己就解决了。剩下20%的UNKNOWN_ERROR，我让前端在报错时自动收集navigator.userAgent和performance.now()时间戳，发到Sentry，错误率从每周12次降到2次。

3.5 部署轻量化：为什么用Gunicorn+nginx而非Docker

看到“Web界面”就想到Docker？我承认它很酷，但在这个项目里，Docker是典型的“杀鸡用牛刀”。我们目标是让一个Python新手，用三条命令就能跑起来，而不是教他写Dockerfile、建镜像、配volume。

最终部署方案极简：

进程管理：用Gunicorn替代Flask内置服务器。gunicorn -w 2 -b 0.0.0.0:5000 app:app，2个工作进程足够应付日常使用，内存占用比Docker容器低60%。
反向代理：用nginx做静态文件托管和端口转发。所有HTML/CSS/JS放在/static目录，nginx直接location /static { alias /path/to/static/; }，不经过Python。/api/*路径则proxy_pass http://127.0.0.1:5000;。
开机自启：Linux用systemd写个service文件，Windows用NSSM工具注册为服务——两套方案我都写了详细文档，用户复制粘贴就能用。

为什么不用Docker？三个现实痛点：

磁盘空间：一个最小化Python镜像+Qwen-code依赖，轻松破1GB。而Gunicorn方案，整个部署包（含venv）不到80MB。
学习成本：新手要理解docker build、docker run -p、-v卷映射，不如直接pip install gunicorn来得直接。
调试障碍：docker logs -f看日志没问题，但想进容器docker exec -it调试，得先学会bash命令，而ps aux | grep gunicorn后kill -9再flask run，对所有人都是零门槛。

实操心得：技术选型的第一原则，不是“最先进”，而是“最不容易出错”。Gunicorn+nginx组合，十年没变过，文档遍地都是，这才是生产环境的底气。

3.6 安全加固：如何防止CSRF和XSS攻击

Web界面一旦开放，安全就是底线。虽然这是内部工具，但绝不能留漏洞。我做了三件事，全部基于Flask原生能力，不引入额外库：

CSRF防护：用Flask-WTF的CSRFProtect。在app.py里初始化csrf = CSRFProtect(app)，前端表单加{{ csrf_token() }}，后端route加@csrf.exempt（因为我们的API是JSON POST，不走表单提交）。等等——既然不走表单，为什么还要CSRF？因为浏览器同源策略下，恶意网站可以用<form action="http://localhost:5000/api/chat" method="POST">诱导用户点击提交，窃取会话。所以所有/api/*路由都强制校验X-CSRF-Tokenheader，前端JS在每次请求头里带上headers: {'X-CSRF-Token': document.querySelector('meta[name=csrf-token]').getAttribute('content')}。
XSS防护：Jinja2模板默认开启autoescape，所有变量渲染都自动转义<为<。但有个例外：Qwen-code返回的代码块，需要保留<符号才能正确显示。我的解法是，在模板里用|safe过滤器，但只对明确来自模型输出的字段，如{{ response|safe }}，而用户输入的prompt永远不加|safe。
CORS限制：用Flask-CORS设origins=["http://localhost:3000", "http://127.0.0.1:5000"]，禁止外部域名调用API。生产环境甚至可以设origins=["https://your-company.com"]，彻底锁死。

最关键的一步是API Key隔离。Qwen-code的API Key绝不能写在前端JS里！我把它存在环境变量QWEN_CODE_API_KEY，Flask启动时读取，初始化QwenCodeClient(api_key=os.getenv("QWEN_CODE_API_KEY"))。这样Key只存在于服务端内存，前端完全接触不到。

3.7 性能优化：首屏加载从3.2秒压到0.8秒的实战技巧

Web界面的“优雅”，一半在功能，一半在体验。我测过初始版本：Chrome DevTools显示首屏加载3.2秒，主要卡在两点——Bootstrap CSS文件（124KB）和jQuery（87KB）的下载解析。

优化方案分三步，全部不改业务逻辑：

CSS按需加载：Bootstrap官网提供Customize功能，我只勾选Reboot、Grid、Buttons、Forms、Alerts五个模块，生成精简版CSS，体积从124KB降到28KB。
移除jQuery：原计划用jQuery处理AJAX，但vanilla JS的fetch()API已足够成熟。把所有$.post()换成fetch()，删掉jQuery引用，省下87KB。
资源预加载：在HTML<head>里加<link rel="preload" href="/static/css/bootstrap.min.css" as="style">，让浏览器优先下载CSS。

效果立竿见影：首屏加载降至0.8秒，Lighthouse评分从52分升到94分。更妙的是，所有优化都发生在静态资源层，后端代码一行没动。这印证了一个真理：性能优化的黄金法则，是先砍掉不必要的东西，而不是给现有东西加速。

4. 实操过程详解：从创建项目到上线运行的完整步骤

4.1 环境准备：三分钟完成Python环境搭建

别被“Web开发”吓到，整个项目对环境要求极低。我用的是Python 3.9+（Qwen-code SDK最低要求），操作系统无关——Mac、Windows、Ubuntu操作几乎一致。以下是实测有效的三分钟流程：

第一步：创建独立虚拟环境
打开终端（是的，这里还得用一次终端，但最后一次！），执行：

# 创建名为qwen-web的虚拟环境 python -m venv qwen-web # 激活环境（Mac/Linux） source qwen-web/bin/activate # 激活环境（Windows） qwen-web\Scripts\activate.bat

提示：虚拟环境名字随意，但建议和项目名一致，避免混淆。激活后，终端提示符前会显示(qwen-web)，这是唯一需要记住的视觉标记。

第二步：安装核心依赖
在已激活的虚拟环境中，执行：

pip install --upgrade pip pip install flask==2.3.3 qwen-code-sdk==0.2.1 gunicorn==21.2.0

注意版本号：flask==2.3.3是LTS稳定版，qwen-code-sdk==0.2.1是当前最新兼容版（截至2024年6月），gunicorn==21.2.0经压测最稳。跳过==直接pip install flask可能导致后续兼容问题。

第三步：验证Qwen-code SDK可用性
在终端里运行Python交互模式：

>>> from qwen_code import QwenCodeClient >>> client = QwenCodeClient(model_name="qwen2.5-coder-32b-instruct") >>> response = client.chat("写一个Python函数，计算斐波那契数列第n项") >>> print(response)

如果看到类似def fibonacci(n): ...的代码输出，说明SDK配置成功。如果报错QwenCodeConnectionError，请先确保Qwen-code服务已启动（参考官方文档启动命令）。

此时，你的环境已100%准备好。接下来所有操作，都在浏览器里完成。

4.2 项目结构搭建：七个文件构成的极简骨架

整个Web界面，只用七个文件，全部放在一个文件夹里（比如qwen-web-ui）。这种扁平结构，让新人一眼看懂全局：

qwen-web-ui/ ├── app.py # Flask主程序，23行代码 ├── requirements.txt # 依赖清单，3行 ├── static/ │ ├── css/ │ │ └── style.css # 自定义样式，12行（覆盖Bootstrap默认色） │ └── js/ │ └── main.js # 前端逻辑，87行（含错误处理、历史管理） ├── templates/ │ └── index.html # 主页面，156行（含Bootstrap组件、Jinja2模板） └── config.py # 配置文件，8行（API Key、模型名等）

关键文件详解：

app.py：核心是@app.route('/')返回render_template('index.html')，和@app.route('/api/chat', methods=['POST'])处理请求。所有业务逻辑都在这里，没有其他Python文件。
config.py：存放QWEN_CODE_API_KEY、DEFAULT_MODEL等，用os.getenv()读取，避免硬编码。
templates/index.html：用Bootstrap的container-fluid布局，顶部导航栏+中间卡片式输入区+底部历史列表。Jinja2语法只用{{ }}和{% %}，无嵌套循环，易读易改。
static/js/main.js：核心是document.getElementById('send-btn').addEventListener('click', async () => {...})，里面封装了fetch调用、loading状态切换、历史存取。所有DOM操作用原生API，不依赖框架。

实操心得：拒绝“过度工程化”。很多教程教你建models/、views/、controllers/目录，但这个项目里，app.py既是路由又是控制器，index.html既是视图又是模板。少一层抽象，就少一分出错可能。

4.3 前端页面开发：手把手写出可交互的主界面

templates/index.html是整个项目的门面，我用最朴素的方式构建，确保每一行代码都有明确目的。以下是关键区块的实现逻辑：

顶部导航栏：

<nav class="navbar navbar-expand-lg navbar-dark bg-dark"> <div class="container-fluid"> <a class="navbar-brand" href="#"> <i class="bi bi-code-slash"></i> Qwen-code Web UI </a> <div class="navbar-nav"> <a class="nav-link active" href="#">对话</a> <a class="nav-link" href="#" onclick="showHistory()">历史</a> </div> </div> </nav>

用Bootstrap的navbar组件，图标用Bootstrap Icons（CDN引入），onclick="showHistory()"调用JS函数切换显示区域，不走路由跳转，保持单页应用体验。

主输入区（卡片式）：

<div class="card mb-4"> <div class="card-header bg-primary text-white"> <h5 class="mb-0">向Qwen-code提问</h5> </div> <div class="card-body"> <div class="mb-3"> <label for="prompt" class="form-label">你的代码或问题</label> <textarea class="form-control" id="prompt" rows="6" placeholder="例如：把这段代码改成异步版本..."></textarea> </div> <!-- 参数折叠面板 --> <div class="accordion mb-3" id="parameters"> <div class="accordion-item"> <h2 class="accordion-header"> <button class="accordion-button collapsed" type="button" ><div class="card" id="response-card" style="display:none;"> <div class="card-header bg-success text-white"> <h5 class="mb-0">Qwen-code 的回答</h5> </div> <div class="card-body"> <pre class="bg-dark text-light p-3 rounded"><code id="response-content"></code></pre> </div> </div>

用<pre><code>保留代码缩进和换行，bg-dark text-light配色符合开发者审美。id="response-card"配合JS控制显隐，避免页面跳动。

整个HTML文件，没有一行多余代码。所有交互逻辑，都在main.js里用事件监听器绑定。

4.4 后端API开发：23行代码实现健壮的聊天接口

app.py是整个项目的引擎，全文仅23行（不含空行和注释），却承载了全部业务逻辑。以下是逐行解析：

from flask import Flask, request, render_template, jsonify from qwen_code import QwenCodeClient import os from config import QWEN_CODE_API_KEY, DEFAULT_MODEL app = Flask(__name__) # 初始化Qwen-code客户端，复用连接 client = QwenCodeClient( api_key=QWEN_CODE_API_KEY, model_name=DEFAULT_MODEL, base_url="http://localhost:8000/v1" # 根据你的Qwen-code服务地址调整 ) @app.route('/') def index(): return render_template('index.html') @app.route('/api/chat', methods=['POST']) def chat_api(): try: data = request.get_json() prompt = data.get('prompt', '').strip() if not prompt: return jsonify({'error': '请输入内容'}), 400 # 构建参数字典，过滤空值 params = {} for key in ['temperature', 'top_p', 'max_new_tokens', 'stop_words', 'seed']: if key in data and data[key] is not None: params[key] = data[key] # 调用Qwen-code SDK response = client.chat(prompt, **params) return jsonify({ 'success': True, 'response': response, 'params': params }) except Exception as e: # 统一错误处理 error_map = { 'QwenCodeConnectionError': 'CONNECTION_FAILED', 'QwenCodeAuthenticationError': 'AUTH_FAILED', 'QwenCodeRateLimitError': 'RATE_LIMIT_EXCEEDED' } error_code = error_map.get(e.__class__.__name__, 'UNKNOWN_ERROR') return jsonify({ 'error_code': error_code, 'message': str(e) }), 500 if __name__ == '__main__': app.run(debug=True, host='0.0.0.0', port=5000)

关键设计点：

客户端复用：client在模块顶层初始化，避免每次请求都新建连接，减少开销。
参数过滤：for key in [...]循环只取指定参数，且if data[key] is not None排除空值，防止SDK接收temperature=None报错。
错误归因：error_map字典把异常类名映射为业务错误码，前端据此做不同提示。
调试开关：app.run(debug=True)仅用于开发，生产环境用Gunicorn启动，debug=False。

实测中，这个接口在Qwen-code服务正常时，平均响应时间280ms（含网络延迟），并发10请求无失败。当Qwen-code服务宕机，QwenCodeConnectionError被捕获，前端立即显示“模型服务未响应”，体验流畅。

4.5 历史会话功能：37行JS实现本地持久化

static/js/main.js是前端灵魂，其中历史功能仅37行代码，却实现了完整的增删查：

// 从sessionStorage读取历史 function loadHistory() { const history = JSON.parse(sessionStorage.getItem('qwen_history') || '[]'); const historyList = document.getElementById('history-list'); historyList.innerHTML = ''; history.forEach(item => { const li = document.createElement('li'); li.className = 'list-group-item d-flex justify-content-between align-items-center'; li.innerHTML = ` <div> <div class="fw-bold">${item.prompt.substring(0, 50)}${item.prompt.length > 50 ? '...' : ''}</div> <small class="text-muted">${new Date(item.timestamp).toLocaleString()}</small> </div> <div> <button class="btn btn-sm btn-outline-primary me-1" onclick="replayPrompt('${item.prompt}')">重试</button> <button class="btn btn-sm btn-outline-danger" onclick="deleteHistory('${item.id}')">删除</button> </div> `; historyList.appendChild(li); }); } // 保存新会话 function saveToHistory(prompt, response, params) { const history = JSON.parse(sessionStorage.getItem('qwen_history') || '[]'); const newItem = { id: 'sess_' + Date.now(), timestamp: new Date().toISOString(), prompt: prompt, response: response, params: params }; // 限制最多50条 if (history.length >= 50) { history.shift(); // 删除最旧 } history.push(newItem); sessionStorage.setItem('qwen_history', JSON.stringify(history)); } // 重试历史提问 function replayPrompt(prompt) { document.getElementById('prompt').value = prompt; document.getElementById('prompt').focus(); } // 删除单条历史 function deleteHistory(id) { let history = JSON.parse(sessionStorage.getItem('qwen_history') || '[]'); history = history.filter(item => item.id !== id); sessionStorage.setItem('qwen_history', JSON.stringify(history)); loadHistory(); // 刷新列表 } // 页面加载时初始化 document.addEventListener('DOMContentLoaded', function() { loadHistory(); });

为什么用sessionStorage而不是localStorage：