当前位置: 首页 > news >正文

影刀RPA新手教程:1688批发网自动化找货询价与下单完全指南

影刀RPA新手教程:1688批发网自动化完全指南——找货+询价+下单实战

作者:林焱

一、认识影刀与安装配置

影刀RPA是阿里巴巴生态中不可或缺的自动化工具,特别适合1688批发场景。

1688自动化环境准备:

  1. 安装影刀编辑器(版本6.0以上)
  2. 安装Chrome浏览器(版本90以上)
  3. 安装影刀Chrome扩展
  4. 准备1688账号(建议开通诚信通)

系统配置要求:

  • 操作系统:Windows 10/11
  • 内存:16GB以上(处理大量商品数据)
  • 硬盘:SSD固态硬盘,100GB以上空间
  • 网络:稳定宽带连接

1688专属配置:

打开影刀编辑器,创建新应用:

  • 应用名称:1688批发自动化
  • 应用类型:网页自动化
  • 默认浏览器:Chrome

配置浏览器参数:

用户代理:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36 语言:zh-CN,zh;q=0.9 ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/da56f874f8314a9789072bfec58a65a5.png#pic_center)

二、元素定位四合一实战

1688网页结构复杂,需要灵活运用四种定位方式。

XPath定位实战:

1688商品列表XPath:

//div[contains(@class,'offer-list')]//div[@class='title']/a

商品价格XPath:

//div[contains(@class,'offer-list')]//div[@class='price']/span

CSS选择器定位:

div.offer-list > div.title > a

文本定位:

1688的"立即询价"按钮:

立即询价

组合定位策略:

配置元素定位优先级:

{"primary":"xpath://div[@class='title']/a","secondary":"css:div.title > a","tertiary":"text:商品标题",![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/1f3fa079b1194283967bbb78e6c2cfe3.png#pic_center)"fallback":"id:product-title"}

动态元素处理:

1688页面有动态加载,使用通配符:

//div[contains(@id,'offer') and contains(@class,'list-item')]

三、变量与数据类型

字符串变量:

变量名:supplier_name 变量值:汕头市澄海区XX玩具厂

列表变量:

存储供应商列表:

店群矩阵自动化突破运营极限!

变量名:supplier_list 变量值:["供应商A", "供应商B", "供应商C"]

字典变量:

存储商品详细信息:

变量名:product_detail 变量值:{ "title": "儿童玩具车", "price": "15.50", "min_order": "2件", "supplier": "XX玩具厂", "location": "广东汕头" }

数据表格结构:

商品标题批发价起订量供应商所在地评分
玩具车15.502件厂家A汕头4.8

| 娃娃 | 8.00 | 5件 | 厂家B | 东莞 | 4.5 |

全局变量配置:

变量名:ali_cookie 作用域:全局 默认值:从浏览器获取 描述:1688登录Cookie

四、流程控制

条件判断——筛选优质供应商:

如果 评分 >= 4.5 且 诚信通年限 >= 3 执行:添加到优质供应商列表 否则如果 评分 >= 4.0 执行:添加到备选供应商列表 否则 执行:跳过该供应商 结束如果

For循环——批量询价:

For i = 0 到 supplier_list.length - 1 打开供应商店铺页面 点击"联系供应商" 发送询价信息:"请问{product_name}的最低起订量和价格是多少?" 等待回复(5000毫秒) 结束For

While循环——翻页采集:

设置变量:current_page = 1 设置变量:max_page = 50 While current_page <= max_page 采集当前页面商品数据 点击"下一页" 等待页面加载(3000毫秒) current_page = current_page + 1 结束While

TryCatch异常处理:

尝试 点击"立即购买" 填写购买数量 提交订单 捕获异常 ex 记录日志:"下单失败:" + ex.message 截图保存:"C:\logs\order_error.png" 结束尝试

五、网页自动化实战

打开1688首页:

指令:打开网页 URL:https://www.1688.com 浏览器:Chrome 等待策略:等待页面完全加载 ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/8b1c1acf71504019bc2a63455a652423.png#pic_center) 超时时间:30000毫秒

搜索商品:

指令:在网页中输入 网页对象:1688首页 元素:id=alisearch-keywords 输入内容:儿童玩具 输入模式:模拟人工输入 输入间隔:100毫秒
指令:点击元素 元素:xpath=//button[@class='sbutton'] 点击事件:左键单击

采集商品信息:

指令:获取相似元素列表 网页对象:搜索结果页 元素:xpath=//div[@class='title']/a 保存至:title_list 指令:循环相似元素 循环列表:title_list 循环项:title_element 获取元素文本:title_element -> product_title 获取元素属性:title_element -> href -> product_url 写入数据表格 结束循环

处理弹窗:

1688经常出现弹窗,需要关闭:

指令:判断元素是否存在 元素:xpath=//div[@class='dialog-close'] 超时时间:3000毫秒 如果 元素存在 指令:点击元素 元素:xpath=//div[@class='dialog-close'] 结束如果

六、数据处理

数据清洗——处理价格:

指令:文本替换 原文本:price_text 查找:¥ 替换:(空) 保存至:clean_price 指令:文本转数字 文本:clean_price 保存至:price_number

数据去重:

指令:列表去重 列表:product_list 去重依据:商品标题 保存至:unique_product_list

数据筛选:

筛选起订量小于等于5件的商品:

指令:列表筛选 列表:product_list 筛选条件:min_order <= 5 保存至:filtered_list

数据导出:

指令:导出到Excel 数据:product_list 文件路径:C:\1688数据\玩具批发_{日期}.xlsx 工作表名:商品列表

七、鼠标键盘图像操作

模拟人工操作:

指令:移动鼠标到元素 元素:xpath=//a[contains(text(),'立即询价')] 移动速度:中速 指令:鼠标点击 点击方式:左键双击

键盘快捷键:

指令:发送快捷键 按键:Ctrl+A 描述:全选输入框内容 指令:发送快捷键 按键:Ctrl+V 描述:粘贴文本

图像识别——识别验证码:

指令:截取元素图像 元素:xpath=//img[@class='captcha-img'] 保存路径:C:\temp\captcha.png 指令:OCR识别 图片路径:C:\temp\captcha.png 识别语言:英文数字 保存至:captcha_text

滚动页面:

指令:滚动网页 滚动方向:向下 滚动距离:500像素 滚动方式:平滑滚动

八、进阶技能

多标签页管理:

指令:打开新标签页 URL:供应商详情页URL 保存网页对象至:supplier_tab 指令:切换标签页 网页对象:supplier_tab ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/f491405ec5414d27a48e19aea629d6db.png#pic_center) 指令:关闭标签页 网页对象:supplier_tab

Cookie管理:

指令:获取Cookie 域名:.1688.com 保存至:ali_cookies 指令:设置Cookie 域名:.1688.com Cookie:ali_cookies

执行JavaScript:

指令:执行JS JS代码: function scrollToBottom() { window.scrollTo(0, document.body.scrollHeight); } scrollToBottom();

API对接:

1688开放平台API调用:

指令:发送HTTP请求 请求方式:POST URL:https://gw.open.1688.com/openapi/xxxxx 请求头: Content-Type: application/json Authorization: Bearer {access_token} 请求体:{ "productId": "123456", "quantity": 10 } 保存响应:api_result

九、平台实战——找货与询价

自动找货流程:

  1. 打开1688搜索页面
  2. 输入关键词搜索
  3. 筛选条件(价格区间、起订量、地区)
  4. 采集商品列表
  5. 过滤优质供应商

筛选配置:

指令:点击元素 元素:xpath=//span[text()='价格'] 指令:在网页中输入 元素:xpath=//input[@placeholder='最低价'] 输入内容:10 指令:在网页中输入 元素:xpath=//input[@placeholder='最高价'] 输入内容:100 指令:点击元素 元素:xpath=//button[text()='确定']

自动询价流程:

指令:循环相似元素 循环列表:supplier_list 点击"联系供应商" 等待元素出现:xpath=//textarea[@class='input-area'] 输入询价内容: "您好,我对贵公司的{product_name}感兴趣,请问: 1. 最低起订量是多少? 2. 批发价格是多少? 3. 发货时间是多久? 谢谢!" 点击"发送" 等待回复(10000毫秒) 保存聊天记录 结束循环

十、系统联动

发送企业微信通知:

指令:发送HTTP请求 URL:https://qyapi.weixin.qq.com/cgi-bin/webhook/send?key=xxx 方法:POST Body:{ "msgtype": "text", "text": { "content": "1688询价结果:找到{count}个优质供应商" } }

写入MySQL数据库:

指令:连接数据库 数据库类型:MySQL 连接字符串:server=localhost;database=1688_db;uid=root;pwd=123456 指令:执行SQL SQL:INSERT INTO products (title, price, supplier, url) VALUES (?, ?, ?, ?) 参数:[title, price, supplier, url]

生成报价单:

指令:使用Word模板 模板路径:C:\templates\1688报价单.docx 填充数据:{ "供应商": supplier_name, "商品": product_name, "价格": price, [video(video-AlhisQl6-1783181548429)(type-csdn)(url-https://live.csdn.net/v/embed/524992)(image-https://v-blog.csdnimg.cn/asset/b59aed2f01d4fe8583467562aaf4dcfd/cover/Cover0.jpg)(title-temu店群自动化报活动案例)] "日期": 当前日期 } 保存路径:C:\报价单\{supplier_name}_{日期}.docx

十一、工程化与规范

流程规范:

  1. 主流程调用子流程
  2. 每个功能模块化
  3. 添加详细的注释
  4. 使用配置表管理参数

目录结构:

1688自动化/ ├── 主流程.yd ├── 模块/ │ ├── 搜索商品.yd │ ├── 采集数据.yd │ ├── 询价.yd │ └── 下单.yd ├── 配置/ │ ├── 账号配置.json │ └── 参数配置.json └── 数据/ ├── 采集结果.xlsx └── 日志.txt

错误处理规范:

// 所有关键操作都要有异常处理 尝试 关键操作 捕获异常 记录详细错误信息 截图保存 发送通知 结束尝试

日志规范:

指令:打印日志 级别:INFO 内容:开始采集第{current_page}页数据 指令:打印日志 级别:ERROR 内容:采集失败,错误原因:{error_message}

十二、速查表与常见报错处理

1688常用XPath速查:

元素XPath
搜索框//input[@id=‘alisearch-keywords’]
商品标题//div[@class=‘title’]/a
商品价格//div[@class=‘price’]/span
供应商名称//a[@class=‘shop-name’]
起订量//div[@class=‘min-order’]
立即询价按钮//a[contains(text(),‘立即询价’)]
下一页//a[@class=‘next-page’]

常见报错处理:

报错1:验证码频繁出现

报错信息:

错误代码:E5001 错误信息:需要验证码验证

解决方案:

  1. 增加操作间隔时间
  2. 使用验证码识别服务
  3. 更换IP地址
  4. 使用多个账号轮换

报错2:元素定位失败

报错信息:

错误代码:E1002 错误信息:元素属性发生变化

解决方案:

  1. 使用更稳定的XPath(包含函数)
  2. 增加等待时间
  3. 使用多路径备选定位
  4. 定期维护元素库

报错3:登录失效

报错信息:

错误代码:E3002 错误信息:请先登录1688账号

解决方案:

  1. 重新扫码登录
  2. 更新Cookie
  3. 使用Cookie持久化
  4. 添加登录状态检测

报错4:数据格式变化

报错信息:

错误代码:E6001 错误信息:数据解析失败

解决方案:

  1. 增加数据格式判断
  2. 使用正则表达式提取
  3. 添加数据校验
  4. 记录异常数据格式

调试方法:

  1. 使用「元素探测器」重新定位
  2. 查看「网页结构」分析变化
  3. 使用「断点调试」逐步执行
  4. 保存「运行日志」分析问题

性能优化:

  1. 使用「批量操作」减少循环次数

  2. 合理使用「等待策略」

  3. 及时「关闭网页对象」释放资源

  4. 使用「数据表格」批量读写


内容标签:影刀RPA 1688自动化 批发网 找货询价 电商RPA 网页自动化 数据采集

作者:林焱

http://www.gsyq.cn/news/1639040.html

相关文章:

  • 好用的郑州geo生产厂家
  • 为什么每个openEuler开发者都需要openEuler-pkginfo:5大核心优势
  • Wireshark网络流量分析实战:从TCP故障排查到安全威胁识别
  • 孤能子视角:三十六计之隔岸观火——时序相位选择
  • 网络性能测试实战:oe-performance中的Netperf测试配置与结果分析
  • YOLO数据集格式转换实战:PASCAL VOC XML与YOLO TXT互转详解
  • openeuler/sysmonitor核心功能解析:10大监控模块守护你的系统安全
  • AI编程工具安全风险与工程实践:从Claude Code事件看生产级应用挑战
  • UTBotJava符号执行技术详解:从代码分析到测试生成的完整流程
  • 终极指南:3步掌握Wallpaper Engine资源提取与TEX图片转换
  • Layer Normalization实战:从原理到PyTorch实现与对比
  • oac高级应用指南:如何为你的HPC项目定制Autoconf宏
  • 家里佳能ip8780,ip1980,ip1180打印机报错1700,1702,1704,5b00,是什么问题?维修店收费150,太贵不修,网友推荐佳能V6.200原版清零软件,不出3分钟给完美修好了。
  • SoftBR性能优化实践:10个提升分支跟踪效率的技巧
  • D-FOT安全与约束:优化过程中的5个关键安全考虑与限制条件
  • Java实战:解析Navicat连接加密机制与密码恢复
  • SillyTavern企业级AI对话前端架构设计与部署指南:5步构建高可用生产环境
  • OpenEuler SONIC内核补丁社区指南:如何参与和获取支持的终极教程
  • OpenEuler kata_integration 社区贡献指南:从Fork到Pull Request的完整流程
  • ExtFUSE入门指南:5步快速搭建高性能用户空间文件系统环境
  • 用MLflow实现LLM评估的可复现性与工程化落地
  • 磁盘空间告急?openeuler/sysmonitor磁盘分区监控与告警设置教程
  • openeuler/riscv-kernel项目架构深度解析:如何实现多SoC平台统一支持
  • hygon-qemu常见问题解答:新手入门必看的10个知识点
  • ExtFUSE与eBPF技术详解:为什么这是文件系统开发的未来
  • 程序员量化交易实战 32:把每日运行结果归档成 JSON
  • 如何用openEuler-wiki-bot追踪SIG项目进展:PR与Issue管理指南
  • Cantian connector for MySQL核心架构解析:理解存储引擎插件的工作原理
  • IIM-42652 IMU传感器与STM32的6DoF运动追踪实现
  • 直流有刷电机驱动方案与H桥控制技术解析