当前位置: 首页 > news >正文

爬取电影数据并保存至csv文件

image
url = 'https://ssr1.scrape.center/'
image

from parsel import Selector
import requests
import csv
import certifidef get_page():# 翻页1-10页for i in range(1,11):url = f'https://ssr1.scrape.center/page/{i}'headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/139.0.0.0 Safari/537.36'}# 1.发送请求response = requests.get(url,headers=headers,verify=certifi.where())# print(response.text)# 2.解析页面selector = Selector(response.text)# 3.获取所有div标签(根据class属性定位div标签),返回数据列表,列表里每一个元素都是selector对象name_list = selector.css('div[class="el-card item m-t is-hover-shadow"]')# print(name_list)# exit()for name in name_list:title = name.css('h2[class="m-b-sm"]::text').get()score = name.css('p[class="score m-t-md m-b-n-sm"]::text').get().strip()type = name.css('button[type="button"] span::text').getall()type_clean = "/".join(type)area = name.css('div[class="m-v-sm info"] span::text').getall()[0]year = name.css('div[class="m-v-sm info"] span::text').getall()[-1]# print(f"{title} {score} {type}")# breakwriter.writerow({"电影":title,"评分":score,"类型":type_clean,"制片地区":area,"上映年份":year})def save_data():fieldname = ["电影","评分","类型","制片地区","上映年份"]global writerwith open("center_movie.csv","w",encoding='utf-8-sig',newline='') as f:writer = csv.DictWriter(f,fieldname)writer.writeheader()   # 写入表头,省略会报错get_page()if __name__ == '__main__':save_data()"""
https://ssr1.scrape.center/page/1
https://ssr1.scrape.center/page/2
https://ssr1.scrape.center/page/3
"""

image

http://www.gsyq.cn/news/163864.html

相关文章:

  • 震惊!企业AI落地难?Agentic AI Stack三层九阶模型来救场,代码小白也能秒懂!
  • vLLM集成Open-AutoGLM全记录(业界首次深度揭秘)
  • 为什么顶尖团队都在关注Open-AutoGLM?(背后隐藏的4大技术壁垒)
  • AI Agent穿针引线:大模型时代工作流、业务流程与智能体的大融合,开发人员必看
  • Open-AutoGLM遇上Windows系统:常见报错解析与实战避坑手册
  • 2025口碑好的微通风窗户生产厂家TOP5权威推荐 - 工业设备
  • Java小白面试实录:从Spring Boot到微服务的技术点解析
  • 2025年新疆汽车托运公司权威推荐榜单:二手车托运/火车托运汽车/轿车托运源头服务商精选 - 品牌推荐官
  • AI Agent卡壳?不是模型不行,而是数据没准备好!AI-ready data全攻略
  • 【Open-AutoGLM下载提速全攻略】:揭秘5大卡顿根源与高效解决方案
  • 大模型推理黑盒揭开,Open-AutoGLM的3大核心机制你了解吗?
  • 如何用TensorFlow优化城市交通信号灯?
  • daemon not running; starting now at tcp5037解决
  • 城市仿真软件:MATSim_(14).MATSim社区与支持资源
  • 毕业季 “论文搭子” 大赏:这八款工具,承包你从选题到答辩的全流程
  • 使用TensorFlow进行心律失常检测研究
  • Open-AutoGLM为何突然爆火?背后隐藏的6个技术真相
  • 手机变身AI大脑:Open-AutoGLM本地化部署全流程详解
  • 大模型编程革命!从“独行侠“到“团队作战“,一文搞懂AI智能体架构演进,小白程序员必看!
  • Open-AutoGLM下载慢如蜗牛(背后隐藏的4个技术陷阱曝光)
  • BP神经网络手写数字/字母识别 matlab代码 数字或者字母 有数据集训练 bp神经网络训练...
  • 一文彻底厘清:AI Agent、Agentic Workflow与Agentic AI(附6篇核心论文)
  • 文献综述不用 “啃文献到吐”:paperzz,让毕业季的 “文献大山” 变 “轻量级作业”
  • Linux平台Open-AutoGLM部署全流程解析(含GPU加速配置细节)
  • 三轴剪切试验的数值模拟就像给土体做CT扫描,只不过我们用的是代码和本构模型。这次用FLAC3D6.0折腾邓肯张模型,整个过程像在玩一个参数化的电子积木游戏
  • LangGraph 1.0智能体开发实战:三步搞定邮件自动分类与回复系统,小白也能轻松上手!
  • 2025年塑料拖链专业供应商推荐:靠谱的塑料拖链品牌服务厂商有哪些? - myqiye
  • 深度学习框架基于YOLOv8 pyqt5的水果蔬菜新鲜度检测系统 识别检测黄瓜‘, ‘新鲜葫芦‘, ‘新鲜生菜‘, ‘新鲜洋葱‘, ‘新鲜土豆‘, ‘成熟苹果‘, ‘成熟香蕉‘, ‘成熟葡萄‘等
  • 收藏!李彦宏预言下的2025职场:程序员不会消失,但必须拥抱大模型
  • 如何用TensorFlow实现命名实体识别(NER)?