当前位置: 首页 > news >正文

Java爬虫入门(2/5)

一、HTTP(超文本传输协议)是什么

HTTP(超文本传输协议):是一种用于网络传输超文本到本地浏览器的传输协议。定义了客户端和服务器之间请求和响应的格式。HTTP工作在TCP/IP模型之上,常用80端口。
区别于HTTPS(超文本传输安全协议):是HTTP的安全版本,HTTP下增加了SSL/TLS协议,提供了数据加密、完整性校验和身份验证。常用443端口。

工作原理: 客户端发送请求▶️服务端处理请求▶️服务端返回响应▶️客户端渲染页面

二、网页的三种数据来源

  • 静态HTML(HTML基础内容)
  • 接口JSON(外部数据)
  • JS动态渲染(JS/CSS表现与交互)

三、HTTPClient、OKHttp的使用(发送HTTP请求)

四、Jsoup的使用(解析HTML)

五、Jackson、Fastjson的使用(解析JSON)

http://www.gsyq.cn/news/100112.html

相关文章:

  • 【单片机】如何理解GPIO的配置寄存器?
  • vue基于Spring Boot的 综合游戏攻略社区论坛交流系统的设计_t8c09gu2
  • Free-NTFS-for-Mac终极免费方案:苹果电脑完美读写NTFS磁盘完整指南
  • 终极指南:用Lan Mouse实现跨设备无缝控制的完整方案
  • 抖音无水印视频下载器:3分钟学会永久保存高清视频
  • 突破大文件处理瓶颈:视频分段技术的实战应用指南
  • ret2shellcode+一点点基础
  • TouchGAL社区完整手册:构建纯净Galgame文化生态的终极指南
  • 回忆录(一)
  • 如何快速配置PotPlayer百度翻译插件:新手完全指南
  • 揭秘BlenderGIS:5分钟搞定专业级地形生成的秘密武器
  • 2025最新榜单:十大短视频获客公司用户口碑真实测评,短视频代运营团队/短视频运营公司/抖音运营公司/小红书代运营短视频获客系统怎么选择 - 品牌推荐师
  • ThinkPad双风扇智能调速:告别噪音困扰的终极解决方案
  • 如何轻松实现B站4K视频下载:3个步骤掌握bilibili-downloader
  • 二叉树
  • 65.【.NET8 实战--孢子记账--从单体到微服务--转向微服务】--新增功能--账本合并
  • 2026在线题库小程序源码(练习+知识库)
  • MouseTester:专业鼠标性能测试工具完整指南
  • docker容器通过host.docker.internal访问宿主机的注意事项
  • Nugget下载工具完整指南:极简高效的命令行文件获取方案
  • 原神帧率同步机制深度解析与性能优化实践
  • 智能防走失定位工具,核心功能,绑定家人手机,实时查看位置,设置安全区域,如小区,超出区域自动提醒,支持一键求救,应用场景,预防老人痴呆患者走失,家人随时掌握位置,放心又安心。
  • tinySubFinder字幕下载
  • 告别单选困境:Layui多选下拉框的优雅解决方案
  • 基于SSM的在线药品销售系统【源码+文档+调试】
  • DOCX.js终极指南:在浏览器中生成Word文档的完整解决方案
  • 抖音无水印视频下载器:5分钟掌握高清保存技巧
  • 两次数字电路模拟程序+课堂测验
  • 深圳|广州|东莞|昆明-茶饮培训课程哪家好|茶饮培训机构怎么选|新中式茶饮培训哪家好|茶饮技术培训|新式茶饮培训|中式茶饮培训课程——圣旺水吧 - 老百姓的口碑
  • 原生 JavaScript 组件化开发:摆脱框架束缚的架构之道