13 存储数据之存储为CSV

13 存储数据之存储为CSV

在上篇中,我们讨论了如何使用 XPathCSS选择器 解析网页内容,并提取了我们需要的数据。在本篇中,我们将重点介绍如何将提取到的数据存储为 CSV 格式,这是数据存储和交换中一

阅读更多
14 存储数据之存储为数据库

14 存储数据之存储为数据库

在爬取数据后,接下来的步骤就是将数据保存到合适的存储形式,其中一种常见的方式就是将数据存储到数据库。相较于将数据存储为CSV文件,数据库具有更强的查询能力和数据管理特点,尤其在处理大规模数据时,它

阅读更多
15 存储数据之文件存储

15 存储数据之文件存储

在本系列教程中,我们将探讨如何将从网页爬取的数据存储为文件。这是一个基础但非常重要的主题,因为选择合适的存储方式可以帮助我们更高效地管理和利用爬取的数据。在上一篇文章中,我们讨论了如何将数据存储到

阅读更多
16 反爬虫机制与应对之常见的反爬虫技术