日韩小视频-日韩久久一区二区三区-日韩久久一级毛片-日韩久久久精品中文字幕-国产精品亚洲精品影院-国产精品亚洲欧美云霸高清

下載吧 - 綠色安全的游戲和軟件下載中心

軟件下載吧

當前位置:軟件下載吧 > 數(shù)據(jù)庫 > DB2 > python實現(xiàn)爬蟲數(shù)據(jù)存到 MongoDB

python實現(xiàn)爬蟲數(shù)據(jù)存到 MongoDB

時間:2024-03-09 11:51作者:下載吧人氣:22

在以上兩篇文章中已經(jīng)介紹到了 Python 爬蟲和 MongoDB , 那么下面我就將爬蟲爬下來的數(shù)據(jù)存到 MongoDB 中去,首先來介紹一下我們將要爬取的網(wǎng)站, readfree 網(wǎng)站,這個網(wǎng)站非常的好,我們只需要每天簽到就可以免費下載三本書,良心網(wǎng)站,下面我就將該網(wǎng)站上的每日推薦書籍爬下來。

python實現(xiàn)爬蟲數(shù)據(jù)存到 MongoDB

利用上面幾篇文章介紹的方法,我們很容易的就可以在網(wǎng)頁的源代碼中尋找到書籍的姓名和書籍作者的信息。

找到之后我們復(fù)制 XPath ,然后進行提取即可。源代碼如下所示

# coding=utf-8

import re
import requests
from lxml import etree
import pymongo
import sys

reload(sys)
sys.setdefaultencoding('utf-8')

def getpages(url, total):
  nowpage = int(re.search('(d+)', url, re.S).group(1))
  urls = []

  for i in range(nowpage, total + 1):
    link = re.sub('(d+)', '%s' % i, url, re.S)
    urls.append(link)

  return urls

def spider(url):
  html = requests.get(url)

  selector = etree.HTML(html.text)

  book_name = selector.xpath('//*[@id="container"]/ul/li//div/div[2]/a/text()')
  book_author = selector.xpath('//*[@id="container"]/ul/li//div/div[2]/div/a/text()')

  saveinfo(book_name, book_author)

def saveinfo(book_name, book_author):
  connection = pymongo.MongoClient()
  BookDB = connection.BookDB
  BookTable = BookDB.books

  length = len(book_name)

  for i in range(0, length):
    books = {}
    books['name'] = str(book_name[i]).replace('n','')
    books['author'] = str(book_author[i]).replace('n','')
    BookTable.insert_one(books)

if __name__ == '__main__':
  url = 'http://readfree.me/shuffle/?page=1'
  urls = getpages(url,3)

  for each in urls:
    spider(each)

標簽python,實現(xiàn),爬蟲,數(shù)據(jù),MongoDB

相關(guān)下載

查看所有評論+

網(wǎng)友評論

網(wǎng)友
您的評論需要經(jīng)過審核才能顯示

熱門閱覽

最新排行

公眾號

主站蜘蛛池模板: 欧美一级美片在线观看免费 | 久久久国产精品免费视频 | 欧美日韩一区二区视频图片 | 中文字幕在线观看一区二区 | 成年人性网站 | 国产91免费在线 | 亚洲成a人片在线网站 | 国产欧美视频在线观看 | 一级做a爰片久久毛片人呢 一级做a爰片久久毛片唾 | 一本色道久久综合亚洲精品 | 午夜主播福利视频在线观看 | 国产在线播放一区 | 全部孕妇毛片 | 中国一级淫片aaa毛片毛片 | a免费网站 | 国产欧美日本亚洲精品五区 | 美国一级毛片免费看 | 国内黄色精品 | 国产日本欧美亚洲精品视 | 欧美日韩一区二区三区在线播放 | 日韩一级a毛片欧美一级 | 成人三级做爰在线视频 | 国产成人综合视频 | 久久久久久久久久毛片精品美女 | 欧美成人老熟妇暴潮毛片 | 亚洲在成人网在线看 | 国产成人精品免费 | a一级特黄日本大片 s色 | 亚洲精品一区二区三区福利 | 18videosex性欧美69 | 日本一级特黄a大片在线 | 久久99国产综合精品 | 亚洲一区二区中文 | 国产精品久久久久久福利漫画 | 国产第一页在线观看 | 精品国产区一区二区三区在线观看 | 天天躁夜夜躁狠狠躁2024 | 久久综合婷婷 | 亚洲人成影院午夜网站 | 色碰碰| 国产丶欧美丶日韩丶不卡影视 |