快轉到主要內容

(18+) Xvideos情色爬蟲 -「XD」

·1276 字
電腦科學 18+ MadeFromMe (我的專案) Python 爬蟲
目錄

相信許多老司機對「Xvideos.com」這個網站應該不陌生,此專案「XD」全名為「Xvideos Downloader」,顧名思義就是下載 Xvideos 影片用的程式 (不需擁有 Xvideos 帳號)。同時,這也是我第一個 Python 專案。

Thank icon designer - “mikicon” for made the logo
Thank icon designer - “mikicon” for made the logo


前言 (初次接觸Python)
#

近期突然想玩玩看爬蟲 (Crawler),也在此刻才開始接觸腳本語言 - Python (蟒蛇)
其實早在兩三年前,友人「Honor」就推坑過我,可惜當時在我心中C語言的那種架構才是王道 (其他都邪教) ,所以我只接觸諸如C#PHP這類語言。至於爬蟲,基本上是0經驗,硬要說的話,只有以前高中做專題時,用PHP去抓 OpenData 的資料來使用的經驗而已。

而我必須說,Python 當初開發時的構想「易懂易學」真的做到了!
這個專案是我接觸 Python 兩個小時後就開始製作的,約不到兩天就成功產出。
建議還沒玩過 Python 的朋友們可以開始入坑了(X


題材選擇 (為什麼是Xvideos?)
#

![Xvideos logo ](xvideos_logo.png)
雖然說下定決心要學習並製作個爬蟲小工具,但我這是屬於為了「學」而「做」,而不像一般專案一樣,先有「目的」再來「做」跟「學」,所以我很煩惱...要爬什麼呢? 我的理想是,這個專案必須是符合大眾族群,而不是單純針對工程師或者資訊領域的人,我也會希望當我把成品分享給身邊朋友們時,他們是感興趣的。

人的生理需求中,就有那麼一項可以當作題材 - 「」。
很多時候我會想,如果我要架服務,怎樣的服務賺錢最輕鬆?

  • 社交網站:使用者胃口永遠餵不飽,必須一直新增功能,太複雜。
  • 搜尋引擎:目前可以說 Google 一家獨大,太競爭。
  • 影音平台:跟搜尋引擎的問題一樣,如何與 Youtube 抗衡?
  • 色情網站:完美!

雖然說 Pornhub 已經是主流,但「色情」不像 Google 跟 Youtube 這麼嚴重,只要有色的地方,就會有流量!今天不管世界上色情網站有多少個(競爭者多),但只要有新的一出現,一樣會有不少人潮來光顧(人類本性)。
總有一部分的使用者,會因為網站風格、界面跟操作方式而被吸引成為常客、加入會員甚至使用付費服務。

於是我開始嘗試製作 Pornhub 爬蟲,但最終還是放棄。
原因是,研究了半個小時過去,還是不明白哪裡可以爬,影片請求的部份有 Hash 驗證,在加上自己本身這方面知識不足,如果繼續研究太浪費時間了。
雖說登入會員就有資料可以給它 Hash ,但是既然都要登入會員了,那就用 Pornhub 自己提供的下載功能就好了…而我也不可能創建公共帳號給各位去使用吧 (奇特思路),畢竟「大多數人」看片是不註冊會員的,所以我想製作的爬蟲是不用登入也可以抓檔的。

於是矛頭指向了同樣位於色情影片網站高地位的「Xvideos」。


我該如何使用?
#

我已經將專案放在我的Github上了。
你可以透過 Python3 (或更高版) 運行目錄下的 main.py 來使用。
若你不清楚什麼是 Python 腳本,你可以在 Wiki 得到答案,安裝方法也可以透過Google搜尋輕鬆找到。
也推薦 Windows 用戶可以使用「PyInstaller」來將 .py 打包成 windows 的 .exe 執行檔。

這也算不上是什麼專案,應該說是我自己的「Python 爬蟲練習」而已,如果你不喜歡,那麼請看看就好,請勿使用。

喔對了,你可以任意的修改使用發布更新,若你覺得不錯也可以轉傳給朋友們,但請聲明來源,這是一個對創作者的尊重。

Alpaca
作者
Alpaca
用心分享各類資訊,希望大家會喜歡