2015年6月1日 星期一

[Python] 漫畫下載機器人

之前找到的一個蒐集漫畫且提供下載的網站,一直覺得下載要自己手動一個一個點有點累,所以一直想寫一個機器人幫我自動下載。
其實用說的很簡單,大概知道要怎麼寫,但是一直就沒有動力寫。
最近開始正式進入tornado 的八奇領域,所以乾脆這個東西也用Python來寫看看。

Plan:
  自動在一個blog網站裡,點擊進入每一篇文章,找到download link並進入Mega的download頁面,下載檔案。

Problem:
1. Spider Tool:
  這東西應該很好找,我直接跑去問大溪,他就直接丟給我一個叫Scrapy的module。不過這東西還滿大包的,也有點複雜,好處是功能應該很完整,壞處是我可能需要花久一點的時間去了解他的framework

reference:

2. 因為有adf.ly的轉址,所以需要想辦法自動跳過adf.ly,目前有一個網站可以做到,所以只要能夠adf.ly的網址給那個網站然後拿到他response的原本網址應該就可以解決

reference:

3. 自動下載Mega的檔案,Mega似乎有Python的api,不過好像有點久了,然後官方的api github已經找不到了,所以還要再查看看。


reference:
  https://github.com/richardasaurus/mega.py


Progress:

1. 試過之後,基本上google到的第一個就可以用了,而且簡單又好用。所以基本上已經可以直接用api下載mega的檔案了,所以接下來要測試怎麼用bypasshoturl那個網站來跳adf.ly

2. 基本上作法就是參考別人的adfly-skipper的作法,只不過他是用java寫,我把它改成用python。
基本上就是模仿input form然後傳送post的request給bypass網站跟他要解完的結果。
還好裝mege的module時幫我裝了另外一個module叫Requests,很容易的就可以直接寫一個request。

reference:
  http://cn.python-requests.org/zh_CN/latest/
  https://github.com/MacKittipat/adfly-skipper

沒有留言:

張貼留言