就在幾天前, 在funP上逛逛, 當然也去看了我最喜歡的影片搞笑&Kuso, 不免也會想把好的影片拉回來收藏, 一如往常的打開了 GooTube FLV Retriever 來查詢下載位址, 耶~~居然404不能瀏覽, 怎麼會掛了呢?..所以, 自己做一個的念頭就油然而生, 就開始找資料及技術了(好吧!! 其實是學正則式, 如何偷網頁資料等技術), 那天成果不如想像, 因為!! 正則式對那時候的我有點難度, 就擱下了.....
過了幾天, 再寫我的WGM報告時, 又想起了這件事, 心動不如馬上行動, 就打開了SSH對主機進行子網域新增( http://plugins.520net.to )及程式核心的建立, 當然嘍!! 也把我自己的PHP套件包及PHPRPC都建立起來了, 順便就把 520 套件之家成立起來(因為我還有欠我朋友一個地址3+2網頁查詢外掛還沒做), 先建立了一個 getvideo 的套件, 首先先從YouTube的解起, 開始著手吧!!
YouTube的比較簡單, 把他的 http://www.youtube.com/watch?v=12345678 那個影片編號抓出來, 再取得Javascript裡的 swfArgs['t'] 的參數, 傳給 http://www.youtube.com/get_video.php 解析就可以下載了, 沒想到這麼容易, 一下就完成了!! 本來想說會用到正則式, 沒想到沒用到, 直接利用他的javascript參數就可以呼叫來用了!! 完成了嗎!?....不..事情沒有那麼簡單, 因為這個功能別人已經有了!!
接下來, 我又想到, 如果是有人直接把YouTube的影音直接崁在他的BLOG裡, 使用者還要先點去YouTube原始位址, 再取得連結, 再貼進來解析, 似乎有點麻煩, 好把!! 我就再把程式改了一下, 這次有用到正則式了!!
首先先找出共同點, 不論是那一種BLOG, 直接從YouTube拉過來的一定有<param value=""></param>所以正則式如下:
preg_match_all('/<param name="movie" value="(.*?)\/v\/(.*?)&.*?".*?>/', $xml_string[$i], $match);
$match[1] 就是網址(主網址)
$match[2] 就是影片編碼
好了, 開始測試(當然還有迴圈讓他把 preg_match_all 排列出的二維陣列資料全取出來, 首先去找了一個BLOG在同一頁有多個崁入影音來試, 成功了, 後來又去試了酷搜樂....呀...失敗....原來是雙引號跟單引號的差異, 好...就把正則再改了一下(在這要好好感謝BawBaw大教了我正則入門)!!
preg_match_all('/<param name=[\s\"\']+movie[\"\'] value=[\s\"\']+(.*?)\/v\/(.*?)&.*?[\"\']+.*?>/', $xml_string[$i], $match);
後來, 測試中, 又發現了似乎有許多人並沒有忠實的把YouTube提供的崁入語法放在BLOG中, 所以只有再重寫一次正則, 變成去偵測 <embed src=""> 來抓取資料, 好吧!! 最後改成這樣!!
preg_match_all('/<embed src=[\s\"\']+(.*?)\/v\/(.*?)[\"\']+.*?>/', $xml_string[$i], $match);
再經過密集的測試, 除了YouTube影音位址可以直接取得之外, 如果輸入BLOG位址, 該頁面內有崁入YouTube影音, 不論有多少個就一併全部抓取出來, 這樣子就方便多了, 不過如果解析的越多, 時間會花得比較久就是了!!
好了, 努力了兩三個小時, 把他改一改放上線服務了, 一切非常陽春, 就等著大家來測試, 結果, 慘劇發生了!!
在測試途中, 遇到其它影音網站(其實還有很多, 只是剛好查這個而已), 他是 Metacafe , 因為不常看到, 所以想說如果解這個應該就有新的賣點吧, 當下就利用 GooGle 大師找了有關這個影音的原理, 請參照: metacafe 影片 下載 - Google 搜尋
結果找到了一個網站, 他居然支援了45種影音網站的查詢解析, 當場我就冷了一半, 什麼麻!! 已經有人做了那麼好的, 我的看起來就連一根草都不如, 開始哭了, 請再參照: KeepVid: Download videos from Google, Youtube, iFilm, Putfile, Metacafe, DailyMotion!
其實到這裡我還是有點不死心, 所以我還是繼續研究, 我繼續找原理, 又接著搜尋原理, 天打雷劈~~~~~, 又出現一個超級解析家, 冷了~~全部都冷了, 不做了...不想做了....已經有太多了...shit....請再此參照:
1. metacafe 影片 下載 原理 - Google 搜尋
2. 優質 Retriever, Retriever
這樣我怎麼做得下去, 原來, 我還在學騎腳踏車, 人家已經上太空了...唉!! 我還是回去趕我的 WGM 成本分析報告吧!!
我的影音解析套件: 520 套件之家 ::: 影音解析工具 (超級陽春版)
不想再更新了...就這樣放著吧....鳴鳴鳴鳴!!
本篇相關閱讀:
測試網站:
酷搜樂 - 男女搶車大作戰! (找到單引號及雙又號BUG)
bebe暖暖&法國PaPa - (AXE廣告影片)男人味 (一次找出所有崁入影片資料)





23/07/2010, 13:32
That is why it is far better to wear that type of shoes you are used to for your wedding. prom dressesHowever, make sure that they are pretty and are in complete harmony with your wedding attire. cheap prom dressesBelieve me when I said that, such wedding shoes are not hard to find.hair extensions You can order them online too. Some virtual shops allow you to select two or three different shoe styles and two or three different shoe sizes. cheap wedding invitationsThey will deliver all of them at your doorstep.bridesmaid dresses This allows you to try them all in comfort and select the one you like best and return the rest. It is easy to find these wedding shoes if you look for them. celebrity lace front wigsThey are also sold online. You can trust on me and I say it is true that these shoes are easily available.human hair extensions Best aspect is that they can be ordered online.