[生活札記 ] 03 三月, 2008 16:23

一樣閒來無事, 不過沒有去逛funP, 而是去看電影資訊(其實是去下載電影! 噓! 小聲點), 看到了一部影片, 並沒有在台灣被上映, 原文片名是 Knight Rider, 中文都亂翻所以自己想嘍!!

還記得在讀國中時, 那時不是看百戰天龍或天龍特攻隊(都是天龍)..最讓我產生科技幻想的就是這齣電視影集 霹靂遊俠, 男主角是李麥克 Knight Michael (大衛漢索霍夫 飾演), 會幻想絕對不是因為男主角有著跟007一樣的好豔遇, 而是他的那台尖端科技的產品 霹靂車, 由於在那時網路不太發達, 所以本來想說不會有太多資料留下, 甚至有時跟一些年輕朋友說, 他們會連聽都沒聽過, 但是剛剛花了時間去搜尋, 發現仍然是有許多跟我一樣的人懷念著這部影集, 資料之多著實讓我嚇了一跳, 也好好的重溫了一下他的過去. (當時的名句, 藍波洛基李麥克[台語])..

請參照:
霹靂遊俠李麥克 - Google 搜尋

霹靂遊俠

我還記得他一開始都會出現李麥克開著夥計在沙漠中狂奔, 接著有人開始口述:

『霹靂車, 尖端科技的結晶, 是一部人性化的萬能電腦車, 出現在我們這個無其不有的世界, 刀槍不入, 無所不能』

『霹靂遊俠李麥克, 充滿著正義感, 是一個英勇的自由鬥士, 他以無比的勇氣, 超人的智慧, 打擊犯罪, 拯救善良無助的受害者』

做為他影集的開場..加上科技的動人配樂, 啊~~真令人懷念(我並沒有很老XD)

懷念完了...回頭去找了原文的說明, 發現了霹靂車(夥計)2.0, 有興趣的朋友可以去看一下, 不過我還是覺得80年代的夥伴比較帥, 新的有點詭異...= ="....

原文資料:
Under the Hood With Knight Rider 2.0: Trans Am vs. Ford Mustang (Featuring Exclusive New KITT Specs—and Classic Hasselhoff!)

下次有空換誰來介紹一下太空戰士或是霹靂貓好了...哈哈..!!

[技術分享 ] 01 三月, 2008 03:11

就在幾天前, 在funP上逛逛, 當然也去看了我最喜歡的影片搞笑&Kuso, 不免也會想把好的影片拉回來收藏, 一如往常的打開了 GooTube FLV Retriever 來查詢下載位址, 耶~~居然404不能瀏覽, 怎麼會掛了呢?..所以, 自己做一個的念頭就油然而生, 就開始找資料及技術了(好吧!! 其實是學正則式, 如何偷網頁資料等技術), 那天成果不如想像, 因為!! 正則式對那時候的我有點難度, 就擱下了.....

過了幾天, 再寫我的WGM報告時, 又想起了這件事, 心動不如馬上行動, 就打開了SSH對主機進行子網域新增( http://plugins.520net.to )及程式核心的建立, 當然嘍!! 也把我自己的PHP套件包及PHPRPC都建立起來了, 順便就把 520 套件之家成立起來(因為我還有欠我朋友一個地址3+2網頁查詢外掛還沒做), 先建立了一個 getvideo 的套件, 首先先從YouTube的解起, 開始著手吧!!

YouTube的比較簡單, 把他的 http://www.youtube.com/watch?v=12345678 那個影片編號抓出來, 再取得Javascript裡的 swfArgs['t'] 的參數, 傳給 http://www.youtube.com/get_video.php 解析就可以下載了, 沒想到這麼容易, 一下就完成了!! 本來想說會用到正則式, 沒想到沒用到, 直接利用他的javascript參數就可以呼叫來用了!! 完成了嗎!?....不..事情沒有那麼簡單, 因為這個功能別人已經有了!!

接下來, 我又想到, 如果是有人直接把YouTube的影音直接崁在他的BLOG裡, 使用者還要先點去YouTube原始位址, 再取得連結, 再貼進來解析, 似乎有點麻煩, 好把!! 我就再把程式改了一下, 這次有用到正則式了!!

首先先找出共同點, 不論是那一種BLOG, 直接從YouTube拉過來的一定有<param value=""></param>所以正則式如下:

preg_match_all('/<param name="movie" value="(.*?)\/v\/(.*?)&.*?".*?>/', $xml_string[$i], $match);
$match[1] 就是網址(主網址)
$match[2] 就是影片編碼

好了, 開始測試(當然還有迴圈讓他把 preg_match_all 排列出的二維陣列資料全取出來, 首先去找了一個BLOG在同一頁有多個崁入影音來試, 成功了, 後來又去試了酷搜樂....呀...失敗....原來是雙引號跟單引號的差異, 好...就把正則再改了一下(在這要好好感謝BawBaw大教了我正則入門)!!

preg_match_all('/<param name=[\s\"\']+movie[\"\'] value=[\s\"\']+(.*?)\/v\/(.*?)&.*?[\"\']+.*?>/', $xml_string[$i], $match);

後來, 測試中, 又發現了似乎有許多人並沒有忠實的把YouTube提供的崁入語法放在BLOG中, 所以只有再重寫一次正則, 變成去偵測 <embed src=""> 來抓取資料, 好吧!! 最後改成這樣!!

preg_match_all('/<embed src=[\s\"\']+(.*?)\/v\/(.*?)[\"\']+.*?>/', $xml_string[$i], $match);

再經過密集的測試, 除了YouTube影音位址可以直接取得之外, 如果輸入BLOG位址, 該頁面內有崁入YouTube影音, 不論有多少個就一併全部抓取出來, 這樣子就方便多了, 不過如果解析的越多, 時間會花得比較久就是了!!

好了, 努力了兩三個小時, 把他改一改放上線服務了, 一切非常陽春, 就等著大家來測試, 結果, 慘劇發生了!!

在測試途中, 遇到其它影音網站(其實還有很多, 只是剛好查這個而已), 他是 Metacafe , 因為不常看到, 所以想說如果解這個應該就有新的賣點吧, 當下就利用 GooGle 大師找了有關這個影音的原理, 請參照: metacafe 影片 下載 - Google 搜尋

結果找到了一個網站, 他居然支援了45種影音網站的查詢解析, 當場我就冷了一半, 什麼麻!! 已經有人做了那麼好的, 我的看起來就連一根草都不如, 開始哭了, 請再參照: KeepVid: Download videos from Google, Youtube, iFilm, Putfile, Metacafe, DailyMotion!

其實到這裡我還是有點不死心, 所以我還是繼續研究, 我繼續找原理, 又接著搜尋原理, 天打雷劈~~~~~, 又出現一個超級解析家, 冷了~~全部都冷了, 不做了...不想做了....已經有太多了...shit....請再此參照:
1. metacafe 影片 下載 原理 - Google 搜尋
2. 優質 Retriever, Retriever

這樣我怎麼做得下去, 原來, 我還在學騎腳踏車, 人家已經上太空了...唉!! 我還是回去趕我的 WGM 成本分析報告吧!!

我的影音解析套件: 520 套件之家 ::: 影音解析工具 (超級陽春版)

不想再更新了...就這樣放著吧....鳴鳴鳴鳴!!

 

本篇相關閱讀:

測試網站:
酷搜樂 - 男女搶車大作戰! (找到單引號及雙又號BUG)

bebe暖暖&法國PaPa - (AXE廣告影片)男人味 (一次找出所有崁入影片資料)