首页 > 抽取优酷视频并生成播放器的问题

抽取优酷视频并生成播放器的问题

我们知道对于Youku的视频,比如像这样的网页链接:

http://v.youku.com/v_show/id_XMzUzNzc1Njgw.html

只需要使用正则抽取其中的id_XMzUzNzc1Njgw这部分内容,然后根据youku的播放器(Falsh Player)地址生成HTML插入到前端页面即可。

可是还有好多其他的视频网站,如YouTube等,本着不重复造轮子的原则,问一下在Python中,有没有专业点的包是干这个事情的呢?

PS:对于上面抽取视频的方法,有更好的,欢迎回帖讨论。

StackOverflow上有以下参考链接:

谢谢


from urllib.parse import urlparse

效率应该比正则高。


如果是获取优酷的话应该是获取XMzUzNzc1Njgw这部分内容吧
其实我觉得正则解析网址就是最方便直接的办法了啊,为什么你还要想着别的办法?
我这个是PHP的,不过稍微改一下python也能用啦~

preg_match_all("/id_(.*).html/U",$url,$youku,PREG_PATTERN_ORDER);
return '<p><embed pluginspage="http://www.macromedia.com/go/getflashplayer" flashvars="isShowRelatedVideo=false&amp;VideoIDS=' . $youku[1][0] . '&amp;isAutoPlay=false&amp;isDebug=false&amp;UserID=0&amp;RecordCode=1001,1002,1003,1004,1005,1006,2001,3001,3002,3003,3004,3005,3007,3008,9999&amp;RecordResource=index&amp;isLoop=false&amp;winType=index&amp;playMovie=true&amp;MMControl=true&amp;MMout=true" wmode="transparent" quality="high" bgcolor="#FFFFFF" name="index_player_swf" id="index_player_swf" src="http://static.youku.com/v1.0.0141/v/swf/qplayer.swf" type="application/x-shockwave-flash"></p>';
【热门文章】
【热门文章】