2 changed files with 158 additions and 0 deletions
Split View
Diff Options
@ -0,0 +1,157 @@ |
|||
# encoding: utf-8 |
|||
from __future__ import unicode_literals |
|||
|
|||
import re |
|||
|
|||
from .common import InfoExtractor |
|||
from ..utils import ( |
|||
RegexNotFoundError, |
|||
unescapeHTML |
|||
) |
|||
|
|||
|
|||
class NTVIE(InfoExtractor): |
|||
_VALID_URL = r'http://(?:www\.)?ntv\.ru/(?P<id>.+)' |
|||
|
|||
_TESTS = [ |
|||
{ |
|||
'url': 'http://www.ntv.ru/novosti/863142/', |
|||
'info_dict': { |
|||
'id': '746000', |
|||
'ext': 'flv', |
|||
'title': 'Командующий Черноморским флотом провел переговоры в штабе ВМС Украины', |
|||
'description': 'Командующий Черноморским флотом провел переговоры в штабе ВМС Украины', |
|||
'duration': 136, |
|||
}, |
|||
'params': { |
|||
# rtmp download |
|||
'skip_download': True, |
|||
}, |
|||
}, |
|||
{ |
|||
'url': 'http://www.ntv.ru/video/novosti/750370/', |
|||
'info_dict': { |
|||
'id': '750370', |
|||
'ext': 'flv', |
|||
'title': 'Родные пассажиров пропавшего Boeing не верят в трагический исход', |
|||
'description': 'Родные пассажиров пропавшего Boeing не верят в трагический исход', |
|||
'duration': 172, |
|||
}, |
|||
'params': { |
|||
# rtmp download |
|||
'skip_download': True, |
|||
}, |
|||
}, |
|||
{ |
|||
'url': 'http://www.ntv.ru/peredacha/segodnya/m23700/o232416', |
|||
'info_dict': { |
|||
'id': '747480', |
|||
'ext': 'flv', |
|||
'title': '«Сегодня». 21 марта 2014 года. 16:00 ', |
|||
'description': '«Сегодня». 21 марта 2014 года. 16:00 ', |
|||
'duration': 1496, |
|||
}, |
|||
'params': { |
|||
# rtmp download |
|||
'skip_download': True, |
|||
}, |
|||
}, |
|||
{ |
|||
'url': 'http://www.ntv.ru/kino/Koma_film', |
|||
'info_dict': { |
|||
'id': '750783', |
|||
'ext': 'flv', |
|||
'title': 'Остросюжетный фильм «Кома» 4 апреля вечером на НТВ', |
|||
'description': 'Остросюжетный фильм «Кома» 4 апреля вечером на НТВ', |
|||
'duration': 28, |
|||
}, |
|||
'params': { |
|||
# rtmp download |
|||
'skip_download': True, |
|||
}, |
|||
}, |
|||
{ |
|||
'url': 'http://www.ntv.ru/serial/Delo_vrachey/m31760/o233916/', |
|||
'info_dict': { |
|||
'id': '751482', |
|||
'ext': 'flv', |
|||
'title': '«Дело врачей»: «Деревце жизни»', |
|||
'description': '«Дело врачей»: «Деревце жизни»', |
|||
'duration': 2590, |
|||
}, |
|||
'params': { |
|||
# rtmp download |
|||
'skip_download': True, |
|||
}, |
|||
}, |
|||
] |
|||
|
|||
_VIDEO_ID_REGEXES = [ |
|||
r'<meta property="og:url" content="http://www\.ntv\.ru/video/(\d+)', |
|||
r'<video embed=[^>]+><id>(\d+)</id>', |
|||
r'<video restriction[^>]+><key>(\d+)</key>' |
|||
] |
|||
|
|||
def _real_extract(self, url): |
|||
mobj = re.match(self._VALID_URL, url) |
|||
video_id = mobj.group('id') |
|||
|
|||
page = self._download_webpage(url, video_id, 'Downloading page') |
|||
|
|||
def extract(patterns, name, page, fatal=False): |
|||
for pattern in patterns: |
|||
mobj = re.search(pattern, page) |
|||
if mobj: |
|||
return mobj.group(1) |
|||
if fatal: |
|||
raise RegexNotFoundError(u'Unable to extract %s' % name) |
|||
return None |
|||
|
|||
video_id = extract(self._VIDEO_ID_REGEXES, 'video id', page, fatal=True) |
|||
|
|||
player = self._download_xml('http://www.ntv.ru/vi%s/' % video_id, video_id, 'Downloading video XML') |
|||
title = unescapeHTML(player.find('./data/title').text) |
|||
description = unescapeHTML(player.find('./data/description').text) |
|||
|
|||
video = player.find('./data/video') |
|||
video_id = video.find('./id').text |
|||
thumbnail = video.find('./splash').text |
|||
duration = int(video.find('./totaltime').text) |
|||
view_count = int(video.find('./views').text) |
|||
puid22 = video.find('./puid22').text |
|||
|
|||
apps = { |
|||
'4': 'video1', |
|||
'7': 'video2', |
|||
} |
|||
|
|||
formats = [] |
|||
for format_id in ['', 'hi', 'webm']: |
|||
file = video.find('./%sfile' % format_id) |
|||
if file is None: |
|||
continue |
|||
size = video.find('./%ssize' % format_id) |
|||
app = apps[puid22] if puid22 in apps else apps['4'] |
|||
formats.append({ |
|||
'url': 'rtmp://media.ntv.ru/%s' % app, |
|||
'app': app, |
|||
'play_path': file.text, |
|||
'rtmp_conn': 'B:1', |
|||
'player_url': 'http://www.ntv.ru/swf/vps1.swf?update=20131128', |
|||
'page_url': 'http://www.ntv.ru', |
|||
'flash_ver': 'LNX 11,2,202,341', |
|||
'rtmp_live': True, |
|||
'ext': 'flv', |
|||
'filesize': int(size.text), |
|||
}) |
|||
self._sort_formats(formats) |
|||
|
|||
return { |
|||
'id': video_id, |
|||
'title': title, |
|||
'description': description, |
|||
'thumbnail': thumbnail, |
|||
'duration': duration, |
|||
'view_count': view_count, |
|||
'formats': formats, |
|||
} |
Write
Preview
Loading…
Cancel
Save