code:python:start

Python

пример: простой парсер сайтов на Python 3.x

import urllib.request
import re
 
site = urllib.request.urlopen('https://news.yandex.ru/')
html = site.read().decode('utf8')
header_tags = re.findall(r'<h[1-2][^>]*><a[^>]*>(.*?)</a></h[1-2]>', str(html))
print( str('\n'.join(header_tags)) )
  • /home/c12628/integrarium.ru/www/data/pages/code/python/start.txt
  • Последнее изменение: 2020/03/19 01:36
  • truadmin