25 урок по программе A-Parser. Рассказываю о том, как внутри сайта найти статьи по параметрам используя 2 парсера HTML::LinkExtractor и HTML::ArticleExtractor
Ссылки источники можно собирать как из файла txt (1 строка - 1 ссылка) так и вводя вручную в поле.
Важный момент Обязательно при парсинге в глубину включать "Уникализацию запросов", чтобы не ходить по одним и тем же ссылкам, если они есть на разных страницах. Без уникализации запросов чистка от якорей не имеет смысла, она не сработает!
Фильтр
\.(?:png|jpe?g|gif|webp)
Регулярка источник
#.*
Формат результата
[% symCount = p2.textContent.remove('\s+').length;
wordCount = p2.textContent.split('\s+').size;
IF wordCount > 100 && symCount > 1000 && p1.data.match('<meta[^>]+content="article"');
query _ "\n";
END %]
Полный пресет:
eJx1VF1T2zAQ/CselY9QUjcw0xe3wISUTOkEQkN4itOOiC9GIEtCkhPSkP/ek+zY
gcKTrdPt3mm1uiWx1DyYKw0GrCHRaEmU/ycRaQ+G553eGWkSRbUB7bZH5MfwohdF
PSYezp6sphMrNWYkMKU5t6S5JHahANFSWSaFwT2W4NJT9GAGHCMzynPMOVzV6VPG
LTgmrO6IohGZSs7lnGMlx+K+ZNwsE4cFSoOQNqN2clezkjgOGyeREunzvYKT9Dll
0+c53Ko9zCm6wiSyGjfXh2lryyYc3jrPeLzuyHSlxkoIHW0HZpF1ZC5scBSow9DC
k+1IYUHYUEMmZ9DYjWOzv7sXchCpvfsai7nUyTsQozizFcKwv4D5sTjvBjXoODho
tYKdnbqyj/iQOggTamnodWjsfsvA0tHv4/H+pChwFBNanDAmu3vIHQSPOehF8CeI
USwRE4ydXX4PtseV/uaazmAoi4uBOtzF1SXNnMwl59EWFgeXFU69Qo290D6hEwhN
EubUpryQzvmnlvNGsEd/XcZqJlLMd00xMF0tMww7hcrgYi39iGz5tfNB7vG/CgyJ
rM6hSQx23aXYS1JtTCk3uMPQNBTvtl/aMloSKdqce0vWaZ7+NGc8Qb+3pwg6L4Fv
p/T/41hVJ9wsNQM919hDxeJXp/2LGpXInkzx4Mmtd3vGLK6Nv2yMtjD4AKAq2S4l
RjKpoSpTMpfV8UkrEO7p1bfXVnXoxTFe3MxGcEmMzPUE641azbdfJOLs+jGm8DQA
xenEOYZqTRfOQC9APgmjH8KP61XxlkXOuQsUcN+idf7zVfCxEnTzlKV9VFKzBNYt
52KIA6wvOjJTHGxFlBsY1JZtm9IPblEr9Rrc8SXcHazHGfYgufl5XTSkNMOWvrg2
3SvfrFpSTijnN4Pe5o4DGitVX5xp/cpH3qHkzlplos+fE5Z9MjZPmAx1ThyZhVSi
3fGoToFyDFfDevnmMI6WaKZ3Bhvu4ea9uSqYnBqmAKCsxk/Gg9U/pDwang==
Видео урок
Похожие новости
А-parser - Как последовательно собрать три разных..
A-Parser - сбор форумов phpbb..
A-Parser - Поиск активных ссылок в отчётах Xrumer..
Check::BackLink - поиск и анализ продвигаемой ссылки...
A-Parser Сбор данных из групп Telegram..