Парсер новостей для InstantCMS 1.10.3

#1 16 мая 2014 в 13:29
Парсер должен брать новости с этих сайтов
1. news.rambler.ru/
2. newsland.com/
3. news.yandex.ru/
4. lenta.ru/

С этих сайтов берется
— Заголовок новости
— Картинка
— Текст

На основание новости создаются
— Ключевые слова
— Теги
— Мето описание

Парсер должен уметь брать новости с определенной категории и публиковать в определенную категорию
Должна быть настройка крон что бы парсер работал в автоматическом режиме
Парсер должен проверять добавляемые статьи что бы не парсить одну и туже новость несколько раз

Настройки парсера:
В настройках парсера мы указываем сайт источник (допустим lenta.ru)
Далее выбираем из какой категории сайт lenta.ru мы будем парсить новости (допустим Мир)
Далее указываем в какую категорию сайта мы будем добавлять эти новости (допустим Новости мира)
Далее указываем по сколько новостей добавлять (допустим 3)
Далее указываем как часто проверять сайт источник на новые новости (допустим раз в 1 час)
Нажимаем сохранить.

Принцип работы
Парсер заходит на сайт источник и проверяет есть ли новые новости в нужной категории если есть то добавляет на сайт

Кто готов взяться и за какую сумму?
#2 16 мая 2014 в 13:37
отписался в теме складчины от меня.
#3 16 мая 2014 в 17:27
Тоесть не по RSS?
Хочу заметить что все равно проверять придется или вводить ограничение, к примеру если новость слишком коротка.
К чему? Да к тому что на том же news.rambler.ru/ часто публикуют анонс а потом "Подробнее читайте..." там-то там-то.
#4 16 мая 2014 в 18:01
Для чего и что проверять?
#5 16 мая 2014 в 18:04
PolarOne, По поводу парсера думаю уже лучше сюда писать instantcms.ru/forum/thread18406-1.html, я этот вариант покупать буду!

Для чего и что проверять?

maxisoft
Думаю он имеет ввиду проверять статью на количество символов и если она меньше заданной то не парсить ее, но думаю это лишнее
Вы не можете отвечать в этой теме.
Войдите или зарегистрируйтесь, чтобы писать на форуме.
Используя этот сайт, вы соглашаетесь с тем, что мы используем файлы cookie.