1. news.rambler.ru/
2. newsland.com/
3. news.yandex.ru/
4. lenta.ru/
С этих сайтов берется
— Заголовок новости
— Картинка
— Текст
На основание новости создаются
— Ключевые слова
— Теги
— Мето описание
Парсер должен уметь брать новости с определенной категории и публиковать в определенную категорию
Должна быть настройка крон что бы парсер работал в автоматическом режиме
Парсер должен проверять добавляемые статьи что бы не парсить одну и туже новость несколько раз
Настройки парсера:
В настройках парсера мы указываем сайт источник (допустим lenta.ru)
Далее выбираем из какой категории сайт lenta.ru мы будем парсить новости (допустим Мир)
Далее указываем в какую категорию сайта мы будем добавлять эти новости (допустим Новости мира)
Далее указываем по сколько новостей добавлять (допустим 3)
Далее указываем как часто проверять сайт источник на новые новости (допустим раз в 1 час)
Нажимаем сохранить.
Принцип работы
Парсер заходит на сайт источник и проверяет есть ли новые новости в нужной категории если есть то добавляет на сайт
Кто готов взяться и за какую сумму?
Хочу заметить что все равно проверять придется или вводить ограничение, к примеру если новость слишком коротка.
К чему? Да к тому что на том же news.rambler.ru/ часто публикуют анонс а потом "Подробнее читайте..." там-то там-то.
Думаю он имеет ввиду проверять статью на количество символов и если она меньше заданной то не парсить ее, но думаю это лишнееДля чего и что проверять?