Видел различные парсеры на нашей системе, но какой из них может подойти, чтобы либо массово, либо адресно парсить врачей со Сберздоровье docdoc.ru/doctor/allergolog и отзывы о врачах с указанием первоисточника?
Можно пробовать решить 2 способами:
— через какой-то имеющийся парсер (например, dwd),
— написать свой с импортом в csv файл.
Чтобы посмотреть, что можно получить с этого сайта средствами php выполните
<?php $url = "https://docdoc.ru/doctor/allergolog/page/2"; echo $page;
Вы увидите там данные в формате json, с которыми можно, я думаю, сразу работать — получать, что надо. Как устроены отзывы не смотрел.
За 2-й способ могу взяться.
Когда-то, года 4 назад, делал это с помощью flowcrawler, правда, без отзывов. За столько лет там, конечно, всё уже изменилось, но это не важно. Сути это не меняет.
Но и отзывы можно было бы добавить при желании, просто проект будет немного сложнее. Был у меня тогда еще один проект, американских адвокатов так парсил вместе с отзывами. Из минусов — публиковаться будет всё очень медленно. Но если не срочно, то можно потихоньку сделать.
Когда-то, года 4 назад, делал это с помощью flowcrawler, правда, без отзывов.
Сегодня это ещё возможно с помощью данного инструмента или он заброшен?
Из минусов — публиковаться будет всё очень медленно. Но если не срочно, то можно потихоньку сделать.
Какая примерно скорость?
п.с.
Доступ запрещён
Эта страница недоступна для просмотра в вашей стране
Доступ запрещён
Эта страница недоступна для просмотра в вашей стране
Да, было такое, баловался с настройками)) Теперь должно быть доступно.
Сегодня это ещё возможно с помощью данного инструмента или он заброшен?
Возможно, почему бы и нет. С тех пор ничего не изменилось. Прога как работала, так и работает. Другое дело, что может docdoc.ru какие-нибудь препятствия чинить. Надо проверять.
Какая примерно скорость?
Примерно чуть быстрее, чем делать всё руками. Можно в несколько потоков, конечно, запустить. Но у меня с ними как-то не срослось))
Когда-то, года 4 назад, делал это с помощью flowcrawler, правда, без отзывов. За столько лет там, конечно, всё уже изменилось, но это не важно. Сути это не меняет.
Но и отзывы можно было бы добавить при желании, просто проект будет немного сложнее. Был у меня тогда еще один проект, американских адвокатов так парсил вместе с отзывами. Из минусов — публиковаться будет всё очень медленно. Но если не срочно, то можно потихоньку сделать.
у меня есть этот софт. Может у вас есть подготовленный проект для загрузки в данную программу?
Возможно, почему бы и нет. С тех пор ничего не изменилось. Прога как работала, так и работает. Другое дело, что может docdoc.ru какие-нибудь препятствия чинить. Надо проверять.
куча сервисов с врачами от них парсят информацию) проверил)
flowcrawler
Раз уж про него речь зашла, есть у кого-нибудь готовый проект по созданию записей на сайт 2ки?