Ищу парсер. Наполнение БД

Необходимо наполнение объектами недвижимости. Много.

#31 16 октября 2012 в 15:40
Я про адреса организаций, соберите их целиком и сохраните, а не расшифровывайте их в процесс парсинга.
#32 16 октября 2012 в 15:50


Я про адреса организаций, соберите их целиком и сохраните, а не расшифровывайте их в процесс парсинга.

lokanaft

так и сделал импортировал полностью в instantmaps в поле полный адрес
в результате где на сайте источнике адрес был заполнен не по формату instantmaps
в поле города появились индексы 450845
в поле города только улица
в поле города дом№5 на Большой Вязовской

тоесть городов уйма и на карте их нет так как неверные города индексы, город-улица
#33 16 октября 2012 в 15:53
Так обрабатывайте их теперь, какие проблемы? Не все же они в абсолютно разном виде написаны.
#34 16 октября 2012 в 15:55


На самом деле спарсить информацию нет проблемы, а вот правильно ее обработать тут возникают проблемы… такие как дубли организаций… неправильные адреса, различные форматы адресов… откровенные ловушки от яндекса(типа студий А. Лабедева)… сопоставление категорий и т.п… еще одна важная проблема телефон у филиала(нет импорта)… пока более правильный вариант загрузить результаты парсинга, а потом шлифовать....

malanas

насчет филиалов вы верно подметили там еще и другие адреса и телефоны и адрес сайта — это правда можно решить объединением значений и разделителями типа запятой
#35 16 октября 2012 в 15:58


Так обрабатывайте их теперь, какие проблемы? Не все же они в абсолютно разном виде написаны.

lokanaft

ну я же говорю что все адреса в произвольной форме — как человеки написать захотели так там и стоит
можно тогда поштучно их перебирать — а это 3000 фирм с адресами
#36 16 октября 2012 в 17:52

это 3000 фирм с адресами

Gumoff
Ну да, 3000 вариантов написания адреса, нормально, чё.
#37 17 октября 2012 в 12:03


это 3000 фирм с адресами

Gumoff
Ну да, 3000 вариантов написания адреса, нормально, чё.

lokanaft

Судя по вашим трудам это нормально чё))
#38 20 октября 2012 в 00:10
В общем все теперь работает. Принимаем заявки на парсинг обьектов: инстантмапс, каталог, итд. Пишем в личку.
#39 14 мая 2013 в 17:22
letsgo, а можно спарсить весь сайт (на фтп входа нет) — на инстант в статьи с картинками.
#40 14 мая 2013 в 22:01

letsgo, а можно спарсить весь сайт (на фтп входа нет) — на инстант в статьи с картинками.

Игорь

Все можно сделать)
Вы не можете отвечать в этой теме.
Войдите или зарегистрируйтесь, чтобы писать на форуме.
Используя этот сайт, вы соглашаетесь с тем, что мы используем файлы cookie.