Как сделать свой парсер

Помогите сделать парсер

#16 8 октября 2013 в 17:36
а как мне еще учится, на чом?
#17 8 октября 2013 в 17:37
это что парсер на инстант?
#18 8 октября 2013 в 17:47
какие ошибки у вас вылезли? Может вообще не к этой строке.
#19 8 октября 2013 в 18:18

Дык этож метод научного тыка! :))

Роман
Тык конечно хорошо, но не когда работаешь с регуляркой…
#20 8 октября 2013 в 20:05

а как мне еще учится, на чом?

Константин Г.

Прежде всего научитесь читать справочный материал, иначе дальше учиться смысла нет.
Если, каждый раз, столкнувшись с проблемой вы будете просить у сообщества решение, то единственное чему вы научитесь — как просить помощи.

По вашему, Константин Г., коду:
$file = preg_replace('/<a href="#" id="ws2" onclick="is_this\(this\);">(.*?)<\/a>/is','<a href="#" id="ws2" onclick="is_this\(this\);">777<\/a>',$file);
#21 8 октября 2013 в 20:13

Дык этож метод научного тыка! :))

Роман
Тык конечно хорошо, но не когда работаешь с регуляркой...

Димитриус
Обычно с регулярками так и выходит)
#22 8 октября 2013 в 20:40
кучу символов экранировать?
#23 8 октября 2013 в 21:48
Плохо получается с post и get запросами0запрос идет на мне открывается сайт тот а не мой((
#24 9 октября 2013 в 06:02


Плохо получается с post и get запросами0запрос идет на мне открывается сайт тот а не мой((

Константин Г.

Значит у вас запрос идет не правильный, покажите весь код, а то гадать можно долго.
#25 10 октября 2013 в 16:34



Плохо получается с post и get запросами0запрос идет на мне открывается сайт тот а не мой((

Константин Г.

Значит у вас запрос идет не правильный, покажите весь код, а то гадать можно долго.

kirkr
  1. <?php
  2. ///Этим мы обозначаем начало скрипта.
  3. //2.Пишем
  4. $file = file ("http://nigma.ru/?view=lite$QUERY_STRING");
  5. $file = implode ("",$file);
  6. //(Команда ?$QUERI_STRING отдает команды исходному скрипту, например, index.php?action=dosug )
  7. //3. Командой
  8. // $file = str_replace('/n','333',$file);
  9. $file = str_replace('<img src(.*)logo.gif(.*)/>','111',$file);
  10. //Заменяем все, что надо заменить (или вырезать, оставив место между второй парой кавычек пустым). Заменяем все адреса и слова на нужные вам(если не понятно, я ниже напишу пример простейшего граббера)
  11. //3. Командой
  12. $file = str_replace('<a href="#" alt="Искать только на ресурсах Megaline" class="ws_normal" id="ws6" onclick="is_this(this);">Megaline</a>','222',$file);
  13. //Заменяем все, что надо заменить (или вырезать, оставив место между второй парой кавычек пустым). Заменяем все адреса и слова на нужные вам(если не понятно, я ниже напишу пример простейшего граббера)
  14.  
  15. //3. Командой
  16.  
  17.  
  18. //$file = preg_replace('/<a href="#" id="ws(.*)" onclick="is_this\(this\);">(.*)<\/a>/is','<a href="#" id="ws1" onclick="is_this(this);">Все</a>',$file);
  19. //$file = preg_replace('/<li id="internet" onclick="mpage\(this\);" class="ms_active"><a href="#">инт(.*)both/is','775',$file);
  20. //$file = preg_replace('/<title>Нигма(.*)right_a"><div id="content_right" ><style>#progress {display: none}<\/style>/is','776',$file);
  21. $file = preg_replace('/src=\"/is','src="http://nigma.ru/',$file);
  22. $file = preg_replace('/src=\'/is','src=\'http://nigma.ru/',$file);
  23. $file = preg_replace('/<form action=\'unban.php\' method=\'post\'>/is','<form action=\'http://nigma.ru/unban.php\' method=\'post\'>',$file);
  24.  
  25. //
  26. //4. Убираем рекламу командой
  27. $file = str_replace('|<a href=(.*)playfon.ru/(.*)>(.*)</a>|','', $file);
  28. //Этой командой мы вырезаем все ссылки, в которых содержится адрес на платный контент(в данном случае это playfon.ru). playfon.ru/ заменяем на адрес, который показывается в рекламных ссылках с постоянно меняющимися названиями. Обычно их 1-3:) Для тех, кто не понял: (.*)-простым языком-это как бы джокер, может принимать любое значение. И поэтому каждая ссылка, содержащая в себе адрес playfon.ru/(неважно, что впереди или после, там ведь стоит (.*) ) будет вырезаться.
  29. //5.Если, вдруг, вы собрались ограбить загрузки, сделали странички, а файлы не скачиваются(пишет файл не найден), значит скрипт запрашивает файл с вашего сервера, на котором этих файлов как раз нет:) Решение проблемы:
  30. //просто замените название вашей папки, в которой лежит скрипт на полный адрес до одноименной папки того сайта, с которого вы грабите.(например,
  31. //$file = str_replace('/static/download/','http://visavi.ne/static/download/',$file);)
  32. //Тогда скрипт будет запрашивать файлы на сервере, на котором они и лежат. Этот метод подходит к тем сайтам, где выдается прямая ссылка на файл.
  33. print "$file";
  34. //(Выводим получившееся)
Вообщем пост идет на тот сайт и мне открывается их сайт с результатом, как переход по ссылке я понял, но вот с post я непонял. ну или GET
#27 10 октября 2013 в 20:06

Дык этож метод научного тыка! :))

Роман
Скорее, это экстримальное программирование )))
#28 11 октября 2013 в 15:13


Дык этож метод научного тыка! :))

Роман
Скорее, это экстримальное программирование )))

Марат

Вот только рекламу своих сайтов ненадо, решению моей проблеме не поможет.
#29 11 октября 2013 в 15:16
помогите чем можите.или тут никто не начинал изучать php, а все сним и родились?
#30 11 октября 2013 в 17:59

помогите чем можите.или тут никто не начинал изучать php, а все сним и родились?

Константин Г.
Константин Г., Я понимаю. Но парсер это не лучший вариант начать изучать PHP.
Вы не можете отвечать в этой теме.
Войдите или зарегистрируйтесь, чтобы писать на форуме.
Используя этот сайт, вы соглашаетесь с тем, что мы используем файлы cookie.