Как сделать свой парсер

Помогите сделать парсер

Предыдущая
1
2
3
Следующая
Показаны 16-30 из 36

#16 8 октября 2013 в 17:36

а как мне еще учится, на чом?

#17 8 октября 2013 в 17:37

это что парсер на инстант?

Петрмаг

#18 8 октября 2013 в 17:47

какие ошибки у вас вылезли? Может вообще не к этой строке.

Фриланс по Intantcms 1 и 2 версий.Писать в ЛС. Отзывы заказчиков

Сегодня в 08:51

#19 8 октября 2013 в 18:18

Дык этож метод научного тыка! :))
Роман

Тык конечно хорошо, но не когда работаешь с регуляркой…

#20 8 октября 2013 в 20:05

а как мне еще учится, на чом?
Константин Г.

Прежде всего научитесь читать справочный материал, иначе дальше учиться смысла нет.
Если, каждый раз, столкнувшись с проблемой вы будете просить у сообщества решение, то единственное чему вы научитесь — как просить помощи.

По вашему, Константин Г., коду:
$file = preg_replace('/<a href="#" id="ws2" onclick="is_this$this$;">(.*?)<\/a>/is','<a href="#" id="ws2" onclick="is_this$this$;">777<\/a>',$file);

#21 8 октября 2013 в 20:13

Дык этож метод научного тыка! :))
Роман
Тык конечно хорошо, но не когда работаешь с регуляркой...
Димитриус

Обычно с регулярками так и выходит)

Нормальный хостинг, сервера быстрые - пользуюсь сам.

#22 8 октября 2013 в 20:40

кучу символов экранировать?

#23 8 октября 2013 в 21:48

Плохо получается с post и get запросами0запрос идет на мне открывается сайт тот а не мой((

#24 9 октября 2013 в 06:02

Плохо получается с post и get запросами0запрос идет на мне открывается сайт тот а не мой((

Константин Г.

Значит у вас запрос идет не правильный, покажите весь код, а то гадать можно долго.

Фриланс по Intantcms 1 и 2 версий.Писать в ЛС. Отзывы заказчиков

#25 10 октября 2013 в 16:34

Плохо получается с post и get запросами0запрос идет на мне открывается сайт тот а не мой((

Константин Г.

Значит у вас запрос идет не правильный, покажите весь код, а то гадать можно долго.

kirkr

Спойлер

<?php
 ///Этим мы обозначаем начало скрипта.
 //2.Пишем 
 $file = file ("http://nigma.ru/?view=lite$QUERY_STRING");
 $file = implode ("",$file);
 //(Команда ?$QUERI_STRING отдает команды исходному скрипту, например, index.php?action=dosug ) 
 //3. Командой 
 // $file = str_replace('/n','333',$file);
 $file = str_replace('<img src(.*)logo.gif(.*)/>','111',$file);
 //Заменяем все, что надо заменить (или вырезать, оставив место между второй парой кавычек пустым). Заменяем все адреса и слова на нужные вам(если не понятно, я ниже напишу пример простейшего граббера) 
 //3. Командой 
 $file = str_replace('<a href="#" alt="Искать только на ресурсах Megaline" class="ws_normal" id="ws6" onclick="is_this(this);">Megaline</a>','222',$file);
 //Заменяем все, что надо заменить (или вырезать, оставив место между второй парой кавычек пустым). Заменяем все адреса и слова на нужные вам(если не понятно, я ниже напишу пример простейшего граббера) 
 
 //3. Командой 
 
 
//$file = preg_replace('/<a href="#" id="ws(.*)" onclick="is_this\(this\);">(.*)<\/a>/is','<a href="#" id="ws1" onclick="is_this(this);">Все</a>',$file);
//$file = preg_replace('/<li id="internet" onclick="mpage\(this\);" class="ms_active"><a href="#">инт(.*)both/is','775',$file);
//$file = preg_replace('/<title>Нигма(.*)right_a"><div id="content_right" ><style>#progress {display: none}<\/style>/is','776',$file);
$file = preg_replace('/src=\"/is','src="http://nigma.ru/',$file);
$file = preg_replace('/src=\'/is','src=\'http://nigma.ru/',$file);
$file = preg_replace('/<form action=\'unban.php\' method=\'post\'>/is','<form action=\'http://nigma.ru/unban.php\' method=\'post\'>',$file);
 
 //
 //4. Убираем рекламу командой
 $file = str_replace('|<a href=(.*)playfon.ru/(.*)>(.*)</a>|','', $file);
 //Этой командой мы вырезаем все ссылки, в которых содержится адрес на платный контент(в данном случае это playfon.ru). playfon.ru/ заменяем на адрес, который показывается в рекламных ссылках с постоянно меняющимися названиями. Обычно их 1-3:) Для тех, кто не понял: (.*)-простым языком-это как бы джокер, может принимать любое значение. И поэтому каждая ссылка, содержащая в себе адрес playfon.ru/(неважно, что впереди или после, там ведь стоит (.*) ) будет вырезаться.
 //5.Если, вдруг, вы собрались ограбить загрузки, сделали странички, а файлы не скачиваются(пишет файл не найден), значит скрипт запрашивает файл с вашего сервера, на котором этих файлов как раз нет:) Решение проблемы:
 //просто замените название вашей папки, в которой лежит скрипт на полный адрес до одноименной папки того сайта, с которого вы грабите.(например,
 //$file = str_replace('/static/download/','http://visavi.ne/static/download/',$file);)
 //Тогда скрипт будет запрашивать файлы на сервере, на котором они и лежат. Этот метод подходит к тем сайтам, где выдается прямая ссылка на файл.
 print "$file";
 //(Выводим получившееся)

Вообщем пост идет на тот сайт и мне открывается их сайт с результатом, как переход по ссылке я понял, но вот с post я непонял. ну или GET

#26 10 октября 2013 в 19:27

#27 10 октября 2013 в 20:06

Дык этож метод научного тыка! :))
Роман

Скорее, это экстримальное программирование )))

Хватит париться, живи как нравится!

#28 11 октября 2013 в 15:13

Дык этож метод научного тыка! :))
Роман
Скорее, это экстримальное программирование )))

Марат

Вот только рекламу своих сайтов ненадо, решению моей проблеме не поможет.

#29 11 октября 2013 в 15:16

помогите чем можите.или тут никто не начинал изучать php, а все сним и родились?

#30 11 октября 2013 в 17:59

помогите чем можите.или тут никто не начинал изучать php, а все сним и родились?
Константин Г.

Константин Г., Я понимаю. Но парсер это не лучший вариант начать изучать PHP.

Предыдущая
1
2
3
Следующая
Показаны 16-30 из 36

Друзья пользователя

Количество просмотров для альб

Вы не можете отвечать в этой теме.
Войдите или зарегистрируйтесь, чтобы писать на форуме.

Как сделать свой парсер

Похожие темы

Парсер канала телеграм?

Нужен парсер (куплю)

Парсер

Нужен парсер постов из телеграм-каналов на инстант

Доработать парсер телеграм-каналов

Создание задания для Парсера контента

[ЗАКРЫТО] Создание задания для Парсера контента от от dwd

Парсер не парсит в авто режиме, только вручную.

Похожее в блогах

Парсер контента для ICMS 2

Пакет расширения для компонента «Парсер контента»

Обновление парсера UPDS для InstantCMS 2 v 1.2.0

Парсер Яндекс.Карт для InstantMaps (версия 1.3, обновление )

InstantCMS Team

О проекте

Поддержка

Дополнения