Парсер PDF для импорта в новости

 
Посетитель
small user social cms
Медаль
Сообщений: 151
Здравствуйте граждане, у нас в городе есть газета муниципальная, которая каждый выпуск выкладывает на свой сайт в виде PDF файла.
Администрация когда-то еще лет 8 назад давала добро на размещение их новостей, но заставить сотрудников размещать новости на моём сайте не удастся, посему нужен парсер их новостей.
Программеры посмотрите пожалуйста этот файл, реально ли его отпарсить вообще? http://www.мо-петергоф.рф/upload/iblock/152/%D0%9C%D0%9F%20%E2%84%968_1.pdf

Статья свёрстана видимо в пейджмейкере каком-то и простым копипастом её не разместить, каждая строка с переносом строки получается.... Еще и фото. Кто разбирается посмотрите пожалуйста и оцените возможность.
Я могу засечь когда выкладывается файл надо чтобы автоматом парсер его скушал.
Посетитель
small user social cms
МедальАвторитет форумаКубок зрительских симпатий
Сообщений: 2595
Думаю, вы слишком многого хотите от жизни)
Не получится у вас это автоматом.
Посетитель
small user social cms
МедальКубок зрительских симпатийАвторитет форума
Сообщений: 1897
Попробуйте, вот парсер и демо там есть и документация...http://www.pdfparser.org/
Контент для ваших проектов. Копирайт всех видов от профессионалов. Создание и продвижение сайтов, реклама.
В начало страницы
Предыдущая темаСледующая тема Перейти на форум:
Быстрый ответ
Чтобы писать на форуме, зарегистрируйтесь или авторизуйтесь.