Поиск и сравнение

Artproma

Client
Регистрация
01.07.2014
Сообщения
63
Благодарностей
3
Баллы
8
Необходимо парсить на постоянной основе некую автонаполняемую страницу.
Задача в следующем:
1. Нужно парсить новые публикации в таблицу (уже реализовано).
2. Каждый раз при парсинге нужно сравнивать по определенному параметру (например по названию), чтоб не парсить повторно. как это реализовать?
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
19 470
Благодарностей
8 691
Баллы
113
топорный вариант - складывать напарсенные в п.1 названия в дополнительный файл и в п.2 проверять новые названия на совпадение с теми, которые уже записаны в файле (содержимое файла берем в переменную и в ней ищем вхождение)..
менее топорный вариант - сравнивать с содержимым таблицы.. алгоритм: берем столбец с названиями из таблицы, сливаем все в переменную и ищем вхождение.. если вхождение не найдено, то значит у нас новая публикация..
 
Последнее редактирование:
  • Спасибо
Реакции: Artproma

Artproma

Client
Регистрация
01.07.2014
Сообщения
63
Благодарностей
3
Баллы
8
Спасибо... сделал
 

zennoX

Client
Регистрация
05.04.2014
Сообщения
482
Благодарностей
131
Баллы
43

MrWebMoney

Client
Регистрация
20.10.2013
Сообщения
70
Благодарностей
6
Баллы
8
топорный вариант - складывать напарсенные в п.1 названия в дополнительный файл и в п.2 проверять новые названия на совпадение с теми, которые уже записаны в файле (содержимое файла берем в переменную и в ней ищем вхождение)..
менее топорный вариант - сравнивать с содержимым таблицы.. алгоритм: берем столбец с названиями из таблицы, сливаем все в переменную и ищем вхождение.. если вхождение не найдено, то значит у нас новая публикация..
Можно подробнее описать весь процесс ? какие экшены использовать.
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
  • Спасибо
Реакции: MrWebMoney

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)