Почему Regex перестал парсить гугл?

loogle

Client
Регистрация
08.12.2013
Сообщения
291
Благодарностей
113
Баллы
43
Делаю GET запрос https://www.google.ru/search?q=key, все в переменную snippet.
Смотрю переменную, в ней вся спаршенная страница со сниппетами, бана нет.
Пробую в тестере регулярок (?<=<span\ class="st">).*?(?=</span>), все нормально текст выпарсивает.
Это всё в экшен Regex:


Но список пустой! Он не может обработать текст, который лежит в переменной и прекрастно выпарсиваеться в тестере. Хотя до этого все было в порядке. Файл шаблона прилагаю:

 

Вложения

Последнее редактирование:

blud

Client
Регистрация
19.04.2011
Сообщения
657
Благодарностей
77
Баллы
28
вот прям сейчас делаю шаблон где есть парсинг гугла по почти такой же((?<=<span\ class="st">).*?(?=</span></div>) регулярке... все норм


пы. сы ... правда я использую по привычке, старый макрос(зенно 3): {-RegExp.RegExp-|-{-твоя переменная-}-|-(?<=<span\ class="st">).*?(?=</span></div>)-|-all-}
 

loogle

Client
Регистрация
08.12.2013
Сообщения
291
Благодарностей
113
Баллы
43
вот прям сейчас делаю шаблон где есть парсинг гугла по почти такой же((?<=<span\ class="st">).*?(?=</span></div>) регулярке... все норм


пы. сы ... правда я использую по привычке, старый макрос(зенно 3): {-RegExp.RegExp-|-{-твоя переменная-}-|-(?<=<span\ class="st">).*?(?=</span></div>)-|-all-}
blud а мой пробовал, норм парсит?
в старых не силен, с зенки 5 начал, куда это вообще вставлять?
 

blud

Client
Регистрация
19.04.2011
Сообщения
657
Благодарностей
77
Баллы
28
  • Спасибо
Реакции: loogle

loogle

Client
Регистрация
08.12.2013
Сообщения
291
Благодарностей
113
Баллы
43
экшн обработка текста сохранить в переменную
Ну теперь понял куда. Только все равно не получаеться, сейчас по логу посмотрел:


Это как так o_O куда ж он делся?
Я кстати и не спрашивал как правильно, спросил с какого он работать перестал? Как будто для него (?<=<span\ class="st">).*?(?=</span>) такой макрос не осуществим.
Зенку переустанавливал - не помогло...
 

blud

Client
Регистрация
19.04.2011
Сообщения
657
Благодарностей
77
Баллы
28
Как будто для него (?<=<span\ class="st">).*?(?=</span>) такой макрос не осуществим..
нуу ... вообщето ... это не макрос ... а регулярка...
и... написал я тебе про старый макрос ... не потому, что так правильно ... а просто попробовать .. будет ли работать ... если ты прочитаешь мое последнее сообщение в теме: http://zennolab.com/discussion/threads/vozvrat-k-nevypolnennomu-dejstviju.20447/ ... то поймешь о чем я... у меня экшн файлы выдает ошибку в простом действии, когда то же действие старым макросом проходит норм..

пы. сы... вот что то подумалось, что ты в экшн обработка переменных пытаешся просто вкрячить регулярку, думая что это старый макрос ... так эмм.... попробуй так:
{-RegExp.RegExp-|-{-Variable.snippet-}-|-(?<=<span\ class="st">).*?(?=</span></div>)-|-all-}
в переменную и сохрани в какую нить переменную
 

blud

Client
Регистрация
19.04.2011
Сообщения
657
Благодарностей
77
Баллы
28
хмм.. попробовал твой шаб.. и с старым макросом не работает(разбираться лень), а вот так работает
 

Вложения

loogle

Client
Регистрация
08.12.2013
Сообщения
291
Благодарностей
113
Баллы
43
Ты не понял через DOM то у меня тоже работает, GET нужен.
Мне не нужны старые макросы, то что в первом посте у меня прекрастно работало на протежении полгода, и вдруг бац вчера ни вкакую не хочет Regex обработать данный текст и всё(
Думал по IP бан получил, нет, в переменной полный html текст сниппетов со страницы гугла.
 

blud

Client
Регистрация
19.04.2011
Сообщения
657
Благодарностей
77
Баллы
28
Ты не понял через DOM то у меня тоже работает, GET нужен.
Мне не нужны старые макросы, то что в первом посте у меня прекрастно работало на протежении полгода, и вдруг бац вчера ни вкакую не хочет Regex обработать данный текст и всё(
Думал по IP бан получил, нет, в переменной полный html текст сниппетов со страницы гугла.
ппц ... это ты не понял ... я не навязываю тебе старые макросы... я пытаюсь сказать, что некоторые экшны пчму то глючат ...(в твоем случае гет.. в моем файлы... )
 

loogle

Client
Регистрация
08.12.2013
Сообщения
291
Благодарностей
113
Баллы
43
ппц ... это ты не понял ... я не навязываю тебе старые макросы... я пытаюсь сказать, что некоторые экшны пчму то глючат ...(в твоем случае гет.. в моем файлы... )
Чет тоже заметил что глючат. Сейчас попробовал после гета в тхт>html записать - белый экран и какая то галиматья записалась, ключ только в тайтле есть. Взял напрямую из переменной в html - все ок)
И опять ошибка, в базе такого макроса нет.
 
Последнее редактирование:

blud

Client
Регистрация
19.04.2011
Сообщения
657
Благодарностей
77
Баллы
28
Чет тоже заметил что глючат. Сейчас попробовал после гета в тхт>html записать - белый экран и какая то галиматья записалась, ключ только в тайтле есть. Взял напрямую из переменной в html - все ок)
И опять ошибка, в базе такого макроса нет.
интересно вот что: взял результат твоего гет запроса, вкрячил его в тестер рег. выражений... вставил твою регулярку ... парсит норм .. а экшном парсить не хочет
 

loogle

Client
Регистрация
08.12.2013
Сообщения
291
Благодарностей
113
Баллы
43
интересно вот что: взял результат твоего гет запроса, вкрячил его в тестер рег. выражений... вставил твою регулярку ... парсит норм .. а экшном парсить не хочет
Вот и я про то, получаеться что постер не может корректно передать текст из переменной GET запроса. Или подкрутили что то в верстке гугла и зенка сбиваеться.
 

blud

Client
Регистрация
19.04.2011
Сообщения
657
Благодарностей
77
Баллы
28
Вот и я про то, получаеться что постер не может корректно передать текст из переменной GET запроса. Или подкрутили что то в верстке гугла и зенка сбиваеться.
хм ... меня сейчас это утверждение, навело на одно подозрение... есть у меня пачка шаблонов(спам по ресурсам) сделаные на гет-пост запросах... так некоторые из них, недавно стали выдавать ошибку и как раз при получении Regex из гет запроса... думал на сайтах что то сменилось ... а теперь ... хм .. нужно проверять
 

loogle

Client
Регистрация
08.12.2013
Сообщения
291
Благодарностей
113
Баллы
43
Проверил на другом ноуте, такая же ахинея, сшибаеться вот на этом:

Думает что это макрос на спаршенной странице )
Осталось понять как это всё обойти.
 

blud

Client
Регистрация
19.04.2011
Сообщения
657
Благодарностей
77
Баллы
28
Проверил на другом ноуте, такая же ахинея, сшибаеться вот на этом:

Думает что это макрос на спаршенной странице )
Осталось понять как это всё обойти.
х.з. дождемся кого нить из админов ...эти(по определению) должны знать все ...)))
 

svaminar

Client
Регистрация
21.08.2013
Сообщения
834
Благодарностей
378
Баллы
63
да сохрани в переменную весь дом или исходный код и замени moz-transition на что небудь.
Или делай парсинг регуляркой в 2 шага. Сначала ищи весь див блок а вторим екшеном регекс из блока бери что нужно.
 

loogle

Client
Регистрация
08.12.2013
Сообщения
291
Благодарностей
113
Баллы
43
да сохрани в переменную весь дом или исходный код и замени moz-transition на что небудь.
Или делай парсинг регуляркой в 2 шага. Сначала ищи весь див блок а вторим екшеном регекс из блока бери что нужно.
Делал уже, бесполезно. Видел там какой код в ошибке?

Тут наверно только средствами C# можно что то изменить.
 
Последнее редактирование:

blud

Client
Регистрация
19.04.2011
Сообщения
657
Благодарностей
77
Баллы
28
сейчас проверяю свои шаблоны с гет запросами ... хм ... такую ошибку выдает только запрос к гуглу ... запросы к другим ресурсам и последующий regex работают норм
 

loogle

Client
Регистрация
08.12.2013
Сообщения
291
Благодарностей
113
Баллы
43
сейчас проверяю свои шаблоны с гет запросами ... хм ... такую ошибку выдает только запрос к гуглу ... запросы к другим ресурсам и последующий regex работают норм
точно верстку гугл изменили, вот и не может зенка понять что от неё хотят, посмотрел код, там что то с голосовым поиском завязано, и всё из за этого {}.
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
JS какой-то выглядит как макрос. Посмотрим что можно сделать.
 

orka13

Client
Регистрация
07.05.2015
Сообщения
2 166
Благодарностей
2 167
Баллы
113

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)