4 место [Обзор]ZennoPoster + xPath на примере Яндекс.Маркета

DocSpoc · 26.03.2020

Phoenix78 сказал(а):
как пример, доработаете под себя
//*/button/*[ (@aria-label='Нравится') and (@height='24') ]

Спасибище! Не знал, что можно объединять через "and"

dtk77 · 30.04.2020

// собрал коллекцию
HtmlElementCollection itemsCollection = tab.FindElementsByXPath("//div[@class='cabinet']");

HtmlElement item = itemsCollection.GetByNumber(3); // взял элемент из коллекции под №4

// тут хочу получить название из взятого элемента №4
HtmlElement nameItem = item.FindChildByXPath ("//div[@class='description']", 0);

// но вместо этого получаю название от элемента №1

Объясните пожалуйста, что я не правильно делаю.

Phoenix78 · 30.04.2020

dtk77 сказал(а):
// собрал коллекцию
HtmlElementCollection itemsCollection = tab.FindElementsByXPath("//div[@class='cabinet']");

HtmlElement item = itemsCollection.GetByNumber(3); // взял элемент из коллекции под №4

// тут хочу получить название из взятого элемента №4
HtmlElement nameItem = item.FindChildByXPath ("//div[@class='description']", 0);

// но вместо этого получаю название от элемента №1

Объясните пожалуйста, что я не правильно делаю.

где то пролетало что FindChildByXPath не совсем корректно ищет.... возможно это и не так...
сделай лучше выбор элемента одним xpath. так надежнее и легче проверить в devtools

dtk77 · 30.04.2020

У меня задача взять определённое объявление. Проверить его статусы и в случае соответствия кликнуть по кнопке поднять. Я вижу решение через коллекции и обращение свойствам элемента коллекции. Не совсем понял как сделать "одни xpath"

Phoenix78 · 30.04.2020

dtk77 сказал(а):
У меня задача взять определённое объявление. Проверить его статусы и в случае соответствия кликнуть по кнопке поднять. Я вижу решение через коллекции и обращение свойствам элемента коллекции. Не совсем понял как сделать "одни xpath"

не одни, а одним.
ну примерно так //div[@class='cabinet'][3]/div[@class='description']
это как пример, полный путь без документа сложно составить
вместо 3-ки подставить свою переменную при формировании пути

dtk77 · 30.04.2020

Phoenix78 сказал(а):
не одни, а одним.
ну примерно так //div[@class='cabinet'][3]/div[@class='description']
это как пример, полный путь без документа сложно составить
вместо 3-ки подставить свою переменную при формировании пути

Спасибо за отклик,
Решил задачу через обращение к элементу в виде item.FindChildByAttribute

У меня при постановке переменной вместо 3ки ничего не происходит. Вероятно ошибка в синтаксисе
//div[@class='cabinet'][nomer]/div[@class='description'] Буду признателен, если укажите на ошибку

Phoenix78 · 30.04.2020

dtk77 сказал(а):
Спасибо за отклик,
Решил задачу через обращение к элементу в виде item.FindChildByAttribute

У меня при постановке переменной вместо 3ки ничего не происходит. Вероятно ошибка в синтаксисе
//div[@class='cabinet'][nomer]/div[@class='description'] Буду признателен, если укажите на ошибку

C#:

int nomer = 3;
string xpath = "//div[@class='cabinet']["+nomer.ToString()+"]/div[@class='description']";

timoxa949 · 13.05.2020

Подскажите пожалуйста как правильно составить запрос и сделать c# сниппет, сохраняющий результат в список, чтобы получить все характеристика товара, на примере: https://market.yandex.ru/product--protsessor-amd-ryzen-5-3600/508275153/spec?track=tabs

Valandersi · 13.05.2020

timoxa949 сказал(а):
Подскажите пожалуйста как правильно составить запрос и сделать c# сниппет, сохраняющий результат в список, чтобы получить все характеристика товара, на примере: https://market.yandex.ru/product--protsessor-amd-ryzen-5-3600/508275153/spec?track=tabs

Там сейчас динамические классы, не как было раньше, но это не самое страшное спарсить можно, но нужно каждую инфу отдельно выпаршивать, весь список не получится сразу, либо как-то поделить.

//div[@data-apiary-widget-name = '@MarketNode/ProductSpecs']

timoxa949 · 14.05.2020

Valandersi сказал(а):
Там сейчас динамические классы, не как было раньше, но это не самое страшное спарсить можно, но нужно каждую инфу отдельно выпаршивать, весь список не получится сразу, либо как-то поделить.

//div[@data-apiary-widget-name = '@MarketNode/ProductSpecs']

модицифицировал запрос таким образом:
//div[@data-apiary-widget-name = '@MarketNode/ProductSpecs']/descendant::dt | //div[@data-apiary-widget-name = '@MarketNode/ProductSpecs']/descendant::dd

парситса все, но в каждую новую строку.

Вопрос как сделать чтобы вывод был таким: Тактовая частота: 3600Мгц?

Или это уже штатными инструментами зенки? Спасибо

timoxa949 · 14.05.2020

timoxa949 сказал(а):
модицифицировал запрос таким образом:
//div[@data-apiary-widget-name = '@MarketNode/ProductSpecs']/descendant::dt | //div[@data-apiary-widget-name = '@MarketNode/ProductSpecs']/descendant::dd

парситса все, но в каждую новую строку.

Вопрос как сделать чтобы вывод был таким: Тактовая частота: 3600Мгц?

Или это уже штатными инструментами зенки? Спасибо

Посмотреть вложение 55728

Решился таким образом: //div[@data-apiary-widget-name = '@MarketNode/ProductSpecs']/descendant::dl

Подскажите пожалуйста как вывод сохранить в список?

timoxa949 · 14.05.2020

timoxa949 сказал(а):
Решился таким образом: //div[@data-apiary-widget-name = '@MarketNode/ProductSpecs']/descendant::dl

Подскажите пожалуйста как вывод сохранить в список?

Очень нужно, хелп!

luk911 · 14.05.2020

timoxa949 сказал(а):
Очень нужно, хелп!

есть же действие - парсить данные по правой кнопке, там есть расширенная настройка и можно поставить свой xpath там же увидишь результат. ну и там есть возможность сразу в список это пихать.

Юра73 · 24.08.2020

Подскажите, пожалуйста, как выбрать только определенную строку в узле и больше не брать дочерние html узлы:
<h1 class="title-section">Раскладной диван-кушетка Фантазия
<a href="/penza/mebelnaya-fabrika-stella-1845">
<span style="font-size: 14px; color: #aaa;">
<br class="xpather-highlight">г. Пенза</span></a>
<br class="xpather-highlight">Мебельная фабрика «Стелла»
</h1>
Страница: www.meb100.ru/livephoto/mebelnaya-fabrika-miks55/4491

В этом коде вторая строка не нужна <br class="xpather-highlight">Мебельная фабрика «Стелла»!
*//h1[@class='title-section']/a/span
У br нет закрывающего тега и тут я не знаю как?

Phoenix78 · 24.08.2020

Юра73 сказал(а):
Подскажите, пожалуйста, как выбрать только определенную строку в узле и больше не брать дочерние html узлы:
<h1 class="title-section">Раскладной диван-кушетка Фантазия
<a href="/penza/mebelnaya-fabrika-stella-1845">
<span style="font-size: 14px; color: #aaa;">
<br class="xpather-highlight">г. Пенза</span></a>
<br class="xpather-highlight">Мебельная фабрика «Стелла»
</h1>
Страница: www.meb100.ru/livephoto/mebelnaya-fabrika-miks55/4491

В этом коде вторая строка не нужна <br class="xpather-highlight">Мебельная фабрика «Стелла»!
*//h1[@class='title-section']/a/span
У br нет закрывающего тега и тут я не знаю как?

непонятно что надо взять. приведенный xpath выбирает 1 span. вроде все нормально. какая конечная цель и какие методы используются для ее достижения ?

Юра73 · 25.08.2020

Нужно только взять - г. Пенза, без Мебельная Фабрика

Phoenix78 · 25.08.2020

Юра73 сказал(а):
Нужно только взять - г. Пенза, без Мебельная Фабрика

*//h1[@class='title-section']/a/span/text()[2] так попробуй

Юра73 · 25.08.2020

Да так работает.
Интересно, плагин XPath Helper Wizard - не видит элемента по этому пути,
а плагин XPather (https://github.com/Simek/XPather) видит

random.Object · 27.11.2020

Написал запрос http://joxi.ru/823P8dQc8aEYWA Выбираю экшн "Обработка текста". Далее {-Page.Dom-}. Далее во вкладке "Выбрать действия" пытаюсь найти Xpath, но такой опции нет. Как сохранить результаты парсинга в файл?

Phoenix78 · 28.11.2020

random.Object сказал(а):
Написал запрос http://joxi.ru/823P8dQc8aEYWA Выбираю экшн "Обработка текста". Далее {-Page.Dom-}. Далее во вкладке "Выбрать действия" пытаюсь найти Xpath, но такой опции нет. Как сохранить результаты парсинга в файл?

через кубик парсинг

Phoenix78 · 28.11.2020

или так

random.Object · 28.11.2020

Phoenix78 сказал(а):
Посмотреть вложение 67978

Посмотреть вложение 67979

или так

Посмотреть вложение 67980

Посмотреть вложение 67981

Cпасибо, помогли разобраться

Philipp · 22.12.2020

Тренируюсь в C# на примере этого шаблона, хочу написать парсер чтобы структуру каталогов собрать в один кубик, первые заголовки получилось собрать, но вот дальше ошибка, подскажите что не так.
Логика такая - беру батю и собираю все списки в коллекции внутри него, в каждой коллекции беру заголовок и ссылку, кладу всё это в ячейки по уровням
Примерно так кладу в таблицу Лвл1|Линк;Лвл2|Линк2;Лвл3|Линк3;Лвл4|Линк4 и т.д. покуда там ещё будут категории.

Все ошибки в строке 28
Сайт https://tur-eda.ru/

Подскажите пожалуйста что не так и как это реализовать

C#:

IZennoList ItemList = project.Lists["Категории"];
IZennoTable table = project.Tables["Таблица 1"];
//Получаем текущу активную вкладку
Tab tab = instance.ActiveTab;

string xpath = "/html[starts-with(@class,'bx-core')]/body[starts-with(@class,'app')]/div[starts-with(@class,'app__wrapper')]/div[starts-with(@class,'b-aside-menu')]/div[@class='b-aside-menu__content']/div[@class='b-aside-menu__navs']/div[@class='b-aside-menu__scroller']/div[@class='b-aside-menu__scroller-content-main-menu']/nav[starts-with(@class,'aside-nav-list')]/ul[1]/li[@class='is-has-child']";
//Соберем все наши элементы используя "//div[starts-with(@data-id, 'model-')]" - xPath запрос. Будьте внимальны и используйте FindElementsByXPath.
HtmlElementCollection itemsCollection = tab.FindElementsByXPath(xpath);
//Лайфхак. Раскомментировать (Чтобы проверить, работает ли xPath) можно отправить в лог информацию о текущем количестве элементов в коллекции
project.SendInfoToLog("Количество элементов на страничке = " + itemsCollection.Count().ToString(), true);

//начинаем перебирать сформированную коллекцию HtmlElement-ов
foreach(HtmlElement item in itemsCollection)
{
    //Обращаемся к каждому элементу, как к пездюку через точку.
    HtmlElement pathItem = item.FindChildByXPath("./a", 0);
    //ItemList.Add(pathItem.InnerText);
    string link = new Regex("(?<=href=\").*?(?=\">)").Match(pathItem.OuterHtml).Value;
    table.AddRow(pathItem.InnerText+"|"+link);
    HtmlElementCollection items2Collection = item.FindChildrenByXPath("./descendant::li");
   
    if {(items2Collection.Count > 0)
        foreach(HtmlElement item2 in items2Collection)
        {
            //Обращаемся к каждому элементу, как к пездюку через точку.
    HtmlElement pathItem2 = item2.FindChildByXPath("./a", 0);

    string link2 = new Regex("(?<=href=\").*?(?=\">)").Match(pathItem2.OuterHtml).Value;
    table.AddRow(pathItem.InnerText+"|"+link+";"+pathItem2.InnerText+"|"+link2);
        }
    }
}

YANKEES · 19.08.2021

Плиз помогите, не могу заставить работать http://xpather.com/8cTCD236
в конструкторе работает а в зенке нет
спасибо

Dibujos en las paredes de la cocina: decoración elegante - pt.onlinesales2021.ru

Dibujos en las paredes de la cocina: decoración elegante

pt.onlinesales2021.ru

страница для парсинга

amyboose · 19.08.2021

YANKEES сказал(а):
Плиз помогите, не могу заставить работать http://xpather.com/8cTCD236
в конструкторе работает а в зенке нет
спасибо

Dibujos en las paredes de la cocina: decoración elegante - pt.onlinesales2021.ru

Dibujos en las paredes de la cocina: decoración elegante

pt.onlinesales2021.ru

страница для парсинга

//h2[@class='panel-title']/i[contains(@class,'star')] и потом взять InnerText

YANKEES · 19.08.2021

amyboose сказал(а):
//h2[@class='panel-title']/i[contains(@class,'star')] и потом взять InnerText

Пробивал выбирал DOM HTML менял InnerText InnerHtml
Ни чего не находит в зенке

YANKEES · 19.08.2021

строка поиска так выглядит
//h2[@class='panel-title', /i[contains(@class,'star')]]
иначе нацепляет кучу левых дивов
//h2[@class='panel-title']/i[contains(@class,'star')]

mr.green · 20.09.2021

Sz5 сказал(а):
ancestor (предок, батя)

descendant (потомок, пезд*к)

Никого не смущает, что сравнение в корне не верное? Тут больше подходит parent и child.

radv · 20.09.2021

mr.green сказал(а):
Никого не смущает, что сравнение в корне не верное? Тут больше подходит parent и child.

Я так понимаю.
parent это только родительский узел элемента (т.е. на 1 уровень вверх), ancestor это самый верхний возможный узел ветки.
child это вложенный узел (т.е. на 1 уровень ниже), descendant это любой из узлов по ветке ниже без учета глубины вложенности.

mr.green · 20.09.2021

radv сказал(а):
Я так понимаю.
parent это только родительский узел элемента (т.е. на 1 уровень вверх), ancestor это самый верхний возможный узел ветки.
child это вложенный узел (т.е. на 1 уровень ниже), descendant это любой из узлов по ветке ниже без учета глубины вложенности.

А я так.
ancestor это отец,дед,прадед, пра прадед....
descendant это сын,внук,правнук, пра правнук...

4 место [Обзор]ZennoPoster + xPath на примере Яндекс.Маркета

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Вложения

Client

Client

Вложения

Client

Client

Client

Client

Client

Новичок

Client

Новичок

Новичок

Client

Client

Client

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)