Собрать информацию с таблицы на сайте

lx2003

Client
Регистрация
15.02.2021
Сообщения
489
Благодарностей
132
Баллы
43
Здравствуйте!
Как используя зеннопостер (projectmaker) собрать информацию с таблицы, расположенной на странице каких-то сайтов, причем тип таблицы может быть сделан любым из способов?
Таблица или несколько таблиц должны найтись на странице самостоятельно. При чем, если визуально таблицы различные, то и в результате должны получить несколько таблиц в среде projectmaker или тоже несколько файлов xls.
 

lx2003

Client
Регистрация
15.02.2021
Сообщения
489
Благодарностей
132
Баллы
43
Может сниппет готовый кто находил?
 

Alexbrush

Client
Регистрация
20.11.2020
Сообщения
126
Благодарностей
98
Баллы
28
Ну поиск таблиц через поиск table в коде и сбор данных между этим тегом, другой вопрос как это обрабатывать, столбцов и строк может быть различное число. Но если таблица 1 на странице, наверно можно так или иначе собрать данные с разделеием и выгрузить после в таблицу внутри PM (делал подобное как-то), а вот если на странице несколько таблиц, то как их между собой разделить уже сложно даже представить. В любом случаем нужны конкретные примеры и под них уже шаманить шаблон.
 
  • Спасибо
Реакции: lx2003

lx2003

Client
Регистрация
15.02.2021
Сообщения
489
Благодарностей
132
Баллы
43
Ну поиск таблиц через поиск table в коде и сбор данных между этим тегом, другой вопрос как это обрабатывать, столбцов и строк может быть различное число. Но если таблица 1 на странице, наверно можно так или иначе собрать данные с разделеием и выгрузить после в таблицу внутри PM (делал подобное как-то), а вот если на странице несколько таблиц, то как их между собой разделить уже сложно даже представить. В любом случаем нужны конкретные примеры и под них уже шаманить шаблон.
В полуавтоматическом режиме у меня предположение, что надо сделать так:
Скопировать некоторую часть первой строки данных и скопировать некоторую часть последней строки из необходимых таблиц в объект Список.

Потому что таблица на сайте может быть сгенерирована или разработана по разным принципам разработки сайтов, в том числе и разным ПО - конструкторами сайтов, из тегов div, к примеру...


Вот что еще нашел.


Если таблица на сайте сделана из тегов div, то как парсером определить, что это таблица, может быть не так просто, как если бы она была сделана из тегов table, tr и td. Однако, есть несколько способов, которые могут помочь вам в этом:

• Вы можете проверить, есть ли у элементов div атрибуты или стили, которые указывают на то, что они являются частями таблицы. Например, если у div есть свойство display: table, display: table-row или display: table-cell, то это может означать, что он представляет собой таблицу или ее часть.

• Вы можете анализировать структуру и содержимое элементов div, чтобы определить, имеют ли они табличный вид. Например, если у div есть дочерние элементы div, которые расположены в ряды и колонки, и содержат однородные данные, то это может означать, что они образуют таблицу
 
Последнее редактирование:

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)