- Регистрация
- 16.09.2015
- Сообщения
- 22
- Благодарностей
- 2
- Баллы
- 3
Братцы, ну подскажите. Нужно выпарсить значения.
Значит есть страница. GET её в DOM (переменная).
В DOM-е HTML-код, который содержит списки (<ol><li>) с сылками. Кроме этого есть ещё другие ссылки и внизу ещё дублирующее меню. Задача задать такую регулярку, где-бы можно было сразу спарсивать несколько значений в массивы. Я не знаю как это на Си-шарпе делать. Но вот на PHP код похожего характера:
Результат:
Только мне нужно, чтобы во вложенные массивы собиралось 4 значения:
Собственно вопрос:
1. Есть ли в Си-шарп какой-либо аналог preg_match_all с включенным PREG_SET_ORDER.
2. Когда я получил всё это в виде такого массива, как теперь это всё интересное запихать в таблицу (*.xlsx). Возможно ли такое?
p.s. разделов там несколько, а вот категорий несколько сотен.
Значит есть страница. GET её в DOM (переменная).
В DOM-е HTML-код, который содержит списки (<ol><li>) с сылками. Кроме этого есть ещё другие ссылки и внизу ещё дублирующее меню. Задача задать такую регулярку, где-бы можно было сразу спарсивать несколько значений в массивы. Я не знаю как это на Си-шарпе делать. Но вот на PHP код похожего характера:
PHP:
<?php
$str = "123 234 345";
$order = PREG_SET_ORDER;
$result = preg_match_all('/\d(\d)\d/',$str,$found,$order);
print_r($found);
?>
HTML:
Array
(
[0] => Array
(
[0] => 123
[1] => 2
)
[1] => Array
(
[0] => 234
[1] => 3
)
[2] => Array
(
[0] => 345
[1] => 4
)
)
HTML:
Array
(
[0] => Array
(
[0] => БОЛЬШОЙ_КУСОК_HTML_КОДА_ГДЕ_ЕСТЬ_ВСЁ_НИЖЕСЛЕДУЮЩЕЕ
[1] => Название Раздела
[2] => Название категории статьи 1
[3] => Ссылка на эту категорию 1
[4] => Количество статей (цифра) 1
)
[1] => Array
(
[0] => БОЛЬШОЙ_КУСОК_HTML_КОДА_ГДЕ_ЕСТЬ_ВСЁ_НИЖЕСЛЕДУЮЩЕЕ
[1] => Название Раздела
[2] => Название категории статьи 2
[3] => Ссылка на эту категорию 2
[4] => Количество статей (цифра) 2
)
)
1. Есть ли в Си-шарп какой-либо аналог preg_match_all с включенным PREG_SET_ORDER.
2. Когда я получил всё это в виде такого массива, как теперь это всё интересное запихать в таблицу (*.xlsx). Возможно ли такое?
p.s. разделов там несколько, а вот категорий несколько сотен.
Последнее редактирование: