Парсинг скриншотов с сайта

sanitarn

Client
Регистрация
15.12.2014
Сообщения
47
Благодарностей
2
Баллы
8
Добрый день, хочу создать скриншоты сайта, но мне "Проджект Менеджер" пишет, не удалось загрузить каптчу, попробуйте снова . Пример ссылки http://phct.ru/analizatory-belka-metodom-keldalya/
Также у меня вопрос, можно при создание скриншота присваивать заголовок сайта или например элемент хлебных крошек?
 
  • Спасибо
Реакции: orka13

orka13

Client
Регистрация
07.05.2015
Сообщения
2 167
Благодарностей
2 169
Баллы
113
Добрый день, хочу создать скриншоты сайта, но мне "Проджект Менеджер" пишет, не удалось загрузить каптчу, попробуйте снова . Пример ссылки http://phct.ru/analizatory-belka-metodom-keldalya/
Также у меня вопрос, можно при создание скриншота присваивать заголовок сайта или например элемент хлебных крошек?
А ты точно используешь "Данные - Обработка изображений"? Откуда там в логе о капче иначе?
Заголовок можно присвоить любой, парсишь регуляркой нужный текст с кода страницы. но потом надо удалить из этого текста символы, запрещенные в использовании названия файлов, а то не сохранит. например, регуляркой
Код:
[^\ a-zA-Zа-яА-Я\.\-\(\)\d]
 

КарлМаркс

Активный пользователь
Регистрация
11.07.2017
Сообщения
200
Благодарностей
64
Баллы
28

Обращаем Ваше внимание на то, что данный пользователь заблокирован.
Не рекомендуем проводить с КарлМаркс какие-либо сделки.

Код:
HtmlElement he = instance.GetTabByAddress("page").FindElementByAttribute("body", "fulltag", "body", "text", 0);
if (he.IsVoid) return -1;

// Отправить на распознавание
string recognition = ZennoPoster.CaptchaRecognition("CaptchaSaver.dll", he.DrawToBitmap(false), project.Path + "/папка/имя.jpg");
 
  • Спасибо
Реакции: sanitarn

sanitarn

Client
Регистрация
15.12.2014
Сообщения
47
Благодарностей
2
Баллы
8
А ты точно используешь "Данные - Обработка изображений"? Откуда там в логе о капче иначе?
Заголовок можно присвоить любой, парсишь регуляркой нужный текст с кода страницы. но потом надо удалить из этого текста символы, запрещенные в использовании названия файлов, а то не сохранит.
Я нашел на форуме вариант сохранения скринов сайта, клацаем по BODY и используем CaptchaSaver.dll , может такой способ устарел? Если не сложно можете пример скинуть или скрин, что нужно сделать для создания скриншота сайта?
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 614
Благодарностей
4 602
Баллы
113
лучше использовать экшн работы с изображениями. там всё проще
 

sanitarn

Client
Регистрация
15.12.2014
Сообщения
47
Благодарностей
2
Баллы
8
  • HtmlElement he = instance.GetTabByAddress("page").FindElementByAttribute("body", "fulltag", "body", "text", 0);
  • if (he.IsVoid) return -1;
  • // Отправить на распознавание
  • string recognition = ZennoPoster.CaptchaRecognition("CaptchaSaver.dll", he.DrawToBitmap(false), project.Path + "/папка/имя.jpg");
Тут я мозг сломал, экшены еще не изучал, что-то бы попроще. Но спасибо, есть чему учиться.

лучше использовать экшн работы с изображениями. там всё проще
Как мил человек?
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 614
Благодарностей
4 602
Баллы
113
  • Спасибо
Реакции: sanitarn

sanitarn

Client
Регистрация
15.12.2014
Сообщения
47
Благодарностей
2
Баллы
8

Всё на поверхности
Вчера целый день потратил на решение :-)

Только вот у меня немного другие параметры, видимо версию обновить нужно.
У меня нет инстанта, есть сохранить урл и браузер.
 

sanitarn

Client
Регистрация
15.12.2014
Сообщения
47
Благодарностей
2
Баллы
8

КарлМаркс

Активный пользователь
Регистрация
11.07.2017
Сообщения
200
Благодарностей
64
Баллы
28

Обращаем Ваше внимание на то, что данный пользователь заблокирован.
Не рекомендуем проводить с КарлМаркс какие-либо сделки.

sanitarn

Client
Регистрация
15.12.2014
Сообщения
47
Благодарностей
2
Баллы
8

Вложения

doc

Client
Регистрация
30.03.2012
Сообщения
8 614
Благодарностей
4 602
Баллы
113

sanitarn

Client
Регистрация
15.12.2014
Сообщения
47
Благодарностей
2
Баллы
8
ну а какая-нибудь пауза не помогает перед скрином?
В общем там даже не пауза, просто в "проджект мекере" размер браузера узкий и он скриншот делает как раз так, как я вижу картинку в "проджект мекере".

Всем спасибо!
 

sanitarn

Client
Регистрация
15.12.2014
Сообщения
47
Благодарностей
2
Баллы
8
Всем привет! Возникли трудности, у меня на парсинге 600 урлов, где-то 15-25 скриншотов делает нормально, а дальше скриншотов нет, а картинки есть.
И как видно по фото размер картинок изменился в 10-15 раз. Почему так получается?
 

Вложения

sanitarn

Client
Регистрация
15.12.2014
Сообщения
47
Благодарностей
2
Баллы
8
ну а какая-нибудь пауза не помогает перед скрином?
Возникли трудности со скриншотами, некоторые страницы не скриншотит, но на страницу заходит. В чем может быть проблема?
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)