WebArchiveMaster - парсер Вебархива2

vsemmoney

Новичок
Регистрация
28.03.2019
Сообщения
8
Благодарностей
0
Баллы
1
Шаблон пришел, буду пробовать
 

vsemmoney

Новичок
Регистрация
28.03.2019
Сообщения
8
Благодарностей
0
Баллы
1
Помогите кто нибудь настроить Textru.
С шаблоном разобрался, спарсил им 500-600 статей.
Скачал Textru v1.4, добавил в зенку, после нажатия на кнопку старта пишет то, что он подключен, но ничего не происходит. Прокси естественно чекнул и они появились в документе. При нажатии на настройки выбивает - проект не содержит входных настроек.

Кое как вроде бы разобрался и каким то чудом начались попытки использовать прокси и даже заходить в text.ru, но вот что происходит



И так по кругу, прокси собирает - пишет что они не рабочие, потом обнулят их и заново..
 

Вложения

  • 111 КБ Просмотры: 190

vsemmoney

Новичок
Регистрация
28.03.2019
Сообщения
8
Благодарностей
0
Баллы
1
Всё заработало, прокси разогнались, нашелся по крайне мере один рабочий и пошло дело.
 

vsemmoney

Новичок
Регистрация
28.03.2019
Сообщения
8
Благодарностей
0
Баллы
1
Поставил на ночь работать проверку текста.
По какой то причине в 2 часа ночи написало "Ваших прокси нет в файле" хотя их там и не было. После чего написало что переходит в прокси лист и все стало.. собрано 500+ прокси - все на их работало, так зачем понадобились какие то "Мои прокси" и почему оно просто выключается, а не ищет альтернативу? что можно сделать в такое ситуации? 6 часов получилось что программа просто висела и не выбила никаких ошибок.

 

Вложения

Mikhail B.

Moderator
Регистрация
23.12.2014
Сообщения
14 303
Благодарностей
5 421
Баллы
113
@vsemmoney Эта тема не для поддержки, связывайтесь с продавцом и решайте вопросы в личке. (вы писать в личку не можете, по этому просите продавца самого написать)
 

footashes

Client
Регистрация
20.02.2015
Сообщения
1 041
Благодарностей
426
Баллы
83
WebArchiveMastersV4.6. Вебархив немного изменил данные, поэтому внесены правки и немного изменена логика, связанная с обработчиком.
  • Дополнена фильтрация
  • Дополнена чистка
Разошлю вечером, после тестирования.

Тестирование идет нормально. Заодно проверю проверку на уник.
Screenshot_1.jpg

P.S.
Отправил всем.

2.png


После парсинга текст нужно подготовить для проверки на уникальность. WebArchiveMastersV4.6 работает автоматически по заданным данным и может почистить на 70-80%. Для более тонкой чистки поможет шаблон "Clear texts".


Он помогает оценить текст визуально и массово внести изменения, если требуется. Цена исключительно формальная - 100 рублей. Кому нужно, вот реквизиты:

Яндекс-Деньги: 410011187505134
Киви - +7 961 999‑51‑37

Затем напишите на почту - [email protected]

Также на праздники шаблон WebArchiveMastersV4.6 с ценой 500 рублей.

Шаблон полностью открытый и без привязок + решение по скоростной проверки на уникальность.

Яндекс-Деньги: 410011187505134
Киви - +7 961 999‑51‑37

В примечании укажите свою почту.

Посмотрите видео - там показан принцип работы.
 
Последнее редактирование:

manka163

Client
Регистрация
28.12.2016
Сообщения
10
Благодарностей
1
Баллы
3
Здравствуйте. Все отлично парсится и проверяется на уникальность, спасибо ).

Сегодня заметила, что не все отработанные домены заносятся в черный список. Два домена таких уже увидела. На скрине для примера inter-cleaning.ru. Несколько дней назад он был обработан. У меня стояла еще версия 4.4.
Сегодня поставила версию 4.6 и загрузила список спаршенных из комментов доменов. Смотрю, опять обрабатывает этот домен, проверяю - нет его в черном списке. Удалила все из чистой карты, краулер закончил его обрабатывать и опять не записал в черный список.

Вопрос по скоростной проверке на уникальность - стоит 200 р?

 

footashes

Client
Регистрация
20.02.2015
Сообщения
1 041
Благодарностей
426
Баллы
83
Здравствуйте. Все отлично парсится и проверяется на уникальность, спасибо ).

Сегодня заметила, что не все отработанные домены заносятся в черный список. Два домена таких уже увидела. На скрине для примера inter-cleaning.ru. Несколько дней назад он был обработан. У меня стояла еще версия 4.4.
Сегодня поставила версию 4.6 и загрузила список спаршенных из комментов доменов. Смотрю, опять обрабатывает этот домен, проверяю - нет его в черном списке. Удалила все из чистой карты, краулер закончил его обрабатывать и опять не записал в черный список.


Домены, в которых мало текста или его нет, не заносятся в черный список (должно быть не менее 10 текстов). Могут быть причины - сбой интернета, сам вебархив не отдает в это время, но может отдать в другое и т.д. В черный список те заносятся домены, которые прошли все проверки и шаблон убедился, что текст действительно скачан.
Вопрос по скоростной проверке на уникальность - стоит 200 р? Да.
 
  • Спасибо
Реакции: manka163

VasiliySer

Новичок
Регистрация
26.10.2018
Сообщения
3
Благодарностей
0
Баллы
1
Привет, отпиши на почту, я в суботу писал.
 

footashes

Client
Регистрация
20.02.2015
Сообщения
1 041
Благодарностей
426
Баллы
83
Новая версия TextruV1.5 - пакетная проверка текста. Для бесперебойной работы папка с проверенным текстом перемещается в директорию "ReadyText" и берется следующая на проверку.

Screenshot.png
 

Galvit

Client
Регистрация
28.03.2019
Сообщения
17
Благодарностей
5
Баллы
3
А рассылка TextruV1.5 уже была?
 

Olegator

Client
Регистрация
15.02.2019
Сообщения
64
Благодарностей
11
Баллы
8
да, вчера тоже не понял, у меня только V1.4
 
  • Спасибо
Реакции: Yolbert_Shantry

footashes

Client
Регистрация
20.02.2015
Сообщения
1 041
Благодарностей
426
Баллы
83
  • Спасибо
Реакции: Webfrilanser

Webfrilanser

Новичок
Регистрация
07.12.2017
Сообщения
23
Благодарностей
0
Баллы
1

Deadman

Client
Регистрация
24.09.2011
Сообщения
75
Благодарностей
3
Баллы
8
А проверка уникальности только на https://text.ru? этот сайт вроде как не всегда корректно показывает уникальность текста
 

goldenbux

Client
Регистрация
06.09.2018
Сообщения
84
Благодарностей
44
Баллы
18
А проверка уникальности только на https://text.ru? этот сайт вроде как не всегда корректно показывает уникальность текста
Полностью поддерживаю! Не выдерживают у них серваки нагрузок..
content-watch давно работает 50 на 50.
text.ru - В последнее время тоже сильно глючит, очень часто при повторной проверке оказывается что там не 100% уникальности, а 0)) Самое фиговое что даже если изначально в пики нагрузок проверять повторно то так же может показывать норм уникальность, а потом когда проверяешь через сутки-две, покажет 0%) После того как начали банить каналы в яндекс дзен просек фишку что оказывается уникальный контент вовсе может быть и не совсем уникальным)) И % такого брака в текстру с каждым днем все растет и растет...
 

Юлия980

Новичок
Регистрация
21.05.2019
Сообщения
1
Благодарностей
0
Баллы
1
Написала вам на почту, ответьте пожалуйста!!!
 

Webfrilanser

Новичок
Регистрация
07.12.2017
Сообщения
23
Благодарностей
0
Баллы
1

footashes

Client
Регистрация
20.02.2015
Сообщения
1 041
Благодарностей
426
Баллы
83
Поддерживаю вы куда пропали??? я вам написал ещё дней 5 назад не ответа не привета !!! Жду от вас ответа на почте!!!
Еще раз напишите, может, просмотрел. Куча спама валится, приходится зачищать.
 

Webfrilanser

Новичок
Регистрация
07.12.2017
Сообщения
23
Благодарностей
0
Баллы
1

footashes

Client
Регистрация
20.02.2015
Сообщения
1 041
Благодарностей
426
Баллы
83
Полностью поддерживаю! Не выдерживают у них серваки нагрузок..
content-watch давно работает 50 на 50.
text.ru - В последнее время тоже сильно глючит, очень часто при повторной проверке оказывается что там не 100% уникальности, а 0)) Самое фиговое что даже если изначально в пики нагрузок проверять повторно то так же может показывать норм уникальность, а потом когда проверяешь через сутки-две, покажет 0%) После того как начали банить каналы в яндекс дзен просек фишку что оказывается уникальный контент вовсе может быть и не совсем уникальным)) И % такого брака в текстру с каждым днем все растет и растет...
Можно сделать контрольные проверки проверенных текстов по Текст.ру через https://advego.com/antiplagiat, но он медленный и с квотой по символам. Протестирую на днях. Либо использовать для дополнительной проверки Адвего Плагиатус, он поддерживает пакетность.
1.png

2.png
 

footashes

Client
Регистрация
20.02.2015
Сообщения
1 041
Благодарностей
426
Баллы
83
Сегодня одиннадцатый канал на Вебархиве выходит на монету. Предлагаю посмотреть, выйдет или нет в реальном времени:
этап жизни.png

Многие, кто работает с Дзеном, получали такие письма. На данный момент дело обстоит так:
Дзен статистика канала.png
Два дня назад после прихода письма о новом этапе жизни зарубили канал, в котором я описывал о своей жизни с формулировкой о заимствовании контента. Просто обрубили показы на 8000. Такое уже не в первый раз. Посмотрим, как будет с Вебархивом.
Ждите 3-4 часа или больше. В любом случае предоставлю пруфы (скриншот ответа техподдержки Яндекс).

Ну а вот и ответ:
яндекс.png


анкета.png


Посмотрите Дзен.Понедельник, увидете много интересного. Читайте между строк, Трибуна не слушайте. Авторские каналы банят на подлете к 5000, Вебархив пропускают. На канале 14 статей - всегда вывозит одна-две.
 
Последнее редактирование:
  • Спасибо
Реакции: specialist и Zennovods

goldenbux

Client
Регистрация
06.09.2018
Сообщения
84
Благодарностей
44
Баллы
18
Вебархив пропускают
Да и так давно понятно было что у них тупо ресурсов нет таких что бы как то выявлять вебархив и уникальные статьи)
Единственное что у них хватает ресурсов что бы 100% выявлять не уникальные статьи - а у нас не всегда 100% гарантия самой уникальности) Так как на всех сервисах проверок нагрузки большие, брака много, когда стал перепроверять повторно по несколько раз, все стало на свои места.

Не массовый характер, но рано или поздно попадаются такие статьи которые загубят канал.

P.S Сколько выходит по деньгам с 11 каналов?
 

goldenbux

Client
Регистрация
06.09.2018
Сообщения
84
Благодарностей
44
Баллы
18
Крч провел я ради интереса свой эксперимент по проверке на уникальность. По несколько раз прогонял одни и те же статьи. Процент брака в text.ru 10-20%. Так же ради эксперимента пытался параллельно работать и с другими сервисами. Ситуация странная. То текст ру покажет 100%(даже при повторной проверке), другой сервис словит 0%, и на оборот, в таком случае % брака еще больше. Но в таком ключе работать, по несколько проверок + в разных сервисах прогонять, это ппц по трудозатратам и ресурсам)) Но кому нужен результат ближе к 100%, кто использует текст для сервисов типа дзен и своих сайтов, советую чекать по нескольким источникам и по несколько раз) Что бы хоть как то уменьшить вероятность брака.

Screenshot_2.png
 

footashes

Client
Регистрация
20.02.2015
Сообщения
1 041
Благодарностей
426
Баллы
83
Глобальное обновление (примерно через неделю). Также лучше иметь десяток своих сайтов, на которых стоит реклама, чтобы иметь свою копеечку - сайты всегда пригодятся. Вот ещё один сайт, который приносит деньги на пассиве - РСЯ платит немного, но пачка сайтов без наполнения будет приносить доходы не один год. Это не доры или адалт, с которыми нужно возиться.
Наполнил или восстановил сайт - повешал РСЯ и забыл про него. Делаешь новый. Вот новый принятый сайт с РСЯ:

Screenshot_1.jpg


Трафик небольшой, но в наше время с миллиардами сайтов и дзенканалов это неплохие деньги. Главное - меньше мороки с рассылкой, дорвеями и адалтом, а на длинной дистанции выходят те же деньги.

Цена - 500 рублей.
Почта - [email protected]
Яндекс-Деньги: 410011187505134
Киви - +7 961 999‑51‑37
 

footashes

Client
Регистрация
20.02.2015
Сообщения
1 041
Благодарностей
426
Баллы
83
Крч провел я ради интереса свой эксперимент по проверке на уникальность. По несколько раз прогонял одни и те же статьи. Процент брака в text.ru 10-20%. Так же ради эксперимента пытался параллельно работать и с другими сервисами. Ситуация странная. То текст ру покажет 100%(даже при повторной проверке), другой сервис словит 0%, и на оборот, в таком случае % брака еще больше. Но в таком ключе работать, по несколько проверок + в разных сервисах прогонять, это ппц по трудозатратам и ресурсам)) Но кому нужен результат ближе к 100%, кто использует текст для сервисов типа дзен и своих сайтов, советую чекать по нескольким источникам и по несколько раз) Что бы хоть как то уменьшить вероятность брака.

Посмотреть вложение 39571
Сколько времени прошло с проверкой? Возможно, уже успели растащить, если разница в месяцы..
 

goldenbux

Client
Регистрация
06.09.2018
Сообщения
84
Благодарностей
44
Баллы
18
Сколько времени прошло с проверкой? Возможно, уже успели растащить, если разница в месяцы..
Сразу же, после первой проверки, запустил вторую по оставшимся уникальным.
 

footashes

Client
Регистрация
20.02.2015
Сообщения
1 041
Благодарностей
426
Баллы
83
Сразу же, после первой проверки, запустил вторую по оставшимся уникальным.
Несколько недель назад Текст.ру улучшал алгоритм, о чем они писали в новостях, чтобы не проверяли в это время, а я писал здесь (поищите в топике), чтобы не проверяли, попробуйте перепроверить сейчас на совпадения.
 

Webfrilanser

Новичок
Регистрация
07.12.2017
Сообщения
23
Благодарностей
0
Баллы
1
Глобальное обновление (примерно через неделю). Также лучше иметь десяток своих сайтов, на которых стоит реклама, чтобы иметь свою копеечку - сайты всегда пригодятся. Вот ещё один сайт, который приносит деньги на пассиве - РСЯ платит немного, но пачка сайтов без наполнения будет приносить доходы не один год. Это не доры или адалт, с которыми нужно возиться.
Наполнил или восстановил сайт - повешал РСЯ и забыл про него. Делаешь новый. Вот новый принятый сайт с РСЯ:

Посмотреть вложение 39704

Трафик небольшой, но в наше время с миллиардами сайтов и дзенканалов это неплохие деньги. Главное - меньше мороки с рассылкой, дорвеями и адалтом, а на длинной дистанции выходят те же деньги.

Цена - 500 рублей.
Почта - [email protected]
Яндекс-Деньги: 410011187505134
Киви - +7 961 999‑51‑37
Здравствуйте, это новый шаблорн вы написали по востановлению сайтов с вебархива с Трафиком или что это? за что 500р?
 

Duser

Client
Регистрация
11.08.2013
Сообщения
286
Благодарностей
192
Баллы
43
Купил шаблон с месяц назад. Только в эти выходные дошли до него руки. Парсер вебархива сработал чётко и им я насобирал много текстов. А вот проверка на Text.ru... У меня не получилось насобирать бесплатных проксей. Через них Text.ru или не открывается совсем или с вот таким окном:



То что шаблон сам находит через hidemyass вообще не грузится. За весь вечер смогло проверить один текст. Нужны хорошие прокси, которые стоят денег. Отобью я их с этими текстами? А фиг знает. Короче очередная декоративная херня.
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)