WebArchiveMaster - парсер Вебархива2

Discussion in 'Продажа и покупка шаблонов ZennoPoster/ZennoDroid' started by footashes, Jan 20, 2018.

  1. enema

    enema Новичок

    Joined:
    Feb 8, 2018
    Messages:
    20
    Likes Received:
    3
    Я так понял что встроенный проксечекер не доступен в демо версии Зенопостера?
     
  2. footashes

    footashes Client

    Joined:
    Feb 20, 2015
    Messages:
    748
    Likes Received:
    298
    В Демо нет. И вроде, не позволяет использовать прокси вообще, хотя показывает, что использует.
     
  3. enema

    enema Новичок

    Joined:
    Feb 8, 2018
    Messages:
    20
    Likes Received:
    3
    А в демо версии зеннопостера не доступен проксичекер? [​IMG] Вот что у меня идет
     
  4. Mikhail B.

    Mikhail B. Moderator

    Joined:
    Dec 23, 2014
    Messages:
    5,568
    Likes Received:
    1,793
    Нет прокси в демоверсии не работают.
     
  5. enema

    enema Новичок

    Joined:
    Feb 8, 2018
    Messages:
    20
    Likes Received:
    3
    Хорошо, как раз собирался завтра купить лайт версию))
     
    Mikhail B. likes this.
  6. enema

    enema Новичок

    Joined:
    Feb 8, 2018
    Messages:
    20
    Likes Received:
    3
    Запускаю проверку на уник, прокси из своего списка удаляются, а из проксичекера ни один не работает уже в течении 7ми часов, что это может быть?[​IMG]
     
  7. footashes

    footashes Client

    Joined:
    Feb 20, 2015
    Messages:
    748
    Likes Received:
    298
    В помощи всё описано, понятно, её никто не читает. В проксичекере нужно использовать фильтрацию, чтобы отсеять 90% шлака.
    Screenshot_1.jpg
     
  8. footashes

    footashes Client

    Joined:
    Feb 20, 2015
    Messages:
    748
    Likes Received:
    298
    Хочу написать по Вебархиву и проверке на Антиплагиат - в связи со вспышкой интереса к Яндекс.Дзен очередь на проверку на копипаст на Текст.ру может достигать 70 - 120 очередности проверок, также забиты прокси, так-как все ломанулись в Дзен. Модераторы там уже не справляются и проверка новых материалов сейчас достигает 3 часов. Также усложнился алгоритм. Они обрезали все RSS каналы для сайтов и тянут трафик на себя. Подробнее я напишу в ветке Дзена, также разошлю новый шаблон с примерами своих и чужих каналов.

    Сейчас хочу приложить пример парсинга ВебархивМастер, чтобы вы представляли, как он работает. На уникальность не проверял, это просто пример работы:
     
  9. enema

    enema Новичок

    Joined:
    Feb 8, 2018
    Messages:
    20
    Likes Received:
    3
    Как раз таки мануал я читал, и "0" там стоит, но он все удаляет и пишет что нет своего списка прокси, в прошлой ветки кто то писал о такой же проблеме, но решения я не нашел))
     
  10. footashes

    footashes Client

    Joined:
    Feb 20, 2015
    Messages:
    748
    Likes Received:
    298
    Да, хочу написать, что я работаю на версии 5.9.9.1, как будет работать на других версиях, не знаю, так-как их слишком много. То, что на младших работать не будет, это точно. Сегодня протестирую на новой версии и отпишу.
     
  11. enema

    enema Новичок

    Joined:
    Feb 8, 2018
    Messages:
    20
    Likes Received:
    3
    Я на 5.15.0.0
     
  12. enema

    enema Новичок

    Joined:
    Feb 8, 2018
    Messages:
    20
    Likes Received:
    3
    А можно ссылку на ветку Дзен, интересно будет почитать
     
  13. footashes

    footashes Client

    Joined:
    Feb 20, 2015
    Messages:
    748
    Likes Received:
    298
    Вот, проверил на 5.13.1.0. Всё работает нормально, берет из файла свои прокси. Проблема найти хорошие прокси, чтобы не фильтровать и проверять, на что уходит много времени. Алгоритм шаблона был разработан специально для плохих прокси, которая может умереть в любой момент, прокси проверяется неоднократно.

     
  14. enema

    enema Новичок

    Joined:
    Feb 8, 2018
    Messages:
    20
    Likes Received:
    3
    Попробую позже с платными прокси
     
  15. AvraamZukoaa

    AvraamZukoaa Client

    Joined:
    Feb 1, 2018
    Messages:
    4
    Likes Received:
    1
    Проверяю с проксичекером. Все работает. Список файлов в папке "Уникальные" не быстро, но растет :-) Версия 5.15.
     
    footashes likes this.
  16. footashes

    footashes Client

    Joined:
    Feb 20, 2015
    Messages:
    748
    Likes Received:
    298
    По Дзену отпишу к вечеру, покажу выплаты. Насчет проверки данных нейросетями Яндекся, видимо, я ошибся, их нейро выглядит вот так:
    2015.10.05_08-39-29215.JPG
     
  17. footashes

    footashes Client

    Joined:
    Feb 20, 2015
    Messages:
    748
    Likes Received:
    298
    Проверка Текст.ру и КонтентВатч изначально не планировалась для промышленных масштабов, я об этом писал. Это предназначено для тех, кому нужно проверить 40-50 текстов, одновременно забирая готовые и подкидывая новые. Если нужно проверять сотни и тысячи текстов, нужно использовать программу AntiPlagiarism.NET, которая поддерживает пакетную проверку. Но потребуются хорошие прокси и антикапча + рекапча. Она позволит отсеять много шлака, но проверка через Текст.ру всё равно потребуется.
     
  18. intourist

    intourist Client

    Joined:
    Aug 30, 2010
    Messages:
    18
    Likes Received:
    1
    footashes, спасибо за шаблон
    у меня такой вопрос. я собираю тексты на английском языке, на каком сервисе мне лучше проверять их на уникальность? корректно ли text.ru и content-watch.ru показывают уникальность для англ. текстов или лучше использовать какой-нибудь бурж сервис?

    вижу ты еще используешь AntiPlagiarism.NET, вообще судя по описанию этого софта это хороший вариант для моих нужд. что посоветуешь исходя из опыта?
     
  19. footashes

    footashes Client

    Joined:
    Feb 20, 2015
    Messages:
    748
    Likes Received:
    298
    Ну, только text.ru, они позиционируют себя по всем языкам, на них и нужно ориентироваться. AntiPlagiarism.NET - это пакетная проверка в промышленных масштабах, разгадка капчи для Яндекса - для меня Ксевил + для Гугл - Рекапча, на остальные ПС можно не ориентироваться, они, как правило, используют выдачу этих двух гигантов в разных вариациях.
     
    intourist likes this.
  20. footashes

    footashes Client

    Joined:
    Feb 20, 2015
    Messages:
    748
    Likes Received:
    298
    Кому интересен Дзен - http://zennolab.com/discussion/threads/jandeks-dzen-sliv-trafika.45534/page-2#post-342661, сейчас проводится проверка на плагиат текстов, напарсеных с Вебархива с помощью WebArchiveMaster (за несколько часов около 600 текстов по своей методике), цель - побить свой рекорд по выводу канала за два дня с помощью уника (я выводил другими методами).

    Дзен, если честно, я понять не могу - там контрл, картинка, кликбейт не играет никакой роли, я проанализировал не одну сотню своих публикаций и не пойму, как оно работает и по какому алгоритму. Это как биткоин, кто раньше встал, того и тапки. Если интересно, как поведет себя уник из Вебархива, через 5-6 дней покажу результат. Правда, думаю, я как обычно, 4-5 дней буду гулять с родственниками, и один день работать, тем не менее.

    Скрин сервера, но ничего не обещаю, скорее всего, забью и буду работать серыми методами:

    Screenshot_2.png
    О, случайно на сервере нашел уже проверенный уник, будет уже проще:
    Screenshot_3.png

    P.S.
    Сейчас проверил выборочно - по Текст.ру все тексты показывают такой результат. Так что, если хотите взять, берите сейчас, потом пригодится ©.
    Screenshot_1.jpg
     
    Last edited: Feb 12, 2018
  21. footashes

    footashes Client

    Joined:
    Feb 20, 2015
    Messages:
    748
    Likes Received:
    298
    Вебархив в Дзене показал себя плохо. Много просмотров и мало показов, что говорит о том, что Дзен - прежде всего новостная платфома с "горячими" новостями и блоговые статьи заходят плохо. Людям не интересны тематики типа "Как вылечить грипп подорожником", зато им интересно "Шурыгина изнасиловала шурыгина".
    Скоро выборы, модерация в Дзене на данный момент ручная и очень жесткая. Выборы пройдут, Путин наконец-то восторжествует и всё нормализуется.
    Да, хочу написать - мои каналы начали перебивать договорные, типа Триникси, поэтому я на одной сетке получил бан за возростание, и сейчас с пессемизированной сетки мой доход составляет не 1000,а 370-389 рублей в день. Скорее всего, сетка ушла по стуку, или кому-то что-то не понравилось.
    Хорошо,что у меня не одна сетка.
     
    Last edited: Feb 15, 2018
    -BeeR-, one and daymos like this.
  22. footashes

    footashes Client

    Joined:
    Feb 20, 2015
    Messages:
    748
    Likes Received:
    298
    Всё-таки я поспешил с выводами - Вебархив показывает себя хорошо, нужно только правильно всё делать. Если вы ведете несколько каналов, не лепите всё на один номер - по горькому опыту: уйдет в пессемизацию один канал - уйдут все, что привязаны на этот номер.

    Как правильно делать - регистрировать номер у смс-регистраторов (2 рубля-смс), один канал - один номер. На разные каналы заходить с разных браузеров, неплохо привязать прокси к каналу (как в ВК). Это основное. Не майтесь фигней и не надейтесь на долгосрочное сотрудничество с Яндексом, типа веду белый канал и всё будет хорошо.

    Смотрите в сторону слива, видел скриншоты, у многих выходит, но нужно понять специфику Дзена, поработать с ним, он очень не любит ссылки и прекрасно их вычисляет, дальше думайте сами.
     
  23. gold

    gold Client

    Joined:
    Aug 6, 2011
    Messages:
    12
    Likes Received:
    1
    Вебархив классная темка,но если нужны тексты строго по нужным ключевикам то поможет слабо.Есть другой способ,но с им повозиться надо немного с текстами.

    Автор я стукну на мыло может тебе тоже интересно будет.Тематика то одна.

    Да всех с праздником с Днем защитника Отечества ,особенно кто служил мужики…
     
  24. Hool

    Hool Client

    Joined:
    Mar 27, 2015
    Messages:
    63
    Likes Received:
    5
    Приобрести еще можно?
     
  25. footashes

    footashes Client

    Joined:
    Feb 20, 2015
    Messages:
    748
    Likes Received:
    298
    Можно всегда.
    WebArchiveMaster - парсер Вебархива + Black Widow Spider + Антиплагиат + Мануал + Content Watch за 500 рублей. Восстановление всего сайта из Вебархива. Полностью готовый сайт, остается только залить на сервер. Все купившие WebArchiveMaster получат его бесплатно.

    Вебмани: R282711380496
    Яндекс-Деньги: 410011187505134
    В примечании введите свой емейл.

    Все шаблоны открыты для редактирования, можно менять и дополнять всё что угодно (многие модернизирубт под себя). По умолчанию проверка уникальности стоит 80%, можно поставить, какой требуется.
     
  26. one

    one Client

    Joined:
    Sep 22, 2015
    Messages:
    5,146
    Likes Received:
    856
    А кто уже купил?
     
  27. footashes

    footashes Client

    Joined:
    Feb 20, 2015
    Messages:
    748
    Likes Received:
    298
    Так он есть в рассылке с небольшим видеообзором - Восстановление сайтов из Вебархива.
     
    one likes this.
  28. one

    one Client

    Joined:
    Sep 22, 2015
    Messages:
    5,146
    Likes Received:
    856
    Хорошо, гляну.
     
  29. footashes

    footashes Client

    Joined:
    Feb 20, 2015
    Messages:
    748
    Likes Received:
    298
    Как-то грустно и скучно. Весна, авитаминоз, ничего делать не хочется, деньги с РСЯ капают, но вечно такое продолжаться не может. Чтобы себя мотивировать, хочу устроить марафон - Вебархив VS Яндекс.Дзен. Ждем решения администраторов, можно ли создать такую тему, где я буду описывать свои взлёты и падения, так-как в коммерческой теме я спамить не буду.
     
  30. footashes

    footashes Client

    Joined:
    Feb 20, 2015
    Messages:
    748
    Likes Received:
    298
    Сейчас по методике, основанной на вероятности поиска нужной тематики, есть возможность выйти в лидеры. Тематика должна быть, узкой - если собаки, не нужно писать о сапогах (собаки в сапогах, согласитесь, это натянуто - алго это очень не нравится, сейчас идет борьба с терминаторами роботами, пришло время), пишите узкую тематику, о том, что интерекно. Не забывайте о ключах (алгоритм Дзена базируется на ключах).

    Используя текст из Вебархива, не забывайте про ключи - используйте актуальную тематику (интересную людям), используйте Мутаген или производную формулу для КейКоллектора, что проще. Ранжирование идет по ключам и трендам, что связанно.
     

Пользователи просматривающие тему (Пользователей: 0, Гостей: 1)