Недавний контент Challenger

  1. Challenger

    Парсинг данных - один большой файл или много маленьких?

    Сам спросил - сам отвечу. Вне зависимости от теоретических выкладок - что на практике: -при использовании RAM диска шаблон выполняется быстрее, где-то на 25% (т.к. отсутствуют операции чтения-записи на диск). -возрастает средняя нагрузка на CPU в районе тех же 25% (скорее всего, за счет...
  2. Challenger

    Парсинг данных - один большой файл или много маленьких?

    В каком-то из видео про логику зеннопостера, видел, что, например копирование файла в зенке реализовано следующим образом -берутся данные из копируемого файла -создается новый файл -в него записываются эти данные -исходный файл удаляется. Действительно ли это так, и может ли быть затык со...
  3. Challenger

    Парсер контента X-Parser Light

    чем больше функций имеет инструмент - тем обычно хуже реализована каждая из них) Как пример - Кей Коллектор. Собирает данные из 100500 сервисов, но по скорости по ряду сервисов (вордстат, директ ) работает хуже чем мои поделки на кубиках в зенке.
  4. Challenger

    Парсер контента X-Parser Light

    Контент парсит фактически без мусора, подтверждаю. Переводить при наличии зенки не проблема. Уникализация присутствует в формате мешапа контента (видел в настройках, но не пользовался, не надо для моих задач).
  5. Challenger

    Парсер контента X-Parser Light

    Позволю себе некропостнуть) Был ряд задач (без прокси и капчи, со стабильной работой скрипта) -собирать выдачу по ряду запросов -собирать заголовки из материалов топа по ряду запросов. И чтобы все это относительно дешево, без лишнего головняка. Икспарсер из коробки закрыл все эти задачи при...
  6. Challenger

    Новость CapMonster Cloud - новый сервис автоматического распознавания капч!

    Добрый день. В зеннопостере в "Настройки" - "каптчи" указал в формате: ключ__yandexnew__recognizingthreshold_90 этого достаточно для распознавания капч яндекса или нужно что-то дополнительно вносить в настройки в самом шаблоне на вкладке "Дополнительно" кубика капчи (параметры модуля или...
  7. Challenger

    Обработка списков

    Спасибо, решение работает, но сделал немного по другому на кубиках, чтобы можно было подключать внешние файлы. Буду учить c#.
  8. Challenger

    Обработка списков

    Пока через костыли сделал выборкой через подсписок через регулярное выражение вида \b{-Variable.test2-}\b (для каждого предлога вопросительного придется делать экшен, чтоб не путать их через |), индусский подход) Если найду более годное решение, выложу для сообщества)
  9. Challenger

    Обработка списков

    Я пробовал, там получается очень много совпадений, когда будет браться мусор и не будет браться то что нужно. Например, если фраза начинается с "Как " то в выборку попадут все слова, которые на "как" заканчиваются, и стоят в середине фразы. По идее можно как-то через регулярку по точному...
  10. Challenger

    Обработка списков

    Столкнулся с проблемой при работе со списками, форум прошерстил через поиск, но так и не нашел подходящего решения для вроде бы простой задачи. 1) Есть список, нужно к строкам, содержащим вопросительные предлоги "как" "что" и т.д. добавить в конец знак вопроса. Сама реализация понятна -взять...
  11. Challenger

    Проблема с кодировкой

    Написал, но скорее всего ничего не изменится. В принципе, нашел способ получать нужные данные и с тем что есть. Тему можно закрывать)
  12. Challenger

    Проблема с кодировкой

    Сервис все равно выдает белиберду, но уже через GET-запрос а не через cURL)) Пробовал и с кодировкой UTF-8 и с Windows-1251. Походу, он или вообще не в состоянии отдать корректный запрос, или надо экспериментировать. В любом случае, спасибо за быстрый ответ.
  13. Challenger

    Проблема с кодировкой

    Согласен, с Zennoposter вопрос связан только тем, что curl запускается через zennoposter. Вопрос про GET-кубик тогда. Каким образом можно в GET-кубик или в C# код поместить следующие данные? GET...
  14. Challenger

    Проблема с кодировкой

    Такой вопрос: Использую сервис https://mercury.postlight.com/web-parser/, через CURL получаю данные с сайтов. Данные с сайтов где charset=utf-8 "приезжают" в плохой кодировке, например: "title":"Создание ассоциации – СЃ чего начать?" "content":"<div id=\"cb\">...
  15. Challenger

    Стоимость апгрейда с Lite до Standard

    Большое всем спасибо за ответы, для себя решил взять еще один ZennoPoster Lite - нет мороки с выписыванием зеннобоксов, можно полностью использовать весь функционал на разных машинах (что для меня актуальнее всего). Тему можно закрывать.