Заказ на парсер для сайта kompege.ru

GNT

Новичок
Регистрация
30.05.2020
Сообщения
5
Благодарностей
1
Баллы
3
Имеется ZennoPoster 7.7.4
Сайт: https://kompege.ru/task
На нем слева можно выбрать тип задания (далее просто задание) нужны с 1 по 27 (19-21 это одно большое задание)

1. Каждое задание надо сделать как отдельный парсер
2. Парсер записывает задания которые уже обработал и при повторном запуске делает сортировку "сначала новые" доходит до первого сделанного и дальше не идет (в консоли вывести сообщение "новых номеров нет")
3. В рамках одного типа задания делятся по уровню на Базовый\Средний\Сложный. Каждый тип в отдельную папку.
4. В рамках одного уровня еще делим на подпапки с однотипными заданиями (однотипными можно считать задания с одинаковыми вопросами). Часть заданий (например 2, они все однотипные и тут такое деление сделать не получится, чтоб упростить задачи ниже подробнее распишу про каждое задание)
5. Наименование файла с заданием: 02-01-0001.k-9825--task.tex
это пример имен файлов которые мне нужны, первые два разряда это номер задания (для заданий 19-21 указать просто 19); после уровень сложность 01 - простые, 02 - средние, 03 - сложные; далее порядковый номер из 4 цифр, идет сквозная нумерация в рамках одного задания; k это для меня, чтоб понимать источник задания; 9825 это номер задачи на сайте источнике, --task модификатор чтоб видеть задание, и да дальше самое интересное, расширение tex (открывается любым блокнотом, по факту это обычный текстовый файл).
6. Самое сложное, надо будет формулы и таблицы забить в заранее подготовленные шаблоны (для примера прикладываю итоговый файл)

Про сам файл (общее для всех):
\subsubsection{Задача 02-01-0001} - указываем номер по принципу описанному выше
Автор: Основная волна 27.06.23 \hfill Источник: kompege.ru (9825)
Автора вписываем из данных на сайте (итогда автор указан уже в тексте задания), источник в скобках указываем номер задачи на сайте
\paragraph*{Задание:}

После идет текст задания

\paragraph*{Ответ:}
В конце задания ответ взятый с сайта.


Более подробные описания по заданиям:

Задание 1:
В задании почти всегда одно изображение, все изображения надо сохранть в отдельную папку img-01, названия изображения как номер задания.
Если в задании два изображения (например задача 7284) сохраняем оба и к названию добаляем --1 и --2 соответственно

Текст до картинки вставляется одной строкой
После пустая строка
\bigskip % отсутп сверху
\noindent % убрать отступ для абзаца
\includegraphics[width=\textwidth]{01-01-0001} (в данной строке надо указать название картинки)
Еще одна пустая строка
Оставшаяся часть задания
Еще одна пустая строка


Если в задании два изображения заменить строку \includegraphics[width=\textwidth]{01-01-0001} на 2 строки:
\includegraphics[width=0.5\textwidth]{01-01-0001--1}
\includegraphics[width=0.5\textwidth]{01-01-0001--2}

Задание 2:

Текст задания до формулы одной строкой
Формулу заключить в \[ тут будет сама формула \] и записать на отдельной строке
Спец сиволы в формула надо будет заменить на команды:
стрелочка вправо \rightarrow
равно \equiv
отрицание \lnot
галачка вниз \lor
галачка вверх \land

Таблицу надо оформить по следующему принципу:
\begin{lite-table}
\begin{tabular}{|c|c|c|c|c|}
\hline
~ & ~ & ~ & ~ & F \\ \hline
~ & 1 & ~ & ~ & 0 \\ \hline
0 & ~ & 0 & ~ & 0 \\ \hline
~ & 0 & 0 & ~ & 0 \\ \hline
\end{tabular}
\end{lite-table}

|c|c|c|c|c| - так определяется сколько будет столбцов в таблице
& - разделитель для ячеек таблицы
~ - указать в пустой ячейке
\\ \hline - конец строки таблицы

Для всех последующих заданий схема будет аналогична, где-то есть картинки, местами таблицы и формулы, для некоторых заданий требуется скачивать и переименовывать файлы.
Если сможете еще настроить распознавание картинок с таблицами и переводить их оформление, как во втором задании будет огромным плюсом.


Если остались вопросы пишите отвечу, прикрепил текстовый файлы как примеры (расширение txt, но еще раз парсер на выходе должен поставить расширение tex), пишите цену и примерные сроки =)
 

Вложения

artsmm

Client
Регистрация
03.10.2018
Сообщения
1 120
Благодарностей
196
Баллы
63
Имеется ZennoPoster 7.7.4
Сайт: https://kompege.ru/task
На нем слева можно выбрать тип задания (далее просто задание) нужны с 1 по 27 (19-21 это одно большое задание)

1. Каждое задание надо сделать как отдельный парсер
2. Парсер записывает задания которые уже обработал и при повторном запуске делает сортировку "сначала новые" доходит до первого сделанного и дальше не идет (в консоли вывести сообщение "новых номеров нет")
3. В рамках одного типа задания делятся по уровню на Базовый\Средний\Сложный. Каждый тип в отдельную папку.
4. В рамках одного уровня еще делим на подпапки с однотипными заданиями (однотипными можно считать задания с одинаковыми вопросами). Часть заданий (например 2, они все однотипные и тут такое деление сделать не получится, чтоб упростить задачи ниже подробнее распишу про каждое задание)
5. Наименование файла с заданием: 02-01-0001.k-9825--task.tex
это пример имен файлов которые мне нужны, первые два разряда это номер задания (для заданий 19-21 указать просто 19); после уровень сложность 01 - простые, 02 - средние, 03 - сложные; далее порядковый номер из 4 цифр, идет сквозная нумерация в рамках одного задания; k это для меня, чтоб понимать источник задания; 9825 это номер задачи на сайте источнике, --task модификатор чтоб видеть задание, и да дальше самое интересное, расширение tex (открывается любым блокнотом, по факту это обычный текстовый файл).
6. Самое сложное, надо будет формулы и таблицы забить в заранее подготовленные шаблоны (для примера прикладываю итоговый файл)

Про сам файл (общее для всех):
\subsubsection{Задача 02-01-0001} - указываем номер по принципу описанному выше
Автор: Основная волна 27.06.23 \hfill Источник: kompege.ru (9825)
Автора вписываем из данных на сайте (итогда автор указан уже в тексте задания), источник в скобках указываем номер задачи на сайте
\paragraph*{Задание:}

После идет текст задания

\paragraph*{Ответ:}
В конце задания ответ взятый с сайта.


Более подробные описания по заданиям:

Задание 1:
В задании почти всегда одно изображение, все изображения надо сохранть в отдельную папку img-01, названия изображения как номер задания.
Если в задании два изображения (например задача 7284) сохраняем оба и к названию добаляем --1 и --2 соответственно

Текст до картинки вставляется одной строкой
После пустая строка
\bigskip % отсутп сверху
\noindent % убрать отступ для абзаца
\includegraphics[width=\textwidth]{01-01-0001} (в данной строке надо указать название картинки)
Еще одна пустая строка
Оставшаяся часть задания
Еще одна пустая строка


Если в задании два изображения заменить строку \includegraphics[width=\textwidth]{01-01-0001} на 2 строки:
\includegraphics[width=0.5\textwidth]{01-01-0001--1}
\includegraphics[width=0.5\textwidth]{01-01-0001--2}

Задание 2:

Текст задания до формулы одной строкой
Формулу заключить в \[ тут будет сама формула \] и записать на отдельной строке
Спец сиволы в формула надо будет заменить на команды:
стрелочка вправо \rightarrow
равно \equiv
отрицание \lnot
галачка вниз \lor
галачка вверх \land

Таблицу надо оформить по следующему принципу:
\begin{lite-table}
\begin{tabular}{|c|c|c|c|c|}
\hline
~ & ~ & ~ & ~ & F \\ \hline
~ & 1 & ~ & ~ & 0 \\ \hline
0 & ~ & 0 & ~ & 0 \\ \hline
~ & 0 & 0 & ~ & 0 \\ \hline
\end{tabular}
\end{lite-table}

|c|c|c|c|c| - так определяется сколько будет столбцов в таблице
& - разделитель для ячеек таблицы
~ - указать в пустой ячейке
\\ \hline - конец строки таблицы

Для всех последующих заданий схема будет аналогична, где-то есть картинки, местами таблицы и формулы, для некоторых заданий требуется скачивать и переименовывать файлы.
Если сможете еще настроить распознавание картинок с таблицами и переводить их оформление, как во втором задании будет огромным плюсом.


Если остались вопросы пишите отвечу, прикрепил текстовый файлы как примеры (расширение txt, но еще раз парсер на выходе должен поставить расширение tex), пишите цену и примерные сроки =)
Напишите в ТГ @Aleksey_job - пообщаемся
 

bashka

Client
Регистрация
13.06.2017
Сообщения
183
Благодарностей
130
Баллы
43
Имеется ZennoPoster 7.7.4
Сайт: https://kompege.ru/task
На нем слева можно выбрать тип задания (далее просто задание) нужны с 1 по 27 (19-21 это одно большое задание)

1. Каждое задание надо сделать как отдельный парсер
2. Парсер записывает задания которые уже обработал и при повторном запуске делает сортировку "сначала новые" доходит до первого сделанного и дальше не идет (в консоли вывести сообщение "новых номеров нет")
3. В рамках одного типа задания делятся по уровню на Базовый\Средний\Сложный. Каждый тип в отдельную папку.
4. В рамках одного уровня еще делим на подпапки с однотипными заданиями (однотипными можно считать задания с одинаковыми вопросами). Часть заданий (например 2, они все однотипные и тут такое деление сделать не получится, чтоб упростить задачи ниже подробнее распишу про каждое задание)
5. Наименование файла с заданием: 02-01-0001.k-9825--task.tex
это пример имен файлов которые мне нужны, первые два разряда это номер задания (для заданий 19-21 указать просто 19); после уровень сложность 01 - простые, 02 - средние, 03 - сложные; далее порядковый номер из 4 цифр, идет сквозная нумерация в рамках одного задания; k это для меня, чтоб понимать источник задания; 9825 это номер задачи на сайте источнике, --task модификатор чтоб видеть задание, и да дальше самое интересное, расширение tex (открывается любым блокнотом, по факту это обычный текстовый файл).
6. Самое сложное, надо будет формулы и таблицы забить в заранее подготовленные шаблоны (для примера прикладываю итоговый файл)

Про сам файл (общее для всех):
\subsubsection{Задача 02-01-0001} - указываем номер по принципу описанному выше
Автор: Основная волна 27.06.23 \hfill Источник: kompege.ru (9825)
Автора вписываем из данных на сайте (итогда автор указан уже в тексте задания), источник в скобках указываем номер задачи на сайте
\paragraph*{Задание:}

После идет текст задания

\paragraph*{Ответ:}
В конце задания ответ взятый с сайта.


Более подробные описания по заданиям:

Задание 1:
В задании почти всегда одно изображение, все изображения надо сохранть в отдельную папку img-01, названия изображения как номер задания.
Если в задании два изображения (например задача 7284) сохраняем оба и к названию добаляем --1 и --2 соответственно

Текст до картинки вставляется одной строкой
После пустая строка
\bigskip % отсутп сверху
\noindent % убрать отступ для абзаца
\includegraphics[width=\textwidth]{01-01-0001} (в данной строке надо указать название картинки)
Еще одна пустая строка
Оставшаяся часть задания
Еще одна пустая строка


Если в задании два изображения заменить строку \includegraphics[width=\textwidth]{01-01-0001} на 2 строки:
\includegraphics[width=0.5\textwidth]{01-01-0001--1}
\includegraphics[width=0.5\textwidth]{01-01-0001--2}

Задание 2:

Текст задания до формулы одной строкой
Формулу заключить в \[ тут будет сама формула \] и записать на отдельной строке
Спец сиволы в формула надо будет заменить на команды:
стрелочка вправо \rightarrow
равно \equiv
отрицание \lnot
галачка вниз \lor
галачка вверх \land

Таблицу надо оформить по следующему принципу:
\begin{lite-table}
\begin{tabular}{|c|c|c|c|c|}
\hline
~ & ~ & ~ & ~ & F \\ \hline
~ & 1 & ~ & ~ & 0 \\ \hline
0 & ~ & 0 & ~ & 0 \\ \hline
~ & 0 & 0 & ~ & 0 \\ \hline
\end{tabular}
\end{lite-table}

|c|c|c|c|c| - так определяется сколько будет столбцов в таблице
& - разделитель для ячеек таблицы
~ - указать в пустой ячейке
\\ \hline - конец строки таблицы

Для всех последующих заданий схема будет аналогична, где-то есть картинки, местами таблицы и формулы, для некоторых заданий требуется скачивать и переименовывать файлы.
Если сможете еще настроить распознавание картинок с таблицами и переводить их оформление, как во втором задании будет огромным плюсом.


Если остались вопросы пишите отвечу, прикрепил текстовый файлы как примеры (расширение txt, но еще раз парсер на выходе должен поставить расширение tex), пишите цену и примерные сроки =)
В чем тут Профит?
 

GNT

Новичок
Регистрация
30.05.2020
Сообщения
5
Благодарностей
1
Баллы
3
В чем тут Профит?
Не совсем понимаю вопрос?? Мне надо перебить данные с сайта на язык latex, учить данный язык я не заставляю, потому подготовлю шаблоны. Я сам репетитор по информатике и мне так будет проще вести свою работу используя данные с сайта в более удобном для себя формате.
 

ovilen

Client
Регистрация
27.05.2023
Сообщения
16
Благодарностей
1
Баллы
3

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)