коллеги, помогите кодесом. актуально для веб транслейтора. может еще кому пригодится, уверен.
нужен сниппет, на вход текст из переменной, неизвестной длинны
нужно разделить по предложениям, куски размером не более Н лимита, примерно 4000 байт.(у переводчика лимит 5к знаков)
например, регуляркой
нужно запихнуть части по размеру в список, чтоб потом по сегментам можно было перевести, и потом собрать воедино перевод, так чтоб структура текста не рушилась бы.
курил варианты по делению типа
http://stackoverflow.com/questions/14254636/improve-regex-to-split-large-text-into-sentences
http://stackoverflow.com/questions/4957226/split-text-into-sentences-in-c-sharp
но, кодинг увы не моя тема. по частям порубил, а вот чтоб 2 и более части сохранялись не вышло.
условно, рубим текст на предложения, собираем по количеству символов по длинне.
если длинна достигла нужной - пихаем в список строкой, далее второй кусок текста (продолжаем с конца первого) и тд. а потом по частям собираем. без тримов и тд. чисто плейнтекст
посодействуйте плз
нужен сниппет, на вход текст из переменной, неизвестной длинны
нужно разделить по предложениям, куски размером не более Н лимита, примерно 4000 байт.(у переводчика лимит 5к знаков)
например, регуляркой
Код:
(?<=[\.!\?])\s+")
курил варианты по делению типа
http://stackoverflow.com/questions/14254636/improve-regex-to-split-large-text-into-sentences
http://stackoverflow.com/questions/4957226/split-text-into-sentences-in-c-sharp
но, кодинг увы не моя тема. по частям порубил, а вот чтоб 2 и более части сохранялись не вышло.
условно, рубим текст на предложения, собираем по количеству символов по длинне.
если длинна достигла нужной - пихаем в список строкой, далее второй кусок текста (продолжаем с конца первого) и тд. а потом по частям собираем. без тримов и тд. чисто плейнтекст
посодействуйте плз