Russian Qt Forum
Ноябрь 26, 2024, 05:22 *
Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.
Вам не пришло письмо с кодом активации?

Войти
 
  Начало   Форум  WIKI (Вики)FAQ Помощь Поиск Войти Регистрация  

Страниц: [1]   Вниз
  Печать  
Автор Тема: Синтаксическая декомпозиция текста при помощи QRegExp  (Прочитано 2153 раз)
Alexander
Гость
« : Февраль 08, 2010, 11:03 »

Здравствуйте!

Буду рад, если кто поможет разобраться с рядом вопросов:

Входной текст необходимо разбить на предложения и хранить их в виде списка или таблицы. Разбиваю текст при помощи простого регулярного выражения и функции split от QStringList'а:

Код:
QRegExp rxp ("[\Q.!?\E]{1,}\\s+|\Q?!\E\\s+|\Q!?\E\\s+");
TSplitter = MText.split(rxp);

Соответственно в результат выводятся предложения разбитые по точкам, вопросительным и восклицательным знакам, НО без самих этих знаков. Вопрос №1: можно ли используя подобные рег. выраж. как-то выводить предложения со знакаи пунктуации в конце? Вопрос №2: как можно организовать при помощи рег. выраж. проверку условий? Например, "если за аббревиатурой 'Mr.' следует пробел и заглавная буква, то это конец предложения". И так же с десятичными числами типа 1.3

Записан
Страниц: [1]   Вверх
  Печать  
 
Перейти в:  


Страница сгенерирована за 0.05 секунд. Запросов: 21.