Написал простой парсер и для разминки натравил его на русский сайт, страницы которого в Utf (парсить нужно именно рунет). QRegExp срабатывает и в результате в QPlainTextEdit вылезает список ссылок и анкоров, найденных на странице, но анкоры выглядят вот так:
Вот код моего обработчика QNetworkRequest (он возвращает страницу в htmlPage):
void MainWindow::getHtmlResults(QNetworkReply * reply)
{
QByteArray total = reply->readAll();
QTextCodec *utf2 = QTextCodec::codecForHtml(total);
htmlPage = utf2->toUnicode(total);
statusCode = reply->attribute(QNetworkRequest::HttpStatusCodeAttribute).toInt();
}
В программе используется русский - русские надписи на кнопках и т.д., но для работы с русским текстом я пока ничего не настраивал, и как настраивать в 5-й версии, не знаю.
Подскажите пожалуйста, что нужно сделать или исправить, чтобы русский язык был виден?