Название: Опять... Парсинг HTML Отправлено: bkmz от Июль 16, 2010, 17:56 Приветствую. Понадобилось тут мне вытащить из html страничек данные.
Код: <div class="load"><a href="http://d1.vpleer.ru/download2/6/5069/18024145/cdbc4143ba55/%D0%A1%D0%94_%26amp%3B_%D0%90%D1%80%D0%B8%D1%8F-%D0%97%D0%B0%D1%81%D1%8B%D0%BF%D0%B0%D0%B9_%28Joker_Prod%29.mp3" title="Скачать"><img src="/images/load.gif" width="8" height="8" alt="Скачать"/></a></div> Пробовал делать как в примере к capturedTexts() - ничего не вышло. Паттерн следущий: Код: (<div class=\"load\"><a href=\")(title=\") Название: Re: Опять... Парсинг HTML Отправлено: serg_hd от Июль 16, 2010, 18:31 хз о каком примере ты. Обычные регвыры.
Код
Название: Re: Опять... Парсинг HTML Отправлено: bkmz от Июль 16, 2010, 19:48 Спасибо. Ваш пример работает только для одного блока <div>
У меня есть страница в котрой их больше 30. Мне нужно выцепить только урлы, _http://vpleer.ru/?q=Nightwish Вот отсюда. Сейчас попробую сам подкрутить данную комбинацию. Название: Re: Опять... Парсинг HTML Отправлено: serg_hd от Июль 16, 2010, 19:50 Спасибо. Ваш пример работает только для одного блока <div> Так никто не говорил что их много. А если их и много, то тоже просто. Набирайся опыта.Название: Re: Опять... Парсинг HTML Отправлено: bkmz от Июль 16, 2010, 19:54 Спасибо. Ваш пример работает только для одного блока <div> Так никто не говорил что их много. А если их и много, то тоже просто. Набирайся опыта.Название: Re: Опять... Парсинг HTML Отправлено: serg_hd от Июль 16, 2010, 19:56 копать в сторону извлечения всех "<div class=\"load\">...</div>" из всей страницы. Как вариант - выуживать все ссылки страницы, заканчивающиеся на mp3, но малость рискованно это, мало ли. А регвыры надо знать, без них парсеры не парсеры.
Название: Re: Опять... Парсинг HTML Отправлено: bkmz от Июль 16, 2010, 19:57 копать в сторону извлечения "<div class=\"load\">...</div>" из всей страницы. Как вариант - выуживать все ссылки страницы, заканчивающиеся на mp3, но малость рискованно это, мало ли. А регвыры надо знать, без них парсеры не парсеры. Вот именно, как мне вытащить то что находится между ними?Название: Re: Опять... Парсинг HTML Отправлено: serg_hd от Июль 16, 2010, 20:00 так выше код же :o
в цикле подставляешь для strSearch каждый такой див и вытягиваешь ссылки Название: Re: Опять... Парсинг HTML Отправлено: bkmz от Июль 16, 2010, 20:07 так выше код же :o У меня все дивы в одном стринге. Там вся страница. Я не могу понять, как их выудить можно?в цикле подставляешь для strSearch каждый такой див и вытягиваешь ссылки Название: Re: Опять... Парсинг HTML Отправлено: bkmz от Июль 16, 2010, 20:16 Код: QString strUrl; Название: Re: Опять... Парсинг HTML Отправлено: serg_hd от Июль 16, 2010, 20:22 Код: QString strUrl; у тебя там див, блин, должен быть, а не вся страница. Надо: 1. Извлечь все дивы с ссылками 2. Извлечь ссылки из дивов. Все дивы, пример: Код
С контейнером дивов понятно же что делать? Всё. Название: Re: Опять... Парсинг HTML Отправлено: bkmz от Июль 16, 2010, 20:28 Все. Спасибо. Остальное завтра разгребать буду)
|