Russian Qt Forum
Октябрь 03, 2024, 01:30 *
Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.
Вам не пришло письмо с кодом активации?

Войти
 
  Начало   Форум  WIKI (Вики)FAQ Помощь Поиск Войти Регистрация  

Страниц: [1] 2   Вниз
  Печать  
Автор Тема: А чем-бы html разобрать ;)  (Прочитано 10721 раз)
Вячеслав
Гость
« : Март 03, 2007, 22:25 »

Не хто случаем подобным не занимался ? В смысле пробежаться по html'ке и выдрать из нее данные .. Чего-то лень руками парсер писать .Хотя если не найдуться варианты - придется Грустный
Записан
Racheengel
Джедай : наставник для всех
*******
Offline Offline

Сообщений: 2679


Я работал с дискетам 5.25 :(


Просмотр профиля
« Ответ #1 : Март 04, 2007, 01:13 »

а что конкретно выдрать надо? я писал когда то, но на дельфе еще...
Записан

What is the 11 in the C++11? It’s the number of feet they glued to C++ trying to obtain a better octopus.

COVID не волк, в лес не уйдёт
Вячеслав
Гость
« Ответ #2 : Март 04, 2007, 18:59 »

Да есть n страничек с более-менее фиксированой структурой - надо оттуда данне выковарять ....
Записан
vipet
Бывалый
*****
Offline Offline

Сообщений: 452


Просмотр профиля
« Ответ #3 : Март 04, 2007, 20:44 »

может быть просто регэкспы подойдут
Записан
Вячеслав
Гость
« Ответ #4 : Март 04, 2007, 21:38 »

Оно конечно да ... Но хотить-ся то чего-нибудь типа DOM'а ..... Но таки видать придеться питоновский парсер переписывать ... или питона к проге цеплять Подмигивающий
Записан
vipet
Бывалый
*****
Offline Offline

Сообщений: 452


Просмотр профиля
« Ответ #5 : Март 04, 2007, 21:49 »

ну DOM - это ж если XHTML, а в HTML может быть что и как угодно
Записан
Racheengel
Джедай : наставник для всех
*******
Offline Offline

Сообщений: 2679


Я работал с дискетам 5.25 :(


Просмотр профиля
« Ответ #6 : Март 05, 2007, 13:55 »

а QtXml не рулит никак?
Записан

What is the 11 in the C++11? It’s the number of feet they glued to C++ trying to obtain a better octopus.

COVID не волк, в лес не уйдёт
Вячеслав
Гость
« Ответ #7 : Март 05, 2007, 23:00 »

А таки можно ? Он-же вроде только XML жрет ?
Записан
noname.pl
Гость
« Ответ #8 : Март 05, 2007, 23:39 »

ну если xml жрет, то html и подавно должен.
Записан
Вячеслав
Гость
« Ответ #9 : Март 05, 2007, 23:43 »

щаззз .... хмл требует наличия закрывающего тега а хотэл-имэл дааадеко не всегда Грустный И страничики довольно веселые .... по офоррмлению
Записан
noname.pl
Гость
« Ответ #10 : Март 07, 2007, 15:24 »

и в чем проблема сделать одиночные теги типа <br> вида <br></br> за пять секунд и заюзать XML-обработку?
Записан
Вячеслав
Гость
« Ответ #11 : Март 07, 2007, 18:55 »

Это как ? Чтоб сунуть тег </br> на место - это место еще найти надоть ....  А для этого нужно файло разобрать Подмигивающий Ну собственно процес переписи питона на с почти закончен - завтрева пробывать буду Подмигивающий
Записан
Вудруф
Гость
« Ответ #12 : Март 07, 2007, 19:31 »

Тогда уж на <br />, ибо </br> - это совсем дико, а вот закрывающий <td> куда всунуть, как правильно было замечено, ещё найти надо Улыбающийся
Записан
Racheengel
Джедай : наставник для всех
*******
Offline Offline

Сообщений: 2679


Я работал с дискетам 5.25 :(


Просмотр профиля
« Ответ #13 : Март 08, 2007, 00:57 »

Зачем разбирать, чтобы <br> в <br/> сконвертить? QString::replace(), и всех делов-то...
А закрывающий <td> по всем правилам HTML обязан присутствовать... Только <tr> необязательно закрывать.
Записан

What is the 11 in the C++11? It’s the number of feet they glued to C++ trying to obtain a better octopus.

COVID не волк, в лес не уйдёт
vipet
Бывалый
*****
Offline Offline

Сообщений: 452


Просмотр профиля
« Ответ #14 : Март 08, 2007, 03:28 »

ну так одно дело правила HTML, а другое дело, что неправильный HTML браузеры могут абсолютно нормально рендерить
Записан
Страниц: [1] 2   Вверх
  Печать  
 
Перейти в:  


Страница сгенерирована за 0.05 секунд. Запросов: 22.