Здравствуйте, гость ( Вход | Регистрация )
![]() ![]() |
|
++Norton++ |
21.11.2009, 22:52
Сообщение
#11
|
|
Студент ![]() Группа: Участник Сообщений: 98 Регистрация: 5.10.2008 Пользователь №: 380 Спасибо сказали: 0 раз(а) Репутация: 1
|
Спасибо за советы! Вот, кстати, пример куска хтмл файла:
Вот. Из такого кода нужно выдрать текст1, текст2, текст3 а также те числа, что идут после ссылки, т.е. в теге td align=right. Т.е. в данном примере после первой ссылки это 5701375, после второй 5701027, после третьей 2804612. Заранее еще раз спасибо! |
|
|
|
|
++Norton++ |
29.11.2009, 14:16
Сообщение
#12
|
|
Студент ![]() Группа: Участник Сообщений: 98 Регистрация: 5.10.2008 Пользователь №: 380 Спасибо сказали: 0 раз(а) Репутация: 1
|
Сделал регулярку, как посоветовал rcdimon. Получилось вроде этого:
Однако ничего не парсит |
|
|
|
|
trdm |
29.11.2009, 20:10
Сообщение
#13
|
|
Дмитрий Трошин ![]() ![]() ![]() ![]() Группа: Участник Сообщений: 575 Регистрация: 12.1.2008 Пользователь №: 68 Спасибо сказали: 21 раз(а) Репутация: 6
|
Блин, я где-то нарывался на html парсер на основе бизона.
Вот бы его в либу оформить, можно было бы просто подключать к проекту. |
|
|
|
![]() ![]() ![]() |
|
Текстовая версия | Сейчас: 25.12.2025, 6:56 |