Здравствуйте, гость ( Вход | Регистрация )
| Гость_Krakozabra_* |
15.9.2014, 12:14
Сообщение
#1
|
|
Гости |
Привет. Есть задача в обработке текста, точнее html кода. Все работает за исключением выбора текста между кавычками.
Цитата m = re.findall('href=".*\"', ht) print m[0] Первое вхождение срабатывает на ура, второе с примесью текста, третье вхождение также проходит хорошо, каждое последующее с примесями. Подскажите, как должна выглядеть эта регулярка, я уже голову сломал. Всем спасибо. |
|
|
|
![]() |
|
ahalaj |
15.9.2014, 17:59
Сообщение
#2
|
![]() Студент ![]() Группа: Участник Сообщений: 47 Регистрация: 14.6.2014 Пользователь №: 4166 Спасибо сказали: 13 раз(а) Репутация: 1
|
Цитата(Krakozabra @ 15.9.2014, 13:14) Link Привет. Есть задача в обработке текста, точнее html кода. Все работает за исключением выбора текста между кавычками. Цитата m = re.findall('href=".*\"', ht) print m[0] Первое вхождение срабатывает на ура, второе с примесью текста, третье вхождение также проходит хорошо, каждое последующее с примесями. Подскажите, как должна выглядеть эта регулярка, я уже голову сломал. Всем спасибо. Искать надо от открывающей кавычки до закрывающей и чтобы внутри кавычек не было. Вот это сработает:
|
|
|
|
Krakozabra Python. Регулярные выражения. Данные между кавычек 15.9.2014, 12:14
lanz Не используйте регулярные выражения для парсинга h... 16.9.2014, 16:36![]() ![]() ![]() |
|
Текстовая версия | Сейчас: 12.2.2026, 13:19 |