ansmirnov

Python: удаление HTML-тегов из строки

Теги: Programming, Python, HowTo, RegExp

Задача: есть строка, которая содержит HTML-текст. Необходимо удалить из него все HTML-теги. Например, из строки

<p>Привет, <b>Мир</b></p>

получить строку

Привет, Мир!

Сделать это можно с использованием регулярных выражений:

 import re
 print re.sub(r'\<[^>]*\>', '', html)