ansmirnov

Экранирование URL в Python

Теги: Programming, Python

Экранирование URL позволяет заменять пробелы и русские символы на последовательность символов %XX, где XX обозначает код символа.

Например, пробел будет заменен на %20.

Такой подход позволяет осуществлять взаимодействие сервераов и клиентов, не поддерживающих полный алфавит символов.

Экранирование URL можно произвести с помощью функций urllib2.quote() и urllib2.unquote(). Пример их использования приведен ниже.

>>> import urllib2
>>> print urllib2.quote('test.org/Русский текст')
test.org/%D0%A0%D1%83%D1%81%D1%81%D0%BA%D0%B8%D0%B9%20%D1%82%D0%B5%D0%BA%D1%81%D1%82
>>> print urllib2.unquote('test.org/%D0%A0%D1%83%D1%81%D1%81%D0%BA%D0%B8%D0%B9%20%D1%82%D0%B5%D0%BA%D1%81%D1%82')
test.org/Русский текст