Как закодировать ссылку на сайт


URL кодирование и декодирование

Для тех кто не любит нудных объяснений :)

Введите строку в одно из полей и нажмите соответствующую кнопку

Строка в закодированном виде


Строка в нормальном виде

Для тех кто любит "во всем разобраться" ;)

Кодирование URL и просто двоичных данных в последовательность букв, цифр и некоторых специальных знаков латинского алфавита в интернете было связано с ограничением физических устройств на передачу только алфавитно-цифровых символов. В URL такое кодирование обычно применяется для передачи символов в формате Unicode (как правило UTF-8) в последовательность из двух байт, записанных в шестнадцатиричном представлении. Каждый байт предваряется знаком %. При таком кодировании строчка "корова" будет иметь вид: %D0%BA%D0%BE%D1%80%D0%BE%D0%B2%D0%B0. То есть русской букве к будет соответствовать последовательность %D0%BA и.т.д. Такое кодирование является общепринятым для путей к файлам или папкам, входящим в URL.

Подмножесто символов, которые разрешены в URL немного шире чем алфавитно-цифровые символы, так, в URL можно использовать дефис и подчеркивание, но нельзя, например, использовать одинарные или двойные кавычки. Некоторые символы используют для разделения параметров в URL, и их кодирование в этом случае будет неправомочным. В зависимости от отношения к кодированию специальных символов в javascript различают функции encodeURI и decodeURI, которые могут работать с полным URL, и, функции encodeURIComponent / decodeURIComponent, применяемые для параметров, входящих в URL.

Вообще говоря, кодирование параметров может быть достаточно произвольным. Здесь разработчик может использовать любую схему кодировки, если состав ее символов будет коректно передаваться через сеть. Так, вместо строки кириллицы в utf-8 можно применить строку в кодировке Windows 1251. В этом случае слово "корова" будет выглядеть как %EA%EE%F0%EE%E2%E0. То есть, символу к будет соответствовать последовательность из двух букв со знаком процента перед ними - %EA. Закодировать в строки с процентами кириллицу из других кодировок можно в нашем HTML кодировщике. В принципе, допустимы также другие способы кодирования, например, escape/unescape функцию javascript. Слово "корова" в этом случае будет выглядеть как %u043A%u043E%u0440%u043E%u0432%u0430.

URL кодировщик с расширенными возможностями

URL Encode and Decode - онлайн

О

Meet URL Decode and Encode, простом онлайн-инструменте, который делает именно то, что он говорит; декодирует кодировку URL и кодирует в нее быстро и легко. URL-адрес кодирует ваши данные простым способом или декодирует их в удобочитаемый формат. Кодирование URL-адреса

, также известное как процентное кодирование, представляет собой механизм кодирования информации в унифицированном идентификаторе ресурса (URI) при определенных обстоятельствах. Хотя это называется кодировкой URL-адресов, на самом деле она используется в более общем плане в основном наборе универсальных идентификаторов ресурсов (URI), который включает как универсальный указатель ресурса (URL), так и универсальное имя ресурса (URN).Как таковой он также используется при подготовке данных типа носителя «application / x-www-form-urlencoded», как это часто бывает при отправке данных HTML-формы в HTTP-запросах.

Дополнительные параметры

  • Набор символов: На нашем веб-сайте используется набор символов UTF-8, ваши входные данные передаются в этом формате. Измените этот параметр, если вы хотите преобразовать его в другой перед кодированием. Обратите внимание, что в случае текстовых данных схема кодирования не содержит их набора символов, поэтому вам, возможно, придется указать выбранный в процессе декодирования.Что касается файлов, по умолчанию используется двоичный параметр, при котором любое преобразование не выполняется; это требуется для всего, кроме текстовых документов.
  • Разделитель новой строки: В системах Unix и Windows используются разные символы разрыва строки, предыдущая кодировка любого варианта будет заменена в ваших данных выбранным параметром. В разделе файлов это частично не имеет значения, поскольку они содержат предполагаемые версии, но вы можете определить, какую из них использовать для кодирования каждой строки отдельно и разделения строк на функции фрагментов.
  • Кодировать каждую строку отдельно: Даже символы новой строки преобразуются в их процентную кодированную форму. Используйте эту опцию, если вы хотите закодировать несколько независимых записей данных, разделенных переносом строки. (*)
  • Разделить строки на фрагменты: Закодированные данные будут представлять собой непрерывный текст без пробелов. Установите этот флажок, если хотите разбить его на несколько строк. Применяемое ограничение на количество символов определено в спецификации MIME (RFC 2045), в которой указано, что длина закодированных строк не должна превышать 76 символов. (*)
  • Режим реального времени: Когда вы включаете эту опцию, введенные данные немедленно кодируются с помощью встроенных функций JavaScript вашего браузера - без отправки какой-либо информации на наши серверы. В настоящее время этот режим поддерживает только набор символов UTF-8.
(*) Эти параметры нельзя включить одновременно, так как результирующий вывод не будет действителен для большинства приложений.

Надежно и надежно

Все коммуникации с нашими серверами осуществляются через безопасные зашифрованные соединения SSL (https).Загруженные файлы удаляются с наших серверов сразу после обработки, а полученный загружаемый файл удаляется сразу после первой попытки загрузки или 15 минут бездействия. Мы никоим образом не храним и не проверяем содержимое введенных данных или загруженных файлов. Прочтите нашу политику конфиденциальности ниже для получения более подробной информации.

Совершенно бесплатно

Наш инструмент можно использовать бесплатно. Теперь вам не нужно загружать какое-либо программное обеспечение для таких задач.

Подробная информация о кодировке URL-адреса

Типы символов URI

Допустимые символы в URI либо зарезервированы, либо не зарезервированы (или символ процента как часть процентного кодирования).Зарезервированные символы - это те символы, которые иногда имеют особое значение. Например, символы прямой косой черты используются для разделения различных частей URL-адреса (или, в более общем смысле, URI). Незарезервированные символы не имеют таких значений. При использовании процентного кодирования зарезервированные символы представляются с помощью специальных последовательностей символов. Наборы зарезервированных и незарезервированных символов, а также обстоятельства, при которых определенные зарезервированные символы имеют особое значение, незначительно менялись с каждым пересмотром спецификаций, управляющих URI и схемами URI.

RFC 3986 раздел 2.2 Зарезервированные символы (январь 2005 г.)
! * ' ( ) ; : @ и = + $ , / ? # [ ]

RFC 3986 раздел 2.3 незарезервированных символа (январь 2005 г.)
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
a b c d e f г h i j k l m n o p q r s t u v w x y z
0 1 2 3 4 5 6 7 8 9 - _ . ~

Другие символы в URI должны быть закодированы в процентах.

Зарезервированные символы с процентным кодированием

Когда символ из зарезервированного набора («зарезервированный символ») имеет особое значение («зарезервированное назначение») в определенном контексте, а схема URI сообщает, что необходимо использовать этот символ для какой-то другой цели, тогда этот символ должен быть закодирован в процентах. Процентное кодирование зарезервированного символа включает преобразование символа в соответствующее ему байтовое значение в ASCII и последующее представление этого значения в виде пары шестнадцатеричных цифр.Цифры, которым предшествует знак процента ("%"), затем используются в URI вместо зарезервированного символа. (Для символа, отличного от ASCII, он обычно преобразуется в его последовательность байтов в UTF-8, а затем каждое значение байта представляется, как указано выше.)

Зарезервированный символ «/», например, если он используется в пути « "компонент URI, имеет особое значение как разделитель между сегментами пути. Если в соответствии с заданной схемой URI «/» должен находиться в сегменте пути, тогда в этом сегменте должны использоваться три символа «% 2F» или «% 2f» вместо необработанного «/».

Зарезервированные символы после процентного кодирования
! # $ и ' ( ) * + , / : ; = ? @ [ ]
% 21 % 23 % 24 % 26 % 27 % 28 % 29 % 2A % 2B % 2C % 2F % 3A % 3B % 3D % 3F % 40 % 5B % 5D

Зарезервированные символы, не имеющие зарезервированной цели в конкретном контексте, также могут быть закодированы в процентах, но не являются семантически отличается от других.

В компоненте «запрос» URI (часть после символа?), Например, «/» по-прежнему считается зарезервированным символом, но обычно он не имеет зарезервированного назначения, если в конкретной схеме URI не указано иное. Символ не нужно кодировать в процентах, если он не имеет зарезервированной цели.

URI, которые отличаются только тем, является ли зарезервированный символ закодированным в процентах или отображается буквально, обычно считаются не эквивалентными (обозначающими один и тот же ресурс), если не может быть определено, что рассматриваемые зарезервированные символы не имеют зарезервированной цели.Это определение зависит от правил, установленных для зарезервированных символов отдельными схемами URI.

Процентное кодирование незарезервированных символов

Символы из незарезервированного набора никогда не нуждаются в процентном кодировании.

URI, которые различаются только тем, является ли незарезервированный символ закодированным в процентах или выглядит буквально, эквивалентны по определению, но процессоры URI на практике могут не всегда распознавать эту эквивалентность. Например, потребители URI не должны рассматривать «% 41» иначе, чем «A», или «% 7E» иначе, чем «~», но некоторые это делают.Для максимальной совместимости производителям URI не рекомендуется использовать процентное кодирование незарезервированных символов.

Процентное кодирование символа процента

Поскольку символ процента («%») служит индикатором для октетов, закодированных в процентах, он должен быть закодирован в процентах как «% 25», чтобы этот октет использовался в качестве данных внутри URI.

Процентное кодирование произвольных данных

Большинство схем URI включают представление произвольных данных, таких как IP-адрес или путь файловой системы, в качестве компонентов URI.Спецификации схемы URI должны, но часто этого не делать, предоставлять явное сопоставление между символами URI и всеми возможными значениями данных, представленными этими символами.

Двоичные данные

С момента публикации RFC 1738 в 1994 году было указано [1], что схемы, которые обеспечивают представление двоичных данных в URI, должны разделять данные на 8-битные байты и кодировать их в процентах. byte таким же образом, как указано выше. Например, байтовое значение 0F (шестнадцатеричное) должно быть представлено как «% 0F», а байтовое значение 41 (шестнадцатеричное) может быть представлено как «A» или «% 41».Использование незакодированных символов для буквенно-цифровых и других незарезервированных символов обычно является предпочтительным, поскольку это приводит к более коротким URL-адресам.

Символьные данные

Процедура процентного кодирования двоичных данных часто экстраполировалась, иногда неправильно или не полностью, для применения к символьным данным. В годы становления Всемирной паутины при работе с символами данных в репертуаре ASCII и использовании соответствующих им байтов в ASCII в качестве основы для определения последовательностей, закодированных в процентах, эта практика была относительно безвредной; просто предполагалось, что символы и байты отображаются взаимно однозначно и взаимозаменяемы.Однако потребность в представлении символов вне диапазона ASCII быстро росла, и схемы и протоколы URI часто не обеспечивали стандартных правил для подготовки символьных данных для включения в URI. Следовательно, веб-приложения начали использовать различные многобайтовые кодировки, кодировки с отслеживанием состояния и другие несовместимые с ASCII кодировки в качестве основы для процентного кодирования, что привело к неоднозначности и трудностям надежной интерпретации URI.

Например, многие схемы и протоколы URI, основанные на RFC 1738 и 2396, предполагают, что символы данных будут преобразованы в байты в соответствии с некоторой неопределенной кодировкой символов, прежде чем будут представлены в URI незарезервированными символами или байтами, закодированными в процентах.Если схема не позволяет URI предоставлять подсказку относительно того, какая кодировка использовалась, или если кодировка конфликтует с использованием ASCII для процентного кодирования зарезервированных и незарезервированных символов, то URI не может быть надежно интерпретирован. В некоторых схемах вообще не учитывается кодировка, и вместо этого просто предлагается, чтобы символы данных отображались непосредственно на символы URI, что оставляет на усмотрение реализации решать, следует ли и как кодировать символы данных в процентах, которые не входят ни в зарезервированные, ни в незарезервированные наборы. _ ` { | } ~ % 0A или % 0D или % 0D% 0A % 20 % 22 % 25 % 2D % 2E % 3C % 3E % 5C % 5E % 5F % 60 % 7B % 7C % 7D % 7E
Данные произвольных символов иногда кодируются в процентах и ​​используются в ситуациях, не связанных с URI, например, для программ обфускации паролей или других системные протоколы перевода..

HTML Кодировка URL


URL - это другое слово для обозначения веб-адреса.

URL-адрес может состоять из слов (например, w3schools.com) или IP-адреса (например, 192.68.20.50).

Большинство людей вводят имя во время серфинга, потому что имена легче запомнить, чем числа.


URL - унифицированный указатель ресурсов

Веб-браузеры запрашивают страницы с веб-серверов с помощью URL-адреса.

Унифицированный указатель ресурсов (URL) используется для адресации документа (или других данных) в сети.

Веб-адрес, например https://www.w3schools.com/html/default.asp следует этим правилам синтаксиса:

схема: //prefix.domain: порт / путь / имя файла

Пояснение:

  • схема - определяет тип интернет-сервиса (чаще всего http или https )
  • prefix - определяет префикс домена (по умолчанию для http www )
  • domain - определяет интернет-домен , имя (например, w3schools.com)
  • порт - определяет номер порта на хосте (по умолчанию для http: 80 )
  • путь - определяет путь на сервере (если не указано: корневой каталог сайта)
  • filename - определяет имя документа или ресурса

Общие схемы URL

В таблице ниже перечислены некоторые общие схемы:

Схема Сокращение для Используется для
http Протокол передачи гипертекста Общие веб-страницы.Не зашифровано
https Безопасный протокол передачи гипертекста Защищенные веб-страницы. Зашифрованный
футов Протокол передачи файлов Скачивание или закачка файлов
файл Файл на вашем компьютере


Кодировка URL

URL-адресов можно отправлять только через Интернет с помощью Набор символов ASCII.Если URL-адрес содержит символы вне набора ASCII, URL-адрес должен быть преобразован.

Кодировка

URL преобразует символы, отличные от ASCII, в формат, который можно передавать через Интернет.

Кодировка

URL заменяет символы, отличные от ASCII, на "%", за которым следуют шестнадцатеричные цифры.

URL-адреса не могут содержать пробелов. Кодировка URL-адреса обычно заменяет пробел знаком плюс (+) или% 20.


Попробуйте сами

Если вы нажмете «Отправить», браузер закодирует ввод по URL перед его отправкой на сервер.

Страница на сервере отобразит полученный ввод.

Попробуйте ввести другие данные и снова нажмите «Отправить».


Примеры кодирования ASCII

Ваш браузер закодирует ввод в соответствии с набором символов, используемым на вашей странице.

Набор символов по умолчанию в HTML5 - UTF-8.

Персонаж из Windows-1252 из UTF-8
% 80 % E2% 82% AC
£ % A3 % C2% A3
© % A9 % C2% A9
® % AE % C2% AE
А % C0 % C3% 80
Á % C1 % C3% 81
 % C2 % C3% 82
à % C3 % C3% 83
Ä % C4 % C3% 84
Å % C5 % C3% 85

Чтобы получить полную информацию обо всех кодировках URL, посетите наш Справочник по кодировке URL.



.

Ссылка на кодировку URL-адресов HTML


URL - унифицированный указатель ресурсов

Веб-браузеры запрашивают страницы с веб-серверов с помощью URL-адреса.

URL-адрес - это адрес веб-страницы, например: https://www.w3schools.com.


Кодировка URL (процентное кодирование)

Кодировка

URL преобразует символы в формат, который можно передавать через Интернет.

URL-адресов можно отправлять только через Интернет с помощью Набор символов ASCII.

Поскольку URL-адреса часто содержат символы вне набора ASCII, URL-адрес должен быть преобразован в допустимый формат ASCII.

Кодировка

URL заменяет небезопасные символы ASCII на "%", за которым следуют два шестнадцатеричные цифры.

URL-адреса не могут содержать пробелов. Кодировка URL-адреса обычно заменяет пробел на знак плюс (+) или% 20.


Попробуйте сами

Если вы нажмете кнопку «Отправить» ниже, браузер закодирует вводимые данные. перед отправкой на сервер.Страница на сервере отобразит полученные ввод.

Попробуйте ввести другие данные и снова нажмите «Отправить».


Функции кодирования URL

В JavaScript, PHP и ASP есть функции, которые можно использовать для URL закодировать строку.

PHP имеет функцию rawurlencode (), а ASP - функцию Server.URLEncode ().

В JavaScript вы можете использовать функцию encodeURIComponent () .

Нажмите кнопку «Кодировать URL», чтобы увидеть, как функция JavaScript кодирует текст.

Примечание: Функция JavaScript кодирует пробел как% 20.



Ссылка на кодировку ASCII

Ваш браузер будет кодировать ввод в соответствии с набор символов, используемый на вашей странице.

Набор символов по умолчанию в HTML5 - UTF-8.

Символ из Windows-1252 из UTF-8
место % 20 % 20
! % 21 % 21
" % 22 % 22
# % 23 % 23
$ % 24 % 24
% % 25 % 25
и % 26 % 26
' % 27 % 27
( % 28 % 28
) % 29 % 29
* % 2A % 2A
+ % 2B % 2B
, % 2C % 2C
% 2D % 2D
. % 2Э % 2Э
/ % 2Ф % 2Ф
0 % 30 % 30
1 % 31 % 31
2 % 32 % 32
3 % 33 % 33
4 % 34 % 34
5 % 35 % 35
6 % 36 % 36
7 % 37 % 37
8 % 38 % 38
9 % 39 % 39
: % 3A % 3A
; % 3B % 3B
< % 3C % 3C
= % 3D % 3D
> % 3Э % 3Э
? % 3F % 3F
@ % 40 % 40
А % 41 % 41
B % 42 % 42
С % 43 % 43
D % 44 % 44
E % 45 % 45
F % 46 % 46
G % 47 % 47
H % 48 % 48
I % 49 % 49
Дж % 4A % 4A
К % 4B % 4B
л % 4C % 4C
M % 4D % 4D
N % 4Э % 4Э
O % 4 этаж % 4 этаж
п. % 50 % 50
Q % 51 % 51
R % 52 % 52
S % 53 % 53
т % 54 % 54
U % 55 % 55
В % 56 % 56
Вт % 57 % 57
х % 58 % 58
Y % 59 % 59
Z % 5A % 5A
[ % 5B % 5B
\ % 5C % 5C
] % 5D % 5D
^ % 5E % 5E
_ % 5F % 5F
` % 60 % 60
a % 61 % 61
б % 62 % 62
с % 63 % 63
г % 64 % 64
e % 65 % 65
f % 66 % 66
г % 67 % 67
ч % 68 % 68
i % 69 % 69
j % 6A % 6A
к % 6B % 6B
л % 6C % 6C
м % 6D % 6D
n % 6E % 6E
или % 6F % 6F
p % 70 % 70
q % 71 % 71
r % 72 % 72
с % 73 % 73
т % 74 % 74
u % 75 % 75
в % 76 % 76
Вт % 77 % 77
х % 78 % 78
y % 79 % 79
z % 7A % 7A
{ % 7B % 7B
| % 7C % 7C
} % 7D % 7D
~ % 7E % 7E
% 7F % 7F
` % 80 % E2% 82% AC
% 81 % 81
% 82 % E2% 80% 9A
ƒ % 83 % C6% 92
% 84 % E2% 80% 9E
% 85 % E2% 80% A6
% 86 % E2% 80% A0
% 87 % E2% 80% A1
ˆ % 88 % CB% 86
% 89 % E2% 80% B0
Š % 8A % C5% A0
% 8B % E2% 80% B9
Π% 8C % C5% 92
% 8D % C5% 8D
Ž % 8E % C5% BD
% 8F % 8F
% 90 % C2% 90
% 91 % E2% 80% 98
% 92 % E2% 80% 99
% 93 % E2% 80% 9C
% 94 % E2% 80% 9D
% 95 % E2% 80% A2
% 96 % E2% 80% 93
% 97 % E2% 80% 94
˜ % 98 % CB% 9C
% 99 % E2% 84
š % 9A % C5% A1
% 9В % E2% 80
œ % 9C % C5% 93
% 9D % 9D
× % 9E % C5% BE
Ÿ % 9F % C5% B8
% A0 % C2% A0
¡ % A1 % C2% A1
¢ % A2 % C2% A2
£ % A3 % C2% A3
¤ % A4 % C2% A4
¥ % A5 % C2% A5
¦ % A6 % C2% A6
§ % A7 % C2% A7
¨ % A8 % C2% A8
© % A9 % C2% A9
ª % AA % C2% AA
« % AB % C2% AB
¬ % AC % C2% AC
% нашей эры % C2% AD
® % AE % C2% AE
¯ % AF % C2% AF
° % B0 % C2% B0
± % B1 % C2% B1
² % B2 % C2% B2
³ % B3 % C2% B3
´ % B4 % C2% B4
мкм % B5 % C2% B5
% B6 % C2% B6
· % B7 % C2% B7
¸ % B8 % C2% B8
¹ % B9 % C2% B9
º % BA % C2% BA
» % BB % C2% BB
¼ % BC % C2% BC
½ % BD % C2% BD
¾ % BE % C2% BE
¿ % BF % C2% BF
À % C0 % C3% 80
Á % C1 % C3% 81
 % C2 % C3% 82
à % C3 % C3% 83
Ä % C4 % C3% 84
Å % C5 % C3% 85
Æ % C6 % C3% 86
Ç % C7 % C3% 87
È % C8 % C3% 88
É % C9 % C3% 89
Ê % CA % C3% 8A
Ë % CB % C3% 8B
Ì % CC % C3% 8C
Í % CD % C3% 8D
Î % CE % C3% 8E
Ï % CF % C3% 8F
ì % D0 % C3% 90
Ñ % D1 % C3% 91
Ò % D2 % C3% 92
Ó % D3 % C3% 93
Ô % D4 % C3% 94
Õ % D5 % C3% 95
Ö % D6 % C3% 96
× % D7 % C3% 97
Ø % D8 % C3% 98
Ù % D9 % C3% 99
Ú % DA % C3% 9A
Û % DB % C3% 9B
Ü % ПВ % C3% 9C
Ý % DD % C3% 9D
Þ % DE % C3% 9E
ß % DF % C3% 9F
до % E0 % C3% A0
á % E1 % C3% A1
â % E2 % C3% A2
ã % E3 % C3% A3
ä % E4 % C3% A4
å % E5 % C3% A5
æ % E6 % C3% A6
ç % E7 % C3% A7
и % E8 % C3% A8
é % E9 % C3% A9
ê % EA % C3% AA
ë % EB % C3% AB
мм % EC % C3% AC
до % ПВ % C3% AD
до % EE % C3% AE
% EF % C3% AF
ð % F0 % C3% B0
ñ % F1 % C3% B1
шт % F2 % C3% B2
ó % F3 % C3% B3
ô % F4 % C3% B4
х % F5 % C3% B5
ö % F6 % C3% B6
÷ % F7 % C3% B7
ø % F8 % C3% B8
ù % F9 % C3% B9
ú % FA % C3% BA
û % FB % C3% BB
ü % FC % C3% BC
ý % FD % C3% BD
þ % FE % C3% BE
ÿ % FF % C3% BF

Ссылка на кодирование URL

Управляющие символы ASCII % 00-% 1F изначально были разработаны для аппаратные устройства управления.

Управляющим символам нечего делать внутри URL.

Символ ASCII Описание Кодировка URL
NUL нулевой символ % 00
SOH начало заголовка % 01
STX начало текста % 02
ETX конец текста % 03
EOT конец передачи % 04
ENQ запрос % 05
ACK подтвердить % 06
БЕЛ звонок (кольцо) % 07
BS возврат % 08
HT горизонтальный язычок % 09
LF перевод строки % 0A
VT вертикальный язычок % 0B
FF подача формы % 0C
CR возврат каретки % 0D
SO сдвиг % 0E
SI смена % 0F
DLE выход канала передачи данных % 10
DC1 устройство управления 1 % 11
DC2 Устройство управления 2 % 12
DC3 Устройство управления 3 % 13
DC4 Устройство управления 4 % 14
НАК отрицательное подтверждение % 15
SYN синхронизировать % 16
ЭТБ блок передачи конца % 17
CAN отменить % 18
EM конец среднего % 19
ПОД заменить % 1A
ESC побег % 1B
ФС разделитель файлов % 1С
GS разделитель групп % 1D
RS разделитель записей % 1Э
США блок сепаратора % 1 этаж


.

URL Decode and Encode - онлайн

О

Meet URL Decode and Encode, простом онлайн-инструменте, который делает именно то, что он говорит; декодирует кодировку URL и кодирует в нее быстро и легко. URL-адрес кодирует ваши данные простым способом или декодирует их в удобочитаемый формат. Кодирование URL-адреса

, также известное как процентное кодирование, представляет собой механизм кодирования информации в унифицированном идентификаторе ресурса (URI) при определенных обстоятельствах. Хотя это называется кодировкой URL-адресов, на самом деле она используется в более общем плане в основном наборе универсальных идентификаторов ресурсов (URI), который включает как универсальный указатель ресурса (URL), так и универсальное имя ресурса (URN).Как таковой он также используется при подготовке данных типа носителя «application / x-www-form-urlencoded», как это часто бывает при отправке данных HTML-формы в HTTP-запросах.

Дополнительные параметры

  • Набор символов: В случае текстовых данных схема кодирования не содержит их набор символов, поэтому вы должны указать, какой из них использовался в процессе кодирования. Обычно это UTF-8, но может быть любой другой; если вы не уверены, поиграйте с доступными опциями, включая автоопределение.Эта информация используется для преобразования декодированных данных в набор символов нашего веб-сайта, чтобы все буквы и символы могли отображаться правильно. Обратите внимание, что это не имеет отношения к файлам, поскольку к ним не нужно применять безопасные веб-преобразования.
  • Декодировать каждую строку отдельно: Закодированные данные обычно состоят из непрерывного текста, даже символы новой строки преобразуются в их процентно закодированные формы. Перед декодированием все незашифрованные пробелы удаляются из ввода, чтобы обеспечить его целостность.Эта опция полезна, если вы намеревались декодировать несколько независимых записей данных, разделенных разрывами строки.
  • Режим реального времени: Когда вы включаете эту опцию, введенные данные немедленно декодируются с помощью встроенных функций JavaScript вашего браузера - без отправки какой-либо информации на наши серверы. В настоящее время этот режим поддерживает только набор символов UTF-8.
Надежно и надежно

Все коммуникации с нашими серверами осуществляются через безопасные зашифрованные соединения SSL (https).Загруженные файлы удаляются с наших серверов сразу после обработки, а полученный загружаемый файл удаляется сразу после первой попытки загрузки или 15 минут бездействия. Мы никоим образом не храним и не проверяем содержимое введенных данных или загруженных файлов. Прочтите нашу политику конфиденциальности ниже для получения более подробной информации.

Совершенно бесплатно

Наш инструмент можно использовать бесплатно. Теперь вам не нужно загружать какое-либо программное обеспечение для таких задач.

Подробная информация о кодировке URL-адреса

Типы символов URI

Допустимые символы в URI либо зарезервированы, либо не зарезервированы (или символ процента как часть процентного кодирования).Зарезервированные символы - это те символы, которые иногда имеют особое значение. Например, символы прямой косой черты используются для разделения различных частей URL-адреса (или, в более общем смысле, URI). Незарезервированные символы не имеют таких значений. При использовании процентного кодирования зарезервированные символы представляются с помощью специальных последовательностей символов. Наборы зарезервированных и незарезервированных символов, а также обстоятельства, при которых определенные зарезервированные символы имеют особое значение, незначительно менялись с каждым пересмотром спецификаций, управляющих URI и схемами URI.

RFC 3986 раздел 2.2 Зарезервированные символы (январь 2005 г.)
! * ' ( ) ; : @ и = + $ , / ? # [ ]

RFC 3986 раздел 2.3 незарезервированных символа (январь 2005 г.)
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
a b c d e f г h i j k l m n o p q r s t u v w x y z
0 1 2 3 4 5 6 7 8 9 - _ . ~

Другие символы в URI должны быть закодированы в процентах.

Зарезервированные символы с процентным кодированием

Когда символ из зарезервированного набора («зарезервированный символ») имеет особое значение («зарезервированное назначение») в определенном контексте, а схема URI сообщает, что необходимо использовать этот символ для какой-то другой цели, тогда этот символ должен быть закодирован в процентах. Процентное кодирование зарезервированного символа включает преобразование символа в соответствующее ему байтовое значение в ASCII и последующее представление этого значения в виде пары шестнадцатеричных цифр.Цифры, которым предшествует знак процента ("%"), затем используются в URI вместо зарезервированного символа. (Для символа, отличного от ASCII, он обычно преобразуется в его последовательность байтов в UTF-8, а затем каждое значение байта представляется, как указано выше.)

Зарезервированный символ «/», например, если он используется в пути « "компонент URI, имеет особое значение как разделитель между сегментами пути. Если в соответствии с заданной схемой URI «/» должен находиться в сегменте пути, тогда в этом сегменте должны использоваться три символа «% 2F» или «% 2f» вместо необработанного «/».

Зарезервированные символы после процентного кодирования
! # $ и ' ( ) * + , / : ; = ? @ [ ]
% 21 % 23 % 24 % 26 % 27 % 28 % 29 % 2A % 2B % 2C % 2F % 3A % 3B % 3D % 3F % 40 % 5B % 5D

Зарезервированные символы, которые не имеют зарезервированного назначения в конкретном контексте, также могут быть закодированы в процентах, но не являются семантически отличается от других.

В компоненте «запрос» URI (часть после символа?), Например, «/» по-прежнему считается зарезервированным символом, но обычно он не имеет зарезервированного назначения, если в конкретной схеме URI не указано иное. Символ не нужно кодировать в процентах, если он не имеет зарезервированной цели.

URI, которые отличаются только тем, является ли зарезервированный символ закодированным в процентах или отображается буквально, обычно считаются не эквивалентными (обозначающими один и тот же ресурс), если не может быть определено, что рассматриваемые зарезервированные символы не имеют зарезервированной цели.Это определение зависит от правил, установленных для зарезервированных символов отдельными схемами URI.

Процентное кодирование незарезервированных символов

Символы из незарезервированного набора никогда не нуждаются в процентном кодировании.

URI, которые различаются только тем, является ли незарезервированный символ закодированным в процентах или выглядит буквально, эквивалентны по определению, но процессоры URI на практике могут не всегда распознавать эту эквивалентность. Например, потребители URI не должны рассматривать «% 41» иначе, чем «A», или «% 7E» иначе, чем «~», но некоторые это делают.Для максимальной совместимости производителям URI не рекомендуется использовать процентное кодирование незарезервированных символов.

Процентное кодирование символа процента

Поскольку символ процента («%») служит индикатором для октетов, закодированных в процентах, он должен быть закодирован в процентах как «% 25», чтобы этот октет использовался в качестве данных внутри URI.

Процентное кодирование произвольных данных

Большинство схем URI включают представление произвольных данных, таких как IP-адрес или путь файловой системы, в качестве компонентов URI.Спецификации схемы URI должны, но часто этого не делать, предоставлять явное сопоставление между символами URI и всеми возможными значениями данных, представленными этими символами.

Двоичные данные

С момента публикации RFC 1738 в 1994 году было указано [1], что схемы, которые обеспечивают представление двоичных данных в URI, должны разделять данные на 8-битные байты и кодировать их в процентах. byte таким же образом, как указано выше. Например, байтовое значение 0F (шестнадцатеричное) должно быть представлено как «% 0F», а байтовое значение 41 (шестнадцатеричное) может быть представлено как «A» или «% 41».Использование незакодированных символов для буквенно-цифровых и других незарезервированных символов обычно является предпочтительным, поскольку это приводит к более коротким URL-адресам.

Символьные данные

Процедура процентного кодирования двоичных данных часто экстраполировалась, иногда неправильно или не полностью, для применения к символьным данным. В годы становления Всемирной паутины при работе с символами данных в репертуаре ASCII и использовании соответствующих им байтов в ASCII в качестве основы для определения последовательностей, закодированных в процентах, эта практика была относительно безвредной; просто предполагалось, что символы и байты отображаются взаимно однозначно и взаимозаменяемы.Однако потребность в представлении символов вне диапазона ASCII быстро росла, и схемы и протоколы URI часто не обеспечивали стандартных правил для подготовки символьных данных для включения в URI. Следовательно, веб-приложения начали использовать различные многобайтовые кодировки, кодировки с отслеживанием состояния и другие несовместимые с ASCII кодировки в качестве основы для процентного кодирования, что привело к неоднозначности и трудностям надежной интерпретации URI.

Например, многие схемы и протоколы URI, основанные на RFC 1738 и 2396, предполагают, что символы данных будут преобразованы в байты в соответствии с некоторой неопределенной кодировкой символов, прежде чем будут представлены в URI незарезервированными символами или байтами, закодированными в процентах.Если схема не позволяет URI предоставлять подсказку относительно того, какая кодировка использовалась, или если кодировка конфликтует с использованием ASCII для процентного кодирования зарезервированных и незарезервированных символов, то URI не может быть надежно интерпретирован. В некоторых схемах вообще не учитывается кодировка, и вместо этого просто предлагается, чтобы символы данных отображались непосредственно на символы URI, что оставляет на усмотрение реализации решать, следует ли и как кодировать символы данных в процентах, которые не входят ни в зарезервированные, ни в незарезервированные наборы. _ ` { | } ~ % 0A или % 0D или % 0D% 0A % 20 % 22 % 25 % 2D % 2E % 3C % 3E % 5C % 5E % 5F % 60 % 7B % 7C % 7D % 7E
Данные произвольных символов иногда кодируются в процентах и ​​используются в ситуациях, не связанных с URI, например, для программ обфускации паролей или других системные протоколы перевода..


Смотрите также

Поделиться в соц. сетях

Опубликовать в Facebook
Опубликовать в Одноклассники
Вы можете оставить комментарий, или ссылку на Ваш сайт.

Оставить комментарий