统一资源定位符 (URL) 只是用于访问网站内容的网站地址,例如 www.geeksforgeeks.org。但是在 URL 中允许使用某些字符,例如字母 AZ 和 az、数字 0-9 和一些特殊字符。它们可以按原样使用,但不在此列表中的其余字符在将它们编码为合适的形式后使用。
URL 编码是将 URL 转换为 Web 浏览器可接受的有效格式的过程。 URL 编码是通过用 % 符号后跟两个十六进制数字替换所有不允许的字符来进行的。这两个十六进制值代表字符在 ASCII字符集中的数值。例如,URL 中不接受空格,在编码时用“%20”或“+”号替换。类似地,$ 符号被替换为“%24”。
保留字符: URL 中的某些字符有时具有特殊含义,可以同时使用。例如,’/’字符是一个保留字符,当用作分隔符来分隔 URL 的路径时,它具有特殊的含义。此处通过将其编码为 ‘%2F’ 来使用它。否则在没有特殊用途的情况下可以正常使用。
下面列出了许多保留字符:
Character | Encoded Form |
---|---|
! | %21 |
* | %2A |
‘ | %27 |
( | %28 |
) | %29 |
; | %3B |
: | %3A |
@ | %40 |
& | %26 |
= | %3D |
+ | %2B |
$ | %24 |
, | %2C |
/ | %2F |
? | %3F |
# | %23 |
[ | %5B |
] | %5D |
有些字符需要编码,有些则不需要。这里是分类显示需要编码的字符组。
- 安全字符:字母数字,即 0-9、az 和 AZ、特殊字符$、-、_、.、+、!、*、’、(、) 以及用于其保留目的的保留字符。这些字符不需要编码。
- ASCII 控制字符: Ii 包括十六进制 00-1F(十进制 0-31)和 7F(十进制 127)的字符。这些字符需要被编码。
- 非 ASCII 控制字符:包括 80-FF 十六进制(十进制 128-255)。这些字符需要被编码。
- 保留字符:这些字符用于特殊目的,它们需要编码。
- 不安全字符:由于各种原因,这些字符可能会在 URL 中被误解。所以它需要编码。字符<和>是不安全的,因为它们在自由文本中用作 URL 的分隔符,引号 (” “) 是不安全的,因为它在某些系统中用于分隔 URL。
不安全字符列表如下:
Character Encoded Form space %20 “ %22 < %3C > %3E # %23 % %25 { %7B } %7D | %7C \ %5C ^ %5E ~ %7E [ %5B ] %5D
下面给出了完整的 URL 编码字符列表:
CHARACTER | ENCODED FORM |
---|---|
backspace | %08 |
tab | %09 |
linefeed | %0A |
c return | %0D |
space | %20 |
! | %21 |
“ | %22 |
# | %23 |
$ | %24 |
% | %25 |
& | %26 |
‘ | %27 |
( | %28 |
) | %29 |
* | %2A |
+ | %2B |
, | %2C |
– | %2D |
. | %2E |
/ | %2F |
0 | %30 |
1 | %31 |
2 | %32 |
3 | %33 |
4 | %34 |
5 | %35 |
6 | %36 |
7 | %37 |
8 | %38 |
9 | %39 |
: | %3A |
; | %3B |
< | %3C |
= | %3D |
> | %3E |
? | %3F |
@ | %40 |
A | %41 |
B | %42 |
C | %43 |
D | %44 |
E | %45 |
F | %46 |
G | %47 |
H | %48 |
I | %49 |
J | %4A |
K | %4B |
L | %4C |
M | %4D |
N | %4E |
O | %4F |
P | %50 |
Q | %51 |
R | %52 |
S | %53 |
T | %54 |
U | %55 |
V | %56 |
W | %57 |
X | %58 |
Y | %59 |
Z | %5A |
[ | %5B |
\ | %5C |
] | %5D |
^ | %5E |
_ | %5F |
` | %60 |
a | %61 |
b | %62 |
c | %63 |
d | %64 |
e | %65 |
f | %66 |
g | %67 |
h | %68 |
i | %69 |
j | %6A |
k | %6B |
l | %6C |
m | %6D |
n | %6E |
o | %6F |
p | %70 |
q | %71 |
r | %72 |
s | %73 |
t | %74 |
u | %75 |
v | %76 |
w | %77 |
x | %78 |
y | %79 |
z | %7A |
{ | %7B |
| | %7C |
} | %7D |
~ | %7E |
%7F | |
` | %E2%82%AC |
%81 | |
‚ | %E2%80%9A |
ƒ | %C6%92 |
„ | %E2%80%9E |
… | %E2%80%A6 |
† | %E2%80%A0 |
‡ | %E2%80%A1 |
ˆ | %CB%86 |
‰ | %E2%80%B0 |
Š | %C5%A0 |
‹ | %E2%80%B9 |
Œ | %C5%92 |
%C5%8D | |
Ž | %C5%BD |
%8F | |
%C2%90 | |
‘ | %E2%80%98 |
’ | %E2%80%99 |
“ | %E2%80%9C |
” | %E2%80%9D |
• | %E2%80%A2 |
– | %E2%80%93 |
— | %E2%80%94 |
˜ | %CB%9C |
™ | %E2%84 |
š | %C5%A1 |
› | %E2%80 |
œ | %C5%93 |
%9D | |
ž | %C5%BE |
Ÿ | %C5%B8 |
%C2%A0 | |
¡ | %C2%A1 |
¢ | %C2%A2 |
£ | %C2%A3 |
¤ | %C2%A4 |
¥ | %C2%A5 |
¦ | %C2%A6 |
§ | %C2%A7 |
¨ | %C2%A8 |
© | %C2%A9 |
ª | %C2%AA |
« | %C2%AB |
¬ | %C2%AC |
| %C2%AD |
® | %C2%AE |
¯ | %C2%AF |
° | %C2%B0 |
± | %C2%B1 |
² | %C2%B2 |
³ | %C2%B3 |
´ | %C2%B4 |
µ | %C2%B5 |
¶ | %C2%B6 |
· | %C2%B7 |
¸ | %C2%B8 |
¹ | %C2%B9 |
º | %C2%BA |
» | %C2%BB |
¼ | %C2%BC |
½ | %C2%BD |
¾ | %C2%BE |
¿ | %C2%BF |
À | %C3%80 |
Á | %C3%81 |
 | %C3%82 |
à | %C3%83 |
Ä | %C3%84 |
Å | %C3%85 |
Æ | %C3%86 |
Ç | %C3%87 |
È | %C3%88 |
É | %C3%89 |
Ê | %C3%8A |
Ë | %C3%8B |
Ì | %C3%8C |
Í | %C3%8D |
Î | %C3%8E |
Ï | %C3%8F |
Ð | %C3%90 |
Ñ | %C3%91 |
Ò | %C3%92 |
Ó | %C3%93 |
Ô | %C3%94 |
Õ | %C3%95 |
Ö | %C3%96 |
× | %C3%97 |
Ø | %C3%98 |
Ù | %C3%99 |
Ú | %C3%9A |
Û | %C3%9B |
Ü | %C3%9C |
Ý | %C3%9D |
Þ | %C3%9E |
ß | %C3%9F |
à | %C3%A0 |
á | %C3%A1 |
â | %C3%A2 |
ã | %C3%A3 |
ä | %C3%A4 |
å | %C3%A5 |
æ | %C3%A6 |
ç | %C3%A7 |
è | %C3%A8 |
é | %C3%A9 |
ê | %C3%AA |
ë | %C3%AB |
ì | %C3%AC |
í | %C3%AD |
î | %C3%AE |
ï | %C3%AF |
ð | %C3%B0 |
ñ | %C3%B1 |
ò | %C3%B2 |
ó | %C3%B3 |
ô | %C3%B4 |
õ | %C3%B5 |
ö | %C3%B6 |
÷ | %C3%B7 |
ø | %C3%B8 |
ù | %C3%B9 |
ú | %C3%BA |
û | %C3%BB |
ü | %C3%BC |
ý | %C3%BD |
þ | %C3%BE |
ÿ | %C3%BF |