本篇文章給大家分享的是有關如何整理HTML5中支持的URL編碼與字符編碼,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

成都創新互聯專注為客戶提供全方位的互聯網綜合服務,包含不限于網站制作、成都網站設計、茌平網絡推廣、微信小程序開發、茌平網絡營銷、茌平企業策劃、茌平品牌公關、搜索引擎seo、人物專訪、企業宣傳片、企業代運營等,從售前售中售后,我們都將竭誠為您服務,您的肯定,是我們最大的嘉獎;成都創新互聯為所有大學生創業者提供茌平建站搭建服務,24小時服務熱線:13518219792,官方網址:www.yijiale78.com
URL 編碼
URL 編碼就是將 URLs 中不宜打印的字符或者具有特殊意義的字符轉換為 Web 瀏覽器和服務器明白且普遍接受的表示法。 這些字符包括:
ASCII 控制字符 - 不宜打印的字符通常用于輸出控制。字符范圍是十六進制的 00-1F(十進制的 0-31)和 7F(十進制的 127)。下面提供了完整的編碼表。
非 ASCII 控制字符 - 這些字符超出了 128 個 ASCII 字符集的范圍。這個范圍是 ISO-拉丁字符集的一部分以及包含整個十六進制的 ISO-拉丁字符集 00-FF (十進制的 128-255)的“前半部分”。下面提供了完整的編碼表。
保留字符 - 諸如美元符號,和號,加號,通用符號,正斜杠,冒號,分好,等號,問號以及 “at”這類符號。所有這些符號在 URL 內都有不同的意義,因此需要編碼。下面提供了完整的編碼表。
不安全字符 - 包括空格,問號,小于符號,大于符號,磅字符,百分比符號,大括號左邊部分,大括號右邊部分,管道符,反斜杠,插入符號,波浪線。左方括號,右方括號,沉音符。出于某些原因,這些字符出現在 URLs 中存在被誤解的可能性。這些字符也應該始終被編碼。下面提供了完整的編碼表。
編碼表示法需要三個字符替換期望的字符:一個百分號,兩個在 ASCII 字符集中表示字符位置的十六進制數字、
示例
最常見的特殊字符之一便是空格。我們不能在 URL 中直接輸入一個空格。空格在字符集中就是十六進制的 20。因此請求服務器時可以使用 %20 表示空格。
這個 URL 實際上是從 www.example.com 檢索一個名為 new pricing.html 的文檔。
ASCII 控制字符編碼
包括十六進制的 00-1F(十進制的 0-31)和 7F(十進制的 127)字符碼。
| 十進制格式 | 十六進制值 | 字符 | URL 編碼 | 
|---|---|---|---|
| 0 | 00 | %00 | |
| 1 | 01 | %01 | |
| 2 | 02 | %02 | |
| 3 | 03 | %03 | |
| 4 | 04 | %04 | |
| 5 | 05 | %05 | |
| 6 | 06 | %06 | |
| 7 | 07 | %07 | |
| 8 | 08 | 退格符 | %08 | 
| 9 | 09 | tab | %09 | 
| 10 | 0a | 換行符 | %0a | 
| 11 | 0b | %0b | |
| 12 | 0c | %0c | |
| 13 | 0d | 回車符 | %0d | 
| 14 | 0e | %0e | |
| 15 | 0f | %0f | |
| 16 | 10 | %10 | |
| 17 | 11 | %11 | |
| 18 | 12 | %12 | |
| 19 | 13 | %13 | |
| 20 | 14 | %14 | |
| 21 | 15 | %15 | |
| 22 | 16 | %16 | |
| 23 | 17 | %17 | |
| 24 | 18 | %18 | |
| 25 | 19 | %19 | |
| 26 | 1a | %1a | |
| 27 | 1b | %1b | |
| 28 | 1c | %1c | |
| 29 | 1d | %1d | |
| 30 | 1e | %1e | |
| 31 | 1f | %1f | |
| 127 | 7f | %7f | 
非 ASCII 控制字符編碼
包括整個十六進制的 ISO-拉丁字符集 80-FF(十進制的 128-255)編碼的“前半部分”。
| 十進制格式 | 十六進制值 | 字符 | URL 編碼 | 
|---|---|---|---|
| 128 | 80 | € | %80 | 
| 129 | 81 | ? | %81 | 
| 130 | 82 | ? | %82 | 
| 131 | 83 | ? | %83 | 
| 132 | 84 | ? | %84 | 
| 133 | 85 | … | %85 | 
| 134 | 86 | ? | %86 | 
| 135 | 87 | ? | %87 | 
| 136 | 88 | ? | %88 | 
| 137 | 89 | ‰ | %89 | 
| 138 | 8a | ? | %8a | 
| 139 | 8b | ? | %8b | 
| 140 | 8c | ? | %8c | 
| 141 | 8d | ? | %8d | 
| 142 | 8e | ? | %8e | 
| 143 | 8f | ? | %8f | 
| 144 | 90 | ? | %90 | 
| 145 | 91 | ‘ | %91 | 
| 146 | 92 | ’ | %92 | 
| 147 | 93 | “ | %93 | 
| 148 | 94 | ” | %94 | 
| 149 | 95 | ? | %95 | 
| 150 | 96 | – | %96 | 
| 151 | 97 | — | %97 | 
| 152 | 98 | ? | %98 | 
| 153 | 99 | ? | %99 | 
| 154 | 9a | ? | %9a | 
| 155 | 9b | ? | %9b | 
| 156 | 9c | ? | %9c | 
| 157 | 9d | ? | %9d | 
| 158 | 9e | ? | %9e | 
| 159 | 9f | ? | %9f | 
| 160 | a0 | %a0 | |
| 161 | a1 | ? | %a1 | 
| 162 | a2 | ¢ | %a2 | 
| 163 | a3 | £ | %a3 | 
| 164 | a4 | ¤ | %a4 | 
| 165 | a5 | ¥ | %a5 | 
| 166 | a6 | | | %a6 | 
| 167 | a7 | § | %a7 | 
| 168 | a8 | ¨ | %a8 | 
| 169 | a9 | ? | %a9 | 
| 170 | aa | a | %aa | 
| 171 | ab | ? | %ab | 
| 172 | ac | ? | %ac | 
| 173 | ad | - | %ad | 
| 174 | ae | ? | %ae | 
| 175 | af | ˉ | %af | 
| 176 | b0 | ° | %b0 | 
| 177 | b1 | ± | %b1 | 
| 178 | b2 | 2 | %b2 | 
| 179 | b3 | 3 | %b3 | 
| 180 | b4 | ′ | %b4 | 
| 181 | b5 | μ | %b5 | 
| 182 | b6 | ? | %b6 | 
| 183 | b7 | · | %b7 | 
| 184 | b8 | ? | %b8 | 
| 185 | b9 | 1 | %b9 | 
| 186 | ba | o | %ba | 
| 187 | bb | ? | %bb | 
| 188 | bc | ? | %bc | 
| 189 | bd | ? | %bd | 
| 190 | be | ? | %be | 
| 191 | bf | ? | %bf | 
| 192 | c0 | à | %c0 | 
| 193 | c1 | á | %c1 | 
| 194 | c2 | ? | %c2 | 
| 195 | c3 | ? | %c3 | 
| 196 | c4 | ? | %c4 | 
| 197 | c5 | ? | %c5 | 
| 198 | c6 | ? | %v6 | 
| 199 | c7 | ? | %c7 | 
| 200 | c8 | è | %c8 | 
| 201 | c9 | é | %c9 | 
| 202 | ca | ê | %ca | 
| 203 | cb | ? | %cb | 
| 204 | cc | ì | %cc | 
| 205 | cd | í | %cd | 
| 206 | ce | ? | %ce | 
| 207 | cf | ? | %cf | 
| 208 | d0 | D | %d0 | 
| 209 | d1 | ? | %d1 | 
| 210 | d2 | ò | %d2 | 
| 211 | d3 | ó | %d3 | 
| 212 | d4 | ? | %d4 | 
| 213 | d5 | ? | %d5 | 
| 214 | d6 | ? | %d6 | 
| 215 | d7 | × | %d7 | 
| 216 | d8 | ? | %d8 | 
| 217 | d9 | ù | %d9 | 
| 218 | da | ú | %da | 
| 219 | db | ? | %db | 
| 220 | dc | ü | %dc | 
| 221 | dd | Y | %dd | 
| 222 | de | T | %de | 
| 223 | df | ? | %df | 
| 224 | e0 | à | %e0 | 
| 225 | e1 | á | %e1 | 
| 226 | e2 | a | %e2 | 
| 227 | e3 | ? | %e3 | 
| 228 | e4 | ? | %e4 | 
| 229 | e5 | ? | %e5 | 
| 230 | e6 | ? | %e6 | 
| 231 | e7 | ? | %e7 | 
| 232 | e8 | è | %e8 | 
| 233 | e9 | é | %e9 | 
| 234 | ea | ê | %ea | 
| 235 | eb | ? | %eb | 
| 236 | ec | ì | %ec | 
| 237 | ed | í | %ed | 
| 238 | ee | ? | %ee | 
| 239 | ef | ? | %ef | 
| 240 | f0 | e | %f0 | 
| 241 | f1 | ? | %f1 | 
| 242 | f2 | ò | %f2 | 
| 243 | f3 | ó | %f3 | 
| 244 | f4 | ? | %f4 | 
| 245 | f5 | ? | %f5 | 
| 246 | f6 | ? | %f6 | 
| 247 | f7 | ÷ | %f7 | 
| 248 | f8 | ? | %f8 | 
| 249 | f9 | ù | %f9 | 
| 250 | fa | ú | %fa | 
| 251 | fb | ? | %fb | 
| 252 | fc | ü | %fc | 
| 253 | fd | y | %fd | 
| 254 | fe | t | %fe | 
| 255 | ff | ? | %ff | 
保留字符編碼
下表用于編碼保留字符。
| 十進制格式 | 十六進制值 | 字符 | URL 編碼 | 
|---|---|---|---|
| 36 | 24 | $ | %24 | 
| 38 | 26 | & | %26 | 
| 43 | 2b | + | %2b | 
| 44 | 2c | , | %2c | 
| 47 | 2f | / | %2f | 
| 58 | 3a | : | %3a | 
| 59 | 3b | ; | %3b | 
| 61 | 3d | = | %3d | 
| 63 | 3f | ? | %3f | 
| 64 | 40 | @ | %40 | 
不安全字符編碼
下表用于編碼不安全字符。
| 十進制格式 | 十六進制值 | 字符 | URL 編碼 | 
|---|---|---|---|
| 32 | 20 | space | %20 | 
| 34 | 22 | " | %22 | 
| 60 | 3c | < | %3c | 
| 62 | 3e | > | %3e | 
| 35 | 23 | # | %23 | 
| 37 | 25 | % | %25 | 
| 123 | 7b | { | %7b | 
| 125 | 7d | } | %7d | 
| 124 | 7c | | | %7c | 
| 92 | 5c | \ | %5c | 
| 94 | 5e | ^ | %5e | 
| 126 | 7e | ~ | %7e | 
| 91 | 5b | [ | %5b | 
| 93 | 5d | ] | %5d | 
| 96 | 60 | ` | %60 | 
字符編碼
字符編碼就是將字節轉換為字符的一種方法。要驗證或者顯示一個 HTML 文檔,程序必須選擇一個字符編碼。HTML5 作者有三種方式設置字符編碼:
HTTP Content-Type 頭:
如果你在編寫 cgi 程序或者類似的程序,那么可以使用 HTTP Content-Type 頭設置任意字符編碼:
下面是一個簡單的例子:
XML/HTML Code復制內容到剪貼板
print "Content-Type: text/html; charset=utf-8\r\n";
<meta> 元素:
可以使用帶有 charset 屬性的 <meta> 元素指定 HTML5 文檔前 512 個字節的編碼:
下面是簡化的例子:
XML/HTML Code復制內容到剪貼板
<meta charset="UTF-8">
盡管這種語法是被允許的,但上述語法需要使用 <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> 替換。
Unicode 字節順序標記(BOM)
一個字節順序標記(BOM)由數據流開頭的 U+FEFF 字符碼組成,它可以用作定義字節順序和編碼形式的簽名,主要是未標記的明文文件。
許多 Windows 程序(包括 Windows 記事本)都會在保存為 UTF-8 的任意文檔開頭添加 0xEF, 0xBB, 0xBF。這就是 Unicode 字節順序標記(BOM)的 UTF-8 編碼,通常被稱為 UTF-8 BOM,盡管它和字節順序沒有關系。
對于 HTML5 文檔,我們可以在文件的開頭使用 Unicode 字節順序標記(BOM)字符。這個字符為使用的編碼提供了簽名。
以上就是如何整理HTML5中支持的URL編碼與字符編碼,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注創新互聯行業資訊頻道。
                分享題目:如何整理HTML5中支持的URL編碼與字符編碼
                
                文章地址:http://www.yijiale78.com/article40/pcheho.html
            
成都網站建設公司_創新互聯,為您提供虛擬主機、定制網站、網站維護、網站設計、網頁設計公司、外貿網站建設
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯
