HTML的entity reference Character列表
所谓 entity reference Character 就是html里类似 &xxxx; 这样的字符,浏览器会把这样的字符给替换成奇奇怪怪的符号.
另外 charref 是指 &#nnnn; 这样的,直接把unicode码写在源码里的字符
昨天给gmbox增加entity reference支持的时候,发现在网上很难找到完整的一个列表,于是问TX.然后TX今天就给我了一个PDF文档,我用脚本稍微整理了一下,如下表,每个格子是一个字符,给出原字符+源码形式+unicode,或许在写HTML代码或者解析HTML代码的时候会用到.另外还提供方便用于源码的txt文件.
À À 192 |
Á Á 193 |
  194 |
à à 195 |
Ä Ä 196 |
Å Å 197 |
Æ Æ 198 |
Ç Ç 199 |
È È 200 |
É É 201 |
Ê Ê 202 |
Ë Ë 203 |
Ì Ì 204 |
Í Í 205 |
Î Î 206 |
Ï Ï 207 |
Ð Ð 208 |
Ñ Ñ 209 |
Ò Ò 210 |
Ó Ó 211 |
Ô Ô 212 |
Õ Õ 213 |
Ö Ö 214 |
Ø Ø 216 |
Œ Œ 338 |
Š Š 352 |
Ù Ù 217 |
Ú Ú 218 |
Û Û 219 |
Ü Ü 220 |
Ý Ý 221 |
Ÿ Ÿ 376 |
Þ Þ 222 |
ß ß 223 |
à à 224 |
á á 225 |
â â 226 |
ã ã 227 |
ä ä 228 |
å å 229 |
æ æ 230 |
ç ç 231 |
è è 232 |
é é 233 |
ê ê 234 |
ë ë 235 |
ì ì 236 |
í í 237 |
î î 238 |
ï ï 239 |
ð ð 240 |
ñ ñ 241 |
ò ò 242 |
ó ó 243 |
ô ô 244 |
õ õ 245 |
ö ö 246 |
ø ø 248 |
œ œ 339 |
š š 353 |
ù ù 249 |
ú ú 250 |
û û 251 |
ü ü 252 |
ý ý 253 |
ÿ ÿ 255 |
þ þ 254 |
Α Α 913 |
Β Β 914 |
Γ Γ 915 |
Δ Δ 916 |
Ε Ε 917 |
Ζ Ζ 918 |
Η Η 919 |
Θ Θ 920 |
Ι Ι 921 |
Κ Κ 922 |
Λ Λ 923 |
Μ Μ 924 |
Ν Ν 925 |
Ξ Ξ 926 |
Ο Ο 927 |
Π Π 928 |
Ρ Ρ 929 |
Σ Σ 931 |
Τ Τ 932 |
Υ Υ 933 |
Φ Φ 934 |
Χ Χ 935 |
Ψ Ψ 936 |
Ω Ω 937 |
α α 945 |
β β 946 |
γ γ 947 |
δ δ 948 |
ε ε 949 |
ζ ζ 950 |
η η 951 |
θ θ 952 |
ι ι 953 |
κ κ 954 |
λ λ 955 |
μ μ 956 |
ν ν 957 |
ξ ξ 958 |
ο ο 959 |
π π 960 |
ρ ρ 961 |
ς ς 962 |
σ σ 963 |
τ τ 964 |
υ υ 965 |
φ φ 966 |
χ χ 967 |
ψ ψ 968 |
ω ω 969 |
ϒ ϒ 978 |
ϖ ϖ 982 |
ϑ ϑ 977 |
¦ ¦ 166 |
¡ ¡ 161 |
¿ ¿ 191 |
& & 38 |
" " 34 |
‘ ‘ 8216 |
’ ’ 8217 |
‚ ‚ 8218 |
“ “ 8220 |
” ” 8221 |
„ „ 8222 |
‹ ‹ 8249 |
› › 8250 |
« « 171 |
» » 187 |
… … 8230 |
· · 183 |
º º 186 |
ª ª 170 |
† † 8224 |
‡ ‡ 8225 |
‰ ‰ 8240 |
´ ´ 180 |
ˆ ˆ 710 |
˜ ˜ 732 |
¨ ¨ 168 |
¸ ¸ 184 |
¯ ¯ 175 |
‾ ‾ 8254 |
– – 8211 |
— — 8212 |
• • 8226 |
§ § 167 |
¶ ¶ 182 |
© © 169 |
® ® 174 |
™ ™ 8482 |
− − 8722 |
± ± 177 |
× × 215 |
÷ ÷ 247 |
≠ ≠ 8800 |
≡ ≡ 8801 |
∼ ∼ 8764 |
≅ ≅ 8773 |
≈ ≈ 8776 |
< < 60 |
≤ ≤ 8804 |
> > 62 |
≥ ≥ 8805 |
∗ ∗ 8727 |
¬ ¬ 172 |
° ° 176 |
² ² 178 |
³ ³ 179 |
′ ′ 8242 |
″ ″ 8243 |
⁄ ⁄ 8260 |
¼ ¼ 188 |
½ ½ 189 |
¾ ¾ 190 |
√ √ 8730 |
∀ ∀ 8704 |
∃ ∃ 8707 |
∅ ∅ 8709 |
∇ ∇ 8711 |
∈ ∈ 8712 |
∉ ∉ 8713 |
∋ ∋ 8715 |
∝ ∝ 8733 |
∠ ∠ 8736 |
∧ ∧ 8743 |
∨ ∨ 8744 |
∩ ∩ 8745 |
∪ ∪ 8746 |
⊂ ⊂ 8834 |
⊃ ⊃ 8835 |
⊄ ⊄ 8836 |
⊆ ⊆ 8838 |
⊇ ⊇ 8839 |
⊕ ⊕ 8853 |
⊗ ⊗ 8855 |
⊥ ⊥ 8869 |
⋅ ⋅ 8901 |
⌈ ⌈ 8968 |
⌉ ⌉ 8969 |
⌊ ⌊ 8970 |
⌋ ⌋ 8971 |
〈 ⟨ 9001 |
〉 ⟩ 9002 |
∴ ∴ 8756 |
∞ ∞ 8734 |
ƒ ƒ 402 |
∂ ∂ 8706 |
∫ ∫ 8747 |
∏ ∏ 8719 |
∑ ∑ 8721 |
µ µ 181 |
℘ ℘ 8472 |
ℑ ℑ 8465 |
ℜ ℜ 8476 |
ℵ ℵ 8501 |
¢ ¢ 162 |
£ £ 163 |
¤ ¤ 164 |
¥ ¥ 165 |
€ € 8364 |
↵ ↵ 8629 |
← ← 8592 |
↑ ↑ 8593 |
→ → 8594 |
↓ ↓ 8595 |
↔ ↔ 8596 |
⇐ ⇐ 8656 |
⇑ ⇑ 8657 |
⇒ ⇒ 8658 |
⇓ ⇓ 8659 |
⇔ ⇔ 8660 |
♠ ♠ 9824 |
♣ ♣ 9827 |
♥ ♥ 9829 |
♦ ♦ 9830 |
◊ ◊ 9674 |
160 |
  8194 |
  8195 |
  8201 |
‌ 8204 |
‍ 8205 |
pjq 在 2009年07月28日 23:42 说:【 】
第一次看到还以为乱码了,顺便也请把脚本贴出来让我们学习学习。
bones7456 在 2009年07月29日 09:25 说:【 】
呵呵,那么丑的脚本都不好意思贴出来…
DaNmarner 在 2009年07月29日 08:56 说:【 】
贵博的Feed在阅读器里异常丑陋,敢问是故意的么?
bones7456 在 2009年07月29日 09:34 说:【 】
这个…feed这块都是WP默认的,我也没去动过啊,不过我一直用thunderbird订阅自己的,效果倒还不错. 只是在Google reader里面,实在是有点难看,有啥好的建议不?
竹影清风 在 2009年07月29日 09:24 说:【 】
比较头疼的就是XML对这坨东西只定义了几个,做Feed输出还得自己做替换
旷旭卿 在 2009年07月29日 09:53 说:【 】
我以前也找过对勾的 Character,结果没找到,不过找到了下面的符号表,也挺全的。
http://knopok.net/symbol-codes/html-code.html
sevk 在 2009年07月29日 10:35 说:【 】
直接调用现成的库多省事啊。
bones7456 在 2009年07月29日 11:05 说:【 】
问题是python有库可以调吗?看了不少资料问了不少人,都没有发现啊…
thom 在 2009年08月02日 11:30 说:【 】
http://unicode.org/Public/MAPPINGS/VENDORS/MISC/SGML.TXT
这个我有在gmbox上贴过么?
uncode上的,当然最权威。
你的还是差不少的。
bones7456 在 2009年08月02日 16:54 说:【 】
恩,谢谢~ 不过我已经找到了专门干这个的python的内部模块了,就是 htmlentitydefs.name2codepoint ,哈哈~