没啥意思的站点

HTML的entity reference Character列表

所谓 entity reference Character 就是html里类似 &xxxx; 这样的字符,浏览器会把这样的字符给替换成奇奇怪怪的符号.
另外 charref 是指 &#nnnn; 这样的,直接把unicode码写在源码里的字符
昨天给gmbox增加entity reference支持的时候,发现在网上很难找到完整的一个列表,于是问TX.然后TX今天就给我了一个PDF文档,我用脚本稍微整理了一下,如下表,每个格子是一个字符,给出原字符+源码形式+unicode,或许在写HTML代码或者解析HTML代码的时候会用到.另外还提供方便用于源码的txt文件.

À
À
192
Á
Á
193
Â
Â
194
Ã
Ã
195
Ä
Ä
196
Å
Å
197
Æ
Æ
198
Ç
Ç
199
È
È
200
É
É
201
Ê
Ê
202
Ë
Ë
203
Ì
Ì
204
Í
Í
205
Î
Î
206
Ï
Ï
207
Ð
Ð
208
Ñ
Ñ
209
Ò
Ò
210
Ó
Ó
211
Ô
Ô
212
Õ
Õ
213
Ö
Ö
214
Ø
Ø
216
Œ
Œ
338
Š
Š
352
Ù
Ù
217
Ú
Ú
218
Û
Û
219
Ü
Ü
220
Ý
Ý
221
Ÿ
Ÿ
376
Þ
Þ
222
ß
ß
223
à
à
224
á
á
225
â
â
226
ã
ã
227
ä
ä
228
å
å
229
æ
æ
230
ç
ç
231
è
è
232
é
é
233
ê
ê
234
ë
ë
235
ì
ì
236
í
í
237
î
î
238
ï
ï
239
ð
ð
240
ñ
ñ
241
ò
ò
242
ó
ó
243
ô
ô
244
õ
õ
245
ö
ö
246
ø
ø
248
œ
œ
339
š
š
353
ù
ù
249
ú
ú
250
û
û
251
ü
ü
252
ý
ý
253
ÿ
ÿ
255
þ
þ
254
Α
Α
913
Β
Β
914
Γ
Γ
915
Δ
Δ
916
Ε
Ε
917
Ζ
Ζ
918
Η
Η
919
Θ
Θ
920
Ι
Ι
921
Κ
Κ
922
Λ
Λ
923
Μ
Μ
924
Ν
Ν
925
Ξ
Ξ
926
Ο
Ο
927
Π
Π
928
Ρ
Ρ
929
Σ
Σ
931
Τ
Τ
932
Υ
Υ
933
Φ
Φ
934
Χ
Χ
935
Ψ
Ψ
936
Ω
Ω
937
α
α
945
β
β
946
γ
γ
947
δ
δ
948
ε
ε
949
ζ
ζ
950
η
η
951
θ
θ
952
ι
ι
953
κ
κ
954
λ
λ
955
μ
μ
956
ν
ν
957
ξ
ξ
958
ο
ο
959
π
π
960
ρ
ρ
961
ς
ς
962
σ
σ
963
τ
τ
964
υ
υ
965
φ
φ
966
χ
χ
967
ψ
ψ
968
ω
ω
969
ϒ
ϒ
978
ϖ
ϖ
982
ϑ
ϑ
977
¦
¦
166
¡
¡
161
¿
¿
191
&
&
38
"
"
34

‘
8216

’
8217

‚
8218

“
8220

”
8221

„
8222

‹
8249

›
8250
«
«
171
»
»
187

…
8230
·
·
183
º
º
186
ª
ª
170

†
8224

‡
8225

‰
8240
´
´
180
ˆ
ˆ
710
˜
˜
732
¨
¨
168
¸
¸
184
¯
¯
175

‾
8254

–
8211

—
8212

•
8226
§
§
167

¶
182
©
©
169
®
®
174

™
8482

−
8722
±
±
177
×
×
215
÷
÷
247

≠
8800

≡
8801

∼
8764

≅
8773

≈
8776
<
&lt;
60

&le;
8804
>
&gt;
62

&ge;
8805

&lowast;
8727
¬
&not;
172
°
&deg;
176
²
&sup2;
178
³
&sup3;
179

&prime;
8242

&Prime;
8243

&frasl;
8260
¼
&frac14;
188
½
&frac12;
189
¾
&frac34;
190

&radic;
8730

&forall;
8704

&exist;
8707

&empty;
8709

&nabla;
8711

&isin;
8712

&notin;
8713

&ni;
8715

&prop;
8733

&ang;
8736

&and;
8743

&or;
8744

&cap;
8745

&cup;
8746

&sub;
8834

&sup;
8835

&nsub;
8836

&sube;
8838

&supe;
8839

&oplus;
8853

&otimes;
8855

&perp;
8869

&sdot;
8901

&lceil;
8968

&rceil;
8969

&lfloor;
8970

&rfloor;
8971

&lang;
9001

&rang;
9002

&there4;
8756

&infin;
8734
ƒ
&fnof;
402

&part;
8706

&int;
8747

&prod;
8719

&sum;
8721
µ
&micro;
181

&weierp;
8472

&image;
8465

&real;
8476

&alefsym;
8501
¢
&cent;
162
£
&pound;
163
¤
&curren;
164
¥
&yen;
165

&euro;
8364

&crarr;
8629

&larr;
8592

&uarr;
8593

&rarr;
8594

&darr;
8595

&harr;
8596

&lArr;
8656

&uArr;
8657

&rArr;
8658

&dArr;
8659

&hArr;
8660

&spades;
9824

&clubs;
9827

&hearts;
9829

&diams;
9830

&loz;
9674
 
&nbsp;
160

&ensp;
8194

&emsp;
8195

&thinsp;
8201

&zwnj;
8204

&zwj;
8205

10 评论

  1. 第一次看到还以为乱码了,顺便也请把脚本贴出来让我们学习学习。

  2. 贵博的Feed在阅读器里异常丑陋,敢问是故意的么?

    • 这个…feed这块都是WP默认的,我也没去动过啊,不过我一直用thunderbird订阅自己的,效果倒还不错. 只是在Google reader里面,实在是有点难看,有啥好的建议不?

  3. 比较头疼的就是XML对这坨东西只定义了几个,做Feed输出还得自己做替换

  4. 我以前也找过对勾的 Character,结果没找到,不过找到了下面的符号表,也挺全的。

    http://knopok.net/symbol-codes/html-code.html

  5. 直接调用现成的库多省事啊。

  6. http://unicode.org/Public/MAPPINGS/VENDORS/MISC/SGML.TXT

    这个我有在gmbox上贴过么?
    uncode上的,当然最权威。

    你的还是差不少的。

发表评论