I am LAZY bones ? all linux

HTML的entity reference Character列表

所谓 entity reference Character 就是html里类似 &xxxx; 这样的字符,浏览器会把这样的字符给替换成奇奇怪怪的符号.
另外 charref 是指 &#nnnn; 这样的,直接把unicode码写在源码里的字符
昨天给gmbox增加entity reference支持的时候,发现在网上很难找到完整的一个列表,于是问TX.然后TX今天就给我了一个PDF文档,我用脚本稍微整理了一下,如下表,每个格子是一个字符,给出原字符+源码形式+unicode,或许在写HTML代码或者解析HTML代码的时候会用到.另外还提供方便用于源码的txt文件.

À
À
192
Á
Á
193
Â
Â
194
Ã
Ã
195
Ä
Ä
196
Å
Å
197
Æ
Æ
198
Ç
Ç
199
È
È
200
É
É
201
Ê
Ê
202
Ë
Ë
203
Ì
Ì
204
Í
Í
205
Î
Î
206
Ï
Ï
207
Ð
Ð
208
Ñ
Ñ
209
Ò
Ò
210
Ó
Ó
211
Ô
Ô
212
Õ
Õ
213
Ö
Ö
214
Ø
Ø
216
Œ
Œ
338
Š
Š
352
Ù
Ù
217
Ú
Ú
218
Û
Û
219
Ü
Ü
220
Ý
Ý
221
Ÿ
Ÿ
376
Þ
Þ
222
ß
ß
223
à
à
224
á
á
225
â
â
226
ã
ã
227
ä
ä
228
å
å
229
æ
æ
230
ç
ç
231
è
è
232
é
é
233
ê
ê
234
ë
ë
235
ì
ì
236
í
í
237
î
î
238
ï
ï
239
ð
ð
240
ñ
ñ
241
ò
ò
242
ó
ó
243
ô
ô
244
õ
õ
245
ö
ö
246
ø
ø
248
œ
œ
339
š
š
353
ù
ù
249
ú
ú
250
û
û
251
ü
ü
252
ý
ý
253
ÿ
ÿ
255
þ
þ
254
Α
Α
913
Β
Β
914
Γ
Γ
915
Δ
Δ
916
Ε
Ε
917
Ζ
Ζ
918
Η
Η
919
Θ
Θ
920
Ι
Ι
921
Κ
Κ
922
Λ
Λ
923
Μ
Μ
924
Ν
Ν
925
Ξ
Ξ
926
Ο
Ο
927
Π
Π
928
Ρ
Ρ
929
Σ
Σ
931
Τ
Τ
932
Υ
Υ
933
Φ
Φ
934
Χ
Χ
935
Ψ
Ψ
936
Ω
Ω
937
α
α
945
β
β
946
γ
γ
947
δ
δ
948
ε
ε
949
ζ
ζ
950
η
η
951
θ
θ
952
ι
ι
953
κ
κ
954
λ
λ
955
μ
μ
956
ν
ν
957
ξ
ξ
958
ο
ο
959
π
π
960
ρ
ρ
961
ς
ς
962
σ
σ
963
τ
τ
964
υ
υ
965
φ
φ
966
χ
χ
967
ψ
ψ
968
ω
ω
969
ϒ
ϒ
978
ϖ
ϖ
982
ϑ
ϑ
977
¦
¦
166
¡
¡
161
¿
¿
191
&
&
38
"
"
34

‘
8216

’
8217

‚
8218

“
8220

”
8221

„
8222

‹
8249

›
8250
«
«
171
»
»
187

…
8230
·
·
183
º
º
186
ª
ª
170

†
8224

‡
8225

‰
8240
´
´
180
ˆ
ˆ
710
˜
˜
732
¨
¨
168
¸
¸
184
¯
¯
175

‾
8254

–
8211

—
8212

•
8226
§
§
167

¶
182
©
©
169
®
®
174

™
8482

−
8722
±
±
177
×
×
215
÷
÷
247

≠
8800

≡
8801

∼
8764

≅
8773

≈
8776
<
&lt;
60

&le;
8804
>
&gt;
62

&ge;
8805

&lowast;
8727
¬
&not;
172
°
&deg;
176
²
&sup2;
178
³
&sup3;
179

&prime;
8242

&Prime;
8243

&frasl;
8260
¼
&frac14;
188
½
&frac12;
189
¾
&frac34;
190

&radic;
8730

&forall;
8704

&exist;
8707

&empty;
8709

&nabla;
8711

&isin;
8712

&notin;
8713

&ni;
8715

&prop;
8733

&ang;
8736

&and;
8743

&or;
8744

&cap;
8745

&cup;
8746

&sub;
8834

&sup;
8835

&nsub;
8836

&sube;
8838

&supe;
8839

&oplus;
8853

&otimes;
8855

&perp;
8869

&sdot;
8901

&lceil;
8968

&rceil;
8969

&lfloor;
8970

&rfloor;
8971

&lang;
9001

&rang;
9002

&there4;
8756

&infin;
8734
ƒ
&fnof;
402

&part;
8706

&int;
8747

&prod;
8719

&sum;
8721
µ
&micro;
181

&weierp;
8472

&image;
8465

&real;
8476

&alefsym;
8501
¢
&cent;
162
£
&pound;
163
¤
&curren;
164
¥
&yen;
165

&euro;
8364

&crarr;
8629

&larr;
8592

&uarr;
8593

&rarr;
8594

&darr;
8595

&harr;
8596

&lArr;
8656

&uArr;
8657

&rArr;
8658

&dArr;
8659

&hArr;
8660

&spades;
9824

&clubs;
9827

&hearts;
9829

&diams;
9830

&loz;
9674
 
&nbsp;
160

&ensp;
8194

&emsp;
8195

&thinsp;
8201

&zwnj;
8204

&zwj;
8205

最后修改时间: 2009年07月28日 23:19

本文章发表于: 2009年07月28日 23:19 | 所属分类:备忘. | 您可以在此订阅本文章的所有评论. | 您也可以发表评论, 或从您的网站trackback.

10 个评论 关于: “HTML的entity reference Character列表”

  1. pjq 在 2009年07月28日 23:42 说:回复

    第一次看到还以为乱码了,顺便也请把脚本贴出来让我们学习学习。

    • bones7456 在 2009年07月29日 09:25 说:回复

      呵呵,那么丑的脚本都不好意思贴出来…

  2. DaNmarner 在 2009年07月29日 08:56 说:回复

    贵博的Feed在阅读器里异常丑陋,敢问是故意的么?

    • bones7456 在 2009年07月29日 09:34 说:回复

      这个…feed这块都是WP默认的,我也没去动过啊,不过我一直用thunderbird订阅自己的,效果倒还不错. 只是在Google reader里面,实在是有点难看,有啥好的建议不?

  3. 竹影清风 在 2009年07月29日 09:24 说:回复

    比较头疼的就是XML对这坨东西只定义了几个,做Feed输出还得自己做替换

  4. 旷旭卿 在 2009年07月29日 09:53 说:回复

    我以前也找过对勾的 Character,结果没找到,不过找到了下面的符号表,也挺全的。

    http://knopok.net/symbol-codes/html-code.html

  5. sevk 在 2009年07月29日 10:35 说:回复

    直接调用现成的库多省事啊。

    • bones7456 在 2009年07月29日 11:05 说:回复

      问题是python有库可以调吗?看了不少资料问了不少人,都没有发现啊…

  6. thom 在 2009年08月02日 11:30 说:回复

    http://unicode.org/Public/MAPPINGS/VENDORS/MISC/SGML.TXT

    这个我有在gmbox上贴过么?
    uncode上的,当然最权威。

    你的还是差不少的。

    • bones7456 在 2009年08月02日 16:54 说:回复

      恩,谢谢~ 不过我已经找到了专门干这个的python的内部模块了,就是 htmlentitydefs.name2codepoint ,哈哈~

发表评论