win-utf解释
[root@release nginx]# more win-utf
# This map is not a full windows-1251<> utf8 map: it does not
# contain Serbian and Macedonianletters. If you need a full map,
# use contrib/unicode2nginx/win-utf map instead.
charset_map windows-1251 utf-8{82E2809A; # single low-9 quotation mark
84E2809E; # double low-9 quotation mark
85E280A6; # ellipsis
86E280A0; # dagger
87E280A1; # double dagger
88E282AC; # euro
89E280B0; # per mille
91E28098; # left single quotation mark
92E28099; # right single quotation mark
93E2809C; # left double quotation mark
94E2809D; # right double quotation mark
95E280A2; # bullet
96E28093; # en dash
97E28094; # em dash
99E284A2; # trade mark sign
A0C2A0; # A1D18E; # capital ByelorussianshortUA2D19E; # small Byelorussianshort u
A4C2A4; # currency sign
A5D290; # capital Ukrainian soft GA6C2A6; # borken bar
A7C2A7; # section sign
A8D081; # capital YOA9C2A9; # (C)AAD084; # capital UkrainianYEABC2AB; # left-pointing double angle quotation mark
ACC2AC; # not sign
ADC2AD; # soft hypen
AEC2AE; # (R)AFD087; # capital UkrainianYIB0C2B0; # °B1C2B1; # plus-minus sign
B2D086; # capital UkrainianIB3D196; # small Ukrainian i
B4D291; # small Ukrainian soft g
B5C2B5; # micro sign
B6C2B6; # pilcrow sign
B7C2B7; # ·B8D191; # small yo
B9E28496; # numero sign
BAD194; # small Ukrainian ye
BBC2BB; # right-pointing double angle quotation mark
BFD197; # small Ukrainian yi
C0D090; # capital AC1D091; # capital BC2D092; # capital VC3D093; # capital GC4D094; # capital DC5D095; # capital YEC6D096; # capital ZHC7D097; # capital ZC8D098; # capital IC9D099; # capital JCAD09A; # capital KCBD09B; # capital LCCD09C; # capital MCDD09D; # capital NCED09E; # capital OCFD09F; # capital PD0D0A0; # capital RD1D0A1; # capital SD2D0A2; # capital TD3D0A3; # capital UD4D0A4; # capital FD5D0A5; # capital KHD6D0A6; # capital TSD7D0A7; # capital CHD8D0A8; # capital SHD9D0A9; # capital SHCHDAD0AA; # capital hard sign
DBD0AB; # capital YDCD0AC; # capital soft sign
DDD0AD; # capital EDED0AE; # capital YUDFD0AF; # capital YAE0D0B0; # small a
E1D0B1; # small b
E2D0B2; # small v
E3D0B3; # small g
E4D0B4; # small d
E5D0B5; # small ye
E6D0B6; # small zh
E7D0B7; # small z
E8D0B8; # small i
E9D0B9; # small j
EAD0BA; # small k
EBD0BB; # small l
ECD0BC; # small m
EDD0BD; # small n
EED0BE; # small o
EFD0BF; # small p
F0D180; # small r
F1D181; # small s
F2D182; # small t
F3D183; # small u
F4D184; # small f
F5D185; # small kh
F6D186; # small ts
F7D187; # small ch
F8D188; # small sh
F9D189; # small shch
FAD18A; # small hard sign
FBD18B; # small y
FCD18C; # small soft sign
FDD18D; # small e
FED18E; # small yu
FFD18F; # small ya
}
文件
win-utf
是一个字符集映射文件,用于将 Windows-1251 编码转换为 UTF-8 编码。这个文件中包含了一系列的映射条目,每个条目将一个 Windows-1251 编码的字符映射到相应的 UTF-8 编码字符。该文件指出,它并不包含塞尔维亚和马其顿字母的完整映射,如果需要完整的映射,建议使用
contrib/unicode2nginx/win-utf
文件。
以下是部分条目的解释:
字符映射详解
- **
82 E2809A
**:单低-9引号(single low-9 quotation mark)。 - **
84 E2809E
**:双低-9引号(double low-9 quotation mark)。 - **
85 E280A6
**:省略号(ellipsis)。 - **
86 E280A0
**:剑号(dagger)。 - **
87 E280A1
**:双剑号(double dagger)。 - **
88 E282AC
**:欧元符号(euro sign)。 - **
89 E280B0
**:每千符号(per mille sign)。
Cyrillic 字符
- **
A1 D18E
**:大写白俄罗斯短 U(capital Byelorussian short U)。 - **
A2 D19E
**:小写白俄罗斯短 u(small Byelorussian short u)。 - **
A5 D290
**:大写乌克兰软 G(capital Ukrainian soft G)。 - **
A8 D081
**:大写俄文字母 Ё(capital YO)。 - **
AA D084
**:大写乌克兰 YE(capital Ukrainian YE)。 - **
AF D087
**:大写乌克兰 YI(capital Ukrainian YI)。
其他符号和标点
- **
91 E28098
**:左单引号(left single quotation mark)。 - **
92 E28099
**:右单引号(right single quotation mark)。 - **
93 E2809C
**:左双引号(left double quotation mark)。 - **
94 E2809D
**:右双引号(right double quotation mark)。 - **
95 E280A2
**:项目符号(bullet)。 - **
96 E28093
**:短破折号(en dash)。 - **
97 E28094
**:长破折号(em dash)。
特殊符号和货币符号
- **
99 E284A2
**:商标符号(trade mark sign)。 - **
A0 C2A0
**:不断开空格(non-breaking space)。 - **
A4 C2A4
**:货币符号(currency sign)。 - **
A6 C2A6
**:破折号(broken bar)。 - **
A7 C2A7
**:节选符(section sign)。 - **
A9 C2A9
**:版权符号(copyright sign)。 - **
AE C2AE
**:注册商标符号(registered trademark sign)。
这些映射是在 Web 服务器和 Web 应用之间处理不同语言和符号时非常重要,确保正确显示和处理文本数据。
版权归原作者 码农阿豪 所有, 如有侵权,请联系我们删除。