0


nginx文件夹内文件解释<八>

win-utf解释

[root@release nginx]# more win-utf 

# This map is not a full windows-1251<> utf8 map: it does not
# contain Serbian and Macedonianletters.  If you need a full map,
# use contrib/unicode2nginx/win-utf map instead.

charset_map  windows-1251  utf-8{82E2809A; # single low-9 quotation mark

    84E2809E; # double low-9 quotation mark
    85E280A6; # ellipsis
    86E280A0; # dagger
    87E280A1; # double dagger
    88E282AC; # euro
    89E280B0; # per mille

    91E28098; # left single quotation mark
    92E28099; # right single quotation mark
    93E2809C; # left double quotation mark
    94E2809D; # right double quotation mark
    95E280A2; # bullet
    96E28093; # en dash
    97E28094; # em dash

    99E284A2; # trade mark sign

    A0C2A0;   # &nbsp;A1D18E;   # capital ByelorussianshortUA2D19E;   # small Byelorussianshort u

    A4C2A4;   # currency sign
    A5D290;   # capital Ukrainian soft GA6C2A6;   # borken bar
    A7C2A7;   # section sign
    A8D081;   # capital YOA9C2A9;   # (C)AAD084;   # capital UkrainianYEABC2AB;   # left-pointing double angle quotation mark
    ACC2AC;   # not sign
    ADC2AD;   # soft hypen
    AEC2AE;   # (R)AFD087;   # capital UkrainianYIB0C2B0;   # &deg;B1C2B1;   # plus-minus sign
    B2D086;   # capital UkrainianIB3D196;   # small Ukrainian i
    B4D291;   # small Ukrainian soft g
    B5C2B5;   # micro sign
    B6C2B6;   # pilcrow sign
    B7C2B7;   # &middot;B8D191;   # small yo
    B9E28496; # numero sign
    BAD194;   # small Ukrainian ye
    BBC2BB;   # right-pointing double angle quotation mark

    BFD197;   # small Ukrainian yi

    C0D090;   # capital AC1D091;   # capital BC2D092;   # capital VC3D093;   # capital GC4D094;   # capital DC5D095;   # capital YEC6D096;   # capital ZHC7D097;   # capital ZC8D098;   # capital IC9D099;   # capital JCAD09A;   # capital KCBD09B;   # capital LCCD09C;   # capital MCDD09D;   # capital NCED09E;   # capital OCFD09F;   # capital PD0D0A0;   # capital RD1D0A1;   # capital SD2D0A2;   # capital TD3D0A3;   # capital UD4D0A4;   # capital FD5D0A5;   # capital KHD6D0A6;   # capital TSD7D0A7;   # capital CHD8D0A8;   # capital SHD9D0A9;   # capital SHCHDAD0AA;   # capital hard sign
    DBD0AB;   # capital YDCD0AC;   # capital soft sign
    DDD0AD;   # capital EDED0AE;   # capital YUDFD0AF;   # capital YAE0D0B0;   # small a
    E1D0B1;   # small b
    E2D0B2;   # small v
    E3D0B3;   # small g
    E4D0B4;   # small d
    E5D0B5;   # small ye
    E6D0B6;   # small zh
    E7D0B7;   # small z
    E8D0B8;   # small i
    E9D0B9;   # small j
    EAD0BA;   # small k
    EBD0BB;   # small l
    ECD0BC;   # small m
    EDD0BD;   # small n
    EED0BE;   # small o
    EFD0BF;   # small p

    F0D180;   # small r
    F1D181;   # small s
    F2D182;   # small t
    F3D183;   # small u
    F4D184;   # small f
    F5D185;   # small kh
    F6D186;   # small ts
    F7D187;   # small ch
    F8D188;   # small sh
    F9D189;   # small shch
    FAD18A;   # small hard sign
    FBD18B;   # small y
    FCD18C;   # small soft sign
    FDD18D;   # small e
    FED18E;   # small yu
    FFD18F;   # small ya
}

文件

win-utf

是一个字符集映射文件,用于将 Windows-1251 编码转换为 UTF-8 编码。这个文件中包含了一系列的映射条目,每个条目将一个 Windows-1251 编码的字符映射到相应的 UTF-8 编码字符。该文件指出,它并不包含塞尔维亚和马其顿字母的完整映射,如果需要完整的映射,建议使用

contrib/unicode2nginx/win-utf

文件。

以下是部分条目的解释:

字符映射详解

  • **82 E2809A**:单低-9引号(single low-9 quotation mark)。
  • **84 E2809E**:双低-9引号(double low-9 quotation mark)。
  • **85 E280A6**:省略号(ellipsis)。
  • **86 E280A0**:剑号(dagger)。
  • **87 E280A1**:双剑号(double dagger)。
  • **88 E282AC**:欧元符号(euro sign)。
  • **89 E280B0**:每千符号(per mille sign)。

Cyrillic 字符

  • **A1 D18E**:大写白俄罗斯短 U(capital Byelorussian short U)。
  • **A2 D19E**:小写白俄罗斯短 u(small Byelorussian short u)。
  • **A5 D290**:大写乌克兰软 G(capital Ukrainian soft G)。
  • **A8 D081**:大写俄文字母 Ё(capital YO)。
  • **AA D084**:大写乌克兰 YE(capital Ukrainian YE)。
  • **AF D087**:大写乌克兰 YI(capital Ukrainian YI)。

其他符号和标点

  • **91 E28098**:左单引号(left single quotation mark)。
  • **92 E28099**:右单引号(right single quotation mark)。
  • **93 E2809C**:左双引号(left double quotation mark)。
  • **94 E2809D**:右双引号(right double quotation mark)。
  • **95 E280A2**:项目符号(bullet)。
  • **96 E28093**:短破折号(en dash)。
  • **97 E28094**:长破折号(em dash)。

特殊符号和货币符号

  • **99 E284A2**:商标符号(trade mark sign)。
  • **A0 C2A0**:不断开空格(non-breaking space)。
  • **A4 C2A4**:货币符号(currency sign)。
  • **A6 C2A6**:破折号(broken bar)。
  • **A7 C2A7**:节选符(section sign)。
  • **A9 C2A9**:版权符号(copyright sign)。
  • **AE C2AE**:注册商标符号(registered trademark sign)。

这些映射是在 Web 服务器和 Web 应用之间处理不同语言和符号时非常重要,确保正确显示和处理文本数据。

标签: nginx 运维

本文转载自: https://blog.csdn.net/weixin_44976692/article/details/138859563
版权归原作者 码农阿豪 所有, 如有侵权,请联系我们删除。

“nginx文件夹内文件解释<八>”的评论:

还没有评论