Mac濁点問題について



Macの濁点問題について

MacOSXでファイルシステムのフォーマットに「HFS+」を利用している場合、ファイル名の濁点や半濁点取り扱いがWindowsやLinuxと異なります。

これは、Unicodeの正規化に関係しています。


Unicodeの濁点表現

Unicode で「が」という文字を表したい場合、以下の二種類の表現方法があります。

・「が」(U+304C)の一文字

・「か」(U+304B)+「・ 」(U+3099)の二文字


WindowsやLinuxでは、NFC正規化されている(合成済みの文字のみしか扱かわないため)ので、濁点を含んだ一文字を扱います。

しかし、MacOSXではファイル名をNFD正規化しているため、濁点を分解した文字として扱います。


Unicodeの正規化形式

Unicodeの正規化形式には4種類存在します。

・Normalization Form D(正規化形式 D, NFD)

・Normalization Form C(正規化形式 C, NFC)

・Normalization Form KD(正規化形式 KD, NFKD)

・Normalization Form KC(正規化形式 KC, NFKC)

「C」は「Composition=合成」の意味

「D」は「Decomposition=分解」の意味


Windows上で通常の操作を行う場合、基本的にはNFC形式の文字列を扱います。

MacOSXでよく使われている「HFS+」というファイルシステム上ではNFDで正規化されます。


WindowsユーザがMacOSXからファイルを受け取ると、名前がNFDで正規化されたファイルが作成され、NFCとは別名ファイルと認識されます。

アプリケーションによってはこのファイルを正しく扱えないため問題となることがあります。



関連

Macintosh設定





スポンサード リンク