Appendix.2 Mid East Times for Windowsフォントについて
はじめに
現在日本で流布している転写文字用フォントに東洋文庫のサイトで配布されているMidEastフォントがある。Timesフォントを基礎としたTrueTypeフォントで、非常に美しく便利な代物なものなのだが、いくつか問題点もある。本章ではそれについて論ずる。
目次
- はじめに
- MidEast Timesフォントの仕様
-
MidEast Times Fontの問題点
- 仕様的問題
- 実用上の問題
- 付表:MidEastTimes文字コード割当表
- 参考文献とリンク
- 変更履歴
MidEast Timesフォントの仕様
MidEastフォントはapple TrueTypeフォント仕様にもとづいたMachintosh用のフォントがまず作られ、続いてWindows用に移植されたTrueTypeフォントである。Timesフォントに基づいて美しい字形を持つ。コード的にはISO-8859におけるGR領域に転写文字用の字形を無理矢理割り当てている。当然Symbolフォントの扱いを受ける。厳密な意味ではなく、わかりやすい言い方をするといわゆる「外字」フォントである。
MidEast Times Fontの問題点
仕様的問題
前項に述べたとおり、MidEast TimesはISO-8859におけるGR領域に独自拡張的に転写文字を割り当てたSymbolフォントである。GR領域には本来ISO-8859シリーズといわれるセットを割り当てることになっているが、MidEastTimesはISO-8859シリーズのいずれにも合致していない。本来外字領域に割り当てるべき字形をGR領域に割り当てている。つまり字形が定義済みの文字コードに対し、それとは別の文字を定義しているため完全な仕様違反(これはWindows標準添付のWindingsやSymbolも同様)である。したがってローカルのワードプロセッサなどで使用する分にはなんの問題もないが、Web上に公開するHTMLで使用してはいけないフォントである。
第一に、外字フォントであるということからわかるとおり、一般のコンピュータにも存在するフォントではない。従ってMidEast Timesを持っていないコンピュータからは絶対に見ることができない。
第二に、外字ということで、字形と文字コードを勝手に結びつけている。どういうことかというと、文字の字形には必ず10進数ないしは16進数で示したコードが指定されている。たとえば$0041といえばAという字形(Latin Capital Letter A)なのである。MidEastTimesフォントでやっていることは、この$0041にDという字形を割り当てているようなものなのである。付表をごらんいただきたい。
第三に、検索などでヒットすることはまずない(というのは、たとえばMidEast Timesフォントを持っている人が、MidEast TimesフォントでWordなりに書いた文字列をコピー&ペーストでGoogleの検索窓で貼り付けて検索するような場合を除いて、ということ)。すなわちMidEast Timesを持っていない環境(もちろんそれが一般的)では、記号の羅列と認識される。とくに文字コードの指定によっては、Midと書いたつもりが、Espなどとなってしまう可能性もある。転写文字の字形が指定された文字コードがあるのに外字を使うというのは好ましくない。
実用上の問題
仕様上の問題とも関連するが、MidEastTimesはUnicodeに対応していない。どういうことかというと、Shift_JISなりでエンコードされたHTMLに対しMidEastTimesを使用するのは文法違反であるが、Internet Explorerのバグにより、意図された通りに表示されてしまうが、UnicodeでエンコードされたHTMLに対して使用しても意図したとおりには表示されることはまずないということである。
付表 MidEastTimes文字コード割当表
文字コード | 字形名 | MidEastTimesで示そうとしている字形 | 本来の字形 |
---|---|---|---|
$0081 | [no description available] | | must not use |
$0082 | [no description available] | | must not use |
$0083 | [no description available] | | must not use |
$0084 | [no description available] | | must not use |
$0085 | [no description available] | must not use | |
$0086 | [no description available] | | must not use |
$0087 | [no description available] | | must not use |
$0088 | [no description available] | | must not use |
$0089 | [no description available] | | must not use |
$008A | [no description available] | | must not use |
$008B | [no description available] | | must not use |
$008C | [no description available] | | must not use |
$008D | [no description available] | | must not use |
$008E | [no description available] | | must not use |
$008F | [no description available] | | must not use |
$0090 | [no description available] | | must not use |
$0091 | [no description available] | | must not use |
$0092 | [no description available] | | must not use |
$0093 | [no description available] | | must not use |
$0094 | [no description available] | | must not use |
$0095 | [no description available] | | must not use |
$0096 | [no description available] | | must not use |
$0097 | [no description available] | | must not use |
$0098 | [no description available] | | must not use |
$0099 | [no description available] | | must not use |
$009A | [no description available] | | must not use |
$009B | [no description available] | | must not use |
$009C | [no description available] | | must not use |
$009D | [no description available] | | must not use |
$009E | [no description available] | | must not use |
$009F | [no description available] | | must not use |
$00A0 | No-Break Space | [No-Break Space] | [No-Break Space] |
$00A1 | Inverted Exclamation Mark | ¡ | ¡ |
$00A2 | Cent Sign | ¢ | ¢ |
$00A3 | Pound Sign | £ | £ |
$00A4 | Currency Sign | ¤ | ¤ |
$00A5 | Yen Sign | ¥ | ¥ |
$00A6 | Broken Bar | ¦ | ¦ |
$00A7 | Section Sign | § | § |
$00A8 | Diaresis | ¨ | ¨ |
$00A9 | Copyright Sign | © | © |
$00AA | Feminine Ordinal Indicator | ª | ª |
$00AB | Left-Pointing Double Angle Quotaion Mark | « | « |
$00AC | Not Sign | ¬ | ¬ |
$00AD | Soft-Hyphen | [Soft-Hyphen] | [Soft-Hyphen] |
$00AE | Registered Mark | ® | ® |
$00AF | Macron | ¯ | ¯ |
$00B0 | Degree Sign | ° | ° |
$00B1 | Plus-Minus Sign | ± | ± |
$00B2 | Superscript Two | ² | ² |
$00B3 | Superscript Three | ³ | ³ |
$00B4 | Acute Accent | ´ | ´ |
$00B5 | Micro Sign | µ | µ |
$00B6 | Pilcrow Sign | ¶ | ¶ |
$00B7 | Middle Dot | · | · |
$00B8 | Cedilla | ¸ | ¸ |
$00B9 | Superscript One | ¹ | ¹ |
$00BA | Masculine Ordinal Indicator | º | º |
$00BB | Right-Pointing Double Angle Quotaion Mark | » | » |
$00BC | Vulgar Fraction One Quarter | ¼ | ¼ |
$00BD | Vulgar Fraction One Half | ½ | ½ |
$00BE | Vulgar Fraction Three Quarters | ¾ | ¾ |
$00BF | Inverted Question Mark | ¿ | ¿ |
$00C0 | Latin Capital Letter A with Grave | À | À |
$00C1 | Latin Capital Letter A with Acute | Á | Á |
$00C2 | Latin Capital Letter A with Circumflex | Â | Â |
$00C3 | Latin Capital Letter A with Tilde | Ã | Ã |
$00C4 | Latin Capital Letter A with Diaeresis | Ä | Ä |
$00C5 | Latin Capital Letter A with Ring above | Å | Å |
$00C6 | Latin Capital Letter AE | Æ | Æ |
$00C7 | Latin Capital Letter C with Cedilla | Ç | Ç |
$00C8 | Latin Capital Letter E with Grave | È | È |
$00C9 | Latin Capital Letter E with Acute | É | É |
$00CA | Latin Capital Letter E with Circumflex | Ê | Ê |
$00CB | Latin Capital Letter E with Diaeresis | Ë | Ë |
$00CC | Latin Capital Letter I with Grave | Ì | Ì |
$00CD | Latin Capital Letter I with Acute | Í | Í |
$00CE | Latin Capital Letter I with Circumflex | Î | Î |
$00CF | Latin Capital Letter I with Diaeresis | Ï | Ï |
$00D0 | Latin Capital Letter ETH | Ð | Ð |
$00D1 | Latin Capital Letter N with Tilde | Ñ | Ñ |
$00D2 | Latin Capital Letter O with Grave | Ò | Ò |
$00D3 | Latin Capital Letter O with Acute | Ó | Ó |
$00D4 | Latin Capital Letter O with Circumflex | Ô | Ô |
$00D5 | Latin Capital Letter O with Tilde | Õ | Õ |
$00D6 | Latin Capital Letter O with Diaeresis | Ö | Ö |
$00D7 | Multiplication Sign | × | × |
$00D8 | Latin Capital Letter O with Stroke | Ø | Ø |
$00D9 | Latin Capital Letter U with Grave | Ù | Ù |
$00DA | Latin Capital Letter U with Acute | Ú | Ú |
$00DB | Latin Capital Letter U with Circumflex | Û | Û |
$00DC | Latin Capital Letter U with Diaeresis | Ü | Ü |
$00DD | Latin Capital Letter Y with Acute | Ý | Ý |
$00DE | Latin Capital Letter THRON | Þ | Þ |
$00DF | Latin Capital Letter Sharp S | ß | ß |
$00E0 | Latin Small Letter A with Acute | à | à |
$00E1 | Latin Small Letter A with Acute | á | á |
$00E2 | Latin Small Letter A with Circumflex | â | â |
$00E3 | Latin Small Letter A with Tilde | ã | ã |
$00E4 | Latin Small Letter A with Diaeresis | ä | ä |
$00E5 | Latin Small Letter A with Ring above | å | å |
$00E6 | Latin Small Letter AE | æ | æ |
$00E7 | Latin Small Letter C with Cedilla | ç | ç |
$00E8 | Latin Small Letter E with Grave | è | è |
$00E9 | Latin Small Letter E with Acute | é | é |
$00EA | Latin Small Letter E with Circumflex | ê | ê |
$00EB | Latin Small Letter E with Diaeresis | ë | ë |
$00EC | Latin Small Letter I with Grave | ì | ì |
$00ED | Latin Small Letter I with Acute | í | í |
$00EE | Latin Small Letter I with Circumflex | î | î |
$00EF | Latin Small Letter I with Diaeresis | ï | ï |
$00F0 | Latin Small Letter ETH | ð | ð |
$00F1 | Latin Small Letter N with Tilde | ñ | ñ |
$00F2 | Latin Small Letter O with Grave | ò | ò |
$00F3 | Latin Small Letter O with Acute | ó | ó |
$00F4 | Latin Small Letter O with Circumflex | ô | ô |
$00F5 | Latin Small Letter O with Tilde | õ | õ |
$00F6 | Latin Small Letter O with Diaeresis | ö | ö |
$00F7 | Division Sign | ÷ | ÷ |
$00F8 | Latin Small Letter O with Stroke | ø | ø |
$00F9 | Latin Small Letter U with Grave | ù | ù |
$00FA | Latin Small Letter U with Acute | ú | ú |
$00FB | Latin Small Letter U with Circumflex | û | û |
$00FC | Latin Small Letter U with Diaeresis | ü | ü |
$00FD | Latin Small Letter Y with Acute | ý | ý |
$00FE | Latin Small Letter THRON | þ | þ |
$00FF | Latin Small Letter Y with Diaeresis | ÿ | ÿ |
$0152 | Latin Capital Lagature OE | Œ | Œ |
$0153 | Latin Small Lagature OE | œ | œ |
$0160 | Latin Capital Letter S with Caron | Š | Š |
$0161 | Latin Small Letter S with Caron | š | š |
$0178 | Latin Small Letter Y with Diaeresis | Ÿ | Ÿ |
$017D | Latin Capital Letter Z with Caron | Ž | Ž |
$017E | Latin Small Letter Z with Caron | ž | ž |
参考文献とリンク
- RFC 2279: "UTF-8, a transformation format of ISO 10646" (http://www3.cds.ne.jp/~marimo/data/rfc/rfc2279.txt”)
- RFC 13941
- ALA-LC Romanization Tables: Transliteration Schemes for Non-Roman Scripts. Randal K. Berry (ed.). Library of Congress, 1997.(http://lcweb.loc.gov/catdir/cpso/romanization/arabic.pdf)
- Arabic. United Nations Romanization Systems for Geographical Names. Preliminary Report on Their Current Status. Compiled by the UNGEGN Working Group on Romanization Systems. Version 1.3,March 2000. (http://www.eki.ee/wgrs/rom1_ar.pdf).
- Lagally, Klaus ArabTeX – a System for Typesetting Arabic. User Manual Version 3.09. Institut für Informatik. Universität Stuttgart, 1999. (http://129.69.218.213/arabtex/doc/arabdoc.pdf).
- Binks, Søren. Arabic. In "Transliteration of Non-Roman Alphabets and Scripts ", 2002. (http://homepage.mac.com/sirbinks/pdf/Arabic.pdf).
- The Encyclopaedia of Islam. New Edition. Leiden, 1960-.
- ISO Rules for Transliteration. In "Manual for the Preparation of Records in Development-Information Systems" by Gisele Morin-Labatut & Maureen Sly. Information Sciences Division, International Development Research Centre. 1982. (http://199.75.20.92/useful/pdf-files/transliteration.pdf).
- 高橋誠「Windows 98/2000上でのUTF-8のページの作り方」鈴木朝子と高橋誠の部屋内, 2001,(http://homepage2.nifty.com/hobbit/html/utf8.html)