« 「朝」の京都 | メイン | こんな動物がいます~新設件名のお知らせ2017年11月分~ »

巳已己ふたたび-和漢古書目録作成における漢字入力(1)

こんにちは。AS 伊藤です。主に和漢古書を担当しています。

何年か前のデータ部ログの記事で、別々の文字である「巳・已・己」の区別に神経を使っている、という話がありました。これらの文字は和漢古書でもよくお目にかかる文字ではあるのですが、現代書とはまた情況が変わってきます。今回はこのことについて書いてみましょう。

現代書の活字フォントでは、この3文字、左上の空隙の有無でしっかり区別されますが、和漢古書の場合を考えてみてください。和漢古書の場合、文字は毛筆による手書きだったり、版木に手彫りで彫られていたりします。
ということで、容易に想像のつくとおり、「安永己亥」とあるはずのところが、どう見ても「安永巳亥」となっていたり、「天明乙巳」とあるはずのところが「天明乙已」となっていたり、跋文が「俟他日之校正而已」(他日の校正を俟(ま)つのみ)で終わっているはずが「俟他日之校正而己」としか見えない、などということがざらにあります。
現代書であればこれらは誤植と見なすことになるでしょうが、和漢古書の場合そのように見なしてよいでしょうか。もし誤記と見るとなると、この3文字にかぎらず、和漢古書は誤記だらけということになります。

もちろんそんなことは不合理であって、手書きもしくは手彫りの文字の性格として、この場合の左上の空隙の有無といった細かい相違は、字そのものの違いを決める要素にはならない、と考えなければなりません。
すなわち、「巳」に対する「已」「己」、「已」に対する「巳」「己」、「己」に対する「巳」「已」は、手書き・手彫りの世界では、字形のわずかなユレと見なすべきものであり、別字(異なる字)と見るべきではありません。ですので、現物に「巳」とあろうと「己」とあろうと「己」とあろうと、それらは「巳」「已」「己」どれである可能性もある、ということになります。
ということで、和漢古書においては、こうした文字について、字形のわずかな相違に注意するのではなく、意味的にどの字として使われているかを、それぞれの出現箇所において個別に判断して入力しなければなりません。字形の細かい違いに注意しなさい、という世界から、さらにまた一ひねりというわけですね。

「巳」「已」「己」のような事例は他にもあり、たとえば「于」と「干」、「旦」と「且」など、和漢古書の世界では、しばしばお互いに厳密に区別されずに使われています。刊記に「寶暦十二年壬午孟春吉且」と書いてあるように見えたとしても、「吉且」では意味が全然通りませんので、「寶暦十二年壬午孟春吉旦」と記録しなければなりません。

上記の例など、「転記の原則」に反するのでは、と思われる方もいるかもしれませんが、『異体字解読字典』などといった工具書を見れば分かりますが、手書き・手彫りの世界では、多くの字に実にさまざまな異体字があります。そうした異体字にはもちろん、本字とは別の字としてコンピュータで扱える文字となっているものもありますし、なかには「己」「旦」のようにそれが他の字とまったく同じ字形になっているものもあります。ですがいずれにしろ、多くの異体字は現時点ではコンピュータで文字として扱えるようになっていないのですから、そういう情況下で、現代書と同じような「転記の原則」を原理的に運用しようとするのは、そもそもナンセンスなのです。
完全にカタチ(形)にもとづく「転記の原則」が成り立つのは、ある字のカタチが、他と区別されるものとしてユニークに決められている現代書の活字フォントの世界のみにおいてであって、和漢古書においては、意味(義)を考え合わせた上での「転記の原則」に基づいて、入力作業を行っていかなければなりません。

字体や字形が異なっていても同じ字であるとして扱う(コンピュータ上の処理において同じ番号を与える)ことを包摂(ほうせつ)と言います。JISにおいて包摂基準というものが定められており、大半は字形の軽微な違いということで得心がいきますが、なかには「歴」「暦」の「たれ」の内がわの上部がほんらいは「禾」二つなのを「木」二つのものに包摂するなど、ほーそこまでやるんだと思うようなものもあります。
手書き・手彫りの世界において、現物にある字形がどの文字に包摂されるかを考える場合も、基本的にこのJISの基準に沿って考えてよいと思いますが、多くの異体字はコンピュータでいまだ扱えないという情況下では、包摂基準はゆるめに運用するということでよいと思います。現時点においてコンピュータで扱えない異体字は、可能であれば基本的に本字に置き換えて入力したほうが、ガチガチな姿勢で、基準に沿わないからと言ってゲタのままにしておくより、はるかによいでしょう。

いずれにしろ、包摂とはいろいろな字形・字体のものを一つにユニファイするものであり、「転記の原則」とある意味で表裏の関係にあると言えます(なお、ここで問題となるのはあくまで字形・字体であって、書体(楷草行)やフォントデザインとはまったく別のものであるのは言うまでもありません)。「巳」「已」「己」については、現代では包摂されませんが、手書き・手彫りの世界では、それぞれがそれぞれに包摂されている、というふうに理解することもできるでしょう。
また、いわゆる変体仮名は、目録規則においては平仮名に置き換える(NCR1.0.6.3)ことになっていますが、JISにおいては(字形の違いというわけではありませんが)ふつうの平仮名に包摂されている、と捉えることもできます。もっとも、ユニコード環境においては変体仮名をそれ自身として別に収録する方向になりつつあるようですが、ただ次回見るように、文字コード番号が与えられればそれで一丁あがり、ということになるわけではありません。

トラックバック

このエントリーのトラックバックURL:
http://datablog.trc.co.jp/cgi-bin/mt/mt-tb.cgi/2933

コメントを投稿

(投稿されたコメントは、TRCデータ部の営業時間内にアップいたします。投稿から掲載までお待ちいただく場合がありますがご了承ください。なお、メールアドレスはTRCデータ部から直接ご連絡する場合にのみ使用いたします。第三者への公開・提供はいたしません。)

博物館、図書館、文書館、公民館(MLAK)東日本大震災被災救援情報
博物館、図書館、文書館、公民館(MLAK)東日本大震災被災救援情報

2017年12月

          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31            

アーカイブ

全てのエントリーの一覧

リンク