« 思い出の... | メイン | 今日は何の日?~9月10日は下水道の日~ »

よくよく見ると違う文字、実は同じ文字 ~典拠のはなし~

先日のこと。原本が中国語の児童書の著者で使われている「火+山」でひと文字のこの漢字、見慣れないけどもしかして...?
そう思い中国語辞典を調べてみると「燦」の簡体字でした。
原本が中国で刊行された本の場合は、もともとの漢字を簡略化した字体である簡体字かどうかを疑います。TRC MARCでは簡体字は繁体字に置き換えて入力をしているからです。
なかには私たちが使う繁体字と同じ字形だけど実は別の字の簡体字、という文字もあるので注意が必要です。

ちょっと特殊な例から始めましたが、明治期の復刻本のタイトルや、前述のような中国や韓国で刊行された本の著者など、日頃あまり馴染みのない漢字に出会うこともしばしばです。
思うのは目録上で扱う文字のなんと多いこと。
私たち典拠班が作成する個人名典拠ファイル。人名に使われる漢字は特にバリエーションが豊富です。
作成中、漢字に悩まされることが多々あります。文字は印刷された文字をそのまま入力するわけにいかない場合が往々にしてあります。
なぜ?と思われるかもしれませんが、印刷された紙の上の文字が、すべてTRC MARCのシステム上でも同じように入力できる文字とは限らないのです。
たとえば草彅剛の「なぎ」の字は【ナギ】と表示します。これはシステム上で入力できないからです。TRC MARCでは【】はカタカナの読みに置き換えた文字であることを示します。

では入力可能な文字かどうかはどう調べるのか?
まずはその文字が入力できる文字なのかを調べます。一見複雑な文字だけど入力できる文字とわかり、ほっとすることも。
どうやらこのまま入力はできなさそうだとわかったら、調査は次の段階へ。
異体字関係にある別の文字で代用するかどうかを決定します。
6C79DF6B-BE5A-4FE5-AA83-BDF95C47464D.jpeg
字典など漢字に関する参考資料類を集結したスペースがあるので、こちらで調査を開始。
ひとつひとつ字典をめくり、コピーをとって専用の調査用紙に切り貼りするというアナログな方法で、どのように扱うか検討します。
こうして地道な作業により、統一できる文字があれば代用し、なければ入力不可の文字としてひと文字ずつ決定するのです。
内容細目のある復刻本ではタイトルや内容著者が多いと、結果的に調査の必要な文字の割合も高い場合があるのでひと苦労です。
新たに典拠ファイルを作成かと思ったら、異体字ですでに典拠ファイルがあったということもたまにあります。
これがたとえば英語を母国語とする国であったなら、アルファベット26文字だけで済むのだと思うと、ちょっと羨ましくも思いますが、人名に使われる漢字の細かな違いにもそれぞれきっとルーツがあるのかなと思いながら、文字調査をするのは結構興味深く楽しい作業です。

コメントを投稿

(投稿されたコメントは、TRCデータ部の営業時間内にアップいたします。投稿から掲載までお待ちいただく場合がありますがご了承ください。なお、メールアドレスはTRCデータ部から直接ご連絡する場合にのみ使用いたします。第三者への公開・提供はいたしません。)

2024年7月

  1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31      

アーカイブ

全てのエントリーの一覧

リンク