こんにちは。新刊目録の藤沢です。
今月は、木曜日を4回使って、TRC MARCを作るときの「漢字の入力」について、かる~くご紹介したいと思います。
「なぜ漢字?普通に変換すれば入るよ?」と思われた方もいるかもしれませんが、例えばニュースサイトの記事を思い出してみてください。文中にいきなり「●」とあり、文末に「●は火へんに韋」などとフォローしてあったりしますよね。世の中の漢字の数はとにかく多いので、全ての漢字を「文字」として、コンピュータ上で入力、表示させるのはなかなか難しいようです。
MARCの現場でも、復刻本にある昔の字、中韓の人名に出てくる見慣れない字、たまには著者が勝手に作っちゃった漢字など、「あれ?この字どうやったら入力できるの?」というものに遭遇します。(その辺が紙媒体の自由なところですね)
で、そんな色んな漢字をTRCではどう扱っているのでしょうか?
まずは第一歩。この文字は、
A.そのまま入力できる
B.ダメ
のどちらなのかを、コードブックを使って調べます。
Aの場合は何も問題ないですね。
では、そのままでは入力できないBは一体どうするのか?
…続きは次の木曜日に。