« きょうのデータ部☆(6/2) | メイン | 紙芝居で歯の大切さを!(64歯497~れ) »

漢字を入力する話 その1

こんにちは。新刊目録の藤沢です。

今月は、木曜日を4回使って、TRC MARCを作るときの「漢字の入力」について、かる~くご紹介したいと思います。

「なぜ漢字?普通に変換すれば入るよ?」と思われた方もいるかもしれませんが、例えばニュースサイトの記事を思い出してみてください。文中にいきなり「●」とあり、文末に「●は火へんに韋」などとフォローしてあったりしますよね。世の中の漢字の数はとにかく多いので、全ての漢字を「文字」として、コンピュータ上で入力、表示させるのはなかなか難しいようです。


MARCの現場でも、復刻本にある昔の字、中韓の人名に出てくる見慣れない字、たまには著者が勝手に作っちゃった漢字など、「あれ?この字どうやったら入力できるの?」というものに遭遇します。(その辺が紙媒体の自由なところですね)

で、そんな色んな漢字をTRCではどう扱っているのでしょうか?

まずは第一歩。この文字は、

A.そのまま入力できる 
B.ダメ
 
のどちらなのかを、コードブックを使って調べます。

Aの場合は何も問題ないですね。
では、そのままでは入力できないBは一体どうするのか?

…続きは次の木曜日に。

トラックバック

このエントリーのトラックバックURL:
http://datablog.trc.co.jp/cgi-bin/mt/mt-tb.cgi/1003

コメントを投稿

(投稿されたコメントは、TRCデータ部の営業時間内にアップいたします。投稿から掲載までお待ちいただく場合がありますがご了承ください。なお、メールアドレスはTRCデータ部から直接ご連絡する場合にのみ使用いたします。第三者への公開・提供はいたしません。)

博物館、図書館、文書館、公民館(MLAK)東日本大震災被災救援情報
博物館、図書館、文書館、公民館(MLAK)東日本大震災被災救援情報

2016年9月

        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30  

アーカイブ

全てのエントリーの一覧

リンク