« TRC MARCニュース第28号発行しました | メイン | 非掲載のMARCとスキャナの秘密 »

統一読みの話

MARC MANIAX目録第4回、今回もカナ読みの話題です。簡易目録づくりという企画のテーマからすると少々マニアックな気もしますが、もうしばらくおつきあいください。

★統一読み

前回は、「こども」も「子ども」も「子供」もカナ読みなら一度に探せる!という話でしたが、今回は、逆にカナ読みの弱点も明かさねばなりません。「日本」は「ニホン」?「ニッポン」?、「硫黄島」は「イオウジマ」?「イオウトウ」??のように、一つの表記に複数の読み方がある場合にはどうしたら良いのでしょうか。

解決のためのひとつの手は、地道ですが、単語ひとつひとつについて統一の読み方を決めていく、という方法です。依拠する資料を決めておけば、統一基準がぶれません。TRCでは、「広辞苑 第5版」「市町村役場便覧の最新版」「コンサイス日本地名事典 第4版」などなどを資料として、統一読みを決めています。これにより、「日本」は「ニホン」、「硫黄島」は「イオウトウ」になりました。

…が、それでもまだすっきりしないところは残ってしまうのでした。依拠している資料の読み方が、我々の日常言語感覚と、少々ずれている場合。多くはありませんが、下記のような例が出てきてしまいます。

顧客  コカク 
茶道  チャドウ 

これらの言葉では、著者の意図とは違う読み方になってしまっている場合もあるかと思われます。が、270万件のMARCからその言葉をもれなく探すため、MARCがぶれないための苦肉の策なのです。

TRC MARCでは対策として、図書に統一読みとは違う読み方がある場合には、そちらの読み方も同時に入力し、図書どおりの読みと統一読みの2つを同時に持たせるようにしています。


第2回のエントリーの末尾でご紹介したルビの読み方も同様に考えます。

「妖怪・神様に出会える異界(ところ)」 は 

ヨウカイ/カミサマ/ニ/デアエル/トコロ
ヨウカイ/カミサマ/ニ/デアエル/イカイ

のようにルビの読み方と漢字本来の読み方の2つを持たせ、どちらでも検索できるようにしています。

次回もまたまたテーマはカナ読み。カナ読みの分かち書きについてご説明する予定です。

トラックバック

このエントリーのトラックバックURL:
http://datablog.trc.co.jp/cgi-bin/mt/mt-tb.cgi/273

コメントを投稿

(投稿されたコメントは、TRCデータ部の営業時間内にアップいたします。投稿から掲載までお待ちいただく場合がありますがご了承ください。なお、メールアドレスはTRCデータ部から直接ご連絡する場合にのみ使用いたします。第三者への公開・提供はいたしません。)

2010年07月

        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

リンク