こんにちは。データぶー子です。
4月になりました!新年度の始まりですね。このデータ部ログダイジェストもまだまだ続きます。
では第14回、カナ読みのルールその2をどうぞ!
(2007年8月31日掲載の記事より)
前回は、「こども」も「子ども」も「子供」もカナ読みなら一度に探せる!という話でしたが、今回は、逆にカナ読みの弱点も明かさねばなりません。「日本」は「ニホン」?「ニッポン」?、「硫黄島」は「イオウジマ」?「イオウトウ」??のように、一つの表記に複数の読み方がある場合にはどうしたら良いのでしょうか。
解決のためのひとつの手は、地道ですが、単語ひとつひとつについて統一の読み方を決めていく、という方法です。依拠する資料を決めておけば、統一基準がぶれません。TRCでは、「広辞苑 第5版」「市町村役場便覧の最新版」「コンサイス日本地名事典 第4版」などなどを資料として、統一読みを決めています。これにより、「日本」は「ニホン」、「硫黄島」は「イオウトウ」になりました。
...が、それでもまだすっきりしないところは残ってしまうのでした。依拠している資料の読み方が、我々の日常言語感覚と、少々ずれている場合。多くはありませんが、下記のような例が出てきてしまいます。
茶道 チャドウ
口腔 コウコウ
これらの言葉では、著者の意図とは違う読み方になってしまっている場合もあるかと思われます。が、320万件のMARCからその言葉をもれなく探すため、MARCがぶれないための苦肉の策なのです。
TRC MARCでは対策として、図書に統一読みとは違う読み方がある場合には、そちらの読み方も同時に入力し、図書どおりの読みと統一読みの2つを同時に持たせるようにしています。
こちらの末尾でご紹介したルビの読み方も同様に考えます。
「妖怪・神様に出会える異界(ところ)」 は
ヨウカイ/カミサマ/ニ/デアエル/トコロ
ヨウカイ/カミサマ/ニ/デアエル/イカイ
のようにルビの読み方と漢字本来の読み方の2つを持たせ、どちらでも検索できるようにしています。
※カナ読みのルールについて、主なものをご紹介しました。もっと詳しく知りたいときは、このブログの左側にある「カテゴリー-読み方」にまとまっていますのでこちらをご覧ください。