« カナ読みのルールその1(ダイジェスト第13回) | メイン | 描かれた美男~新設件名のお知らせ2013年3月分~ »

カナ読みのルールその2(ダイジェスト第14回)

こんにちは。データぶー子です。
4月になりました!新年度の始まりですね。このデータ部ログダイジェストもまだまだ続きます。
では第14回、カナ読みのルールその2をどうぞ!
databuko4.gif
2007年8月31日掲載の記事より)


前回は、「こども」も「子ども」も「子供」もカナ読みなら一度に探せる!という話でしたが、今回は、逆にカナ読みの弱点も明かさねばなりません。「日本」は「ニホン」?「ニッポン」?、「硫黄島」は「イオウジマ」?「イオウトウ」??のように、一つの表記に複数の読み方がある場合にはどうしたら良いのでしょうか。

解決のためのひとつの手は、地道ですが、単語ひとつひとつについて統一の読み方を決めていく、という方法です。依拠する資料を決めておけば、統一基準がぶれません。TRCでは、「広辞苑 第5版」「市町村役場便覧の最新版」「コンサイス日本地名事典 第4版」などなどを資料として、統一読みを決めています。これにより、「日本」は「ニホン」、「硫黄島」は「イオウトウ」になりました。

...が、それでもまだすっきりしないところは残ってしまうのでした。依拠している資料の読み方が、我々の日常言語感覚と、少々ずれている場合。多くはありませんが、下記のような例が出てきてしまいます。

茶道  チャドウ 
口腔  コウコウ


これらの言葉では、著者の意図とは違う読み方になってしまっている場合もあるかと思われます。が、320万件のMARCからその言葉をもれなく探すため、MARCがぶれないための苦肉の策なのです。

TRC MARCでは対策として、図書に統一読みとは違う読み方がある場合には、そちらの読み方も同時に入力し、図書どおりの読みと統一読みの2つを同時に持たせるようにしています。


こちらの末尾でご紹介したルビの読み方も同様に考えます。

「妖怪・神様に出会える異界(ところ)」 は 

ヨウカイ/カミサマ/ニ/デアエル/トコロ
ヨウカイ/カミサマ/ニ/デアエル/イカイ

のようにルビの読み方と漢字本来の読み方の2つを持たせ、どちらでも検索できるようにしています。



※カナ読みのルールについて、主なものをご紹介しました。もっと詳しく知りたいときは、このブログの左側にある「カテゴリー-読み方」にまとまっていますのでこちらをご覧ください。

コメントを投稿

(投稿されたコメントは、TRCデータ部の営業時間内にアップいたします。投稿から掲載までお待ちいただく場合がありますがご了承ください。なお、メールアドレスはTRCデータ部から直接ご連絡する場合にのみ使用いたします。第三者への公開・提供はいたしません。)

2024年7月

  1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31      

アーカイブ

全てのエントリーの一覧

リンク