« いまの流行りはなにかしら?~MARCや検索のはなし~ | メイン | お気に入りの道 »

統一読みの話~MARC MANIAX 目録2022④~

MARC MANIAX 目録2022第4回、今回もカナ読みの話題です。少々マニアックですが、もうしばらくおつきあいください。

★統一読み
前回は、「こども」も「子ども」も「子供」もカナ読みなら一度に探せる!という話でしたが、今回は、逆にカナ読みの弱点も明かさねばなりません。
「日本」は「ニホン」?「ニッポン」? 「硫黄島」は「イオウジマ」?「イオウトウ」??のように、一つの表記に複数の読み方がある場合にはどうしたらよいのでしょうか。

解決のためのひとつの手は、地道ですが、単語ひとつひとつについて統一の読み方を決めていく、という方法です。依拠する資料を決めておけば統一基準がぶれません。TRCでは、「広辞苑」「市町村役場便覧の最新版」「コンサイス日本地名事典」などを資料として、統一の読み方を決めています。これにより、「日本」は「ニホン」、「硫黄島」は「イオウトウ」になりました。
...しかし、それでもまだすっきりしないところは残ってしまうのでした。依拠している資料の読み方が、我々の日常言語感覚と少々ずれている場合があるのです。あまり多くはありませんが、下記のような例も出てきてしまいます。

私 ワタクシ
茶道 チャドウ 
転生 テンショウ

これらの言葉では、著者の意図とは違う読み方になってしまっている場合もあるかと思われます。が、400万件を超えるMARCからその言葉をもれなく探すため、MARCがぶれないための方策なのです。

TRC MARCでは対策として、図書に統一読みとは違う読み方がある場合には、そちらの読み方も同時に入力し、図書どおりの読みと統一読みの2つを両方入力するようにしています。

例えば「日本妖怪探検」には、図書に「ニッポン」いうルビがありました。そこで、
第1の読み:ニッポン/ヨウカイ/タンケン
第2の読み:ニホン/ヨウカイ/タンケン
のように、図書どおりの読みと統一読みの2通りの読みを入力します。

第2回の末尾でご紹介した、漢字本来の読み方でないルビがある場合も同様に考えます。
「謎(リドル)の謎(ミステリ)その他の謎(リドル)」は、

漢字形:謎の謎その他の謎
第1の読み:リドル/ノ/ミステリ/ソノタ/ノ/リドル
第2の読み:ナゾ/ノ/ナゾ/ソノタ/ノ/ナゾ

のようにルビの読み方と漢字本来の読み方の2つを持たせ、どちらでも検索できるようにしています。

また、前回「アルファベット・数字を含むカタカナ形」をご紹介しましたが、アルファベットと数字にも、統一読みを定めています。
例えば、四(ヨン)、七(ナナ)、A(エー)、J(ジェー)、K(ケー)など。
「7人のJK」というタイトルの本がルビなしであった場合、読みは「ナナニン ノ ジェーケー」となります。

さて、第5回は「読み」に関係するけれども、図書館ならではのちょっとマニアックな「分かち書き」について取り上げる予定です。お楽しみに!

コメントを投稿

(投稿されたコメントは、TRCデータ部の営業時間内にアップいたします。投稿から掲載までお待ちいただく場合がありますがご了承ください。なお、メールアドレスはTRCデータ部から直接ご連絡する場合にのみ使用いたします。第三者への公開・提供はいたしません。)

2024年7月

  1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31      

アーカイブ

全てのエントリーの一覧

リンク