« TRC MARCニュース第28号発行しました | メイン | 非掲載のMARCとスキャナの秘密 »

統一読みの話

MARC MANIAX目録第4回、今回もカナ読みの話題です。簡易目録づくりという企画のテーマからすると少々マニアックな気もしますが、もうしばらくおつきあいください。

★統一読み

前回は、「こども」も「子ども」も「子供」もカナ読みなら一度に探せる!という話でしたが、今回は、逆にカナ読みの弱点も明かさねばなりません。「日本」は「ニホン」?「ニッポン」?、「硫黄島」は「イオウジマ」?「イオウトウ」??のように、一つの表記に複数の読み方がある場合にはどうしたら良いのでしょうか。

解決のためのひとつの手は、地道ですが、単語ひとつひとつについて統一の読み方を決めていく、という方法です。依拠する資料を決めておけば、統一基準がぶれません。TRCでは、「広辞苑 第5版」「市町村役場便覧の最新版」「コンサイス日本地名事典 第4版」などなどを資料として、統一読みを決めています。これにより、「日本」は「ニホン」、「硫黄島」は「イオウトウ」になりました。

...が、それでもまだすっきりしないところは残ってしまうのでした。依拠している資料の読み方が、我々の日常言語感覚と、少々ずれている場合。多くはありませんが、下記のような例が出てきてしまいます。

顧客  コカク 
茶道  チャドウ 

これらの言葉では、著者の意図とは違う読み方になってしまっている場合もあるかと思われます。が、270万件のMARCからその言葉をもれなく探すため、MARCがぶれないための苦肉の策なのです。

TRC MARCでは対策として、図書に統一読みとは違う読み方がある場合には、そちらの読み方も同時に入力し、図書どおりの読みと統一読みの2つを同時に持たせるようにしています。


第2回のエントリーの末尾でご紹介したルビの読み方も同様に考えます。

「妖怪・神様に出会える異界(ところ)」 は 

ヨウカイ/カミサマ/ニ/デアエル/トコロ
ヨウカイ/カミサマ/ニ/デアエル/イカイ

のようにルビの読み方と漢字本来の読み方の2つを持たせ、どちらでも検索できるようにしています。

次回もまたまたテーマはカナ読み。カナ読みの分かち書きについてご説明する予定です。

トラックバック

このエントリーのトラックバックURL:
http://datablog.trc.co.jp/cgi-bin/mt/mt-tb.cgi/273

コメント (8)

特命:

http://hiramatu-hifuka.com/onyak/nippon.html
も参考になるのでしょうね。というか、音訳と統一されていないとまずいとは思います・・・

新刊目録 望月:

特命さん、こんにちは。
サイトのご紹介ありがとうございました。
ニホン/ニッポンの奥深さに圧倒されました。
TRC MARCでは日本はニホンに統一していますが、図書にニッポンとルビがあるものはニッポンとしています。

特命:

巻次のカナ読みですが、データの中には入っているのでしょうか?(ダウンロードデータの中に、タグ551D01自体が見えません)マニュアルにはタグはあるのですが・・・

新刊目録 望月 :

特命さん、こんにちは。
巻次のカナ読みはMARCに入っています。ダウンロードしたデータにないというのは、おそらくシステムの問題ではないかと思われます。

特命:

巻次のカナ読みですが、データの中に入っていない例を挙げてみました↓
例えば、TRCMARC№12034987のダウンロードデータ(MARC_WAU1.txt)では、
251A0001 肉声でつづる民衆のアメリカ史
251D0001 上巻
251F0001 ハワード・ジン‖編
251F0002 アンソニー・アーノブ‖編
251F0003 寺島/隆吉‖訳
251F0004 寺島/美紀子‖訳
とデータが続いていますが、その先には
551D0001のタグがありません。
こちらのシステムでは、551D0001がない場合に、自動でヨミを振るようにしていますが、この例ですと251D0001上巻では、ウエ カン などとなってしまい、いつも訂正しています。

新刊目録 望月 :

特命さん、例を出してのご質問ありがとうございます。
前回の回答のピントがずれていたようで申し訳ありません。「上・下」のように順番を表わしていることが明らかな場合は、551Dにヨミの入力はしていません。TRC MARCのマニュアルに用例を載せていますので、そちらを参照していただくとよいかと思います。
また何かご不明な点などありましたら、ご質問ください。

特命:

>上・下」のように順番を表わしていることが明らかな場合は、551Dにヨミの入力はしていません。

TRC MARC/Tタイプマニュアル-図書編-第1版
を見ていますが、どのページに書いてありますでしょうか?

新刊目録 望月 :

特命さん、こんにちは。
「TRC MARC/Tタイプマニュアル 図書編 第1版」のp121に「数字および数字に変換できるものは690Dに入力する」とあります。p124に690Dに入力する主な例を掲載しています。

いつもお問い合わせありがとうございます。ブログのコメント欄での回答ですとお返事するのに時間がかかってしまう場合もあります。弊社HPの「お問い合わせ」にデータ事業部の問い合わせ窓口もありますので、よろしかったらこちらもご利用ください。

コメントを投稿

(投稿されたコメントは、TRCデータ部の営業時間内にアップいたします。投稿から掲載までお待ちいただく場合がありますがご了承ください。なお、メールアドレスはTRCデータ部から直接ご連絡する場合にのみ使用いたします。第三者への公開・提供はいたしません。)

博物館、図書館、文書館、公民館(MLAK)東日本大震災被災救援情報
博物館、図書館、文書館、公民館(MLAK)東日本大震災被災救援情報

2016年9月

        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30  

アーカイブ

全てのエントリーの一覧

リンク