-MARCと検索のはなし-
「オツベルと象」という宮沢賢治の作品がありますが、私、長らくこの作品を「オッベルと象」(促音の"ッ")だと思っていました。ところが、MARC作成にたずさわるようになったある日「あれ?オツベルとなっている本があるぞ?え、オッベルよりむしろオツベルのほうが多い!?」と気がつきました。
初版が促音も区別せず大文字表記をしていたこと、原稿が現存しないことから、著者が「オツベル」「オッベル」どちらのつもりだったのか不明。そのため、両方の表記で刊行されているということのようです。
このような例もあるので、TRCMARCでは「ひらがな、カタカナの大文字は全て記述の通りに表記する」としています。
図書に「オツベルと象」とあれば、
タイトル:オツベルと象
タイトルカタカナ読み:オツベル/ト/ゾウ
図書に「オッベルと象」とあれば、
タイトル:オッベルと象
タイトルカタカナ読み:オッベル/ト/ゾウ
となります。
でも、どっちでもいっぺんに検索できたほうが嬉しい、と思ってしまいますね。
そんな要望にこたえるための方法の一つに「正規化」があります。
Aという文字とBという文字を同じ検索結果にするようにシステム上で設定することを正規化といいます。
「ッ」と「ツ」を正規化しておくと、検索に「オッベル」と入れても「オツベル」と入れても、両方まとめた検索結果を得ることができます。
さてこの作品、「オツベルと象」「オッベルと象」のほかにも「オッペルと象」の表記で刊行されているものもあります。
こちらもTRCMARCでは図書のまま
タイトル:オッペルと象
タイトルカタカナ読み:オッペル/ト/ゾウ
と記録されます。
「ペ」「ベ」「ヘ」を正規化してあるシステムでは、「オッペル」で検索しても「オッベル」も検索結果に含まれるようになります。
注意していただきたいのは、正規化はTRCMARCに組み込まれているのではなく、それぞれのシステムの設定によるという点です。
たとえば、TRCのWebシステムであるTOOLiの検索では「ッ」「ツ」は正規化していますが、「ペ」「ベ」「ヘ」は正規化していません。そのため「オツベル」でも「オッベル」でも検索結果は同じですが、「オッペル」で検索した場合は「オツベル」「オッペル」などは検索結果に含まれず、前二者とは検索結果が異なります。
それぞれのシステム毎に「ペンチ」と検索したら「ベンチ」も検索結果に含まれいいか...といったことを考慮の上、正規化の設定がされているかと思います。
お使いの図書館システムでは正規化という方法をとっているかいないか、どのような正規化がされているか、是非一度確認してみてください。
◆カタカナ読みや正規化に興味をもたれた方はこちらの記事もどうぞ
カナ読みのルールその1(データ部ログダイジェスト第13回)
カナ読みのルールその2(データ部ログダイジェスト第14回)
斉・齊・斎・齋?(正規化)