« 短いもの ~今年こそ読んでみたい本~ | メイン | 話題の3Dプリンタ~新設件名のお知らせ2014年1月分~ »

斉・齊・斎・齋?

月末にお届けしている「MARCや検索のはなし」。今回は文字のお話です。

「サイトウ」さんを著者名で検索する際、どの文字で検索しますか?

斉藤
齊藤
斎藤
齋藤
...

漢字は本当にバリエーションが豊富です。
では、上記4つの「サイトウ」の「サイ」の字にはどのような違いがあるのでしょうか。

「斉」と「齊」は新字・旧字の関係です。
「斎」と「齋」は新字・旧字の関係です。
「斉」と「斎」は異体字関係にあります。


Aという文字とBという文字を同じ検索結果にするようにシステム上で設定することを正規化といいます。
よくある正規化の例として「ひらがなとカタカナ」「清音と濁音」「新字と旧字」などがあります。
正規化テーブルはそれぞれのシステムの設定により異なります。

TOOLi上では「斉」と「齊」は正規化しているけれど、「斉」と「斎」は正規化していません。
「斎藤一人」さんを検索する際、うっかり「斉藤一人」と検索してしまうと、ヒットしないことになります。
「サイトウ」をTOOLiで検索する際には、漢字を覚えていない場合はカナで検索することをお勧めします。

お使いの検索システムが何を正規化していて何を正規化していないのか、ぜひ試してみて下さい。

トラックバック

このエントリーのトラックバックURL:
http://datablog.trc.co.jp/cgi-bin/mt/mt-tb.cgi/1982

コメントを投稿

(投稿されたコメントは、TRCデータ部の営業時間内にアップいたします。投稿から掲載までお待ちいただく場合がありますがご了承ください。なお、メールアドレスはTRCデータ部から直接ご連絡する場合にのみ使用いたします。第三者への公開・提供はいたしません。)

博物館、図書館、文書館、公民館(MLAK)東日本大震災被災救援情報
博物館、図書館、文書館、公民館(MLAK)東日本大震災被災救援情報

2016年9月

        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30  

アーカイブ

全てのエントリーの一覧

リンク