日本語環境のコンピュータでドイツ語で書かれているサイトを見ると、例えば
St臈te & L舅der
といった文字化けが生じることがあります。これは実際には、
Städte & Länder
と表記されるべきものなのですが、これは、例えば文字コード設定(Charset)が参照しているファイルにおいてなされていないなどの理由によって起こっている現象です。つまり、いま参照しているウェブ上のHTMLファイルにどの文字コードでデコードするべきか指定されていないため、とりあえず現在使っているブラウザのデフォルトの文字コード(日本語環境であれば、日本語の文字コードのうちどれか)で解釈し、表示していることになります。
こういった場合、次のような設定をすることによって、ブラウザがデコードする文字コードを一時的に変え、正しく表示することができます。
「表示」→「エンコード」→(「その他」→)「西ヨーロッパ言語」
ドイツ語サイトでウムラウトを含む言葉、例えば「Österreich」を検索しようとする場合、「左Alt+Shift」で言語を「ドイツ語」に変え、「Österreich」という語によってもちろんそのまま検索できます。
ウムラウトは、この記号を使うことができない場合、母音の後に「e」を加えることによって表記できますから(たとえば「Ö」を「Oe」)、これで(「Oesterreich」)検索してもヒットするようにサーチエンジンは対応しているようです。(Yahoo!
DeutschlandとExcite.deで試してみました。)
ただし、ウムラウトを単になくして「Osterreich」で検索すると本来ヒットすべき質量でヒットしません。(ヒットするものは、サイトのほうでそのキーワードに対応しているのかもしれません。)
日本語環境で「Ö」と見えているものは、実は「Ö」という文字列で、欧文サイトの文字コード体系(Charset=iso-8859-1)でのOウムラウトとは別物です。そのため、例えば、日本語サイトで「Österreich」と入力して検索すると、じつはそれは、「Österreich」という文字列を検索していることになります。
そういうわけで、日本語サイトにおいて直接ウムラウトやエスツェットを検索語句に含めることはできません。
ドイツ語の書籍も扱っているamazon.co.jpでは、ウムラウトをどのように表記するか必ずしも統一しているとは限らないようですが、「Osterreich」と「Oesterreich」で検索してみたところ、2004年7月8日18:19現在の「洋書」として、
「Osterreich」 27件
「Oesterreich」 346件
がヒットしました。
また、webcatで「タイトル」で検索してみると、
「Osterreich」 3035件
「Oesterreich」 844件
となります。
東京外大の付属図書館のOPACでは「タイトル」で検索すると、
「Osterreich」 85件
「Oesterreich」 0件 (!)
です。
つまり、どのようにデータを入力しているかはまったくまちまちであるということです。東京外大の付属図書館では、どうも「ウムラウトは完全に無視してデータ入力する」という原則によってデータベースを作っているようですが、amazon.co.jpでは不統一で混在しています。webcatでも混在しているのは、各大学の図書館によって表記の原則が異なるためでしょう。
要するに、両方の可能性を考えて検索する必要があるということになりそうです。