Webを使った中国語の用例の調べ方

現代中国語篇

古典中国語篇

#パソコンで中国語を表示したり入力したりする方法については、パソコンで中国語を使うにはを参照してください。

どんな時に用例を調べる?

Webで用例を調べる時に注意する点

用例を調べるのに役立つWebページ

中国学に役立つリンク集を作ってありますので、そちらも参照してください。

【現代中国語篇】

Webページをキーワードで検索

広大なWeb空間から用例を拾うことができます。書き手のレベルや文章の風格は種々雑多で、規範的でない文章も含まれますので注意してください。

Google日本語
JISコードに含まれている漢字であれば、特に設定をしなくとも日本語のサイトと中国語のサイトを同時に検索できる。
中国語のWebbページだけを検索するには以下のようにする。
【方法1】
「言語ツール」をクリック。
「対象言語」で「中国語(簡体)」または「中国語(繁体)」を選ぶ。
【方法2】
「検索オプション」をクリック。
「検索の対象にする言語」で「中国語(簡体)」または「中国語(繁体)」を選ぶ。
百度(簡体字中国語)
中国語のWebページを専門に検索。検索結果を表示する画面がシンプルで見やすい。
検索結果画面にある「百度快照」はGoogleにおけるキャッシュのようなもの、プログラムが巡回した時のWebページを保存している。
繁体字版もある。
中国搜索(簡体字中国語)
中国語のWebページを専門に検索。中国の代表的なポータルサイトに検索技術を提供している。

Kiwi Sytem
Webを使ってある言葉がどの言葉と共起しているかを調べるシステム。
いくつか種類があるがとりあえず標準Kiwiを選び、Queryに調べたい言葉を入れ、Languageで対象言語を選んで、Searchをクリックする。
日本語や英語の他、中国語・フランス語・ドイツ語・朝鮮語・ロシア語・スペイン語にも対応。Corpusのサイズを変えると上位に上がってくる言葉も変 わってくる。詳しくはWebページにある?をクリックしてヘルプを参照のこと。

新聞記事を検索

Web上の文章は本当に書き手のレベルも文章の風格も様々で、中には規範的でないものも少なくありません。新聞記事の場合は、全てとは言いませんが、比較的規範的な用例が採集できるのではないかと思われます。また、ニュースという性質上一つの文章の長さには自ずと限界があり、用例の前後を読むのが比較的楽で文脈も捉えやすいでしょう。但し、文体としては書面語が中心で、口語でしか使われないような単語の用例を拾うのにはあまり向いていません。

人民网检索(簡体字中国語)
中国を代表する新聞である《人民日报》のWebサイトを検索するページ。
ページ上側にある「搜索关键词」に検索語を入れる。
京报网(簡体字中国語)
北京の夕刊紙《北京晚报》等を発行する北京日报报业集团のWebサイト。
ページ上の左側にある「关键词」に検索語を入れる。
新民晚报电子版(簡体字中国語)
上海の人気夕刊紙の《新民晚报》の記事を検索するページ。
「正文」のところに検索語を入れる。
Google新闻中国版(簡体字中国語)
Googleによる中国のニュース検索。複数のニュースサイトを横断して検索できる。
Google新聞香港版(繁体字中国語)
Googleによる香港のニュース検索。複数のニュースサイトを横断して検索できる。
Google新聞台灣版(繁体字中国語)
Googleによる台湾のニュース検索。複数のニュースサイトを横断して検索できる。

データベースを検索する

中国語語料庫(簡体字中国語)
中国語教材研究会(関西大学)が作った現代中国語のデータベース。
今のところ『人民日報』2000〜2002年まで3年分のデータ(約5000万字)がデーターベースに入っている。
ページを開けた時に文字化けしていたら、ブラウザの表示メニューのエンコード(文字コード)で簡体字中国語(GB2312)を選ぶ。
なお、Internet Explorer以外のWebブラウザでは表示がくずれる。
中央研究院現代漢語語料庫(繁体字中国語)
台湾の現代中国語のコーパス。
文字化けしていたら、ブラウザの表示メニューのエンコード(文字コード)で繁体字中国語(Big5)を選ぶ。
「中央研究院現代漢語語料庫」のリンクをクリックしてコーパスに入る。
香港城市大學共時語料庫(繁体字中国語)
香港・台湾・北京・上海・アモイ・シンガポールの代表的中国語新聞や電子メディア上のニュースを材料としたコーパス。
「See LIVAC Online in action」のリンクをたどってコーパスに入る。

オンライン書庫−−Web上にある現代小説のデータを使う

古典から現代小説まで大量の中国語文献がWeb上で公開されるようになりました。こういうWebページを自分のパソコンに保存した上で、ワープロソフトやエディタの検索機能を使って検索するという方法があります。
但し底本が明記されていなかったりきちんと校勘がされていないことが多く、また著作権上問題のあるデータもあり、利用に当たっては注意が必要です。

中国青少年新世纪读书网(簡体字中国語)

亦凡公益图书馆(簡体字中国語)

新语丝电子文库(簡体字中国語)

黄金书屋(簡体字中国語)


Web上にあるテレビの字幕を使う

中国のテレビ番組には中国語字幕が入っているものがけっこうあります。こうしたテレビの字幕をWeb上で公開しているところがあります。インタビュー番組の字幕などは口語の用例を採集するのに有用でしょう。
用例を探すにはWebページを自分のパソコンに保存した上で、ワープロソフトやエディタの検索機能を使って検索します。

凤凰卫视中文台(簡体字中国語)
香港を拠点とする衛星放送だが、番組は普通話で放送されている。
字幕が公開されている番組には、「鲁豫有约」「名人面对面」「冷暖人生」といったインタビュー番組、著名な学者による講演番組「世纪大讲堂」、ニュース解説の「时事开讲」などがある。

【古典中国語篇】

データベース

中央研究院漢籍電子文獻(繁体字中国語)
二十五史、十三経注疏、小説戯曲、上古漢語語料庫、楽府詩集、文心雕龍、詞話集成など。人文資料庫師生版は学生のために作られたもので、主な中国古典をざっと検索するのに便利。新バーションはこちら。「資料庫」をクリックして 入る。
中央研究院漢籍電子文獻(ミラー)(繁体字中国語)
大東文化大学内に置かれた中央研究院のミラーサイト。
二十五史、十三経注疏、漢晉史三種、朱子語類。
寒泉(繁体字中国語)
先秦諸子、宋元学案、明儒学案、四庫全書総目、資治通鑑、全唐詩、紅楼夢など。
元智工学院 (繁体字中国語)
全唐詩、唐宋詞、宋詩、三国演義、水滸伝、紅楼夢など。
漢達文庫(繁体字中国語)(¥有料)
華夏文庫から改称。香港中文大学中国文化研究所によるデータベース。先秦から六朝までの文献の他、甲骨文や竹簡などの出土文献もカバーする。
北京大学全唐诗电子检索系统(簡体字中国語またはUTF8)
全唐詩、楽府詩集、漢魏六朝詩、詩話集成など。
無料だが要登録。
国学 (簡体字中国語)
中国古典研究を中心とするサイト。書庫の他に学術書の書評等がある。

仏教文献についてはやSAT(大正新脩大藏經テキストデータベース)や中華電子佛典協會(CBETA)(繁体字中国語)がある。

中央研究院漢籍電子文献・寒泉・漢達文庫(華夏文庫)・北京大学全唐詩電子検索系統・中華電子仏典線上蔵経閣(CBETA)については、漢字文献情報処理研究会『電脳中国学II』(好文出版 2001年)第3章に使用法などの解説がある。


上記のデータベースには収録されていない漢籍を調べたいときには?

現代漢語篇で紹介した紹介したオンライン書庫には古典のデータが含まれていますが、まずはKanhoo!東洋学サーチ(漢字文献情報処理研究会)の東洋学古典電子テキスト検索を使って自分の探す漢籍が電子化されていないか探してみましょう。


付:CD-ROMによる大規模データベース

中国におけるの古籍の電子化は急速に進んでいます。书同文による『四庫全書』『四部叢刊』はすでに発売されており、日本の大学でも導入しているところがあります。今後も続々と登場してくるでしょう。


2006年9月30日

ホームへ