語言的研究,一般來說主要是使用語料來進行的。尤其是書面語的研究,多以報紙、雜誌、書籍等印刷品為研究對象。語言史方面的研究,則以書寫於文獻資料中的語言為對象。 近年來,關於日語的資料庫或各種電子資料逐漸在線上公開。本研習營將以資料庫為中心,聚焦於「語料及日語研究」,介紹目前的研究方法及研究成果。
主講人:小木曾智信(國立國語研究所言語資源研究系副教授) 講 題:日語資料庫的調查方法—資料庫檢索應用「中納言」入門—
介紹有關國立國語研究所開發的日語資料庫的使用方法。首先,解說資料庫的設計方針及資料庫中的形態資訊(短單位.長單位)之後,接著利用公開在web 上的資料庫「中納言」進行資料庫的檢索,統計方法的說明。同時介紹『現代日本語書き言葉均衡コーパス』及『日本語歴史コーパス』,說明實際運用資料庫進行日語調查及研究時必須注意的事項。
主講人:高田智和(國立國語研究所理論・構造研究系副教授) 講 題:表記辭典與資料庫
日語表記中有各式各樣的書寫區分。例如同音異義語(「改訂.改定」等)、異字同訓(「熱い・暑い・厚い」等)、送假名(「受け付け・受付」等)等等。因此,收集不知如何書寫的問題語例並匯整成一本表記辭書則有其必要。本演講中將針對發表者參與編修表記辭典的修訂進行報告。此修訂雖然是配合2010年的改定常用漢字表而進行,然而在判斷語例的增刪上,則是參考書面語資料庫、詞彙調查現況及www上的使用頻率。
主講人:藤本灯(國立國語研究所言語變化研究領域特任助教) 講 題:利用古代的辭典解讀日本古典文獻
閱讀平安時代文獻的時候,為了得知文章中的漢字讀音,利用當時日本的辭典(=古辭書)是最常見的方式。本演講除了介紹具代表性的平安時代辭典之外,也以『今昔物語集』為例,解說如何使用古代的辭典解讀日本古典文獻的方法。另外,也會提及日本古代的辭典資料庫化時產生的問題與課題。
ことばの研究は,言語データを用いて進めるのが一般的です。特に、書き言葉の研究では,新聞,雑誌,書籍など印刷物を対象にします。ことばの歴史研究では,文献資料に書き留められたことばを対象にします。最近は,日本語に関するコーパスやさまざまな電子化資料(言語資源)がネット上に公開されつつあります。このセミナーでは,コーパスを中心に,「言語データと日本語研究」に焦点を絞って,研究方法と研究成果を紹介します。
講演者:小木曽智信(國立國語研究所言語資源研究系准教授) テーマ:日本語コーパスの調査方法―コーパス検索アプリケーション「中納言」入門―
国立国語研究所で開発された日本語コーパスの利用方法について解説する。コーパスの設計方針と、コーパスに付与された形態論情報(短単位・長単位という二つの単語の情報)について解説したのち、Web上で公開されているコーパス検索アプリケーション「中納言」を用いてコーパスを検索、集計する方法を説明する。また『現代日本語書き言葉均衡コーパス』と『日本語歴史コーパス』の利用例を示し、実際にコーパスを日本語の調査・研究に活用する際の注意点について述べる。
講演者:高田智和高田智和(國立國語研究所理論.構造研究系准教授) テーマ:表記辞書とコーパス
日本語表記には様々な書き分けがある。同音異義語(「改訂・改定」等)、異字同訓(「熱い・暑い・厚い」等)、送り仮名(「受け付け・受付」等)などである。そのため、どう書いたら良いか、問題となる語を集めた表記辞書が必要となる。本発表では、発表者が携わった表記辞書の改訂について報告する。2010年の改定常用漢字表を反映させるための改訂であったが、語例の追加や削除の判断には、書き言葉コーパスや語彙調査に基づく使用実態、WWWでの使用頻度を参考にした。
講演者:藤本灯(國立國語研究所言語變化研究領域特任助教) テーマ:古辞書を用いた日本古典の解読
平安時代の文献を読むとき、その文章に用いられた漢字の読み方を知るためには、当時の日本の辞書(=古辞書)を利用するという手法が最も一般的である。代表的な平安時代の古辞書を紹介するとともに、これらの古辞書を用いた日本古典の解読方法を、具体的に『今昔物語集』の例を挙げながら解説する。また、日本の古辞書をデータベース化する際の問題点、課題についても触れる。