OpenCHJ Project
「オープンCHJ」(Open Corpus of Holistic Japanese)はオープンライセンスのテキストデータにもとづいて構築し、形態論情報もオープンデータとして公開するコーパスです。 2025年現在、国立国語研究所の 「通時コーパス」プロジェクト が中心になって、外部の研究者や日本語研究に関心を持つ方々が、国語研のコーパスと同様に形態論情報を整備してコーパス検索アプリケーション「中納言」上で資料を公開することができる環境の整備を進めています。
オープンCHJ講習会(12月19日)
このたび下記の通りオンラインで「オープンCHJ講習会」を行うことになりました。ご関心のある方はぜひご参加ください。
- 日時:12月19日 13:30~16:30(終了時間は予定)
- 場所:オンライン(Zoom)
- 申し込み:終了しました
事前登録が必要です。上記のアドレスからお申し込みください。
- 動画を後日、公開予定です。
プログラム
- はじめに ― OpenCHJプロジェクトと講習会の趣旨
- OpenCHJのデータ構築の流れ 小木曽 智信(国立国語研究所)
- Web茶まめによるOpenCHJの形態素解析 堤 智昭(筑波大学助教)
- 短単位修正ツール temari から始める OpenCHJ 生活 尹 熙洙(総合研究大学院大学院生)
- 速記叢書講談演説集コーパスの構築と公開 久保 柾子(国立国語研究所プロジェクト非常勤研究員/総合研究大学院大学院生)
- 生成AIを使ったOpenCHJのための画像データのXML文書化 金 賢眞(総合研究大学院大学院生/大阪大学特任助教)
- 先達のOpenCHJ苦労話 ― 既公開・構築中のコーパスから
- 質疑応答
更新履歴
- 2025/12/19 整備中の資料・作品ページを追加しました。
- 2025/12/07 「オープンCHJ講習会」(12月19日)の開催を告知しました。
- 2025/11/21 「短単位版関西弁コーパス」を追加しました。
| 更新履歴 | 整備中の資料・作品 | 語数について | OpenCHJリポジトリ | OpenCHJ中納言 | 「通時コーパス」プロジェクト | 国立国語研究所 |