Skip to the content.

OpenCHJ Project

「オープンCHJ」(Open Corpus of Holistic Japanese)はオープンライセンスのテキストデータにもとづいて構築し、形態論情報もオープンデータとして公開するコーパスです。 2025年現在、国立国語研究所「通時コーパス」プロジェクト が中心になって、外部の研究者や日本語研究に関心を持つ方々が、国語研のコーパスと同様に形態論情報を整備してコーパス検索アプリケーション「中納言」上で資料を公開することができる環境の整備を進めています。

オープンCHJ講習会(12月19日)

このたび下記の通りオンラインで「オープンCHJ講習会」を行うことになりました。ご関心のある方はぜひご参加ください。

プログラム

  1. はじめに ― OpenCHJプロジェクトと講習会の趣旨
  2. OpenCHJのデータ構築の流れ 小木曽 智信(国立国語研究所)
  3. Web茶まめによるOpenCHJの形態素解析 堤 智昭(筑波大学助教)
  4. 短単位修正ツール temari から始める OpenCHJ 生活 尹 熙洙(総合研究大学院大学院生)
  5. 速記叢書講談演説集コーパスの構築と公開 久保 柾子(国立国語研究所プロジェクト非常勤研究員/総合研究大学院大学院生)
  6. 生成AIを使ったOpenCHJのための画像データのXML文書化 金 賢眞(総合研究大学院大学院生/大阪大学特任助教)
  7. 先達のOpenCHJ苦労話 ― 既公開・構築中のコーパスから 
  8. 質疑応答

更新履歴


| 更新履歴 | 整備中の資料・作品 | 語数について | OpenCHJリポジトリ | OpenCHJ中納言 | 「通時コーパス」プロジェクト | 国立国語研究所 |