メンテナンス点検のお知らせ
以下の日時にメンテナンス点検を実施いたします。点検中はサーバを停止しますのでご利用いただけなくなります。ご不便をおかけしますがどうぞご了承ください。
日時:2021年2月7日(日)午後6時から翌8日(月)午前3時まで

アイヌ語口承文芸コーパス―音声・グロス付き―とは

 ここ10年間で、言語が消滅の危機にさらされているということは世界的に認知されてきました。また、言語ドキュメンテーションは、危機言語のデータを用いた多目的コーパスの構築を中心に独立の分野として確立されてきています。

 現在、アイヌ語の危機的な状況は深刻です。しかし、アイヌ語はもともと文字を用いない言語でしたが、一世紀以上前からさまざまな表記法が模索され、また筆録や音声の録音によって人々が記録に努めてきたおかげで、アイヌ語やアイヌ文化、アイヌの口承文芸に関する資料は豊富に残されています。よって、アイヌ研究は今後も絶えることなく、国際的により広く発表されることで成長もしていくことでしょう。そうした研究は、これから先、似たような状況にあるほかの危機言語コミュニティとの繋がりも強めていくはずです。

 『アイヌ語口承文芸コーパス―音声・グロスつき―』は、日本語と英語による訳とグロスや注解がついた初めてのアイヌ口承文芸デジタル集成です。ここで扱った音声資料の大半は、中川裕が1977年から1983年に記録し、非常に優れたアイヌ語話者で語り部でもあった木村きみさん(1900-1988、沙流川上流域のペナコリ出身)が語ったものです。きみさんは、日本語よりもアイヌ語を自由に使えるほどの技量を持っていた方でした。その物語の豊富なレパートリーと語り口のテンポのよさには圧倒されます。

 ロンドン大学SOASの危機言語アーカイヴでは、言語資料を安全に長期間保管する場所が提供されており、当該音声ファイルもRausing基金による危機言語ドキュメンテーションプログラムの研究費プロジェクト「アイヌ語沙流方言のドキュメンテーション」(2007-2009;研究代表者:アンナ・ブガエワ)の研究成果の一部としてそこに保管されていました。保管されたファイルhttp://hdl.handle.net/2196/00-0000-0000-0001-E77F-Aは、物語23編(ウエペケㇾ(散文説話)20編、カムイユカㇻ(神謡)3編;全録音時間は約7時間、アイヌ語の延べ語数は44,717語)です。

 2015年度、グロスつきの物語10編(ウエペケㇾ(散文説話)8編、カムイユカㇻ(神謡)2編)を公開しました。これは録音時間にして約3時間分です。

 本コーパスは、2015年度成果物刊行助成経費を受け、国立国語研究所共同研究プロジェクト「日本列島と周辺諸言語の類型論的・比較歴史的研究」(プロジェクトリーダー:ジョン・ホイットマン;そのなかのアイヌ語班リーダー:アンナ・ブガエワ)と「日本の消滅危機言語・方言の記録と伝承」(プロジェクトリーダー:木部暢子)の研究成果の一部として作成したものです。

 2017年度、13編の物語(ウエペケㇾ(散文説話)12編、カムイユカㇻ(神謡)1編)を公開しました。これは録音時間にして約4時間分です。これは国立国語研究所研究プロジェクト「日本の消滅危機言語・方言の記録とドキュメンテーションの作成」(プロジェクトリーダー:木部暢子)の成果の一部として作成したものです。

 アイヌ語テキストの文字化は、中川裕(千葉大学教授、アイヌ語班メンバー)とアンナ・ブガエワ(国立国語研究所特任准教授、アイヌ語班リーダー)、和訳は中川裕、英訳はブガエワ・アンナ(協力:セラー・ルメ氏)が担当しました。英語と日本語によるグロス(形態論情報)付けは、アンナ・ブガエワの監督のもと小林美紀(千葉大学博士課程、国立国語研究所プロジェクト非常勤研究員、アイヌ語班メンバー)が行いました。

 2019年度、7編の物語(ウエペケㇾ(散文説話)3編、カムイユカㇻ(神謡)4編)を公開しました。録音時間にして約1時間分です。これは1999年から2000年にブガエワ・アンナが採録した、アイヌ語千歳方言話者の小田イトさん(1908-2000)の音声資料(ブガエワ・アンナ(2004)『アイヌ語千歳方言の文法と口承文芸―小田イトの個人語―』(ELPR A2-045), 大阪学院大学)の一部です。和訳と日本語グロス付けは、アンナ・ブガエワ(東京理科大学/国立国語研究所)の監督のもと吉川佳見(千葉大学博士課程、国立国語研究所プロジェクト非常勤研究員)が行いました。

2020年度、8編の物語(ウエペケㇾ(散文説話)6編、カムイユカㇻ(神謡)2編)を公開しました。録音時間にして96分です。これは1999年から2000年にブガエワ・アンナが採録した、アイヌ語千歳方言話者の小田イトさん(1908-2000)の音声資料(ブガエワ・アンナ(2004)『アイヌ語千歳方言の文法と口承文芸―小田イトの個人語―』(ELPR A2-045), 大阪学院大学)の一部です。和訳と日本語グロス付けは、アンナ・ブガエワ(東京理科大学/国立国語研究所)の監督のもと吉川佳見(千葉大学博士課程、国立国語研究所プロジェクト非常勤研究員)が行いました。小田イトさんのテキストのアイヌ語の延べ語数は14,285語であり、これでコーパスのアイヌ語の延べ語数が59,002 語に達しました。そして何よりも、このオンラインシステムを構築した赤瀬川史朗氏(Lago NLP)の協力があってはじめて、このような成果が実現したと言えるでしょう。こちらも国立国語研究所研究プロジェクト「日本の消滅危機言語・方言の記録とドキュメンテーションの作成」(プロジェクトリーダー:木部暢子)の成果の一部として作成したものです。

 このコーパスが、今まさにアイヌ語・アイヌ文化復興への道のりを歩むアイヌ民族に、言語学者や文化人類学者の国際的なコミュニティに、アイヌ語に興味を抱くすべての人に役立つことを、そして、人類の知的遺産としてかけがえのない口承文芸のためになることを心より願っています。

2021年2月22日、東京

中川裕、アンナ・ブガエワ、小林美紀、吉川佳見