2024年1月30日 国立情報学研究所における大規模言語モデル構築への協力について
2024年1月29日、国立国会図書館は、国立国会図書館インターネット資料収集保存事業︵WARP︶において収集保存した数十億件のファイルのURLリストを提供することについて、国立情報学研究所︵NII︶と合意しました。
提供したURLリストは、NIIにおける大規模言語モデル︵LLM︶の構築を目的として、主にコーパス用データを収集するために利用される予定です。LLMの詳細については、NIIの﹁LLM勉強会﹂をご参照ください。
本件は、当館とNIIの間で締結した﹁国立国会図書館及び学術情報センターの相互協力に関する協定﹂︵平成7︵1995︶年4月19日︶に基づく協力の一つです。