ニュース

LINE、大規模日本語言語モデル「japanese-large-lm」を公開

 LINEは、大規模日本語言語モデル「japanese-large-lm(ジャパニーズ ラージ エルエム)」を公開した。36億パラメータモデル、17億パラメータモデルの二種類が公開されている。

 公開されたモデルは、HuggingFace Hubで公開されており、transformersライブラリから利用できる。

 「japanese-large-lm」の構築には、約650GBの大規模日本語Webコーパスが用いられており、一般的な英語の大規模コーパスと遜色ないデータ量であるという。

 同社は、大規模日本語モデル「HyperCLOVA」も開発しているが、今回の「japanese-large-lm」は、別の開発ラインで開発されたものとなる。

 LINEは、指示文に対して適切な出力をするようチューニングしたモデルを近日中に公開し、また今後も構築したモデルの一部を継続的に公開するとしている。