ニュース
LINE、大規模日本語言語モデル「japanese-large-lm」を公開
2023年8月16日 12:30
LINEは、大規模日本語言語モデル「japanese-large-lm(ジャパニーズ ラージ エルエム)」を公開した。36億パラメータモデル、17億パラメータモデルの二種類が公開されている。
公開されたモデルは、HuggingFace Hubで公開されており、transformersライブラリから利用できる。
「japanese-large-lm」の構築には、約650GBの大規模日本語Webコーパスが用いられており、一般的な英語の大規模コーパスと遜色ないデータ量であるという。
同社は、大規模日本語モデル「HyperCLOVA」も開発しているが、今回の「japanese-large-lm」は、別の開発ラインで開発されたものとなる。
LINEは、指示文に対して適切な出力をするようチューニングしたモデルを近日中に公開し、また今後も構築したモデルの一部を継続的に公開するとしている。