ニュース

現代日本語を江戸のくずし字に変換する「そあん(soan)」公開

 ROIS-DS人文学オープンデータ共同利用センターは、現代日本語テキストを古活字(崩し字)画像に変換するサービス「そあん(soan)」の提供を開始した。

 さらに、古活字データセットの古活字画像を用いて現代日本語テキストを描画するJavaScriptライブラリ「そあん(soan)」も公開した。

 「そあん(soan)」サービスは、入力ボックスに現代日本語を入力すると、「そあん(soan)」ライブラリを利用して古活字(くずし字)画像を生成する。学習する生成AIの方法とは異なり、実際の本を断片化し組み合わせるというコラージュ技法に近い方法で生成される。

 また、その生成した画像はウェブサイトなどで共有できる。

「そあん(soan)」サービス使用上の注意事項

 注意点は、入力したテキストが同じでもデータセット内の古活字の選び方で生成画像は異なるので、同一の画像を再び生成することは難しいということ、さらに、サービスで生成した画像はURLを知っていれば誰でもアクセスできる状態で公開されるが、逆にURLを忘れてしまうと生成した本人でもアクセスができなくなるのでURLの保存が必要だということ。

 また、提供されるのはユーザーが生成する画像を一時的にウェブサイト上で共有する機能であり、永続的な保存は保障されないので必要な画像はユーザー自身がダウンロードしておく必要がある。

 名前「そあん」の由来は江戸時代初期に京都嵯峨で出版業にかかわった角倉素庵(すみのくらそあん)。