Jumanpp 2.0のPython環境構築方法

この記事は GMOアドマーケティング Advent Calendar 2021 11日目の記事です。

こんにちは。GMOアドマーケティングのS.Rです。
前回Jumanpp 1.04/KNPの環境構築方法を紹介しました。いかがでしたでしょうか?
Jumanpp1.04よりJumanpp 2.0の実行速度は20倍以上に改良されました。今回は継のJumanpp 2.0のpython環境構築方法を皆さんへ紹介させていただます。

ColabのInstanceを作る

今回はGoogleのMachine Learning Cloud ServiceというColabを利用して説明します。Colabの公式サイトからColabのPython3のInstanceを作ります。

Jumanpp V2をダウンロードする

下記のcommandでJumanpp V2をダウンロードします。

JumanppV2をインストールする

下記のcommandでJumanppV2をインストールします。

pyknpをインストールする

JumanppV2の実行速度を測る

下記のcodeでJumanppV2を実行してみましょう。 実行した結果は下記です。実行時間は0.034秒でした。

Jumanpp1.04の実行速度と比較する

下記のcommandでJumanpp1.04をインストールします。 同じコードをJumanpp1.04で実行しましょう。結果は下記になります。実行時間はJumanppV2の実行時間の10.5倍(0.36秒)になりました。

まとめ

今回は構文解析のツールJumanppV2のpython環境を構築する方法紹介しました。
JumanppV2はJumanppより精度と解析速度が大幅に改良されていますので、もし今回のブログが皆さんの日本語のNLPの開発にお役に立てば幸いです。
明日は「TensorFlow Recommenderで映画のレコメンダーシステムを構築」について皆さんへ紹介させていただきます。
引き続き、GMOアドマーケティング Advent Calendar 2021 をお楽しみください!  

■エンジニア採用ページ ~福利厚生や各種制度のご案内はこちら~
https://note.gmo-ap.jp/n/n02cbeb6edb0d

■noteページ ~ブログや採用、イベント情報を公開中!~
https://note.gmo-ap.jp/