(株)PKSHA Technology【3993】の掲示板 2020/02/05〜2020/02/20
-
>>138
https://qiita.com/tamurahey/items/53a1902625ccaac1bb2f?utm_campaign=popular_items&utm_medium=feed&utm_source=popular_items
Camphr: spaCy plugin for Transformers, Udify, KNP
PKSHA Technologyから,NLPライブラリCamphrを公開しました.
Camphrを使うと,TransformersやUdifyなどの最先端の手法の他,knpなど伝統的な言語処理手法を簡単に組み合わせて使うことができます.
本記事では,Camphrの特徴や,簡単な使い方を紹介していきます.
spaCy
CamphrはspaCyのプラグインです.日本だとGinzaがspaCyを利用しており有名ですね.
spaCyはNLPフレームワークで,以下のような特長があります(主観).
様々な機能を簡単に合成できる (深層学習からパターンマッチまで何でもOK)
パイプラインを1コマンドで保存&復元できる
1つ目の機能は実用上とても重要です.NLPはここ数年で大幅に進歩しましたが,実際のタスクはend-to-endにデータを食わせればOK,みたいに美味しいものばかりではありません.かといって新しい手法を全く使わないのも,あまり筋が良くなさそうです.
spaCyを使うと,最新の手法からルールベースの手法まで,様々な手法を組み合わせることができます.そしてCamphrを使うと,例えばBERTをfine-tuneした後にKNPと正規表現を組み合わせる,ということが簡単にできます.
また2つめの機能のおかげで,組み合わせた複雑なパイプラインを簡単に保存・復元でき,容易に持ち運ぶことができます.
>
> 難しすぎてチンプンカンプン
私も!w
SPY 2020年2月13日 11:20
PKSHA NLPライブラリー Camphrを公開しました。
Camphrを使うとTransformersゃUdifyなどの
最先端の手法の他Kmpなど伝統的な
言語処理手法を簡単に組み合わせて使うことができる。
難しすぎてチンプンカンプン