日本語形態素解析(字句解析)用のAPIをリリースしました
開発者向けに形態素解析(字句解析)用APIをリリースしました。
その名前の通り、日本語の形態素解析を行うAPIです。
文章を最小単位の言葉で分割します。
表層形、品詞、品詞細分類、活用形、活用型、原形、読み等を返します。
詳しい仕様はAPIの説明ページでご確認ください。
その場で試してみることもできます。
形態素解析エンジンはMeCab(和布蕪)です。辞書はIPAdic並びにWikipediaのデータを元としたユーザー辞書を用いています。
まだまだ納得いく結果は返してくれないですが、今後徐々に改善して、少しはマシに……。
140noteにて使用する目的で作られたAPIではありますが、本APIそのものとTwitterはまったく関係ありません。
よければご活用ください。
以下、本APIを作った経緯等。
140noteの人気コンテンツであるあなたの恋人等では形態素解析のためにYahoo!デベロッパーネットワークのAPIを用いています。
(無料で使える上に制限も緩く、とても素晴らしいAPIです!)
YahooのAPIそのものにはまったく不満がないのですが、ただ、自前で形態素解析ができるようにしたいということは前から考えていました。
無料サービスに頼りすぎるのはリスクがあるので。
それで140note用に形態素解析を用意しまして、せっかく作ったのだから一般に公開してしまおうかなと。
なにかあれば私のTwitterアカウントにでも気軽に連絡ください。