2017年12月19日火曜日

自然言語処理関係ツール

MeCab

形態素解析エンジン

Yet Another Part-of-Speech and Morphological Analyzer

京都大学情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所共同研究ユニットプロジェクトを通じて開発されたオープンソース 形態素解析エンジン。言語、辞書,コーパスに依存しない汎用的な設計を基本方針としています。

 

ChaSen

形態素解析器

形態素解析器とは、入力文を単語単位に分割し品詞を付与するツールである。

茶筌システムは,広く自然言語処理研究に資するため無償のソフトウェアとして開発されたものである。

 

JUMAN

日本語形態素解析システム

計算機による日本語の解析の研究を目指す多くの研究者に共通に使える形態素解析ツールを提供するために開発されました。

 

KyTea

京都テキスト解析ツールキット

日本語など、単語(または形態素)分割を必要とする言語のための一般的なテキスト解析器です。

分かち書きされていないテキストを適当な単語または形態素に分割する。

かな漢字変換や音声認識、音声生成のために単語の発音を推定することができ、品詞を推定することもできます。

 

CaboCha/南瓜

Yet Another Japanese Dependency Structure Analyzer

Support Vector Machines に基づく日本語係り受け解析器です。

柔軟な入力形式、生文はもちろん、形態素解析済みデータ、文節区切り済みデータ、部分的に係り関係が付与されたデータからの解析が可能。

 

KNP

日本語構文・格・照応解析システム

日本語文の構文・格・照応解析を行うシステムです。

形態素解析システムJUMANの解析結果(形態素列)を入力とし、文節および基本句間の係り受け関係、格関係、照応関係を出力します。

係り受け関係、格関係および照応関係は、Webから自動構築した大規模格フレームに基づく確率的モデルにより決定します。

 

0 件のコメント:

コメントを投稿