読者です 読者をやめる 読者になる 読者になる

入門 自然言語処理

「入門 自然言語処理」関連のページ

原著の1版

NLTK Book

原著のPython3対応の奴

NLTK Book

原著のerrata

Confirmed Errata | O'Reilly Media Natural Language Processing with Python

Unconfirmed Errata | O'Reilly Media Natural Language Processing with Python

日本語版の日本語に関する12章

Python による日本語自然言語処理

Python による日本語自然言語処理 http://www.nltk.org/book-jp/ch12.html#id36

12.2.2 文字単位分かち書きを使う なお、TinySegmenter in Python の最新版は https://code.google.com/p/mhagiwara/source/browse/trunk/nltk/jpbook/jptokenizer.py から入手することができる。

上記URLからのダウンロードはできなくなった模様。下記URLに移動?

nltk/jptokenizer.py at master · mhagiwara/nltk https://github.com/mhagiwara/nltk/blob/master/jpbook/jptokenizer.py


書籍

O'Reilly Japan - 入門 自然言語処理

内容

自然言語処理NLP:Natural Language Processing)の実践的な入門書です。「自然言語」とは、英語や日本語など人々が日常のコミュニケーションで使う言語のことで、NLPに基づく技術は、モバイル端末におけるテキストの予測や手書き文字認識、検索エンジンにおける統一されていないテキスト内の情報取得、機械翻訳においてはある言語で書かれたテキストの分析と多言語への変換など、広範囲に活用されるようになってきています。本書では、NLPの理論的な基礎、理論、応用をバランスよく解説。本書の例から学び、実際のプログラムを書き、そして実装することを通して、読者はNLPを始めるための実用的な知識と技術を得られるでしょう。


参考情報まとめ記事:

自然言語処理の専門家に入門書を聞いてきた - あれもPython,これもPython

自然言語処理を学ぶ推薦書籍 - 首都大学東京 自然言語処理研究室(小町研)

上記から特にお薦めっぽいのを抜粋:

自然言語処理を自習したくなったら参考になりそうなサイトなど - 鴨川にあこがれる日々

unnonouno: 日本語で読める自然言語処理のチュートリアルスライドまとめ