入門 自然言語処理
「入門 自然言語処理」関連のページ
原著の1版
原著のPython3対応の奴
原著のerrata
Confirmed Errata | O'Reilly Media Natural Language Processing with Python
Unconfirmed Errata | O'Reilly Media Natural Language Processing with Python
日本語版の日本語に関する12章
Python による日本語自然言語処理 http://www.nltk.org/book-jp/ch12.html#id36
12.2.2 文字単位分かち書きを使う なお、TinySegmenter in Python の最新版は https://code.google.com/p/mhagiwara/source/browse/trunk/nltk/jpbook/jptokenizer.py から入手することができる。
上記URLからのダウンロードはできなくなった模様。下記URLに移動?
nltk/jptokenizer.py at master · mhagiwara/nltk https://github.com/mhagiwara/nltk/blob/master/jpbook/jptokenizer.py
書籍
内容
自然言語処理(NLP:Natural Language Processing)の実践的な入門書です。「自然言語」とは、英語や日本語など人々が日常のコミュニケーションで使う言語のことで、NLPに基づく技術は、モバイル端末におけるテキストの予測や手書き文字認識、検索エンジンにおける統一されていないテキスト内の情報取得、機械翻訳においてはある言語で書かれたテキストの分析と多言語への変換など、広範囲に活用されるようになってきています。本書では、NLPの理論的な基礎、理論、応用をバランスよく解説。本書の例から学び、実際のプログラムを書き、そして実装することを通して、読者はNLPを始めるための実用的な知識と技術を得られるでしょう。
参考情報まとめ記事:
自然言語処理の専門家に入門書を聞いてきた - あれもPython,これもPython
自然言語処理を学ぶ推薦書籍 - 首都大学東京 自然言語処理研究室(小町研)
上記から特にお薦めっぽいのを抜粋: