本の紹介 : 自然言語処理

Steven Bird, Ewan Klein, Edward Loper 「入門自然言語処理」 (2010)

1. 言語処理とPython
2. テキストコーパスと語彙資源へのアクセス
3. 生テキストの処理
4. 構造化されたプログラムを書く
5. 単語の分類とタグ付け
6. テキスト分類の学習
7. テキストからの情報抽出
8. 文構造の分析
9. 素性ベースの文法の構築
10. 文の意味の解析
11. 言語データの管理
12. Pythonによる日本語自然言語処理

人工知能学会「人工知能学事典」 (2005)

第7章で自然言語処理が扱われています。

1. 言語資源 (Language Resource)
2. 形態素解析と品詞タグつけ (Morphological Analysis and Part of Speech Tagging)
3. 統語解析アルゴリズム (Parsing Algorithm)
4. 統計的統語解析 (Statistical Parsing)
5. 文法 (Grammar)
6. チャンキング (Chunking)
7. 言語生成 (Language Generation)
8. 言い換え技術 (Paraphrasing Technology)
9. 意味処理 (Semantic Processing)
10. 語彙意味論 (Lexical Semantics)
11. 語義曖昧性解消 (Word Sense Disambiguation)
12. 言語知識獲得 (Linguistic Knowledge Acquisition)
13. 談話処理 (Discourse Processing)
14. 対話処理 (Dialog Processing)
15. 照応解析 (Anaphora Resolution)
16. 機械翻訳 (Machine Translation)
17. 統計的機械翻訳 (Statistical Machine Translation)
18. 2言語間アラインメント (Bilingual Alignment)
19. 情報検索 (Information Retrieval)
20. 適合性フィードバック (Relevance Feedback)
21. 他言語情報検索 (Multi-Lingual Information Retrieval)
22. 情報抽出 (Information Extraction)
23. 文書要約 (Text Summarization)
24. 文書分類 (Text Categorization)
25. テキストマイニング (1) (Text Mining (1))

奥村学「自然言語処理の基礎」 (2010)

1. 自然言語処理概論
2. 辞書とコーパス
3. 形態素解析
4. 構文解析
5. 意味解析
6. 文脈解析
7. 自然言語処理の応用

高村大也「言語処理のための機械学習入門」 (2010)

1. 必要な数学的知識
1. 準備と本書における約束事
2. 最適化問題
3. 確率
4. 連続確率変数
5. パラメータ推定法
6. 情報理論

2. 文書および単語の数学的表現
1. タイプ，トークン
2. nグラム
3. 文書，文のベクトル表現
4. 文書に対する前処理とデータスパースネス問題
5. 単語のベクトル表現
6. 文書や単語の確率分布による表現

3. クラスタリング
1. 準備
2. 凝集型クラスタリング
3. k-平均法
4. 混合正規分布によるクラスタリング
5. EMアルゴリズム
6. クラスタリングにおける問題点や注意点

4. 分類
1. 準備
2. ナイーブベイズ分類器
3. サポートベクトルマシン
4. カーネル法
5. 対数線形モデル
6. 素性選択

5. 系列ラベリング
1. 準備
2. 隠れマルコフモデル
3. 通常の分類器の逐次適用
4. 条件付き確率場
5. チャンキングへの適用の仕方

6. 実験の仕方など
1. プログラムとデータの入手
2. 分類問題の実験の仕方
3. 評価指標
4. 検定

北研二「確率的言語モデル」 (1999)

1. 序章
2. 言語モデルの基礎
3. Nグラムモデル
4. 隠れマルコフモデル
5. 確率文法
6. 最大エントロピーモデル
7. 言語モデルの応用

金・村上・永田・大津・山西「言語と心理の統計」 (2003)

第I部文章の統計分析とは (金明哲・村上征勝)
1. 文章の統計分析と著者推定
2. 文章の特徴抽出
3. 統計分析方法
4. 日本語の文章の統計分析
5. 展望と文献案内

第II部確率モデルによる自然言語処理 (永田昌明)
1. 人工知能的アプローチから確率・統計的アプローチへ
2. 形態素解析
3. 固有表現抽出
4. テキスト分類
5. 統計的機械翻訳

第III部社会調査データからの推論：実践的入門 (大津起夫)
1. 調査データから何が推論できるか？
2. NSLY79と“The Bell Curve”論争
3. 主成分分析と特異値分解
4. 対応分析
5. 連関モデル
6. 多重対応分析
7. 尺度最適化を伴う主成分分析
8. おわりに

第IV部データとテキストのマイニング (山西健司)
1. データマイニングとは
2. バスケット分析
3. 分類ルールの学習
4. 嗜好学習とリコメンデーション
5. 外れ値検出と不正検出
6. データマイニングその他の話題
7. テキスト分類と自由記述アンケート分析
8. Webマイニング
9. おわりに
A.1. 確率的コンプレキシティ
A.2. 拡張型確率的コンプレキシティ

本の紹介 : 自然言語処理

Steven Bird, Ewan Klein, Edward Loper 「入門自然言語処理」 (2010)

人工知能学会「人工知能学事典」 (2005)

奥村学「自然言語処理の基礎」 (2010)

高村大也「言語処理のための機械学習入門」 (2010)

北研二「確率的言語モデル」 (1999)

金・村上・永田・大津・山西「言語と心理の統計」 (2003)

荒牧英治「医療言語処理」 (2017)

奥野陽, グラム・ニュービッグ, 萩原正人「自然言語処理の基本と技術」 (2016)

徳永拓之「日本語入力を支える技術」 (2012)

黒橋禎夫, 柴田知秀「自然言語処理概論」 (2016)

斎藤康毅「ゼロから作るDeep Learning 2 - 自然言語処理編」 (2018)

Lin & Dyer 「Hadoop MapReduce デザインパターン - MapReduce による大規模テキストデータ処理」 (2010, 2011)