テキストマイニング【text mining】

概要

テキストマイニング（text mining）とは、定型化されていない文字情報(テキストデータ)の集まりを自然言語解析などの手法を用いて解析し、何らかの未知の有用な知見を見つけ出すこと。

テキストマイニングのイメージ画像

目次

概要
解説
関連用語
他の用語辞典の解説

解説「データマイニング」（data mining）の手法を非定型のテキストデータに応用したもので、自然言語の文の蓄積として集められたデータを分析し、鉱山から鉱石などを掘り出す（mining）ように、業務や製品に役立つ情報を探し出す。

目的や具体的な技術は様々だが、多くの場合、文章に形態素解析を行ってテキストを単語やフレーズに分解し、特定の表現の出現頻度やその増減、複数の表現の関連性や時系列の変化などを調べる。

これにより、知られていなかった問題点を見出したり、様々な要素や要因の間の結びつきを可視化したり（共起ネットワーク分析）、顧客や消費者の評判（肯定的か否定的か）や時系列の推移を把握したりする（センチメント分析）ことができる。

対象となるデータの例として、アンケートや報告書などに含まれる自由記述の文章、電子掲示板（BBS）やSNSの書き込み、ニュース記事、OCRでスキャンしてテキストデータ化した過去の書籍、雑誌、新聞の記事などが挙げられる。

(2018.12.11更新)

「テキストマイニング」の関連用語

形態素解析

形態素解析

【morphological analysis】

構文解析

【syntax analysis】

字句解析

【lexical analysis】

パターン認識

パターン認識

【pattern recognition】

ダッシュボード

ダッシュボード

【dashboard】

データマイニング

データマイニング

【data mining】

ビッグデータ

ビッグデータ

主成分分析

主成分分析

散布図

【scatter diagram】

相関関係

【correlation】

データクレンジング

データクレンジング

【data cleansing】

RPA

【Robotic Process Automation】

データサイエンティスト

データサイエンティスト

【data scientist】

CSV

【Comma-Separated Values】

多次元尺度構成法

多次元尺度構成法

クラスター分析

クラスター分析

【cluster analysis】

クロス集計

クロス集計

【cross tabulation】

SaaS

【Software as a Service】

データマイグレーション

データマイグレーション

【data migration】

回帰分析

【regression analysis】

標準偏差

棒グラフ

【bar chart】

Webマイニング

Webマイニング

【ウェブマイニング】

COUNTIF関数

【COUNTIF function】

他の用語辞典による「テキストマイニング」の解説（外部サイト）

各種試験対策（一部は会員限定）

ITパスポート

✅ 用語一覧
✅ 単語帳
✅ 一問一答
✅ 過去問模試
✅ 過去問集

基本情報技術者

✅ 用語一覧
✅ 単語帳
✅ 一問一答
✅ 過去問模試
✅ 過去問集

高校情報Ⅰ

✅ 用語一覧
✅ 単語帳
✅ 一問一答
✅ 小テスト作成

この分野の閲覧数ランキング

1位

.xlsbファイル

2位

二乗平均平方根【RMS】

3位

切り上げ【round up】

4位

SAS 【Statistical Analysis System】

5位

二乗平均平方根誤差【RMSE】

6位

端数処理【丸め処理】

7位

XLSXファイル【.xlsxファイル】

8位

プロンプト【prompt】

9位

汎化【generalization】

10位

ODSファイル【OpenDocument Spreadsheet】

11位

CSV 【Comma-Separated Values】

12位

平均二乗誤差【MSE】

13位

ダッシュボード【dashboard】

14位

YoY 【Year over Year】

15位

.xlsmファイル

… 総合ランキングへ