TF (Term Frequency)
定義
ある文書内での各単語の出現回数。
覚え方
TF (Term Frequency): 「単語の"頻度"」を覚える。
FがFrequencyで、TはTerm(単語)。
IDF (Inverse Document Frequency)
定義
単語がどれだけレアかを測定する指標。
覚え方
IDF (Inverse Document Frequency): 「逆数で"文書の頻度"」を考える。
IはInverse(逆数)なので、DFはDocument Frequency(文書の頻度)。
TF-IDF (Term Frequency-Inverse Document Frequency)
定義
TF と IDF の積。文書内での単語の重要度を表す。
覚え方
TF-IDF: これらを掛け合わせたもの。単語の文書内での重要度。