tf-idf - не нужен... на этом можно закрыть было статью и не читать... он нужен для построения анализа плотности ТОПа и подгонки по нему и поиска значимых LSI слов...
LSI никогда не использовался ПС. Вот LDA - таки да, а кроме него - ещё пачка алго этого рода. Так что может, всё таки стоит тематику-то изучить? В частности, тут сказано, что tf-idf может и должно использоваться для анализа отдельных текстовых зон, анкоров и анализа отклонений и медианных данных?
tf-idf - не нужен...
на этом можно закрыть было статью и не читать...
он нужен для построения анализа плотности ТОПа и подгонки по нему и поиска значимых LSI слов...
LSI никогда не использовался ПС. Вот LDA - таки да, а кроме него - ещё пачка алго этого рода.
Так что может, всё таки стоит тематику-то изучить? В частности, тут сказано, что tf-idf может и должно использоваться для анализа отдельных текстовых зон, анкоров и анализа отклонений и медианных данных?