从lda gensim检索topic-word数组和document-topic数组

来源：互联网收集：自由互联发布时间：2021-06-16

情况：我有一个numpy term-document矩阵例如：[[0,1,0,0 ….],…. […… 0,0,0,0]]. 我已将上述矩阵插入到gensim的ldamodel方法中.并且它与lad方法lda = LdaModel(语料库,num_topics = 10)一起正常工作. 语料

情况：

我有一个numpy term-document矩阵
例如：[[0,1,0,0 ….],…. […… 0,0,0,0]].

我已将上述矩阵插入到gensim的ldamodel方法中.并且它与lad方法lda = LdaModel(语料库,num_topics = 10)一起正常工作.
语料库是我上面提到的术语 – 文档矩阵.
我需要两个中间矩阵(主题词阵列和文档主题数组)用于研究目的.

1) per document-topic probability matrix (p_d_t)

2) per topic-word probability matrix (p_w_t)

题：

如何从gensim LdaModel()函数中获取这些数组.请帮助我获取这些矩阵.

1.Per-document主题概率矩阵：

将transformation应用于您的语料库.

docTopicProbMat = lda[corpus]

>每主题词概率矩阵：

K = lda.num_topicstopicWordProbMat = lda.print_topics(K)

相关文章