情况: 我有一个numpy term-document矩阵 例如:[[0,1,0,0 ….],…. […… 0,0,0,0]]. 我已将上述矩阵插入到gensim的ldamodel方法中.并且它与lad方法lda = LdaModel(语料库,num_topics = 10)一起正常工作. 语料
我有一个numpy term-document矩阵
例如:[[0,1,0,0 ….],…. […… 0,0,0,0]].
我已将上述矩阵插入到gensim的ldamodel方法中.并且它与lad方法lda = LdaModel(语料库,num_topics = 10)一起正常工作.
语料库是我上面提到的术语 – 文档矩阵.
我需要两个中间矩阵(主题词阵列和文档主题数组)用于研究目的.
1) per document-topic probability matrix (p_d_t)
2) per topic-word probability matrix (p_w_t)
题:
如何从gensim LdaModel()函数中获取这些数组.请帮助我获取这些矩阵.
1.Per-document主题概率矩阵:将transformation应用于您的语料库.
docTopicProbMat = lda[corpus]
>每主题词概率矩阵:
K = lda.num_topicstopicWordProbMat = lda.print_topics(K)