当前位置 : 主页 > 网络推广 > seo >

从lda gensim检索topic-word数组和document-topic数组

来源:互联网 收集:自由互联 发布时间:2021-06-16
情况: 我有一个numpy term-document矩阵 例如:[[0,1,0,0 ….],…. […… 0,0,0,0]]. 我已将上述矩阵插入到gensim的ldamodel方法中.并且它与lad方法lda = LdaModel(语料库,num_topics = 10)一起正常工作. 语料
情况:

我有一个numpy term-document矩阵
例如:[[0,1,0,0 ….],…. […… 0,0,0,0]].

我已将上述矩阵插入到gensim的ldamodel方法中.并且它与lad方法lda = LdaModel(语料库,num_topics = 10)一起正常工作.
语料库是我上面提到的术语 – 文档矩阵.
我需要两个中间矩阵(主题词阵列和文档主题数组)用于研究目的.

1) per document-topic probability matrix (p_d_t)

2) per topic-word probability matrix (p_w_t)

题:

如何从gensim LdaModel()函数中获取这些数组.请帮助我获取这些矩阵.

1.Per-document主题概率矩阵:

将transformation应用于您的语料库.

docTopicProbMat = lda[corpus]

>每主题词概率矩阵:

K = lda.num_topicstopicWordProbMat = lda.print_topics(K)

网友评论