Aria2及BaiduExporter使用指北

最近几天家里的电脑被人占用了,自己手边只有一台linux笔记本。突然想玩美****镜(你知道的太多了)的游戏,虚拟机搞事情什么的都好说,但是我第一步卡在了百度网盘下载上。百度网盘有Linux客户端,但是那个客户端的稳定性简直不敢恭维。想了想我以前用过aria2这个神器,决定在自己的小本本上也配置一下。以下是给今后预留的放折腾指北。

继续阅读“Aria2及BaiduExporter使用指北”

PLSA 主题分析与关键词提取的利器

背景问题 文档相似度比较

假设我们现在有若干文档,我们想比较其中两个文档的相似度,或者说我们希望知道这两份文档说的是不是一样的或者类似的事情。一个naive的想法就是,直接进行词频统计,也就是说,先选取一个大小为\(M\)的常用词汇集\(W\),然后比较这样两个向量

继续阅读“PLSA 主题分析与关键词提取的利器”