表中有500万条数据,每个数据是包含300+个单词的文本,现要对这么多数据进行topic model,但是我不知道这些数据从数据库中取出,放在哪儿?大数组?
而且表中的数据还在增加。
用下面两个存试试~~
ElasticSearch
Hadoop
之前做过这样的几个学习,https://github.com/phodal/learning-data
表中有500万条数据,每个数据是包含300+个单词的文本,现要对这么多数据进行topic model,但是我不知道这些数据从数据库中取出,放在哪儿?大数组?
而且表中的数据还在增加。
用下面两个存试试~~
ElasticSearch
Hadoop
之前做过这样的几个学习,https://github.com/phodal/learning-data