想使用Hadoop以及Storm、Spark等等大数据工具,可是又被Java、Scala吓倒了, 有没有python语言的替代品?
有没有基于Python的轻量级的机器算法、实时处理平台?
spark也有python接口呀,后面也会对python支持的越来越好。
python 最严肃的数据分析不是强项
当然数据量尚可的小实验,可以用python,python语言本身就有 map, reduce 原语的,也有一些简单的并发库
pyspark,spark 1.5以后 甚至还有SparkR
想使用Hadoop以及Storm、Spark等等大数据工具,可是又被Java、Scala吓倒了, 有没有python语言的替代品?
有没有基于Python的轻量级的机器算法、实时处理平台?
spark也有python接口呀,后面也会对python支持的越来越好。
python 最严肃的数据分析不是强项
当然数据量尚可的小实验,可以用python,python语言本身就有 map, reduce 原语的,也有一些简单的并发库
pyspark,spark 1.5以后 甚至还有SparkR