Live in the future, then build what's missing!

大数据的陷阱5 新一代的工具链

tony /
分类 | 互联网 
标签 | 大数据 

新时代,开源社区确实给我们带来了更多好用的工具,有必要升级一下了。

硬件: 多core,大memory,ssd,gpu,fpga哈哈。。。

os系统: tcmalloc内存分配,llvm编译器,python,c++

代码管理: git, github, dropbox

分布式系统: spark(mapreduce), graphlab(graph-computing), gensim(topic-model)

nosql数据库: mongodb, redis, graph-db

算法模型: word2ec(词向量化), senna。。。

graph-computing: graph is the future

工具的选择很重要,kiss me, not kill me。


前一页     后一页