Hive

60 TB 数据：Facebook 是如何大规模使用 Apache Spark 的

Apache Spark 于 2009 年在加州大学伯克利分校的 AMPLab 由 Matei Zaharia 发起，后来在2013 年贡献给 Apache。它是目前增长最快的数据处理平台之一，由于它能支持流、批量、命令式（RDD）、声明式（SQL）、图数据库和机器学习等用例，而且所有这些都内置在相同的 API 和底层计算引擎中。

2017-06-23

11分钟阅读时长

技术

60 TB 数据：Facebook 是如何大规模使用 Apache Spark 的

在 Apache Hive 中轻松生存的12个技巧