Spark 2.3.1-2.2.1-2

Apache Spark 是一种用于大数据的快速通用群集计算系统。

欢迎使用 DC/OS Apache Spark 服务文档。有关新特性和更新特性的详细信息,请参阅 发布说明

Apache Spark 是一种用于大数据的快速通用集群计算系统。它提供 Scala、Java、Python 和 R 的高级 API,以及支持数据分析一般计算图形的优化引擎。它还支持丰富的高级工具,包括用于 SQL 和 DatAframes 的 Spark SQL、用于机器学习的 MLlib、用于图形处理的 GraphX 和用于流处理的 Spark Streaming。有关详细信息,请参阅 Apache Spark 文档

DC/OS Apache Spark 包括 Apache Spark和几个自定义提交DC/OS 特定包装

DC/OS Apache Spark 包括:

优势

  • 利用率:DC/OS Apache Spark 利用 Mesos 在与其他 DC/OS 服务相同的集群上运行 Spark
  • 提高效率
  • 简单管理
  • 多团队支持
  • 通过笔记本电脑进行交互式分析
  • UI 集成
  • 安全,包括基于文件和环境的密钥

特征

  • 多版本支持
  • 运行多个 Spark 调度器
  • 针对多个 HDFS 集群运行
  • 计划排程改进的后端端口
  • 简单安装所有 Spark 组件,包括调度器和历史服务器
  • 调度器和历史服务器的集成
  • Zeppelin 集成
  • Kerberos 和 SSL 支持

相关服务