通过ACK Serverless创建Spark计算任务

在ACK Serverless集群中，您可以按需按量创建Pod。当Pod结束后停止收费，无需为Spark计算任务预留计算资源，从而摆脱集群计算力不足和扩容的烦扰，同时结合抢占式实例可以降低任务的计算成本。本文主要为您介绍如何通过ACK Serverless按需创建Spark计算任务。

前提条件

已创建ACK Serverless集群。具体操作，请参见创建ACK Serverless集群。
已通过Kubectl工具连接ACK Serverless集群。具体操作，请参见通过kubectl连接Kubernetes集群。

操作步骤

部署ack-spark-operator Chart，可以通过以下两种方式：

在容器服务管理控制台的导航栏中选择市场 > 应用市场，通过选择ack-spark-operator来进行部署。

通过helm命令行手动安装。

说明

要求Helm的版本不低于V3。

#创建Service account。
kubectl create serviceaccount spark
#绑定权限。
kubectl create clusterrolebinding spark-role --clusterrole=edit --serviceaccount=default:spark --namespace=default
#安装Operator。
helm repo add incubator http://storage.googleapis.com/kubernetes-charts-incubator
helm install incubator/sparkoperator --namespace default  --set operatorImageName=registry.cn-hangzhou.aliyuncs.com/acs/spark-operator  --set operatorVersion=ack-2.4.5-latest  --generate-name

部署后可以执行以下命令确认spark-operator已经启动成功。

kubectl -n spark-operator get pod

预期输出：

NAME                                  READY   STATUS      RESTARTS   AGE
ack-spark-operator-7698586d7b-pvwln   1/1     Running     0          5m9s
ack-spark-operator-init-26tvh         0/1     Completed   0          5m9s

创建spark-pi.yaml文件并拷贝以下内容到该文件。

apiVersion: "sparkoperator.k8s.io/v1beta2"
kind: SparkApplication
metadata:
  name: spark-pi
  namespace: default
spec:
  arguments:
  - "1000"
  sparkConf:
    "spark.scheduler.maxRegisteredResourcesWaitingTime": "3000s"
    "spark.kubernetes.allocation.batch.size": "1"
    "spark.rpc.askTimeout": "36000s"
    "spark.network.timeout": "36000s"
    "spark.rpc.lookupTimeout": "36000s"
    "spark.core.connection.ack.wait.timeout": "36000s"
    "spark.executor.heartbeatInterval": "10000s"
  type: Scala
  mode: cluster
  image: "registry.aliyuncs.com/acs/spark:ack-2.4.5-latest"
  imagePullPolicy: Always
  mainClass: org.apache.spark.examples.SparkPi
  mainApplicationFile: "local:///opt/spark/examples/jars/spark-examples_2.11-2.4.5.jar"
  sparkVersion: "2.4.5"
  restartPolicy:
    type: Never
  args:
  driver:
    cores: 4
    coreLimit: "4"
    annotations:
      k8s.aliyun.com/eci-image-cache: "true"
    memory: "6g"
    memoryOverhead: "2g"
    labels:
      version: 2.4.5
    serviceAccount: spark
  executor:
    annotations:
      k8s.aliyun.com/eci-image-cache: "true"
    cores: 2
    instances: 1
    memory: "3g"
    memoryOverhead: "1g"
    labels:
      version: 2.4.5

部署Spark计算任务。
1. 执行以下命令，部署Spark计算任务。
```
kubectl apply -f spark-pi.yaml
```
  预期输出：
```
sparkapplication.sparkoperator.k8s.io/spark-pi created
```
2. 执行以下命令，查看Spark计算任务的部署状态。
```
kubectl get pod
```
  预期输出：
```
NAME              READY   STATUS    RESTARTS   AGE
spark-pi-driver   1/1     Running   0          2m12s
```
  从预期输出可得，Pod的运行状态为Running，表示正在部署Spark计算任务。
3. 执行以下命令，再次查看Spark计算任务的部署状态。
```
kubectl get pod
```
  预期输出：
```
NAME              READY   STATUS      RESTARTS   AGE
spark-pi-driver   0/1     Completed   0          2m54s
```
  从预期输出可得，Pod的运行状态为Completed，表示Spark计算任务已部署完成。

执行以下命令，查看Spark任务的计算结果。

kubectl logs spark-pi-driver|grep Pi

预期输出：

20/04/30 07:27:51 INFO DAGScheduler: ResultStage 0 (reduce at SparkPi.scala:38) finished in 11.031 s
20/04/30 07:27:51 INFO DAGScheduler: Job 0 finished: reduce at SparkPi.scala:38, took 11.137920 s
Pi is roughly 3.1414371514143715

可选：通过给Pod加上抢占式实例的Annotation，使用抢占式实例。
关于抢占式实例Annotation的用法，请参见使用抢占式实例。

前提条件

操作步骤

ACK Serverless弹性低成本CICD 2025-04-18 14:52

使用ECI搭建WordPress应用 2025-04-18 14:52

使用ECI运行Spark作业 2025-04-18 14:52

使用ECI运行TensorFlow任务 2025-04-18 14:52

使用抢占式ECI实例运行Job任务 2025-04-18 14:52

在ACK Serverless集群中部署Jenkins并完成应用构建和部署 2025-04-18 14:52

目录