HBase使用OSS-HDFS服务作为底层存储

HBase是Hadoop生态中的实时数据库，有较高的写入性能。 OSS-HDFS服务是阿里云新推出的存储空间类型，并兼容HDFS接口。JindoSDK支持HBase使用OSS-HDFS服务作为底层存储，同时支持存储WAL文件，实现存储与计算分离。相对于本地HDFS存储，OSS-HDFS服务使用更加灵活，且一定程度减少了运维成本。

前提条件

已创建ECS实例。具体步骤，请参见选购ECS实例。
已创建Hadoop环境。具体步骤，请参见创建Hadoop运行环境。
已部署Apache HBase。具体步骤，请参见Apache HBase。
已开通并授权访问OSS-HDFS服务。具体操作，请参见开通并授权访问OSS-HDFS服务。

操作步骤

连接ECS实例。具体操作，请参见连接ECS实例。
配置JindoSDK。
1. 下载最新版本的JindoSDK JAR包。下载地址，请参见GitHub。
2. 可选：如果您的环境中未包含Kerberos和SASL相关依赖，则需要在部署JindoSDK的所有节点安装以下依赖。
  - Ubuntu或Debian
```
sudo apt-get install libkrb5-dev krb5-admin-server krb5-kdc krb5-user libsasl2-dev libsasl2-modules libsasl2-modules-gssapi-mit
```
  - Red Hat Enterprise Linux或CentOS
```
sudo yum install krb5-server krb5-workstation cyrus-sasl-devel cyrus-sasl-gssapi cyrus-sasl-plain
```
  - macOS
```
brew install krb5
```
3. 解压下载的安装包。
  以下以解压jindosdk-x.x.x-linux.tar.gz为例，如使用其他版本的JindoSDK，请替换为对应的JAR包名称。
```
tar -zxvf jindosdk-x.x.x-linux.tar.gz -C /usr/lib
```
  说明
  x.x.x表示JindoSDK JAR包版本号。
4. 配置JINDOSDK_HOME。
```
export JINDOSDK_HOME=/usr/lib/jindosdk-x.x.x-linux
export PATH=$JINDOSDK_HOME/bin:$PATH
```
5. 配置HADOOP_CLASSPATH。
```
export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:${JINDOSDK_HOME}/lib/*
```
  重要
  请将安装目录和环境变量部署到所有所需节点上。
6. 将已下载的JindoSDK JAR包安装到Hadoop的classpath路径下。
```
cp jindosdk-x.x.x-linux/lib/jindo-core-x.x.x.jar <HADOOP_HOME>/share/hadoop/hdfs/lib/
cp jindosdk-x.x.x-linux/lib/jindo-sdk-x.x.x.jar <HADOOP_HOME>/share/hadoop/hdfs/lib/
```

配置OSS-HDFS服务实现类及AccessKey。

将OSS-HDFS服务实现类配置到HBase的core-site.xml文件中。

<configuration>
    <property>
        <name>fs.AbstractFileSystem.oss.impl</name>
        <value>com.aliyun.jindodata.oss.JindoOSS</value>
    </property>

    <property>
        <name>fs.oss.impl</name>
        <value>com.aliyun.jindodata.oss.JindoOssFileSystem</value>
    </property>
</configuration>

将已开启OSS-HDFS服务的Bucket对应的AccessKey ID、AccessKey Secret预先配置在HBase的core-site.xml文件中。

<configuration>
    <property>
        <name>fs.oss.accessKeyId</name>
        <value>LTAI********</value>
    </property>

    <property>
        <name>fs.oss.accessKeySecret</name>
        <value>KZo1********</value>
    </property>
</configuration>

配置OSS-HDFS服务Endpoint。
使用OSS-HDFS服务访问OSS Bucket时需要配置Endpoint。推荐访问路径格式为oss://<Bucket>.<Endpoint>/<Object>，例如oss://examplebucket.cn-shanghai.oss-dls.aliyuncs.com/exampleobject.txt。配置完成后，JindoSDK会根据访问路径中的Endpoint访问对应的OSS-HDFS服务接口。
您还可以通过其他方式配置OSS-HDFS服务Endpoint，且不同方式配置的Endpoint存在生效优先级。更多信息，请参见附录一：配置Endpoint的其他方式。
指定HBase的存储路径。
您可以通过将hbase-site配置文件中的参数hbase.rootdir的值修改为OSS地址（格式为oss://bucket.endpoint/hbase-root-dir）的方式，指定HBase和WAL文件的存储路径。
重要
如果要释放集群，需要先禁用table，确保WAL文件已全量更新到存储文件HFile。

HBase使用OSS-HDFS服务作为底层存储

前提条件

操作步骤

开源Flink写入OSS-HDFS服务 2025-04-21 17:14

Flume使用JindoSDK写入OSS-HDFS服务 2025-04-21 17:14

Hadoop使用JindoSDK访问OSS-HDFS服务 2025-04-21 17:14

HBase使用OSS-HDFS服务作为底层存储 2025-04-21 17:14

Hive使用JindoSDK处理OSS-HDFS服务中的数据 2025-04-21 17:14

Impala使用JindoSDK查询OSS-HDFS服务中的数据 2025-04-21 17:14

目录