赛尔校园公共服务平台 Logo
平台使用
阿里云
百度云
移动云
智算服务
教育生态
登录 →
赛尔校园公共服务平台 Logo
平台使用 阿里云 百度云 移动云 智算服务 教育生态
登录
  1. 首页
  2. 阿里云
  3. 对象存储
  4. 操作指南
  5. 数据湖管理
  6. OSS-HDFS服务
  7. 访问服务
  8. 通过Jindo CLI访问

通过Jindo CLI访问

  • 访问服务
  • 发布于 2025-04-21
  • 0 次阅读
文档编辑
文档编辑

如果您希望通过命令行的方式在开通OSS-HDFS服务的Bucket中执行上传、下载、删除等相关操作时,您可以使用Jindo CLI的方式。

环境准备

您可以选择以下任意一种方式访问OSS-HDFS服务。

  • 通过阿里云EMR访问OSS-HDFS服务,确保已创建EMR-3.44.0及以上版本或EMR-5.10.0及以上版本的集群,这些版本的EMR集群默认集成了JindoSDK。具体操作,请参见创建集群。

  • 通过非阿里云EMR访问OSS-HDFS服务,确保已安装和部署 4.6.x及以上版本JindoSDK。具体操作,请参见在非EMR集群中部署JindoSDK。

操作步骤

  1. 配置环境变量。

    • 如果通过阿里云EMR访问OSS-HDFS服务,则直接跳过此步骤,执行下一步。

    • 如果通过非阿里云EMR访问OSS-HDFS服务,则按照以下说明完成配置。

      1. 连接ECS实例。具体操作,请参见连接ECS实例。

      2. 进入已安装的JindoSDK JAR包下的bin目录。

        以下以jindosdk-x.x.x-linux为例,如使用其他版本的JindoSDK,请替换为对应的JAR包名称。

        cd jindosdk-x.x.x-linux/bin/
        说明

        x.x.x表示JindoSDK JAR包版本号。

      3. 授予bin目录下的jindo-util文件的读、写、执行的权限。

        chmod 700 jindo-util
      4. 将jindo-util文件重命名为jindo。

        mv jindo-util jindo
      5. 新建配置文件jindosdk.cfg,然后在配置文件中添加以下配置项。

        [common]保持以下默认配置。
        logger.dir = /tmp/jindo-util/
        logger.sync = false
        logger.consolelogger = false
        logger.level = 0
        logger.verbose = 0
        logger.cleaner.enable = true
        hadoopConf.enable = false
        
        [jindosdk]自定义以下配置项。
        <!-- 以下以杭州地域为例,其他地域请根据实际情况替换。 -->
        fs.oss.endpoint = cn-hangzhou.oss-dls.aliyuncs.com
        <!-- 配置访问OSS-HDFS服务的AccessKeyId、AccessKeySecret。 -->
        fs.oss.accessKeyId = LTAI********    
        fs.oss.accessKeySecret = KZo1********                                       
      6. 设置环境变量。

        export JINDOSDK_CONF_DIR=<JINDOSDK_CONF_DIR>

        <JINDOSDK_CONF_DIR>填写jindosdk.cfg 配置文件所在的绝对路径。

  2. 通过Jindo CLI命令访问OSS-HDFS服务。

  • 上传文件

    将本地根目录下的examplefile.txt文件上传至examplebucket。

    ./jindo fs -put examplefile.txt oss://examplebucket.cn-shanghai.oss-dls.aliyuncs.com/
  • 新建目录

    在examplebucket下创建名为dir/的目录。

    ./jindo fs -mkdir oss://examplebucket.cn-shanghai.oss-dls.aliyuncs.com/dir/
  • 查看文件或目录信息

    查看examplebucket下的文件或目录信息。

    ./jindo fs -ls oss://examplebucket.cn-shanghai.oss-dls.aliyuncs.com/
  • 获取文件或目录大小

    获取examplebucket下所有文件或目录的大小。

    ./jindo fs -du oss://examplebucket.cn-shanghai.oss-dls.aliyuncs.com/
  • 查看文件内容

    查看examplebucket下名为localfile.txt的文件内容。

    ./jindo fs -cat oss://examplebucket.cn-shanghai.oss-dls.aliyuncs.com/localfile.txt
    重要 查看文件内容时,文件内容将以纯文本形式显示。如果文件内容进行了特定格式的编码,请使用HDFS的Java API读取并解码文件内容。
  • 下载文件

    将examplebucket下的exampleobject.txt下载到本地根目录文件夹/tmp。

    ./jindo fs -get oss://examplebucket.cn-shanghai.oss-dls.aliyuncs.com/exampleobject.txt  /tmp/
  • 删除目录或文件

    删除examplebucket下destfolder/目录及其目录下的所有文件。

    ./jindo fs -rm -r oss://examplebucket.cn-shanghai.oss-dls.aliyuncs.com/destfolder/

相关文档

关于Jindo CLI支持的命令和用法,请参见Jindo CLI使用指南。

相关文章

通过OSS控制台访问 2025-04-21 18:15

本文介绍如何通过OSS控制台访问OSS-HDFS服务。 前提条件 已开通并授权访问OSS-HDFS服务。具体操作,请参见开通并授权访问OSS-HDFS服务。 操作步骤

通过Hadoop Shell命令访问 2025-04-21 18:15

如果您希望通过命令行的方式在开通OSS-HDFS服务的Bucket中执行上传、下载、删除等相关操作,您可以使用Hadoop Shell的方式。 环境准备 您可

通过Jindo CLI访问 2025-04-21 18:15

如果您希望通过命令行的方式在开通OSS-HDFS服务的Bucket中执行上传、下载、删除等相关操作时,您可以使用Jindo CLI的方式。 环境准备 您可以选择以下任意一种方式访问O

使用JindoFuse挂载访问 2025-04-21 18:15

如果您希望将OSS-HDFS服务映射为本地文件系统,并通过标准文件系统接口(如读、写、删除文件等)访问OSS-HDFS服务中的文件,可以使用JindoFuse挂载访问。JindoFuse是一个开源的、兼容POSIX的分布式文件系统访问工具,使AI应用程序可以直接使用OSS-HDFS服务。 前提条件

通过RootPolicy访问 2025-04-21 18:15

OSS-HDFS服务支持RootPolicy。您可以通过RootPolicy为OSS-HDFS服务设置自定义前缀,在无需修改原有访问hdfs://前缀作业的基础上,将作业直接运行在OSS-HDFS服务上。 前提条件

目录
Copyright © 2025 your company All Rights Reserved. Powered by 赛尔网络.
京ICP备14022346号-15
gongan beian 京公网安备11010802041014号