赛尔校园公共服务平台 Logo
平台使用
阿里云
百度云
移动云
智算服务
教育生态
登录 →
赛尔校园公共服务平台 Logo
平台使用 阿里云 百度云 移动云 智算服务 教育生态
登录
  1. 首页
  2. 阿里云
  3. 对象存储
  4. 操作指南
  5. 数据处理
  6. 媒体处理
  7. 媒体处理参数
  8. 音频拼接

音频拼接

  • 媒体处理参数
  • 发布于 2025-04-21
  • 0 次阅读
文档编辑
文档编辑

您可以通过音频拼接功能,将多个音频拼接为一个音频并转换为需要的格式。本文介绍音频拼接功能参数及示例。

使用场景

  • 音乐创作与制作:音乐人和制作人在创作歌曲时,常将独立录制的乐器或人声拼接成完整的曲目。

  • 有声读物和语音内容创作:有声书制作时,常将朗读音频按章节顺序拼接,确保故事连贯。

  • 影视后期制作:在影视制作中,音频编辑师需将对话、旁白、环境音效和配乐拼接,以匹配画面。

  • 社交媒体内容创作:用户在短视频平台上传内容时,常将声音效果、旁白和背景音乐拼接,以增强表现力。

注意事项

  • 音频拼接仅支持异步处理(x-oss-async-process处理方式)。

  • 使用音频拼接前,需要先绑定IMM Project。关于控制台和API如何绑定,请参见快速入门和AttachOSSBucket - 绑定对象存储桶。

  • 不支持匿名访问。

  • 必须拥有IMM处理所需的相关权限。更多信息,请参见权限。

  • 当使用默认采样率或声道数进行拼接时,拼接可能由于目标音频容器的兼容性而失败。

  • 进行音频拼接时,最大支持的音频数量为 11 个。

参数说明

操作名称:audio/concat

具体参数如下表所示。

拼接参数

audio/concat的拼接顺序按照pre与sur在请求串中的先后顺序进行拼接,具体如下:

  • /pre:前置拼接的音频文件。

  • /sur:后置拼接的音频文件。

参数

类型

是否必须

描述

ss

int

否

前缀或后缀音频的拼接起始时间,单位为毫秒。取值:

  • 0(默认值):从起始位置开始。

  • 大于0:从第ss毫秒开始。

t

int

否

前缀或后缀音频的拼接持续时长,单位为毫秒。取值:

  • 0(默认值):持续到结束位置。

  • 大于0:持续t毫秒。

o

string

是

当前Bucket下的OSS Object,需要以Base64 URL安全方式编码。

转码参数

参数

类型

是否必须

描述

ss

int

否

被拼接音频的转码起始时间,单位为毫秒。取值:

  • 0(默认值):从起始位置开始。

  • 大于0:从第ss毫秒开始。

t

int

否

被拼接音频的转码持续时长,单位为毫秒。取值:

  • 0(默认值):持续到结束位置。

  • 大于0:持续t毫秒。

f

string

是

音频容器:

  • mp3

  • aac

  • flac

  • oga

  • ac3

  • opus

  • amr

ar

int

否

音频采样率。默认与align指定的源音频一致,取值:

  • 8000

  • 11025

  • 12000

  • 16000

  • 22050

  • 24000

  • 32000

  • 44100

  • 48000

  • 64000

  • 88200

  • 96000

说明

不同格式支持的采样率有所不同,mp3仅支持48kHz及以下;opus支持8kHz、12kHz、16kHz、24kHz与48kHz;ac3支持32kHz、44.1kHz与48kHz;amr仅支持8kHz与16kHz。

ac

int

否

音频声道数。默认与align指定的源音频一致,取值范围:1~8。

说明

不同格式支持的声道数有所不同,mp3仅支持单声道、双声道;ac3最大支持6声道(“5.1”);amr仅支持单声道。

aq

int

否

音频压缩质量。取值范围:0~100。

说明

该参数与ab互斥,若都不设置则按照编码器默认码率进行编码。

ab

int

否

音频比特率(码率)。单位为比特/秒(bps)。取值范围:1000~10000000。

abopt

string

否

音频码率选项。取值:

  • 0(默认值):始终使用目标音频码率。

  • 1:拼接列表中存在源音频码率小于ab参数的值时使用拼接列表中最小的源音频码率。

  • 2:拼接列表中存在源音频码率小于ab参数的值时返回失败。

说明

该参数需要与ab参数的值一同设置。

align

int

否

主音频文件(提供默认转码参数)在拼接列表中的序号,默认为0(对齐拼接列表中第一个音频)。

adepth

int

否

音频采样位深,取值为16或24。

说明

该参数仅在f为flac时有效。

说明

音频拼接时也会用到sys/saveas和notify参数。更多信息,请参见另存为和消息通知。

使用REST API

音频拼接为AAC格式

  • 音频名称:pre1.mp3,pre2.wav,example.oga,sur1.aac,sur2.wma

  • 拼接时长与顺序:

    音频名称

    顺序

    时长

    pre1.mp3

    1

    整段音频

    pre2.wav

    2

    前2秒

    example.oga

    3

    整段音频

    sur1.aac

    4

    第4秒到第十秒

    sur2.wma

    5

    第10秒到结尾

  • 转码完成消息通知:发送MNS消息

  • 拼接后音频信息

    • 音频格式:aac

    • 音频配置:44.1kHz采样率,单声道

    • 音频码率:96 Kbps

    • 文件存储路径

      • aac文件:oss://outbucket/outobj.aac

处理示例

// 对文件example.oga进行音频拼接。
POST /example.oga?x-oss-async-process HTTP/1.1
Host: video-demo.oss-cn-hangzhou.aliyuncs.com
Date: Fri, 28 Oct 2022 06:40:10 GMT
Authorization: OSS qn6q**************:77Dv****************

x-oss-async-process=audio/concat,f_aac,ac_1,ar_44100,ab_96000,align_2/pre,o_cHJlMS5tcDMK/pre,o_cHJlMi53YXYK,t_2000/sur,o_c3VyMS5hYWMK,ss_4000,t_10000/sur,o_c3VyMi53bWEK,ss_10000|sys/saveas,b_b3V0YnVja2V0,o_b3V0b2JqLnthdXRvZXh0fQo/notify,topic_QXVkaW9Db252ZXJ0

使用SDK

仅支持使用Java、Python、Go SDK通过异步处理的方式完成音频拼接。

前提说明

  1. 请确保已设置环境变量OSS_ACCESS_KEY_ID和OSS_ACCESS_KEY_SECRET。

  2. 指定Bucket名称,例如examplebucket。

  3. 指定拼接后的音频文件名称,例如dest.aac。

  4. 需要拼接的音频文件名称,例如src1.mp3和src2.mp3。

仅支持使用Java、Python、Go SDK通过异步处理的方式完成音频拼接。

Java

要求使用3.17.4及以上版本的Java SDK。

import com.aliyun.oss.ClientBuilderConfiguration;
import com.aliyun.oss.OSS;
import com.aliyun.oss.OSSClientBuilder;
import com.aliyun.oss.common.auth.CredentialsProviderFactory;
import com.aliyun.oss.common.auth.EnvironmentVariableCredentialsProvider;
import com.aliyun.oss.common.comm.SignVersion;
import com.aliyun.oss.model.AsyncProcessObjectRequest;
import com.aliyun.oss.model.AsyncProcessObjectResult;
import com.aliyuncs.exceptions.ClientException;

import java.nio.charset.StandardCharsets;
import java.util.Base64;

public class Demo {

    public static void main(String[] args) throws ClientException {
        // yourEndpoint填写Bucket所在地域对应的Endpoint。
        String endpoint = "https://oss-cn-hangzhou.aliyuncs.com";
        // 指定阿里云通用Region ID,例如cn-hangzhou。
        String region = "cn-hangzhou";
        // 从环境变量中获取访问凭证。运行本代码示例之前,请确保已设置环境变量OSS_ACCESS_KEY_ID和OSS_ACCESS_KEY_SECRET。
        EnvironmentVariableCredentialsProvider credentialsProvider = CredentialsProviderFactory.newEnvironmentVariableCredentialsProvider();
        // 指定Bucket名称。
        String bucketName = "examplebucket";
        // 指定拼接后的音频文件名称。
        String targetAudio = "dest.aac";
        // 需要拼接的音频文件名。
        String audio1 = "src1.mp3";
        String audio2 = "src2.mp3";

        // 创建OSSClient实例。
        ClientBuilderConfiguration clientBuilderConfiguration = new ClientBuilderConfiguration();
        clientBuilderConfiguration.setSignatureVersion(SignVersion.V4);
        OSS ossClient = OSSClientBuilder.create()
                .endpoint(endpoint)
                .credentialsProvider(credentialsProvider)
                .clientConfiguration(clientBuilderConfiguration)
                .region(region)
                .build();

        try {
            // 构建音频处理的样式字符串以及音频拼接处理参数。
            String audio1Encoded = Base64.getUrlEncoder().encodeToString(audio1.getBytes(StandardCharsets.UTF_8)).replace("=", "");
            String audio2Encoded = Base64.getUrlEncoder().encodeToString(audio2.getBytes(StandardCharsets.UTF_8)).replace("=", "");
            String style = String.format("audio/concat,f_aac,ac_1,ar_44100,ab_96000,align_2/pre,o_%s/pre,o_%s,t_0", audio1Encoded, audio2Encoded);

            // 构建异步处理指令。
            String bucketEncoded = Base64.getUrlEncoder().encodeToString(bucketName.getBytes(StandardCharsets.UTF_8)).replace("=", "");
            String targetEncoded = Base64.getUrlEncoder().encodeToString(targetAudio.getBytes(StandardCharsets.UTF_8)).replace("=", "");
            String process = String.format("%s|sys/saveas,b_%s,o_%s/notify,topic_QXVkaW9Db252ZXJ0", style, bucketEncoded, targetEncoded);

            // 创建AsyncProcessObjectRequest对象。
            AsyncProcessObjectRequest request = new AsyncProcessObjectRequest(bucketName, audio1, process);
            // 执行异步处理任务。
            AsyncProcessObjectResult response = ossClient.asyncProcessObject(request);
            System.out.println("EventId: " + response.getEventId());
            System.out.println("RequestId: " + response.getRequestId());
            System.out.println("TaskId: " + response.getTaskId());

        } finally {
            // 关闭OSSClient。
            ossClient.shutdown();
        }
    }
}

Python

要求使用Python SDK 2.18.4及以上版本。

# -*- coding: utf-8 -*-
import base64
import oss2
from oss2.credentials import EnvironmentVariableCredentialsProvider


def main():
    # 从环境变量中获取临时访问凭证。运行本代码示例之前,请确保已设置环境变量OSS_ACCESS_KEY_ID、OSS_ACCESS_KEY_SECRET。
    auth = oss2.ProviderAuthV4(EnvironmentVariableCredentialsProvider())

    # 填写Bucket所在地域对应的Endpoint。以华东1(杭州)为例,Endpoint填写为https://oss-cn-hangzhou.aliyuncs.com。
    endpoint = 'https://oss-cn-hangzhou.aliyuncs.com'

    # 指定阿里云通用Region ID,例如cn-hangzhou。
    region = 'cn-hangzhou'

    # 指定Bucket名称,例如examplebucket。
    bucket = oss2.Bucket(auth, endpoint, 'examplebucket', region=region)

    # 指定拼接后的音频文件名称。
    target_audio = 'dest.aac'

    # 指定需要拼接的音频文件名称。
    audio1 = 'src1.mp3'
    audio2 = 'src2.mp3'

    # 构建音频处理的样式字符串以及音频拼接处理参数。
    audio1_encoded = base64.urlsafe_b64encode(audio1.encode()).decode().rstrip('=')
    audio2_encoded = base64.urlsafe_b64encode(audio2.encode()).decode().rstrip('=')
    style = f"audio/concat,f_aac,ac_1,ar_44100,ab_96000,align_2/pre,o_{audio1_encoded}/pre,o_{audio2_encoded},t_0"

    # 构建异步处理指令。
    bucket_encoded = base64.urlsafe_b64encode(bucket.encode()).decode().rstrip('=')
    target_encoded = base64.urlsafe_b64encode(target_audio.encode()).decode().rstrip('=')
    process = f"{style}|sys/saveas,b_{bucket_encoded},o_{target_encoded}/notify,topic_QXVkaW9Db252ZXJ0"

    print(process)

    # 执行异步处理任务。
    try:
        result = bucket.async_process_object(audio1, process)
        print(f"EventId: {result.event_id}")
        print(f"RequestId: {result.request_id}")
        print(f"TaskId: {result.task_id}")
    except Exception as e:
        print(f"Error: {e}")


if __name__ == "__main__":
    main()

Go

要求使用Go SDK 3.0.2及以上版本。

package main

import (
	"encoding/base64"
	"fmt"
	"log"
	"os"

	"github.com/aliyun/aliyun-oss-go-sdk/oss"
)
func main() {
	// 从环境变量中获取临时访问凭证。运行本代码示例之前,请确保已设置环境变量OSS_ACCESS_KEY_ID、OSS_ACCESS_KEY_SECRET、OSS_SESSION_TOKEN。
	provider, err := oss.NewEnvironmentVariableCredentialsProvider()
	if err != nil {
		fmt.Println("Error:", err)
		os.Exit(-1)
	}
	// 创建OSSClient实例。
	// yourEndpoint填写Bucket对应的Endpoint,以华东1(杭州)为例,填写为https://oss-cn-hangzhou.aliyuncs.com。
	// yourRegion指定阿里云通用Region ID,例如cn-hangzhou。
	client, err := oss.New("https://oss-cn-hangzhou.aliyuncs.com", "", "", oss.SetCredentialsProvider(&provider), oss.AuthVersion(oss.AuthV4), oss.Region("cn-hangzhou"))
	if err != nil {
		fmt.Println("Error:", err)
		os.Exit(-1)
	}
	// 指定Bucket名称,例如examplebucket。
	bucketName := "examplebucket"

	bucket, err := client.Bucket(bucketName)
	if err != nil {
		fmt.Println("Error:", err)
		os.Exit(-1)
	}

	// 需要拼接的音频文件名称。
	audio1 := "src1.mp3"
	audio2 := "src2.mp3"
	// 指定拼接后的音频文件名称。
	targetAudio := "dest.aac"

	// 构建音频处理的样式字符串以及音频拼接处理参数。
	audio1Encoded := base64.URLEncoding.EncodeToString([]byte(audio1))
	audio2Encoded := base64.URLEncoding.EncodeToString([]byte(audio2))
	style := fmt.Sprintf("audio/concat,f_aac,ac_1,ar_44100,ab_96000,align_2/pre,o_%s/pre,o_%s,t_0", audio1Encoded, audio2Encoded)

	// 构建异步处理指令。
	bucketEncoded := base64.URLEncoding.EncodeToString([]byte(bucketName))
	targetEncoded := base64.URLEncoding.EncodeToString([]byte(targetAudio))
	process := fmt.Sprintf("%s|sys/saveas,b_%s,o_%s/notify,topic_QXVkaW9Db252ZXJ0", style, bucketEncoded, targetEncoded)

	// 执行异步处理任务。
	result, err := bucket.AsyncProcessObject(audio1, process)
	if err != nil {
		log.Fatalf("Failed to async process object: %s", err)
	}

	fmt.Printf("EventId: %s\n", result.EventId)
	fmt.Printf("RequestId: %s\n", result.RequestId)
	fmt.Printf("TaskId: %s\n", result.TaskId)
}
相关文章

视频转码 2025-04-21 18:16

当您需要修改视频编码格式、降低分辨率和码率、转换封装格式、调整视频参数以适应不同需求,可以使用视频转码功能。 功能简介 视频转码通过将已压缩编码的视频码流转换为另一种视频码流,将视频格式、封装、分辨率、帧率及码率等参数转换为适合不同设备和平台播放,同时降低文件大小以优化传输效率的过程。

视频转动图 2025-04-21 18:16

您可以通过视频转动图功能,将视频转换为GIF、WebP等格式的动图。本文介绍视频转动图功能参数及示例。 使用场景 社交媒体分享:在社交媒体上,视频的关键片段常被转换成GIF分享,以便快速加载和生动地展示内容。 网络

视频截雪碧图 2025-04-21 18:16

视频截雪碧图(CSS Sprite或CSS Sprites)主要用于网站性能优化和前端开发。雪碧图是将多个小图标拼接成一张大图,通过CSS背景定位技术减少HTTP请求,提升网页加载速度和用户体验。您可以通过视频截雪碧图功能提取视频帧并拼接为雪碧图。本文介绍视频截雪碧图功能参数及示例。 注意事项

视频截帧 2025-04-21 18:16

您可以通过视频截帧功能,按一定规则提取多个视频帧并转换为需要的图片格式。本文介绍视频截帧功能参数及示例。 使用场景 视频编辑与制作:在视频剪辑中,需要从原始视频中截取某一帧作为静态图像,用于动态海报或预告片。 动画

视频拼接 2025-04-21 18:16

您可以通过视频拼接功能,将多个视频拼接为一个视频并转换为需要的格式。本文介绍视频拼接功能参数及示例。 功能简介 视频拼接是将多个视频片段合并为一个完整视频并转换为所需格式的能力。

视频信息提取 2025-04-21 18:16

您可以通过视频信息提取功能,获取媒体文件的封装与音视频流信息,例如:视频分辨率、帧率、音视频编码器类型、是否包含字幕流、视频时长、视频拍摄时间、视频画面宽度和高度等。 使用场景 视频监控:在安全监控系统中,使用OSS视频信息提取识别和跟踪人员、车辆及异常活动。

目录
Copyright © 2025 your company All Rights Reserved. Powered by 赛尔网络.
京ICP备14022346号-15
gongan beian 京公网安备11010802041014号