РАГС - РОССИЙСКИЙ АРХИВ ГОСУДАРСТВЕННЫХ СТАНДАРТОВ,
а также строительных норм и правил (СНиП)
и образцов юридических документов







Описание
Источник публикации
М.: ФГБУ "Институт стандартизации", 2025
Примечание к документу
Документ вводится в действие с 01.01.2026.
Название документа
"ГОСТ Р 71012.4-2025. Национальный стандарт Российской Федерации. Телевидение вещательное цифровое. Динамическая адаптивная потоковая передача. Часть 4. Передача звука в формате кодирования HEVC средствами протокола HTTP по сетям с IP. Основные параметры"
(утв. и введен в действие Приказом Росстандарта от 27.06.2025 N 633-ст)

"ГОСТ Р 71012.4-2025. Национальный стандарт Российской Федерации. Телевидение вещательное цифровое. Динамическая адаптивная потоковая передача. Часть 4. Передача звука в формате кодирования HEVC средствами протокола HTTP по сетям с IP. Основные параметры"
(утв. и введен в действие Приказом Росстандарта от 27.06.2025 N 633-ст)



Оглавление


Утвержден и введен в действие
Приказом Федерального
агентства по техническому
регулированию и метрологии
от 27 июня 2025 г. N 633-ст
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
ТЕЛЕВИДЕНИЕ ВЕЩАТЕЛЬНОЕ ЦИФРОВОЕ
ДИНАМИЧЕСКАЯ АДАПТИВНАЯ ПОТОКОВАЯ ПЕРЕДАЧА
ЧАСТЬ 4
ПЕРЕДАЧА ЗВУКА В ФОРМАТЕ КОДИРОВАНИЯ HEVC СРЕДСТВАМИ
ПРОТОКОЛА HTTP ПО СЕТЯМ С IP. ОСНОВНЫЕ ПАРАМЕТРЫ
Digital video broadcasting. Dynamic adaptive streaming.
Part 4. Transmission of audio in HEVC encoding format using
the HTTP protocol over IP networks. Basic parameters
ГОСТ Р 71012.4-2025
ОКС 33.170
Дата введения
1 января 2026 года
Предисловие
1 РАЗРАБОТАН Автономной некоммерческой организацией "Научно-технический центр информатики" (АНО "НТЦИ")
2 ВНЕСЕН Техническим комитетом по стандартизации ТК 480 "Связь"
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 27 июня 2025 г. N 633-ст
4 ВВЕДЕН ВПЕРВЫЕ
Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. N 162-ФЗ "О стандартизации в Российской Федерации". Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.rst.gov.ru)
1 Область применения
Настоящий стандарт устанавливает требования к параметрам динамической адаптивной потоковой передачи звука по протоколу передачи гипертекста (HTTP) (DASH) в сетях с интернет-протоколом (IP) при кодировании файлов цифрового телевизионного вещания (DVB) в формате высокоэффективного видеокодирования (HEVC).
Для обеспечения совместимости условий передачи и приема звука в настоящем стандарте установлены дополнительные требования к наборам кодеков аудиомедиаслужб DVB, применяемых с MPEG DASH.
Требования настоящего стандарта следует учитывать при разработке, изготовлении и эксплуатации устройств DVB, работающих в сетях с IP.
2 Нормативные ссылки
В настоящем стандарте использована нормативная ссылка на следующий стандарт:
ГОСТ Р 59806-2021 Телевидение вещательное цифровое. Динамическая адаптивная потоковая передача форматов файлов медиаслужб DVB средствами протокола HTTP по сетям с IP. Основные параметры
Примечание - При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет или по ежегодному информационному указателю "Национальные стандарты", который опубликован по состоянию на 1 января текущего года, и по выпускам ежемесячного информационного указателя "Национальные стандарты" за текущий год. Если заменен ссылочный стандарт, на который дана недатированная ссылка, то рекомендуется использовать действующую версию этого стандарта с учетом всех внесенных в данную версию изменений. Если заменен ссылочный стандарт, на который дана датированная ссылка, то рекомендуется использовать версию этого стандарта с указанным выше годом утверждения (принятия). Если после утверждения настоящего стандарта в ссылочный стандарт, на который дана датированная ссылка, внесено изменение, затрагивающее положение, на которое дана ссылка, то это положение рекомендуется применять без учета данного изменения. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, рекомендуется применять в части, не затрагивающей эту ссылку.
3 Термины, определения и сокращения
3.1 Термины и определения
В настоящем стандарте применены следующие термины с соответствующими определениями:
3.1.1
выборка (sample): Данные, связанные одной меткой времени.
Примечания
1 Выборки в одном треке не должны иметь одинаковые метки времени.
2 В треках "без подсказок" выборка может представлять отдельный кадр видео, серию видео- или аудиокадров, размещенных в порядке декодирования; в треках "подсказок" выборка определяет процесс формирования одного или нескольких пакетов в составе потока.
[ГОСТ Р 71012.1-2023, пункт 3.1.6]
3.1.2
высокоэффективное видеокодирование; HEVC (High Efficiency Video Coding, HEVC): Наименование стандарта кодирования со сжатием подвижных изображений.
Примечание - Стандарт HEVC входит в состав группы стандартов с неформальным обозначением MPEG-4.
[ГОСТ Р 71012.2-2023, статья 3.1.3]
3.1.3
дескриптор (descriptor): Кодовое слово, служащее для описания типа передаваемых данных.
[ГОСТ Р 54995-2012, пункт 3.1.5]
3.1.4 индекс сегмента (index segment): Индекс отображения времени в диапазоне байтов в сегменте медиа без учета описания презентации медиа.
3.1.5 микс аудио (mix audio): Совокупность непрерывной последовательности аудиотреков, которые близки по жанру, тематике и другим признакам.
Примечание - В этой последовательности аудиотреки плавно сменяют друг друга. На стыке между аудиотреками отсутствуют интервалы тишины, а сами аудиотреки микса в процессе перехода совпадают по темпу, размерности и другим признакам.
3.1.6 (mixing): Операция создания из отдельных треков конечной записи, включающая отбор, редактирование исходных треков аудио и их последующее объединение.
3.1.7
набор адаптации (adaptation set): Набор взаимозаменяемых кодированных версий одного или нескольких компонентов медиаконтента.
[ГОСТ Р 71012.1-2023, пункт 3.1.14]
3.1.8
период презентации медиа (period of the media presentation): Период, на котором непрерывная последовательность всех интервалов представления образует презентацию медиа.
[ГОСТ Р 59806-2021, пункт 3.1.13]
3.1.9
поток битов (bitstream): Последовательность битов, формируемых видеокодером, которая образует репрезентацию кодированных изображений и связанных с ними данных.
[ГОСТ Р 71012.1-2023, пункт 3.1.19]
3.1.10
презентация медиа (media presentation): Набор данных, который устанавливает ограниченную или неограниченную презентацию медиаконтента.
[ГОСТ Р 71012.1-2023, пункт 3.1.20]
3.1.11
проигрыватель (player): Устройство, выполняющее прием и презентацию медиаслужб.
[ГОСТ Р 71012.1-2023, пункт 3.1.21]
3.1.12
профиль (profile): 1) Описание группы минимальных конфигураций, определяющих параметры потока битов, формируемого одной из совокупностей рассматриваемых систем кодирования (или параметры приемников-декодеров этих потоков), и отображающих функции, которые характеризуют контекст опций службы; 2) набор средств и инструментов обработки видеосигнала (видео) или аудиосигнала (аудио), использующий предусмотренную стандартом кодирования технологию и формирующий кодированный поток битов.
[ГОСТ Р 71012.1-2023, пункт 3.1.22]
3.1.13 рендеринг (rendering): Процесс преобразования файла цифровой звуковой рабочей станции в готовый для воспроизведения файл аудио.
3.1.14
репрезентация (representation): Набор инкапсулированных потоков медиа в формате доставки, включающих описательные метаданные.
[ГОСТ Р 71012.1-2023, пункт 3.1.23]
3.1.15 преселекция аудио (audio preselection): Набор компонентов аудиопрограммы, который может быть выбран пользователем для декодирования.
3.1.16
сегмент (segment): Единица данных, связанная с URL HTTP и с диапазоном скоростей передачи, указанным в MPD.
[ГОСТ Р 71012.1-2023, пункт 3.1.25]
3.1.17
сегмент инициализации (initialization segment): Сегмент, содержащий метаданные, необходимые для презентации медиапотоков, инкапсулированных в медиасегментах.
[ГОСТ Р 71012.1-2023, пункт 3.1.26]
3.1.18
сегмент медиа (media segment): Сегмент, который соответствует используемому формату медиа и позволяет воспроизводить его в сочетании с одним или несколькими сегментами и сегментом инициализации.
[ГОСТ Р 71012.2-2023, пункт 3.1.14]
3.1.19
субсегмент (subsegment): Блок в сегментах медиа, который маркируется индексом сегмента.
[ГОСТ Р 71012.2-2023, пункт 3.1.17]
3.1.20
субсегмент медиа (media subsegment): Субсегмент, который содержит только данные медиа и не содержит индекс сегмента.
[ГОСТ Р 71012.2-2023, пункт 3.1.18]
3.1.21
точка доступа к потоку; SAP (stream access point; SAP): Позиция в репрезентации, позволяющая начать воспроизведение медиапотока, используя информацию в данных репрезентации, начиная с этой позиции (предшествует инициализации данных в сегменте инициализации).
[ГОСТ Р 71012.1-2023, пункт 3.1.28]
3.1.22 чистое аудио: Дополнительная служба аудио.
Примечание - Чистое аудио применяют, например, для пользователей с ослабленным слухом.
3.2 Сокращения
В настоящем стандарте применены следующие сокращения:
AAC - профиль усовершенствованного кодирования аудио (Advanced Audio Coding);
AC-3 - система цифрового кодирования аудио (Dolby AC-3 Audio Coding System);
AC-4-1 - система цифрового кодирования аудио (Dolby AC-4 Audio Coding System);
AD - описание аудиосцены для пользователей со слабым зрением (Audio Description);
BMFF - базовый формат медиафайла (Base Media File Format);
CA - поток чистого аудио (Clean Audio);
DASH - динамическая адаптивная потоковая передача средствами HTTP (Dynamic Adaptive Streaming over HTTP);
DAW - цифровая звуковая рабочая станция (Digital Audio Workstation);
DTS - система цифрового (домашнего) кинотеатра (Digital Theater System);
DTS-HD - расширенная система кодирования аудио HD (Extended DTS-HD Audio Coding System);
DTS-UHD - система кодирования звука UHD (DTS-UHD Audio Coding System);
DVB - цифровое телевизионное вещание (Digital Video Broadcasting);
HD - стандарт качества видеозаписи, обеспечивающий более четкое изображение по сравнению с обычным разрешением (High Definition);
HE-AAC - высокоэффективное AAC (High Efficiency Advanced Audio Coding);
HEVC - высокоэффективное кодирование видео (High Efficiency Video Coding);
HTTP - протокол передачи гипертекста (Hyper Text Transfer Protocol);
IP - интернет-протокол (Internet Protocol);
ISO - Международная организация по стандартизации (International Standards Organizations);
ISOBMFF - базовый формат медиафайла ISO (ISO Base Media File Format);
MIME - многоцелевое расширение интернет-почты (Multipurpose Internet Mail Extensions);
MPD - презентация медиа (Media Presentation Description);
MPEG - наименование группы стандартов кодирования и передачи цифровой видео- и аудиоинформации (Moving Pictures Expert Group);
MPEG-H - аудиокодек следующего поколения (MPEG-H Audio Stream);
MSB - старший значащий бит (Most Significant Bit);
NGA - технология формирования компонентного звука (Next Generation Audio);
SAP - точка доступа к потоку битов (Stream Access Point);
URI - универсальный идентификатор ресурса (Uniform Resource Identifier);
URL - универсальный локатор ресурса (Uniform Resource Locator);
URN - унифицированное имя ресурса (Uniform Resource Name);
XML - расширяемый язык разметки (eXtensible Markup Language).
4 Параметры динамической адаптивной потоковой передачи файлов медиа средствами HTTP по сетям с IP
DASH средствами HTTP использует язык разметки XML и потоки битов, которые обеспечивают непрерывную доставку медиа контента от стандартных HTTP к серверу пользователя и позволяют буферизировать контент с помощью стандартных буферов HTTP.
Характеристики профиля DASH файлов медиаслужб MPEG DVB средствами HTTP по сетям с IP приведены в ГОСТ Р 59806-2021 (подраздел 4.1).
Модель данных DASH медиа основана на параметрах медиа, содержащих последовательность периодов, иерархически связанных с нижеперечисленными элементами потока данных:
- преселекция аудио.
Примечание - Преселекция аудио является эквивалентом аудиоуслуг в предшествующих системах, в которых каждая аудиоуслуга содержит полный микс аудио;
- набор адаптации;
- репрезентация;
- сегмент инициализации;
- сегмент медиа;
- субсегмент медиа.
Сегмент является единицей данных, имеющей URL-адрес, который можно получить по запросу HTTP.
Сегментированные репрезентации содержат сегменты инициализации с метаданными репрезентации, и сегменты медиа с выборками медиа.
Параметры медиа являются набором данных, доступных DASH для предоставления пользователю услуги потоковой передачи. Презентация медиа содержится в описании MPD.
MPD содержит метаданные, необходимые DASH для создания соответствующих URL-адресов HTTP и доступа к сегментам для представления пользователю услуг потоковой передачи.
Требования к элементам презентации медиа в потоке битов при DASH установлены в ГОСТ Р 59806-2021 (подраздел 4.2). Требования к форматам презентаций, периодов и сегментов при DASH установлены в ГОСТ Р 59806-2021 (подраздел 4.3). Правила применения атрибутов и элементов в наборах адаптаций и презентаций при DASH установлены в ГОСТ Р 59806-2021 (подраздел 4.4). Требования к параметрам MPD и сегментов при DASH установлены в ГОСТ Р 59806-2021 (подраздел 4.5).
5 Параметры динамической адаптивной потоковой передачи файлов аудио
Параметры DASH аудио, согласно таблице 1, определяют элементы и атрибуты репрезентаций, размещенных в наборе адаптации аудио и не относящихся к репрезентациям вспомогательных потоков NGA.
Таблица 1
Элементы и атрибуты репрезентаций аудио
в наборе адаптации аудио
Атрибут
Назначение параметра
Отношение параметра к репрезентациям
@mimeType
Определяет тип MIME соединения сегмента инициализации (при наличии) и всех последующих сегментов медиа в репрезентации, например "аудио/mp4"
Параметр должен быть общим для всех репрезентаций в наборе адаптации
@codecs
Определяет тип кодека для репрезентации, например "mp4a.40.5" для формата HE-AAC
Параметр должен быть общим для всех репрезентаций в наборе адаптации для обеспечения плавного перехода между репрезентациями аудио (см. примечание 1)
@audioSampling-Rate
Определяет частоту дискретизации на выходе кодека, Гц, например "48 000" для 48 кГц
Параметр должен быть общим для всех репрезентаций в наборе адаптации для обеспечения плавного перехода между репрезентациями аудио (см. примечание 1)
AudioChannel-Configuration
Определяет конфигурацию канала аудио и расположение каналов аудио в пространстве, например: моно, стерео или объемный звук
Параметр должен быть общим для всех репрезентаций в наборе адаптации для обеспечения плавного перехода между репрезентациями аудио (см. примечания 1 и 2)
Примечания
1 Параметры процесса переключения репрезентаций аудио определены в приложении А.
2 Все наборы адаптации, которые ссылаются на вспомогательные звуковые потоки, должны включать дескриптор преселекции EssentialProperty.
Идентификация наборов адаптации (при наличии в потоке битов элементов преселекции) выполняется включением в каждый набор адаптации аудиосхемы Role и дескриптора Accessibility (для случаев применения кодеков NGA: AC-4-1, DTS-UHD, MPEG-H Audio).
При отсутствии в потоке битов элементов преселекции каждый набор адаптации аудио должен включать в себя не менее одного элемента Role, использующего схему "urn:mpeg:dash:role:2011".
Наличие атрибута @value со значением "main" указывает проигрывателю, что набор адаптации аудио, по мнению провайдера контента, является предпочтительным. При наличии атрибута @value только со значением "main" набор адаптации аудио применяется по умолчанию.
Если презентация DASH содержит более одного набора адаптации аудио, то один из них должен иметь атрибут @value со значением "main". Если презентация DASH имеет несколько наборов адаптации с дескриптором @value со значением "main", то наборы адаптации аудио должны отличаться другими атрибутами, содержащимися в MPD, например @lang или @codecs или дескриптор AudioChannelConfiguration.
Если в репрезентации DASH есть только один набор адаптации аудио и он имеет атрибут @value со значением "main", то элемент Role может отсутствовать.
При наличии в программе нескольких наборов адаптации аудио с однотипными кодеками, со звуковой дорожкой на языке оригинала и со звуковыми дорожками на разных языках для основного языка должен быть установлен атрибут @value со значением "main", для всех остальных языков значение атрибута @value должно быть "dub".
При наличии в программе нескольких наборов адаптации аудио с одинаковыми типами кодеков, но с разными оригинальными звуковыми дорожками на разных языках (например, спортивная игра, комментируемая несколькими комментаторами на нескольких языках), все наборы адаптации аудио каждого языка должны иметь атрибут @value со значением "main". Проигрыватели должны оценивать атрибут @lang набора адаптации для подтверждения языка аудио, соответствующего языку, который выбирает пользователь. Требования к проигрывателю установлены в ГОСТ Р 59806-2021 (подраздел 4.7).
Если программа содержит несколько наборов адаптации аудио нескольких кодеков с одной и той же исходной программой аудио на одном языке, то провайдер контента может установить несколько наборов адаптации с атрибутом @value со значением "main" для того, чтобы проигрыватель мог выбрать необходимый набор адаптации.
При использовании более одной схемы Role применяются несколько элементов Role.
В таблице 2 приведены варианты использования дескрипторов схемы Role и дескриптора Accessibility, позволяющие идентифицировать наборы адаптации, содержащие AD и потоки чистого аудио. Для приема аудио, микшированного ассоциированным аудио, должен использоваться атрибут @dependencyId, указывающий на зависимость набора адаптации от связанных репрезентаций и обозначающий, что ассоциированный поток аудио не должен предоставляться в формате независимой репрезентации.
Таблица 2
Значения дескрипторов Role и Accessibility для программ,
содержащих AD и CA
Элемент
Схема Role
Дескриптор Accessibility
Вещание микс AD
@schemeIdUri =
"urn:mpeg:dash:role:201
"1" @value = "alternate"
@schemeIdUri = "urn:tva:metadata:cs:AudioPurpose
CS:2007" @value = "1" для пользователей со слабым зрением
Прием микс AD
@schemeIdUri =
"urn:mpeg:dash:role:2011"
@value = "commentary"
@schemeIdUri = "urn:tva:metadata:cs:AudioPurposeCS:2007"
@value = "1" для пользователей со слабым зрением
Чистое аудио
@schemeIdUri =
"urn:mpeg:dash:role:2011"
@value = "alternate"
@schemeIdUri = "urn:tva:metadata:cs:AudioPurposeCS:2007" @value = "2" для пользователей со слабым зрением
Проигрыватель должен игнорировать потоки аудио с атрибутами схемы Role и дескриптора Accessibility, которые не соответствуют перечисленным требованиям.
В таблице 3 приведены варианты использования дескрипторов в соответствии с требованиями настоящего раздела.
Таблица 3
Примеры использования схемы Role, дескриптора Accessibility,
атрибута @codecs, частоты дискретизации @audio, конфигурации
канала аудио, атрибута @lang, элементов схемы Role
и дескриптора Accessibility, атрибута @value наборов
адаптации аудио
Вариант использования
Профиль вещания аудио
Атрибут @codecs
Частота дискретизации @audio
Конфигурация канала аудио
Атрибут @lang
Атрибут @value элемента схемы Role
Атрибут @value элемента дескриптора Accessibility
Звуковая дорожка (саундтрек)
HE-AAC
mp4a.40.5
48 кГц
стерео
en
main
Не применяется
HE-AAC
mp4a.40.5
48 кГц
стерео
fr
dub
Не применяется
HE-AAC
mp4a.40.5
48 кГц
стерео
de
dub
Не применяется
Конфигурация презентации аудио
AC-3
5.1 кан
ec-3
48 кГц
5.1 кан
de
main
Не применяется
AC-3
2.0 кан
ec-3
48 кГц
стерео
de
alternate
Не применяется
AC-3
7.1 кан
ec-3
48 кГц
7.1 кан
de
alternate
Не применяется
Профиль кодирования аудио
AC-3
ec-3
48 кГц
5.1 кан
en
main
Не применяется
DTS-HD
dtsh
48 кГц
5.1 кан
en
main
Не применяется
HE-AAC
mp4a.40.5
48 кГц
5.1 кан
en
alternate
Не применяется
AAC
mp4a.40.2
44,1 кГц
стерео
en
main
Не применяется
AC-3
ec-3
48 кГц
7.1 кан
en
alternate
Не применяется
DTS-HD
dtsh
192 кГц
5.1 кан
en
alternate
Не применяется
AD с вещанием микс AD
DTS-HD
dtsh
48 кГц
5.1 кан
en
main
Не применяется
DTS-HD
dtsh
48 кГц
5.1 кан
en
alternate
1
Чистое аудио
AC-3
mp4a.40.2
48 кГц
стерео
de
main
Не применяется
AC-3
mp4a.40.2
48 кГц
стерео
de
alternate
2
Перечень кодеков
AC-3
ec-3
48 кГц
5.1 кан
en
main
Не применяется
DTS-HD
dtsh
48 кГц
5.1 кан
en
main
Не применяется
ИС NORMPROD: примечание.
В официальном тексте документа, видимо, допущена опечатка: примечание отсутствует.
AC-3
ec-3
48 кГц
5.1 кан
fr
main dub (см. примечание)
Не применяется
AAC
mp4a.40.2
44,1 кГц
стерео
en
alternate
Не применяется
AAC
mp4a.40.2
44,1 кГц
стерео
fr
alternate
Не применяется
6 Параметры динамической адаптивной потоковой передачи файлов аудио в форматах кодирования AC-3 и AC-4-1
Параметры сигнализации и инкапсуляции BMFF кодеков аудио в формах кодирования AC-3 и AC-4-1 должны соответствовать таблице 4.
Таблица 4
Параметры сигнализации и инкапсуляции BMFF кодеков аудио
в форматах кодирования AC-3 и AC-4-1
Тип кодека
Тип MIME
Атрибут кодека
Параметры инкапсуляции
Тип SAP
AC-3
audio/mp4
ec-3
ISOBMFF
1
AC-4-1
audio/mp4
ac-4.aa.bb.cc
ISOBMFF
1
В соответствии с таблицей 4 значение атрибута кодека для формата кодирования AC-4-1 должно состоять из "ac-4" и трех последующих элементов "aa.bb.cc", состоящих из двузначных шестнадцатеричных чисел.
В формате кодирования AC-4-1 должны использоваться I-кадры (кадры синхронизации). Каждый фрагмент репрезентации должен начинаться с кадра синхронизации.
В форматах кодирования AC-3 и AC-4-1 конфигурация канала аудио использует схему URI "tag:dolby.com,2014:dash:audio_channel_configuration:2011".
Атрибут @value содержит четырехзначное шестнадцатеричное представление 16-битного поля, описывающего назначение, в котором левый канал маркируется в формате MSB. Например, для потока битов с L, C, R, Ls, Rs, LFE значение должно быть "F801" (шестнадцатеричный эквивалент двоичного значения 1111 1000 0000 0001).
Приложение А
(справочное)
ПАРАМЕТРЫ ПРОЦЕССА ПЕРЕКЛЮЧЕНИЯ РЕПРЕЗЕНТАЦИЙ АУДИО
Параметры процесса переключения репрезентаций аудио определяются при условии, что проигрыватели будут переключаться между репрезентациями для оптимизации качества презентации при изменении условий передачи потока битов в сети.
Переключения репрезентаций должны выполняться без помех в программе аудио, заметных для пользователя.
Проигрыватели должны поддерживать бесшовное переключение между презентациями аудио, отличающимися скоростями передачи.
Презентацию аудио считают бесшовной при следующих условиях:
- отсутствие слышимых щелчков или перерывов в программе аудио;
- отсутствие пауз, потерянных или лишних звуков;
- наличие синхронизации во времени с другими потоками медиа (например, видео или дополнительным звуком).
Частые переключения репрезентаций предпочтительнее завершения презентации аудио.
Приложение Б
(справочное)
ПРИМЕНЕНИЕ ПРОФИЛЕЙ КОДИРОВАНИЯ АУДИО
Б.1 Декодеры профилей для расширенных наборов адаптации в форматах кодирования AC-3 и AC-4-1 декодируют потоки битов стереосигнала с типичными скоростями передачи данных согласно таблице Б.1.
Таблица Б.1
Стандартные скорости передачи стереосигнала для расширенных
наборов адаптации в форматах кодирования AC-3 и AC-4-1
(случаи работы с нормальным качеством показаны
в квадратных скобках)
Профиль
Тип кодека
Скорость передачи данных, Кбит/с
AC-3
ec-3
-
-
64
[96]
[128]
160
AC-4-1
ac-4
32
48
64
89
-
-
Число каналов аудио для воспроизведения определяется реализацией устройства рендеринга.
Примечание - Потоки битов AC-3 и AC-4-1 не ограничены стереофоническим или 5.1-канальным аудио. В качестве примеров в таблицах Б.1 и Б.2 представлены типичные скорости передачи данных для стереофонических и 5.1-канальных презентаций (цифровое объемное звучание 5.1 в форматах Dolby Digital <*> AC-3 и DTS).
--------------------------------
<*> Система цифрового многоканального звука, разработанная фирмой "Dolby Laboratories, Inc.".
Декодеры профилей в форматах кодирования AC-3 и AC-4-1 декодируют потоки битов объемного звучания 5.1 в соответствии с таблицей Б.2.
Таблица Б.2
Стандартные скорости передачи данных объемного звучания 5.1
для наборов адаптации в форматах кодирования AC-3 и AC-4-1
(случаи работы с нормальным качеством показаны
в квадратных скобках)
Профиль
Тип кодека
Скорость передачи данных, Кбит/с
AC-3
ec-3
-
128
160
[192]
[224]
[256]
320
384
AC-4-1
ac-4
96
128
160
192
-
-
-
-
Б.2 Непрерывность обслуживания в формате объемного звучания обеспечивается возможностью кодера AC-3 применять доступную скорость многоканального потока битов для передачи стереопаре каналов (при постоянном режиме кодирования) и исключения возможности разрыва процесса вещания аудио/видеоприемником во время изменения режима кодирования.
Б.3 Коммутация потоков и задержка кодирования при применении кодеков AC-3 и AC-4-1 обеспечивают максимальную эффективность кодирования, предоставляя возможность плавного переключения на системном уровне.
Потоки битов AC-3 содержат информацию о конфигурации аудиоканалов и скоростях передачи данных. Кодеры AC-3 и AC-4-1 обеспечивают постоянную задержку кодирования для предусмотренных конфигураций аудиоканалов и переключение между разными потоками AC-3 или AC-4-1 с возможными конфигурациями кодирования звука, например на границах периодов без компенсации задержки кодирования. Таким образом, упрощается процесс создания контента при использовании различных принципов кодирования контента для различных наборов адаптации или периодов (например, для различных программ или компонентов программ).
Формат кодирования AC-4-1 обеспечивает адаптацию частот кадров аудио и видео. Функция выравнивания кадров аудио и видео AC-4-1 в сочетании со статической задержкой, вносимой AC-4-1, используется для устранения проблем на системном уровне, возникающих в сценариях переключения, без внесения артефактов звуковыми паузами или дополнительными звуками.
Потоки битов AC-4-1 должны кодироваться с частотой кадров соответствующего видео. Процесс кодирования контента в формате AC-4-1 должен обеспечивать совпадение во времени аудио и соответствующих видеокадров.
Для обеспечения синхронного переключения I-кадры AC-4-1 должны быть синхронизированы во времени с I-кадрами видео.
УДК 621.397.132.129: 006.354
ОКС 33.170
Ключевые слова: телевидение вещательное цифровое, динамическая адаптивная потоковая передача, передача звука в формате кодирования HEVC средствами протокола HTTP по сетям с IP, основные параметры, аудио, презентация, преселекция, репрезентация, контент, проигрыватель



Вернуться в "Каталог нормативных документов"