Глава 4 - Основы звука

netlib.narod.ru	< Назад \| Оглавление \| Далее >

Основы звука

Издает ли шум дерево, которое падает в лесу, где его никто не может услышать? Хотя часто этот вопрос считают провокационным, он имеет смысл. Звук — это просто волны идущие через среду, такую как воздух. С практической точки зрения, эти волны ничто, пока они не достигнут уха и не воздействуют на барабанную перепонку, воспроизводя звук.

Большинство природных звуков представляют собой «чистую» волну, для которой вы можете ясно видеть шаблон, которому она следует. Синусоидальная волна (sine wave) — это хороший пример «чистой» волны; ее спады и подъемы чередуются по постоянному шаблону. Другие волны, такие как голос человека, более сложны — спады и подъемы чередуются очень быстро, не следуя какому-либо шаблону. На рис. 4.1 показаны две различных звуковых волны.

Рис. 4.1. Звуковые волны могут иметь простую, чистую форму или могут быть очень сложными

У каждого звука есть уникальные свойства, такие как амплитуда (уровень громкости) и частота. Вы можете в течение времени записывать свойства звуков, чтобы сохранить их в цифровой форме и потом воспроизвести.

Кроме того, вы можете использовать эти звуки музыки, например, для того, чтобы играть композиции на вашем компьютере. Записав звуки, скажем, фортепьяно и скрипки, вы можете практически неотличимо воспроизводить реальные песни. Вообразите, что кто-то играет пьесу Моцарта, и нельзя отличить — реальный это оркестр или его компьютерный двойник!

Цифровая звукозапись

Основы цифровой записи и воспроизведения звуков не слишком сложны для понимания. В общем случае вы берете звук, скажем, продолжительностью в две секунды, и исследуете звуковую волну от начала до конца с определенной периодичностью (частотой выборки или частотой дискретизации, sampling rate), которая измеряется в Герцах (Гц).

Скажем, вы хотите выполнить запись двухсекундного звука с частотой дискретизации 11 025 Гц, значит звук будет разделен на 22 050 фрагментов (по 11 025 фрагментов в секунде). Эти фрагменты называются выборками (samples). Для каждой выборки вы определяете амплитуду звуковой волны в месте нахождения выборки, измеряя таким образом уровень громкости в определенный момент времени. Вы записываете полученное значение и переходите к следующей выборке. Записав уровень громкости для каждой выборки волны, вы получите цифровое представление звука.

На рис. 4.2 показана звуковая волна, разбитая на несколько выборок. При оцифровке звук теряет свою «волновую» форму. Оцифрованная волна не сохраняет форму оригинальной волны, поскольку для точного воссоздания оригинальной волны количества выборок недостаточно.

Рис. 4.2. Оригинальная волна на рисунке слева разбивается на несколько выборок. Вы используете эти выборки для создания цифрового представления звука, показанного на рисунке справа

Ясно, что чем выше частота дискретизации, использовавшаяся при захвате звуковой волны, тем точнее вы можете воссоздать исходный звук. «Какая частота дискретизации лучше» спрашиваете вы? У меня нет точного ответа для вас, это зависит от необходимого вам уровня качества, и обычно используются значения 8 000 Гц, 11 025 Гц, 22 050 Гц и 44 100 Гц. Последнее значение используется при записи музыки на компакт-диски и, предполагается, что оно обеспечивает наилучшее качество.

Следующая вещь, которую необходимо понимать — хранение (storage). Захватывая выборку из волны вы получаете число, величина которого представляет амплитуду. Вы можете выбрать, хранить ли это значение как 8-разрядное, или как 16-разрядное. Это означает, что вы можете сохранять 256 уровней при использовании 8-разрядной выборки, или 65 536 уровней при использовании 16-разрядной выборки.

Выбирайте большее значение, чтобы у вас было больше уровней для репликации. 8-разрядные выборки должны использоваться только для низкокачественных звуков. Всегда старайтесь использовать 16-разрядный звук; даже несмотря на то, что его размер в два раза больше — он того стоит.

И, наконец, вы должны решить сколько каналов использовать. Стереофонические звуки (те, которые по-разному звучат с левой и с правой сторон) используют два канала. Монофонические звуки используют только один канал; следовательно со всех сторон слышен один и тот же звук.

Вы можете хранить цифровые звуки различными способами и использовать для них различные методы шифрования и сжатия. Я обычно храню их в несжатом формате волновых файлов Windows (.WAV), потому что это наиболее популярный (и лучше всего поддерживаемый) способ хранения звука.

Простейший волновой файл содержит единственный звук, которому предшествует описывающий данные заголовок. Win32 SDK предоставляет набор функций для работы с волновыми файлами, так что имея дело с ними вы можете обратиться к документации за дополнительной информацией.

Музыкальное безумие

Музыка принимает множество форм, и вы можете записывать и воспроизводить ее различными способами. Технологические достижения позволили нам наслаждаться музыкой, которая использует цифровые звуки, что увеличивает наш слушательский опыт.

Музыка — ни что иное, как последовательность нот, воспроизводимых и останавливаемых в разное время с разными амплитудами. Для воспроизведения одной песни могут использоваться различные инструменты, но все они действуют одинаково — пользуясь нотами. Когда вы пишете песню на компьютере, то сохраняете ноты, а затем воспроизводите их, используя звуковую карту.

MIDI

Формат MIDI (идентифицируемый по расширению .MID) — это стандарт для хранения музыкальных партитур. Файлы MIDI содержат сообщения, или инструкции, необходимые для воспроизведения песни. Эти инструкции сообщают звуковому оборудованию что и когда делать, в том числе, когда и как начинать и завершать ноту, менять темп, использовать другой инструмент и т.д.

MIDI предоставляет до 128 стандартизованных инструментов, позволяя вам, например, составлять песню, используя инструмент 0 (который представляет пианино). Когда другие люди будут слушать песню, их устройство воспроизведения гарантирует, что играть будет указанный инструмент.

Песни делятся на треки, и каждый трек содержит ноты, воспроизводимые одним инструментом. В одном файле может быть до 128 треков, а длина их не ограничена. Это обещает самое настоящее музыкальное безумие!

MIDI-песни могут воспроизводить не только компьютеры; есть музыкальные инструменты с поддержкой MIDI, такие как синтезаторы. Верно. Вы можете подключить компьютер к такому музыкальному инструменту и получить устройство, воспроизводящее для вас инструментальные данные.

DirectMusic

Формат DirectMusic похож на формат MIDI; однако формат DirectMusic добавляет больше функциональных возможностей, таких как возможность создавать динамические музыкальные последовательности, генерируя согласованные уникальные музыкальные события. Во время воспроизведения вы можете менять аккорды, темп и инструменты, создавая таким образом мощную систему.

Музыкальные сегменты (segments) DirectMusic (собственно файлы песен) используют расширение файлов .SGT. Связанные с сегментами файлы включают оркестры (band, расширение .BND), содержащие информацию об инструментах, карты аккордов (chordmap, расширение .CDM), содержащие аккорды для смены воспроизведения, стили (style, расширение .STY) для создания стилей воспроизведения, и шаблоны (template, расширение .TPL) для конструирования музыкальных сегментов.

Когда вы конструируете песню DirectMusic, все необходимые файлы обрабатываются DirectMusic автоматически (поэтому я ссылаюсь на песни DirectMusic, как на родной (native) формат). Это означает, что вы будете иметь дело только с файлами сегментов.

MP3

MIDI достаточно мощный в своей области, и единственный недостаток — необходимость использовать синтез для репликации инструментов во время воспроизведения. Поскольку MIDI хранит только информацию о нотах, компьютер должен воспроизводить ноты, используя звуковое оборудование. Хотя достижения производящей аппаратуру индустрии сделали возможным очень точное воспроизведение звуков инструментов, существуют ситуации, когда вам нужна не синтезированная, а реальная записанная музыка. Здесь на сцену выходит MP3 (это сокращение для MPEG Layer 3).

Файл формата MP3, определяемый по расширению файла .MP3, — это звуковой файл, чем-то похожий на файл .WAV. Главное различие в том, что файлы .MP3 могут сжимать звуковые данные, уменьшая их размер без заметного ухудшения качества. Альбом с компакт-диска, занимающий обычно около 700 мегабайт необработанных звуковых данных, может быть сжат до размера в 40 мегабайт! Так что вместо прослушивания синтезированных музыкальных инструментов, вы можете выбрать реальную музыку за счет небольшого увеличения объема занимаемой памяти и возросшей нагрузки на процессор.

Возможность воспроизводить файлы MP3 предоставляет DirectShow — мультимедийный источник энергии Microsoft DirectX. Хотя DirectShow может воспроизводить практически любой мультимедйиный файл, который вы ему предоставите, включая звуковые и видеозаписи, я буду использовать DirectShow только для воспроизведения звуковых файлов.


netlib.narod.ru	< Назад \| Оглавление \| Далее >

Сайт управляется системой uCoz