Самый простой звуковой формат?

Я читал о растровых изображениях. Это один из наиболее простых форматов изображений (особенно однобитовых растровых изображений). Мне интересно посмотреть, как выглядит звуковой файл. Может кто-нибудь посоветует мне самый простой формат звукового файла?

Благодарность

Собственно, я нашел эту ссылку на wav файл . Если у кого-то еще есть какие-либо другие ссылки / мудрые слова, которые они хотели бы опубликовать, я был бы признателен.

Ответов (10)

Загляните в libsndfile http://www.mega-nerd.com/libsndfile/

Есть еще одно хорошее объяснение базового формата WAVE:
https://ccrma.stanford.edu/courses/422/projects/WaveFormat/
Я использовал его для реализации чтения / записи WAV на C# с нуля без каких-либо проблем.
PS AudioFormat равен 1 для целых значений и 3 для чисел с плавающей запятой.

В случае сжатия ogg - это наиболее сжатый формат

В случае простоты я думаю, что файлы wav самые простые

Как уже упоминалось, файлы WAV не самые простые и содержат заголовок.

1-битный звук с ШИМ (широтно-импульсной модуляцией) можно считать самым простым в относительном выражении по сравнению с 1-битным кодированным растровым изображением.

Принцип тот же, хотя и в двух измерениях для растрового изображения, в отличие от одного измерения для звука.

Подробнее о широтно-импульсной модуляции в Википедии

Подарочные карты со звуком и любая дешевая игрушка, которая воспроизводит звук, используют методы кодирования звука PWM, обычно с пьезоэлектрическим преобразователем (динамиком).

Проверьте аудиоформат RAW.

Если это 8 бит, то его проще всего обработать.

https://en.wikipedia.org/wiki/Raw_audio_format

Подобно репрессии однобитового изображения, вы можете представлять аудио одним битом, только проблема в том, что вы не сможете ничего от него услышать. Поскольку для того, чтобы слышать звуки, волна изменения давления должна исходить от устройства (наушников / динамиков), это не соответствует действительности. Это в основном связано с тем, что звук является продолжением медиа, а графика - неподвижным медиа.

Вы можете представлять аудио с менее чем 8 битами на отсчет и меньшим количеством отсчетов в секунду. Где вы изобразите это с более низким разрешением и потерянными более высокими частотами соответственно. Например, если вы используете 8 бит для представления каждой выборки, ограничение отношения сигнал / шум (SNR) составляет 50 дБ. Размещая 8000 выборок в секунду, можно представить полосу пропускания до 4 кГц (качество звука старой телефонии).

С другой стороны, если вы представляете каждый сэмпл с 16 битами и 44 100 сэмплами в секунду, мы получаем звук CD-качества.
В необработанном виде количество битов и выборок снижается в зависимости от ожиданий пользователя, аналогично тому, насколько низкое разрешение изображения приемлемо для пользователя.

Сжатие звука используется для уменьшения количества битов, используемых в сэмплах, а также количества сэмплов. Они основаны на методах сжатия, таких как файлы ZIP, а также на CELP (линейное предсказание с кодовым возбуждением) http://en.wikipedia.org/wiki/Code-excited_linear_prediction mp3, AMR-nb - это алгоритмы, которые используют эти методы.

Файлы WAV довольно просты. Они просто состоят из нескольких 8, 16 или 32-битных целых чисел, которые указывают «высоту» (координату Y) волны в данный момент времени. Например, прямоугольная волна в 8-битном WAV может выглядеть так:

00 FF 00 FF 00

Это, конечно, сильно упрощено.

Волновые файлы - это самый простой звуковой формат. У них есть заголовок (который иногда может быть сложным, но обычно таковым не является), а затем фактические звуковые данные представляют собой необработанный несжатый PCM. Но поскольку они несжатые, они очень быстро становятся очень большими даже для умеренно длинных звуков.

8-битный моно несжатый WAV, на мой взгляд ...

запись в Википедии

WAV - это путь, хотя будьте осторожны - формат файла WAV может фактически хранить сжатые данные, хотя обычно это не так.

Недавно я использую Audacity для импорта необработанных звуковых данных из системы микроконтроллера. Он также может экспортировать необработанный звук.

Таким образом, вы можете начать со звука практически в любом формате и экспортировать его как двоичный файл по своему желанию. Например, я использую 16-битный звук с прямым порядком байтов, моно звук. Очень удобно и очень легко манипулировать в простых тестовых программах. Возможно, даже можно десериализовать его на некоторых языках программирования в массив или вектор.

-Адам