Ovoz sifati va u nimaga bog'liq. Ovozli ma'lumotni kodlash Raqamlangan ovozning sifati qanday

Inson qulog'i tovushni sekundiga 20 tebranishdan (past tovush) 20 000 tebranishgacha (yuqori tovush) chastotalarda qabul qiladi.

Inson tovushni juda katta intensivlik diapazonida idrok eta oladi, bunda maksimal intensivlik minimaldan (yuz ming milliard marta) 10 14 marta ko'pdir. Ovoz balandligini o'lchash uchun maxsus birlik ishlatiladi "desibel"(dbl) (5.1-jadval). Ovoz balandligining 10 dbl ga kamayishi yoki ortishi tovush intensivligining 10 marta kamayishi yoki oshishiga to'g'ri keladi.

Ovozning vaqt namunasi. Kompyuter tovushni qayta ishlash uchun, vaqt namunasi yordamida uzluksiz audio signal raqamli diskret shaklga aylantirilishi kerak. Uzluksiz tovush to'lqini alohida kichik vaqtinchalik bo'limlarga bo'linadi va har bir bunday bo'lim uchun tovush intensivligining ma'lum bir qiymati o'rnatiladi.

Shunday qilib, tovush hajmining A(t) vaqtiga uzluksiz bog'liqligi ovoz balandligi darajalarining diskret ketma-ketligi bilan almashtiriladi. Grafikda bu silliq egri chiziqni "qadamlar" ketma-ketligi bilan almashtirishga o'xshaydi (1.2-rasm).


Guruch. 1.2. Audio vaqt namunasi

Namuna olish chastotasi. Ovoz kartasiga ulangan mikrofon analog audioni yozib olish va uni raqamli shaklga o'tkazish uchun ishlatiladi. Olingan raqamli tovushning sifati vaqt birligida ovoz balandligi darajasining o'lchovlari soniga bog'liq, ya'ni. namuna olish stavkalari. Bir soniyada qanchalik ko'p o'lchovlar amalga oshirilsa (namuna olish chastotasi qanchalik baland bo'lsa), raqamli audio signalning "narvon" dialog signalining egri chizig'ini qanchalik aniqroq kuzatib boradi.

Audio namuna olish tezligi- bir soniyada ovoz balandligi o'lchovlari soni.

Ovozni tanlash tezligi sekundiga 8000 dan 48000 gacha tovush hajmini o'lchashi mumkin.

Audio kodlash chuqurligi. Har bir "qadam" ma'lum bir ovoz balandligi darajasi bilan belgilanadi. Ovoz balandligi darajalarini N mumkin bo'lgan holatlar to'plami sifatida ko'rib chiqish mumkin, ularni kodlash ma'lum miqdordagi ma'lumotni I talab qiladi, bu tovush kodlash chuqurligi deb ataladi.

Audio kodlash chuqurligi raqamli audioning diskret tovush darajalarini kodlash uchun zarur bo'lgan ma'lumotlar miqdori.

Agar kodlash chuqurligi ma'lum bo'lsa, u holda raqamli ovoz balandligi darajalari sonini N = 2 I formulasi yordamida hisoblash mumkin. Ovozni kodlash chuqurligi 16 bit bo'lsin, keyin ovoz balandligi darajalari soni teng bo'ladi:

N = 2 I = 2 16 = 65,536.

Kodlash jarayonida har bir ovoz balandligi darajasiga o'zining 16 bitli ikkilik kodi beriladi, eng past ovoz darajasi 0000000000000000 kodiga, eng yuqori darajasi esa 1111111111111111 kodiga to'g'ri keladi.

Raqamli ovoz sifati. Ovozning chastotasi va namuna olish chuqurligi qanchalik baland bo'lsa, raqamlashtirilgan ovozning sifati shunchalik yuqori bo'ladi. Telefon aloqasi sifatiga mos keladigan raqamlashtirilgan ovozning eng past sifati sekundiga 8000 marta namuna olish tezligi, 8 bit chuqurlik va bitta audio trekni yozish (mono rejim) bilan olinadi. Audio CD sifatiga mos keladigan eng yuqori sifatli raqamli audioga sekundiga 48 000 marta namuna olish tezligi, 16 bitli namuna olish chuqurligi va ikkita audio trekni yozib olish (stereo rejim) bilan erishiladi.

Shuni esda tutish kerakki, raqamli ovozning sifati qanchalik baland bo'lsa, ovoz faylining ma'lumot hajmi shunchalik katta bo'ladi. Ovoz davomiyligi 1 soniya bo'lgan raqamli stereo audio faylining axborot hajmini o'rtacha ovoz sifati bilan (16 bit, soniyada 24 000 o'lchov) baholashingiz mumkin. Buning uchun kodlash chuqurligini 1 soniyadagi o'lchovlar soniga ko'paytirish va 2 ga (stereo tovush) ko'paytirish kerak:

16 bit × 24 000 × 2 = 768 000 bit = 96 000 bayt = 93,75 KB.

Ovoz muharrirlari. Ovoz muharrirlari nafaqat ovozni yozib olish va ijro etish, balki uni tahrirlash imkonini beradi. Raqamlangan tovush tovush muharrirlarida vizual shaklda taqdim etiladi, shuning uchun audio trek qismlarini nusxalash, ko'chirish va o'chirish operatsiyalari sichqoncha yordamida osonlik bilan amalga oshirilishi mumkin. Bundan tashqari, siz audio treklarni bir-birining ustiga qo'yishingiz (tovushlarni aralashtirish) va turli akustik effektlarni qo'llashingiz mumkin (aks-sado, teskari o'ynatish va boshqalar).

Ovoz muharrirlari namuna olish tezligi va kodlash chuqurligini o'zgartirish orqali raqamli audio sifatini va audio fayl hajmini o'zgartirishga imkon beradi. Raqamlangan audio audio fayllarda universal formatda siqilmagan holda saqlanishi mumkin WAV yoki siqilgan formatda MP3.

Ovozni siqilgan formatlarda saqlashda inson idroki uchun "ortiqcha" bo'lgan va yuqori intensivlikdagi tovush chastotalari bilan vaqtga to'g'ri keladigan past intensivlikdagi tovush chastotalari o'chiriladi. Ushbu formatdan foydalanish ovozli fayllarni o'nlab marta siqish imkonini beradi, lekin ma'lumotlarning qaytarilmas yo'qolishiga olib keladi (fayllarni asl shakliga qaytarish mumkin emas).

Nazorat savollari

1. Namuna tezligi va kodlash chuqurligi raqamli audio sifatiga qanday ta'sir qiladi?

Mustaqil bajarish uchun topshiriqlar

1.22. Tanlangan javob vazifasi. Ovoz kartasi analog audio signalning ikkilik kodlashini ishlab chiqaradi. Signal intensivligining 65 536 ta mumkin bo'lgan har bir darajasini kodlash uchun qancha ma'lumot kerak?
1) 16 bit; 2) 256 bit; 3) 1 bit; 4) 8 bit.

1.23. Batafsil javob bilan topshiriq. Kodlash chuqurligida 10 soniya davom etadigan raqamli audio fayllarning axborot hajmini va minimal va maksimal ovoz sifatini ta'minlaydigan audio signallarni tanlash chastotasini hisoblang:
a) mono, 8 bit, sekundiga 8000 o'lchov;
b) stereo, 16 bit, soniyada 48 000 o'lchov.

1.24. Batafsil javob bilan topshiriq. 3,5 dyuymli floppi diskga sig'adigan ovoz faylining davomiyligini aniqlang (esda tutingki, bunday floppi diskda ma'lumotlarni saqlash uchun har biri 512 baytdan iborat 2847 sektor ajratilgan):
a) past ovoz sifati bilan: mono, 8 bit, soniyada 8000 o'lchov;
b) yuqori ovoz sifati bilan: stereo, 16 bit, soniyada 48 000 o'lchov.

Dars" "

Ovozni ifodalashning analog va diskret usullari

Axborot, jumladan, grafik va audio, analog yoki diskret shaklda taqdim etilishi mumkin.

Misol audio ma'lumotlarni analog saqlash vinil yozuvidir (tovush treki o'z shaklini doimiy ravishda o'zgartiradi) va diskret - audio kompakt disk (uning audio treki turli aks ettiruvchi bo'limlarni o'z ichiga oladi).

Insonning tovushni idrok etishi

Ovoz to'lqinlari eshitish organi tomonidan ushlanib, undagi tirnash xususiyati keltirib chiqaradi, bu esa asab tizimi orqali miyaga uzatiladi va tovush hissini yaratadi.

Quloq pardasidan tebranishlar o'z navbatida ichki quloqqa uzatiladi va eshitish nervini bezovta qiladi. Inson tovushni shunday qabul qiladi.

Gerts (Hz yoki Hz) - tebranish chastotasini o'lchash birligi. 1 Hz= 1/s

Inson qulog'i sekundiga 20 tebranish (20 Gerts, past ovoz) dan 20 000 tebranish (20 KHz, yuqori ovoz) gacha bo'lgan chastotalarda tovushni qabul qilishi mumkin.

- analog - uzluksiz - tovush

Audio ma'lumotlarni kodlash

Kompyuterning tovushni qayta ishlashi uchun uzluksiz tovush signali elektr impulslari ketma-ketligiga aylantirilishi kerak(ikkilik nollar va birliklar).

Uzluksiz audio signalni kodlash jarayonida uning vaqtini tanlash amalga oshiriladi. Uzluksiz tovush to'lqini alohida kichik vaqtinchalik qismlarga bo'linadi va har bir bunday bo'lim uchun ma'lum bir amplituda qiymati o'rnatiladi.

Bu. Uzluksiz audio signalni ikkilik kodlashda u diskret signal darajalari ketma-ketligi bilan almashtiriladi.

Guruch. Audio vaqt namunasi

Shunday qilib, signal amplitudasining A(t) vaqtiga uzluksiz bog'liqligi tovush darajalarining diskret ketma-ketligi bilan almashtiriladi.

Grafikda bu silliq egri chiziqni "qadamlar" ketma-ketligi bilan almashtirishga o'xshaydi:

Har bir "qadam" ovoz balandligi darajasi va uning kodi (1, 2, 3 va boshqalar) bilan belgilanadi.

Ovoz balandligi darajalari mos ravishda mumkin bo'lgan holatlar to'plami sifatida ko'rib chiqilishi mumkin, kodlash jarayonida qanchalik ko'p ovoz balandligi ajratilsa, har bir darajaning qiymati shunchalik ko'p bo'ladi va ovoz yaxshi bo'ladi;

Zamonaviy ovoz kartalari 16 bitli audio kodlash chuqurligini ta'minlaydi. Turli xil signal darajalari sonini (ma'lum kodlash uchun holatlar) quyidagi formula yordamida hisoblash mumkin: N=2 i = 2 16 = 65536, bu erda i - tovush chuqurligi.

Shunday qilib, zamonaviy ovoz kartalari 65536 signal darajasini kodlashni ta'minlay oladi. Har bir audio signal amplitudasi qiymatiga 16 bitli kod beriladi.

Bir soniyada o'lchovlar soni 8000 dan 48 000 gacha bo'lishi mumkin, ya'ni analog audio signalning namuna olish chastotasi 8 dan 48 kHz gacha bo'lishi mumkin. 8 kHz chastotada namunaviy audio signalning sifati radio eshittirish sifatiga mos keladi va 48 kHz chastotada u audio-C ovoz sifatiga mos keladi. D . Shuni ham hisobga olish kerakki, mono va stereo rejimlar ham mumkin.

1-VAZIFA.

Yuqori ovoz sifati (16 bit, 48 kHz) bilan 1 sekundlik tovush davomiyligi bilan stereo audio faylning axborot hajmini baholashingiz mumkin. Buning uchun har bir namunadagi bitlar soni soniyada namunalar soniga ko'paytirilishi va 2 ga (stereo) ko'paytirilishi kerak:

Yechim: 16 bit 48 000 2 = 1 536 000 bit = 192 000 bayt = 187,5 KB.

2-VAZIFA.

O'rtacha ovoz sifati bilan (16 bit, 24) ovoz davomiyligi 1 daqiqa bo'lgan raqamli stereo tovush faylining axborot hajmini hisoblang kHz).

Yechim: 16 bit × 24 000 × 2 × 60 = 46 080 000 bit = 5 760 000 bayt = 5,625 KB ≈ 5,5 MB

Standart dastur Ovoz yozish raqamli magnitafon rolini o'ynaydi va ovozni yozib olish, ya'ni ovoz signallarini namuna olish va ularni formatdagi ovoz fayllarida saqlash imkonini beradi. V AV. Ushbu dastur sizga audio fayllarni tahrirlash, ularni aralashtirish (ularni bir-birining ustiga qo'yish) va ularni o'ynatish imkonini beradi.

Tasvir yoki tovushning ikkilik kodlash sifati namuna olish chastotasi va kodlash chuqurligi bilan aniqlanadi.

Uy vazifasi- muammolarni hal qilish:

1. 24 bitli ovoz kartasining signal darajalari sonini aniqlang.

2. Qo'shiq 1,44 MB disketga sig'ishi mumkinmi, agar u quyidagi parametrlarga ega bo'lsa: stereo tovush davomiyligi 3 minut ovoz sifati bilan - 16 bit, 16 kHz.


Ovoz doimiy o'zgaruvchan intensivlik va chastota bilan havoda, suvda yoki boshqa muhitda tez-tez tarqaladigan to'lqin.

Odam tovush to‘lqinlarini (havo tebranishlarini) tovush ko‘rinishidagi eshitish yordamida idrok eta oladi, ovoz balandligi va ohangini ajrata oladi.

Ko'proq intensivlik tovush to'lqini, tovush qanchalik baland bo'lsa, to'lqinning chastotasi qanchalik baland bo'lsa, tovush balandligi;


Ovoz balandligining, shuningdek tovush balandligining tovush to'lqinining intensivligi va chastotasiga bog'liqligi

Gerts(Hz yoki Gts bilan ko'rsatilgan) - davriy jarayonlarning chastotasini o'lchash birligi (masalan, tebranishlar). 1 Gts bir soniyada bunday jarayonning bir bajarilishini bildiradi: 1 Hz = 1/s.

Agar bizda 10 Gts bo'lsa, demak, bu bizda bir soniyada bunday jarayonning o'nta bajarilishini anglatadi.

Inson qulog'i sekundiga 20 tebranish (20 Gerts, past ovoz) dan 20 000 tebranish (20 KHz, yuqori ovoz) gacha bo'lgan chastotalarda tovushni qabul qilishi mumkin.

Bundan tashqari, odam tovushni keng intensivlik diapazonida idrok eta oladi, bunda maksimal intensivlik minimaldan (yuz ming milliard marta) 1014 marta ko'pdir.

Ovoz hajmini o'lchash uchun maxsus birlik ixtiro qilingan va ishlatilgan " desibel" (dB)

Ovoz balandligining 10 dB ga kamayishi yoki ortishi tovush intensivligining 10 marta kamayishi yoki oshishiga to'g'ri keladi.

Desibellarda ovoz balandligi


Kompyuter tizimlarining ovozni qayta ishlashi uchun doimiy audio signal vaqtni tanlash yordamida raqamli, diskret shaklga aylantirilishi kerak.

Buning uchun uzluksiz tovush to'lqini alohida kichik vaqtinchalik bo'limlarga bo'linadi va har bir bunday bo'lim uchun tovush intensivligining ma'lum bir qiymati o'rnatiladi.

Shunday qilib, tovush hajmining A(t) vaqtiga uzluksiz bog'liqligi ovoz balandligi darajalarining diskret ketma-ketligi bilan almashtiriladi. Grafikda bu silliq egri chiziqni "qadamlar" ketma-ketligi bilan almashtirishga o'xshaydi.


Audio vaqt namunasi


Ovoz kartasiga ulangan mikrofon analog audioni yozib olish va uni raqamli shaklga o'tkazish uchun ishlatiladi.

Grafikda diskret chiziqlar qanchalik zich joylashgan bo'lsa, asl tovush sifati shunchalik yaxshi qayta yaratiladi.

Olingan raqamli tovushning sifati vaqt birligida ovoz balandligi darajasini o'lchash soniga, ya'ni namuna olish chastotasiga bog'liq.

Audio namuna olish tezligi- bir soniyada ovoz balandligi o'lchovlari soni.

Bir soniyada qanchalik ko'p o'lchovlar amalga oshirilsa (namuna olish chastotasi qanchalik baland bo'lsa), raqamli audio signalning "zinapoyasi" analog signalning egri chizig'ini qanchalik aniqroq kuzatib boradi.

Grafikdagi har bir "qadam" ma'lum bir ovoz balandligi darajasi bilan belgilanadi. Ovoz balandligi darajalarini mumkin bo'lgan holatlar to'plami sifatida ko'rish mumkin N(gradatsiyalar), kodlash uchun ma'lum miqdordagi ma'lumot talab qilinadi I, bu audio kodlash chuqurligi deb ataladi.

Audio kodlash chuqurligi raqamli audioning diskret tovush darajalarini kodlash uchun zarur bo'lgan ma'lumotlar miqdori.

Agar kodlash chuqurligi ma'lum bo'lsa, u holda raqamli ovoz balandligi darajalari sonini umumiy formuladan foydalanib hisoblash mumkin N=2I.

Masalan, audio kodlash chuqurligi 16 bit bo'lsin, bu holda ovoz balandligi darajalari soni quyidagilarga teng:

N = 2 I = 2 16 = 65,536.

Kodlash jarayonida har bir ovoz balandligi darajasiga o'zining 16 bitli ikkilik kodi beriladi, eng past ovoz darajasi 0000000000000000 kodiga, eng yuqori darajasi esa 1111111111111111 kodiga to'g'ri keladi.

Raqamli ovoz sifati


Shunday qilib, namuna olish chastotasi va audio kodlash chuqurligi qanchalik baland bo'lsa, raqamlashtirilgan ovoz shunchalik yuqori sifatga ega bo'ladi va raqamlashtirilgan ovozni asl tovushga qanchalik yaxshi yaqinlashtirasiz.

Telefon aloqasi sifatiga mos keladigan raqamlashtirilgan ovozning eng past sifati sekundiga 8000 marta namuna olish tezligi, 8 bit chuqurlik va bitta audio trekni yozish (mono rejim) bilan olinadi.

Audio CD sifatiga mos keladigan eng yuqori sifatli raqamli audioga sekundiga 48 000 marta namuna olish tezligi, 16 bitli namuna olish chuqurligi va ikkita audio trekni yozib olish (stereo rejim) bilan erishiladi.

Shuni esda tutish kerak raqamli tovush sifati qanchalik yuqori bo'lsa, ovoz faylining axborot hajmi shunchalik katta bo'ladi.

O'rtacha ovoz sifati (16 bit, sekundiga 24 000 o'lchov) bilan ovoz davomiyligi 1 soniya bo'lgan raqamli stereo audio faylning axborot hajmini osongina taxmin qilishingiz mumkin. Buning uchun kodlash chuqurligini soniyada o'lchovlar soniga ko'paytirish va 2 kanalga (stereo tovush) ko'paytirish kerak:

16 bit × 24 000 × 2 = 768 000 bit = 96 000 bayt = 93,75 KB.

Ovoz muharrirlari


Ovoz muharrirlari nafaqat ovozni yozib olish va ijro etish, balki uni tahrirlash imkonini beradi. Eng ko'zga ko'ringanlarini xavfsiz deb atash mumkin, masalan Sony Sound Forge, Adobe Audition, GoldWave va boshqalar.

Raqamlangan tovush tovush muharrirlarida aniq vizual shaklda taqdim etiladi, shuning uchun audio trekning qismlarini nusxalash, ko'chirish va o'chirish kompyuter sichqonchasi yordamida osonlik bilan amalga oshirilishi mumkin.

Bundan tashqari, siz audio treklarni bir-birining ustiga qo'yishingiz va qoplashingiz mumkin (tovushlarni aralashtirish) va turli akustik effektlarni qo'llashingiz mumkin (aks-sado, teskari o'ynatish va boshqalar).

Ovoz muharrirlari namuna olish chastotasi va kodlash chuqurligini o'zgartirish orqali raqamli tovush sifatini va yakuniy ovoz faylining hajmini o'zgartirishga imkon beradi. Raqamlangan audio universal WAV formatidagi audio fayllarda (Microsoft formati) yoki OGG, MP3 (yo'qolgan siqish) siqilgan formatlarida siqilmagan holda saqlanishi mumkin.
Kamroq tarqalgan, ammo e'tiborga loyiq yo'qotishsiz siqish formatlari ham mavjud.

Ovozni siqilgan formatlarda saqlashda inson idrok etishi uchun eshitilmaydigan va sezilmaydigan ("ortiqcha") past intensivlikdagi tovush chastotalari yuqori intensivlikdagi tovush chastotalari bilan vaqtga to'g'ri keladi. Ushbu formatdan foydalanish ovozli fayllarni o'nlab marta siqish imkonini beradi, lekin ma'lumotlarning qaytarilmas yo'qolishiga olib keladi (fayllarni asl, asl shakliga qaytarish mumkin emas).

Raqamli audio haqidagi mashhur afsonalarni yo'q qilish.

2017-10-01 15:27

2017-10-01 15:27

Audiofillar uchun dasturiy ta'minot

Eslatma: Quyidagi matnni yaxshiroq tushunish uchun men raqamli audio asoslari bilan tanishishingizni tavsiya qilaman.

Bundan tashqari, quyida ko'tarilgan ko'plab fikrlar mening "Yana bir bor qayg'uli haqiqat haqida: yaxshi ovoz qayerdan keladi?" .

Bitrate qanchalik yuqori bo'lsa, trekning sifati shunchalik yaxshi bo'ladi.

Bu har doim ham shunday emas. Avvalo, sizga bitray nima ekanligini eslatib o'taman T(bitreyd emas, bitreyd). Bu, aslida, ijro etish paytida sekundiga kilobitlardagi ma'lumotlar tezligi. Ya'ni, agar biz trekning o'lchamini kilobitlarda olsak va uni soniyalarga bo'linadigan bo'lsak, biz uning bit tezligini olamiz - deb ataladi. faylga asoslangan bit tezligi (FBR), odatda u audio oqimining bit tezligidan unchalik farq qilmaydi (farqlarning sababi trekdagi metama'lumotlarning mavjudligi - teglar, o'rnatilgan tasvirlar va boshqalar).

Endi misol keltiramiz: oddiy Audio CD-da yozilgan siqilmagan PCM audioning bit tezligi quyidagicha hisoblanadi: 2 (kanal) × 16 (namuna uchun bit) × 44100 (sekundiga namunalar) = 1411200 (bps) = 1411,2 kbps . Endi trekni har qanday yo'qotishsiz kodek ("yo'qotishsiz" - "yo'qotishsiz", ya'ni hech qanday ma'lumot yo'qolishiga olib kelmaydigan), masalan, FLAC kodek bilan olamiz va siqamiz. Natijada, biz asl nusxadan pastroq bit tezligiga ega bo'lamiz, ammo sifat o'zgarishsiz qoladi - bu sizning birinchi raddiyangiz.

Bu erda yana bir narsani qo'shishga arziydi. Yo'qotishsiz siqilish bilan chiqish bit tezligi juda boshqacha bo'lishi mumkin (lekin, qoida tariqasida, u siqilmagan audiodan kamroq) - bu siqilgan signalning murakkabligiga yoki aniqrog'i ma'lumotlarning ortiqcha miqdoriga bog'liq. Shunday qilib, oddiyroq signallar yaxshiroq siqiladi (ya'ni, bizda bir xil vaqt uchun kichikroq fayl hajmi => past bit tezligi) va murakkabroq signallar yomonroq siqiladi. Shuning uchun yo'qotishsiz klassik musiqa, aytaylik, rokka qaraganda pastroq bit tezligiga ega. Ammo shuni ta'kidlash kerakki, bu erda bit tezligi hech qanday tarzda audio material sifatining ko'rsatkichi emas.

Endi yo'qolgan siqilish haqida gapiraylik. Avvalo, juda ko'p turli xil kodlovchilar va formatlar mavjudligini tushunishingiz kerak va hatto bir xil formatda ham turli kodlovchilarning kodlash sifati farq qilishi mumkin (masalan, QuickTime AAC eskirgan FAACga qaraganda ancha yaxshi kodlaydi), bu haqda gapirmaslik kerak. zamonaviy formatlarning (OGG Vorbis, AAC, Opus) MP3 dan ustunligi. Oddiy qilib aytganda, bir xil bit tezligiga ega bo'lgan turli kodlovchilar tomonidan kodlangan ikkita bir xil treklardan biri yaxshiroq, ikkinchisi esa yomonroq eshitiladi.

Bundan tashqari, bunday narsa bor yuqori konvert. Ya'ni, siz 96 kbps bit tezligi bilan MP3 formatidagi trekni olishingiz va uni MP3 320 kbps ga aylantirishingiz mumkin. Sifat nafaqat yaxshilanmaydi (oxir-oqibat, oldingi 96 kbit / s kodlash paytida yo'qolgan ma'lumotlarni qaytarib bo'lmaydi), u yanada yomonlashadi. Shuni ta'kidlash kerakki, yo'qolgan kodlashning har bir bosqichida (har qanday bit tezligi va har qanday kodlovchi bilan) ovozga ma'lum miqdordagi buzilishlar kiritiladi.

Va undan ham ko'proq. Yana bir nuance bor. Agar aytaylik, audio oqimning bit tezligi 320 kbps bo'lsa, bu 320 kbit / s o'sha soniya kodlash uchun sarflangan degani emas. Bu doimiy bit tezligi bilan kodlash uchun odatiy holdir va odam maksimal sifatga ega bo'lishga umid qilib, doimiy bit tezligini juda yuqori bo'lishga majbur qilganda (masalan, Nero AAC uchun 512 kbps CBR o'rnatish). Ma'lumki, ma'lum bir ramkaga ajratilgan bitlar soni psixoakustik model bilan tartibga solinadi. Ammo ajratilgan miqdor belgilangan bit tezligidan ancha past bo'lsa, hatto bit rezervuari ham saqlamaydi ("CBR, ABR, VBR nima?" Maqolasidagi shartlar haqida o'qing) - natijada biz foydasiz bo'lamiz. "Nol bitlar" oddiygina "tugaydi" » ramka o'lchamini kerakli o'lchamga (ya'ni, oqim hajmini belgilangan hajmgacha oshiring). Aytgancha, buni tekshirish oson - natijada olingan faylni arxivator bilan siqib oling (afzalroq 7z) va siqish nisbatiga qarang - u qanchalik baland bo'lsa, nol bitlar qanchalik ko'p bo'lsa (chunki ular ortiqcha bo'lishiga olib keladi), bo'sh joy shunchalik ko'p sarflanadi.

Yo'qotilgan kodeklar (MP3 va boshqalar) zamonaviy elektron musiqaga dosh bera oladi, ammo klassik (akademik), jonli, instrumental musiqani yuqori sifatli kodlashga qodir emas.

Bu erda "taqdirning ironiyasi" shundaki, aslida hamma narsa aksincha. Ma'lumki, akademik musiqa aksariyat hollarda melodik va garmonik tamoyillarga, shuningdek, instrumental kompozitsiyaga amal qiladi. Matematik nuqtai nazardan, bu musiqaning nisbatan sodda garmonik kompozitsiyasiga olib keladi. Shunday qilib, undoshlarning ustunligi kamroq sonli ikkilamchi garmonikani hosil qiladi: masalan, beshinchi uchun (ikki tovushning asosiy chastotalari bir yarim baravar farq qiladigan oraliq), har bir ikkinchi garmonika ikkita tovush uchun umumiy bo'ladi. , to'rtinchisi uchun, bu erda chastotalar uchdan biriga - har uchdan biriga, va hokazo. Bundan tashqari, teng temperamentdan foydalanish tufayli qattiq chastota nisbatlarining mavjudligi ham klassik musiqaning spektral tarkibini soddalashtiradi. Klassikaning jonli instrumental kompozitsiyasi elektron musiqaga xos shovqin yo'qligi, buzilish, amplituda keskin sakrash, shuningdek, yuqori chastotali komponentlarning ortiqcha yo'qligini aniqlaydi.

Yuqorida sanab o'tilgan omillar klassik musiqani, birinchi navbatda, sof matematik tarzda siqish ancha oson bo'lishiga olib keladi. Esingizda bo'lsa, matematik siqish ortiqchalikni yo'q qilish (kamroq bitlar yordamida o'xshash ma'lumotlar qismlarini tavsiflash) va bashorat qilish (aka. bashorat qiluvchilar signalning harakatini bashorat qiling, shundan so'ng faqat haqiqiy signalning bashorat qilinganidan og'ishi kodlanadi - ular qanchalik aniq mos kelsa, kodlash uchun kamroq bitlar kerak bo'ladi). Bunday holda, nisbatan oddiy spektral kompozitsiya va uyg'unlik yuqori ortiqchalikka olib keladi, ularning yo'q qilinishi sezilarli darajada siqilishni ta'minlaydi va kam sonli portlashlar va shovqin komponentlari (ular tasodifiy va oldindan aytib bo'lmaydigan signallar) yaxshi matematik prognozlilikni aniqlaydi. ma'lumotlarning katta qismi. Va men klassik treklarning nisbatan past o'rtacha hajmi va tez-tez sukunat oraliqlari haqida gapirmayapman, ular uchun kodlash uchun deyarli hech qanday ma'lumot talab qilinmaydi. Natijada, biz, masalan, ba'zi yakkaxon instrumental musiqalarni 320 kbps dan past bit tezligiga yo'qotishsiz siqishimiz mumkin (TAK va OFR kodlovchilari bunga juda qodir).

Shunday qilib, birinchidan, haqiqat shundaki, yo'qotishsiz kodlash asosidagi matematik siqilish ham yo'qolgan kodlash bosqichlaridan biridir (MP3 kodlashni tushunishni o'qing). Ikkinchidan, Lossy Fourier transformatsiyasidan (signalning harmonikaga parchalanishi) foydalanganligi sababli, spektral kompozitsiyaning soddaligi hatto kodlovchining ishini ikki baravar osonlashtiradi. Natijada, ko'r-ko'rona testda asl va kodlangan klassik musiqa namunalarini taqqoslab, biz nisbatan past bit tezligida ham hech qanday farq topa olmasligimizdan hayratdamiz. Va kulgili tomoni shundaki, biz kodlash bit tezligini to'liq pasaytira boshlaganimizda, farqlarni ochib beradigan birinchi narsa bu yozuvdagi fon shovqinidir.

Elektron musiqaga kelsak, koderlar juda qiyin vaqtni boshdan kechirishadi: shovqin komponentlari minimal ortiqcha bo'ladi va o'tkir sakrashlar (ba'zi turdagi arra impulslari) bilan birga ular juda oldindan aytib bo'lmaydigan signallardir (o'zini tutadigan tabiiy tovushlarga "moslangan" koderlar uchun. butunlay aks holda), psixoakustik model tomonidan individual harmonikalarni rad etish bilan to'g'ridan-to'g'ri va teskari Furye o'zgarishi muqarrar ravishda aks-sadodan oldingi va keyingi effektlarni keltirib chiqaradi, ularning eshitilishi kodlovchi uchun har doim ham oson emas ... Bunga qo'shing. HF komponentlarining yuqori darajasi - va siz juda ko'p sonli qotillarga ega bo'lasiz - hatto eng ilg'or kodlovchilar ham o'rta-past bit tezligida bardosh bera olmaydi, g'alati, ayniqsa elektron musiqa orasida.

Shuningdek, "tajribali tinglovchilar" va musiqachilarning fikrlari ham qiziqarli, ular yo'qolgan kodlash tamoyillarini to'liq tushunmasliklari bilan, kodlashdan keyin musiqa asboblari qanday qilib ohangdan chiqa boshlaganini, chastotalar suzayotganini eshitishlarini da'vo qila boshlaydilar. , va hokazo. Bu hali ham portlashi bo'lgan antidiluvia kasseta pleyerlari uchun to'g'ri bo'lishi mumkin, ammo raqamli audioda hamma narsa to'g'ri: chastota komponenti qoladi yoki yo'q qilinadi, shunchaki ohangni o'zgartirishga hojat yo'q. Bundan tashqari: insonning musiqa uchun qulog'ining mavjudligi uning yaxshi chastotali eshitish qobiliyatiga ega ekanligini anglatmaydi (masalan, yoshi bilan yo'qolib ketadigan > 16 kHz chastotalarni idrok etish qobiliyati) va unga hech qanday qulaylik yaratmaydi. yo'qolgan kodlash artefaktlarini qidiring, chunki buzilish Ular juda o'ziga xos xususiyatga ega va yo'qolgan audioni ko'r-ko'rona taqqoslash tajribasini talab qiladi - nima va qaerga qarash kerakligini bilishingiz kerak.

DVD-Audio audio CD dan yaxshiroq eshitiladi (24 bit va 16, 96 kHz va 44,1 va boshqalar)

Afsuski, odamlar odatda faqat raqamlarga qarashadi va juda kamdan-kam hollarda ma'lum bir parametrning ob'ektiv sifatga ta'siri haqida o'ylashadi.

Keling, avval bit chuqurligini ko'rib chiqaylik. Ushbu parametr dinamik diapazondan boshqa hech narsa uchun javobgar emas, ya'ni eng jim va eng baland tovushlar orasidagi farq (dB da). Raqamli audioda maksimal daraja 0 dBFS (FS - to'liq shkala) va minimal shovqin darajasi bilan cheklangan, ya'ni aslida mutlaq qiymatdagi dinamik diapazon shovqin darajasiga teng. 16-bitli audio uchun dinamik diapazon 20 × log 10 2 16 sifatida hisoblanadi, bu 96,33 vB ga teng. Shu bilan birga, simfonik orkestrning dinamik diapazoni 75 dB gacha (asosan taxminan 40-50 dB).

Endi real sharoitlarni tasavvur qilaylik. Xonadagi shovqin darajasi taxminan 40 dB ni tashkil qiladi (dB nisbiy qiymat ekanligini unutmang. Bu holda, eshitish ostonasi 0 dB sifatida qabul qilinadi), maksimal musiqa hajmi 110 dB ga etadi (noqulaylikni oldini olish uchun) - biz 70 dB farqni oling. Shunday qilib, bu holda 70 dB dan ortiq dinamik diapazon shunchaki foydasiz ekanligi ma'lum bo'ldi. Ya'ni, yuqori diapazonda yoki baland tovushlar og'riq chegarasiga etadi yoki tinch tovushlar atrofdagi shovqin tomonidan so'riladi. Atrofdagi shovqin darajasi 15 dB dan past (insonning nafas olish hajmi va inson fiziologiyasi tufayli yuzaga keladigan boshqa shovqinlar shu darajada bo'lgani uchun) erishish juda qiyin, natijada musiqa tinglash uchun 95 dB diapazoni chiqadi. to'liq etarli bo'lishi.

Endi namuna olish chastotasi haqida (namuna olish chastotasi, namuna tezligi). Ushbu parametr vaqtni namuna olish chastotasini nazorat qiladi va ma'lum bir ovoz tasviri bilan tavsiflanishi mumkin bo'lgan maksimal signal chastotasiga bevosita ta'sir qiladi. Kotelnikov teoremasiga ko'ra, u namuna olish chastotasining yarmiga teng. Ya'ni, odatdagi namuna olish chastotasi 44100 Gts uchun signal komponentlarining maksimal chastotasi 22050 Gts ni tashkil qiladi. Maksimal chastota. inson qulog'i tomonidan idrok etiladigan 20 000 Gts dan biroz yuqoriroq (va keyin tug'ilganda; biz o'sib ulg'ayganimizda, chegara 16 000 Gts gacha tushadi).

Bu mavzu eng yaxshi 24/192 formatidagi yuklamalar maqolasida yoritilgan - nima uchun ular mantiqiy emas.

Turli xil dasturiy ta'minot pleyerlari har xil ovoz chiqaradi (masalan, foobar2000 Winampdan yaxshiroq va hk.)

Nima uchun bunday emasligini tushunish uchun dasturiy ta'minot o'yinchisi nima ekanligini tushunishingiz kerak. Asosan, bu dekoder, ishlov beruvchilar (ixtiyoriy), chiqish plaginlari (interfeyslardan biriga: ASIO, DirectSound, WASAPI va boshqalar) va, albatta, GUI (grafik foydalanuvchi interfeysi). 99,9% hollarda dekoder standart algoritm bo'yicha ishlayotganligi va chiqish plagini oqimni interfeyslardan biri orqali ovoz kartasiga uzatadigan dasturning faqat bir qismi bo'lganligi sababli, farqlarning yagona sababi ishlov beruvchilar bo'lishi mumkin. Ammo haqiqat shundaki, ishlov beruvchilar odatda sukut bo'yicha o'chiriladi (yoki o'chirilishi kerak, chunki yaxshi o'yinchi uchun asosiy narsa ovozni "toza" shaklida etkazishdir). Natijada, bu erda taqqoslashning yagona mavzusi bo'lishi mumkin imkoniyatlar Aytgancha, ko'pincha umuman kerak bo'lmagan qayta ishlash va ishlab chiqarish. Ammo bunday ehtiyoj bo'lsa ham, bu o'yinchilarni emas, balki protsessorlarni taqqoslashdir.

Turli xil drayverlarning versiyalari boshqacha eshitiladi

Ushbu bayonot ovoz kartasining ishlash tamoyillarini bilmaslikka asoslangan. Drayv - bu qurilmaning operatsion tizim bilan samarali o'zaro ta'siri uchun zarur bo'lgan dasturiy ta'minot, shuningdek, odatda qurilmani, uning parametrlarini va hokazolarni boshqarish qobiliyati uchun foydalanuvchi grafik interfeysini ta'minlaydi. Ovoz kartasi drayveri ovoz kartasining Windows sifatida tan olinishini ta'minlaydi. ovozli qurilma, operatsion tizimga kartaning formatlarni qo'llab-quvvatlashi haqida ma'lumot beradi, siqilmagan PCM (ko'p hollarda) oqimini kartaga uzatishni ta'minlaydi, shuningdek sozlamalarga kirish imkonini beradi. Bunga qo'shimcha ravishda, agar dasturiy ta'minotni qayta ishlash (CPU vositalari yordamida) mavjud bo'lsa, drayverda turli xil DSP (protsessorlar) bo'lishi mumkin. Shuning uchun, birinchi navbatda, effektlar va ishlov berish o'chirilgan bo'lsa, drayver kartaga PCM-ni aniq uzatishni ta'minlamasa, bu qo'pol xato, tanqidiy xato hisoblanadi. Va bu sodir bo'ladi kamdan-kam hollarda. Boshqa tomondan, drayverlar o'rtasidagi farqlar qayta ishlash algoritmlarini yangilashda (qayta namunalar, effektlar) bo'lishi mumkin, ammo bu ham tez-tez sodir bo'lmaydi. Bundan tashqari, eng yuqori sifatga erishish uchun effektlar va har qanday drayverni qayta ishlash hali ham istisno qilinishi kerak.

Shunday qilib, drayverlarni yangilash asosan barqarorlikni yaxshilash va ishlov berish xatolarini bartaraf etishga qaratilgan. Bizning holatlarimizda na biri, na boshqasi ijro etish sifatiga ta'sir qilmaydi, shuning uchun 1000 ta holatdan 999 tasida haydovchi ovozga ta'sir qilmaydi.

Litsenziyalangan audio kompakt disklar nusxalariga qaraganda yaxshiroq ovoz chiqaradi

Agar nusxa ko'chirish paytida (o'limga olib keladigan) o'qish / yozish xatolari yuzaga kelmasa va nusxa ko'chirish diski o'ynaladigan qurilmaning optik drayveri uni o'qishda muammolarga duch kelmasa, bu bayonot noto'g'ri va osongina rad etiladi.

Stereo kodlash rejimi Joint Stereoga qaraganda yaxshiroq sifatni beradi

Bu noto'g'ri tushuncha, asosan, LAME MP3-ga tegishli, chunki barcha zamonaviy enkoderlar (AAC, Vorbis, Musepack) foydalanadi. faqat Birgalikda Stereo rejimi (va bu allaqachon nimanidir aytadi)

Boshlash uchun shuni ta'kidlash kerakki, Joint Stereo rejimi yo'qotishsiz siqish bilan muvaffaqiyatli qo'llaniladi. Uning mohiyati shundan iboratki, kodlashdan oldin signal o'ng va chap kanallar (O'rta) va ularning farqi (Yon) yig'indisiga bo'linadi va keyin bu signallarning alohida kodlanishi sodir bo'ladi. Limitda (o'ng va chap kanallarda bir xil ma'lumotlar uchun) ikki marta ma'lumot tejash olinadi. Va aksariyat musiqalarda o'ng va chap kanallardagi ma'lumotlar juda o'xshash bo'lganligi sababli, bu usul juda samarali bo'lib chiqadi va siqishni nisbatini sezilarli darajada oshirishga imkon beradi.

Yo'qotishda printsip bir xil. Ammo bu erda, doimiy bit tezligi rejimida, ikkita kanalda o'xshash ma'lumotlarga ega bo'lgan fragmentlarning sifati oshadi (chegarada, ikki baravar), va VBR rejimi uchun bunday joylarda bit tezligi shunchaki pasayadi (unutmang asosiy vazifa VBR rejimining maqsadi eng past bit tezligidan foydalangan holda belgilangan kodlash sifatini barqaror saqlashdir). Yo'qotilgan kodlash paytida stereo panoramaning yomonlashishiga yo'l qo'ymaslik uchun ustunlik (bitlarni tarqatishda) kanallar yig'indisiga beriladi, qo'shma stereo (o'rta/yon) va oddiy (chap/o'ng) ramkaga asoslangan stereo o'rtasida dinamik almashinadi. rejimlardan foydalaniladi. Aytgancha, bu noto'g'ri tushunchaning sababi LAME-ning eski versiyalarida kommutatsiya algoritmining nomukammalligi, shuningdek, avtomatik kommutatsiya mavjud bo'lmagan Majburiy qo'shma rejimining mavjudligi edi. LAME-ning so'nggi versiyalarida qo'shma rejim sukut bo'yicha yoqilgan va uni o'zgartirish tavsiya etilmaydi.

Spektr qanchalik keng bo'lsa, yozib olish sifati shunchalik yaxshi bo'ladi (spektrogramlar, auCDtect va chastota diapazoni haqida)

Bugungi kunda forumlarda, afsuski, trekning sifatini "spektrogramma yordamida o'lchagich bilan" o'lchash juda keng tarqalgan. Shubhasiz, bu usulning soddaligi tufayli. Ammo, amaliyot shuni ko'rsatadiki, aslida hamma narsa ancha murakkab.

Va gap shu. Spektrogramma signal kuchining chastotalar bo'yicha taqsimlanishini vizual tarzda namoyish etadi, ammo yozuv ovozi, undagi buzilishlar va siqilish artefaktlari haqida to'liq tasavvurni bera olmaydi. Ya'ni, spektrogramma orqali aniqlanishi mumkin bo'lgan hamma narsa chastota diapazoni (va qisman HF mintaqasidagi spektr zichligi). Ya'ni, eng yaxshi holatda, spektrogrammani tahlil qilish orqali yuqoriga aylantiruvchini aniqlash mumkin. Turli kodlovchilar bilan kodlash natijasida olingan treklarning spektrogrammalarini asl nusxa bilan solishtirish mutlaqo bema'nilikdir. Ha, siz spektrdagi farqlarni aniqlashingiz mumkin, ammo ularning inson qulog'i tomonidan idrok etilishini (va qanchalik darajada) aniqlash deyarli mumkin emas. Shuni unutmasligimiz kerakki, yo'qolgan kodlashning vazifasi farq qilib bo'lmaydigan natijani ta'minlashdir inson qulog'i asl nusxadan (ko'z bilan emas).

Xuddi shu narsa auCDtect dasturi yordamida chiqish treklarini tahlil qilish orqali kodlash sifatini baholash uchun ham amal qiladi (Audiochecker, auCDtect Task Manager, Tau Analyzer, fooCDtect - bu auCDtect yagona konsol dasturi uchun qobiqlar). auCDtect algoritmi haqiqatda chastota diapazonini tahlil qiladi va faqat kodlash bosqichlarining har qandayida MPEG siqish qo'llanganligini aniqlashga imkon beradi (ma'lum bir ehtimollik darajasi bilan). Algoritm MP3 uchun mo'ljallangan, shuning uchun uni Vorbis, AAC va Musepack kodeklari yordamida "aldash" oson, shuning uchun dastur "100% CDDA" deb yozsa ham, bu kodlangan audio 100% degani emas. asl nusxasi bilan bir xil.

Va to'g'ridan-to'g'ri spektrlarga qaytish. Shuningdek, ba'zi "ishqibozlar" orasida LAME kodlagichidagi past chastotali filtrni har qanday holatda ham o'chirib qo'yish istagi bor. Kodlash va psixoakustika tamoyillarini tushunmaslik aniq. Birinchidan, enkoder yuqori chastotalarni faqat bitta maqsadda kesadi - ma'lumotlarni saqlash va undan eng eshitiladigan chastota diapazonini kodlash uchun foydalanish. Kengaytirilgan chastota diapazoni umumiy ovoz sifatiga halokatli ta'sir ko'rsatishi va eshitiladigan kodlash artefaktlariga olib kelishi mumkin. Bundan tashqari, 20 kHz chastotada o'chirishni o'chirish umuman asossizdir, chunki odam shunchaki yuqori chastotalarni eshita olmaydi.

Ovozni sezilarli darajada yaxshilaydigan ma'lum "sehrli" ekvalayzer oldindan o'rnatilgan

Bu mutlaqo to'g'ri emas, birinchidan, chunki har bir individual konfiguratsiya (naushniklar, akustika, ovoz kartasi) o'z parametrlariga ega (xususan, o'z amplituda-chastota javobi). Va shuning uchun har bir konfiguratsiya o'ziga xos, o'ziga xos yondashuvga ega bo'lishi kerak. Oddiy qilib aytganda, bunday ekvalayzerning oldindan o'rnatilishi mavjud, ammo u turli xil konfiguratsiyalar uchun farq qiladi. Uning mohiyati yo'lning chastotali javobini sozlashda, ya'ni kiruvchi pasayish va kuchlanishni "tekislashda" yotadi.

Bundan tashqari, tovush bilan to'g'ridan-to'g'ri ishlashdan uzoqda bo'lgan odamlar orasida "shampula" bilan grafik ekvalayzerni o'rnatish juda mashhur bo'lib, bu aslida past chastotali va yuqori chastotali komponentlar darajasining oshishini anglatadi, lekin shu bilan birga bo'g'ilishga olib keladi. tovush spektri o'rta chastotali mintaqada joylashgan vokal va asboblar.

Musiqani boshqa formatga aylantirishdan oldin uni WAV-ga ochishingiz kerak

Darhol shuni ta'kidlashim kerakki, WAV WAVE konteyneridagi (*.wav kengaytmali fayl) PCM ma'lumotlarini (impuls kodi modulyatsiyasi) anglatadi. Ushbu ma'lumotlar 16, 24 yoki 32 (bit chuqurligiga qarab) guruhlardagi bitlar (nol va birliklar) ketma-ketligidan boshqa narsa emas, ularning har biri mos keladigan namunaning amplitudasining ikkilik kodini ifodalaydi (masalan, O'nlik kasrda 16 bit, bu -32768 dan +32768 gacha bo'lgan qiymatlar).

Shunday qilib, haqiqat shundaki, har qanday ovoz protsessori - u filtr yoki kodlovchi bo'ladimi - odatda ishlaydi faqat bu qadriyatlar bilan, ya'ni faqat siqilmagan ma'lumotlar bilan. Bu shuni anglatadiki, audioni, aytaylik, FLAC-dan APE-ga aylantirish uchun siz shunchaki zarur Avval FLAC-ni PCM-ga dekodlang, so'ngra PCM-ni APE-ga kodlang. Bu ZIP-dan RAR-ga fayllarni qayta o'rashga o'xshaydi, siz avval ZIP-ni ochishingiz kerak.

Biroq, agar siz konvertordan yoki shunchaki rivojlangan konsol kodlovchisidan foydalansangiz, PCM-ga oraliq konvertatsiya tezda, ba'zan hatto vaqtinchalik WAV fayliga yozmasdan ham sodir bo'ladi. Bu odamlarni chalg'itadigan narsa: formatlar to'g'ridan-to'g'ri biridan ikkinchisiga aylantirilganga o'xshaydi, lekin aslida bunday dasturda PCM ga oraliq konvertatsiyani amalga oshiradigan kirish formati dekoderi bo'lishi kerak.

Shunday qilib, WAV-ga qo'lda aylantirish sizga vaqtni behuda sarflashdan boshqa hech narsa bermaydi.

Raqamli audio amplitudasining diskret raqamli qiymatlari bilan ifodalangan analog audio signaldir.

Ovozni raqamlashtirish- bo'lingan vaqt bosqichi texnologiyasi va olingan qiymatlarni raqamli shaklda keyinchalik qayd etish.
Ovozni raqamlashtirishning yana bir nomi analogdan raqamliga o'tkazish ovoz.

Ovozni raqamlashtirish ikkita jarayonni o'z ichiga oladi:

  • vaqt o'tishi bilan signalni namuna olish (namuna olish) jarayoni
  • amplitudani kvantlash jarayoni.

Vaqt namunasi

Vaqt namunalarini olish jarayoni - ma'lum bir vaqt bosqichida o'zgartiriladigan signalning qiymatlarini olish jarayoni - namuna olish bosqichi. Bir soniyada amalga oshirilgan signal kattaligi o'lchovlari soni deyiladi namuna olish tezligi yoki namuna olish chastotasi, yoki namuna olish tezligi(ingliz tilidan "namuna olish" - "namuna olish"). Namuna olish bosqichi qanchalik kichik bo'lsa, namuna olish chastotasi shunchalik yuqori bo'ladi va biz qabul qiladigan signalni aniqroq ko'rsatamiz.
Buni Kotelnikov teoremasi tasdiqlaydi (xorijiy adabiyotlarda Shennon teoremasi deb topiladi, Shennon). Unga ko'ra, cheklangan spektrli analog signal, agar bu qiymatlar signal spektrining eng yuqori chastotasidan kamida ikki baravar ko'p bo'lgan chastotada olingan bo'lsa, uning amplitudasi qiymatlarining diskret ketma-ketligi bilan aniq tasvirlanishi mumkin. Ya'ni, spektrning eng yuqori chastotasi F m ga teng bo'lgan analog signal, F d namuna olish chastotasi ushlab tursa, diskret amplituda qiymatlari ketma-ketligi bilan aniq ifodalanishi mumkin: F d >2F m .
Amalda, bu raqamlashtirilgan signalning dastlabki analog signalning (0 - 20 kHz) eshitiladigan chastotalarining butun diapazoni haqida ma'lumotni o'z ichiga olishi uchun tanlangan namuna olish chastotasi kamida 40 kHz bo'lishi kerakligini anglatadi. Bir soniyada amplituda o'lchovlar soni deyiladi namuna olish tezligi(namuna olish bosqichi doimiy bo'lsa).
Raqamlashtirishning asosiy qiyinligi - o'lchangan signal qiymatlarini mukammal aniqlik bilan yozib olishning mumkin emasligi.

Chiziqli (bir xil) amplituda kvantlash

Signal amplitudasining bir qiymatini kompyuter xotirasiga yozish uchun N bit ajratamiz. Bu shuni anglatadiki, bitta N bitli so'z bilan siz 2 N xil pozitsiyani tasvirlashingiz mumkin. Raqamlangan signalning amplitudasi ba'zi bir an'anaviy birliklarning -1 dan 1 gacha bo'lsin. Keling, bu amplituda o'zgarishlar diapazoni - signalning dinamik diapazoni - 2 N -1 teng oraliqlar shaklida, uni 2 N darajaga - kvantlarga bo'linib tasavvur qilaylik. Endi har bir alohida amplituda qiymatini qayd etish uchun uni eng yaqin kvantlash darajasiga yaxlitlash kerak. Bu jarayon amplituda kvantlash deb ataladi. Amplitudani kvantlash - haqiqiy signal amplitudasi qiymatlarini ma'lum bir aniqlik bilan taxminiy qiymatlar bilan almashtirish jarayoni. 2N mumkin bo'lgan darajalarning har biri kvantlash darajasi deb ataladi va ikkita eng yaqin kvantlash darajasi orasidagi masofa kvantlash bosqichi deb ataladi. Agar amplituda shkalasi chiziqli ravishda darajalarga bo'linsa, kvantlash chiziqli (bir hil) deb ataladi.
Yaxlitlashning aniqligi kvantlash darajalarining tanlangan soniga (2 N) bog'liq bo'lib, bu o'z navbatida amplituda qiymatini yozish uchun ajratilgan bitlar soniga (N) bog'liq. N raqami chaqiriladi kvantlash bit chuqurligi(har bir so'zdagi raqamlar sonini, ya'ni bitlarni anglatadi) va amplituda qiymatlarini yaxlitlash natijasida olingan raqamlar hisoblar yoki namunalar(inglizcha "namuna" - "o'lchov" dan). 16-bitli kvantlash natijasida hosil bo'lgan kvantlash xatolar tinglovchi uchun deyarli sezilmaydi deb taxmin qilinadi. Signalni raqamlashtirishning bu usuli - bir hil kvantlash usuli bilan birgalikda signalni o'z vaqtida tanlash usuli deyiladi. impuls kodini modulyatsiya qilish, PCM(Inglizcha: Pulse Code Modulation - PCM).
Raqamlangan signal ketma-ket amplituda qiymatlari to'plami ko'rinishida allaqachon kompyuter xotirasida saqlanishi mumkin. Mutlaq amplituda qiymatlari qayd etilgan hollarda, masalan yozib olish formati chaqirdi PCM(Puls kodini modulyatsiya qilish). 1980-yillarning boshidan beri foydalanilgan standart audio kompakt disk (CD-DA) ma'lumotni PCM formatida 44,1 kHz namuna olish chastotasi va 16 bit kvantlash bit chuqurligi bilan saqlaydi.

Boshqa raqamlashtirish usullari

Analog-raqamli konvertorlar (ADC)

Yuqorida tavsiflangan audio raqamlashtirish jarayoni analog-raqamli konvertorlar (ADC) tomonidan amalga oshiriladi.
Ushbu konvertatsiya quyidagi operatsiyalarni o'z ichiga oladi:

  1. Tarmoqli kengligi cheklash chastotasi namuna olish chastotasining yarmidan oshgan spektral komponentlarni bostirish uchun past o'tkazuvchan filtr yordamida amalga oshiriladi.
  2. Vaqt bo'yicha namuna olish, ya'ni uzluksiz analog signalni vaqtning diskret momentlarida qiymatlari ketma-ketligi bilan almashtirish - namunalar. Bu muammo ADC ning kirish qismidagi maxsus sxema - namuna olish va ushlab turish qurilmasi yordamida hal qilinadi.
  3. Darajani kvantlash - bu signal namunasi qiymatini belgilangan qiymatlar to'plamidan eng yaqin qiymatga - kvantlash darajalariga almashtirish.
  4. Kodlash yoki raqamlashtirish, buning natijasida har bir kvantlangan namunaning qiymati kvantlash darajasining seriya raqamiga mos keladigan raqam sifatida ifodalanadi.

Bu quyidagicha amalga oshiriladi: uzluksiz analog signal bo'limlarga "kesiladi", namuna olish chastotasi bilan raqamli diskret signal olinadi, u ma'lum bir bit chuqurligi bilan kvantlash jarayonidan o'tadi va keyin kodlanadi, ya'ni almashtiriladi. kod belgilarining ketma-ketligi bilan. 20-20 000 Gts chastota diapazonida ovoz yozish uchun 44,1 va undan yuqori namuna olish chastotasi talab qilinadi (hozirda 192 va hatto 384 kHz namuna olish chastotalari bo'lgan ADC va DAClar paydo bo'ldi). Yuqori sifatli yozuvni olish uchun 16 bit etarli, ammo dinamik diapazonni kengaytirish va ovoz yozish sifatini yaxshilash uchun 24 (kamroq 32) bit ishlatiladi.

Raqamlashtirilgan audioni mediaga yozishdan oldin kodlash

Raqamli ovozni saqlashning turli usullari mavjud. Raqamli tovush - bu ma'lum vaqt oralig'ida olingan signal amplitudasi qiymatlari to'plami.

Terminologiya

  • kodlovchi - ma'lumotlarni kodlashning ma'lum algoritmini (masalan, arxivator yoki MP 3 kodlovchi) amalga oshiradigan dastur (yoki qurilma) manba ma'lumotlarini kirish sifatida qabul qiladi va kodlangan ma'lumotni ma'lum formatda chiqish sifatida qaytaradi.
  • dekoder - kodlangan signalni dekodlangan signalga teskari aylantirishni amalga oshiradigan dastur (yoki qurilma).
  • kodek (inglizcha "codec" - "Coder / Decoder" dan) - ma'lumotlarni kodlash/dekodlash uchun mo'ljallangan dasturiy ta'minot yoki apparat birligi.

Eng keng tarqalgan kodeklar

  • MP3 - MPEG-1 qatlami 3
  • OGG - Ogg Vorbis
  • WMA - Windows Media Audio
  • MPC - MusePack
  • AAC - MPEG-2/4 AAC (Kengaytirilgan audio kodlash)
    • MPEG-2 AAC standarti
    • MPEG-4 AAC standarti

Taqqoslashda ba'zi audio raqamlashtirish formatlari

Asosiy maqola: Audio formatlarni taqqoslash

Format nomi Kvantlash, bit Namuna olish chastotasi, kHz Kanallar soni Diskdan ma'lumotlar oqimining miqdori, kbit/s Siqish/qadoqlash nisbati
16 44,1 2 1411,2 1:1 hisobida mag'lubiyatsiz
Dolby Digital (AC3) 16-24 48 6 640 gacha ~12:1 yo'qotishlar bilan
DTS 20-24 48; 96 8 gacha 1536 yilgacha ~3:1 yo'qotishlar bilan
DVD-audio 16; 20; 24 44,1; 48; 88,2; 96 6 6912 2:1 mag'lubiyatsiz
DVD-audio 16; 20; 24 176,4; 192 2 4608 2:1 mag'lubiyatsiz
MP3 suzuvchi 48 gacha 2 320 gacha ~11:1 yo'qotishlar bilan
A.A.C. suzuvchi 96 gacha 48 gacha 529 gacha yo'qotishlar bilan
AAC+ (SBR) suzuvchi 48 gacha 2 320 gacha yo'qotishlar bilan
Ogg Vorbis 32 gacha 192 gacha 255 gacha 1000 gacha yo'qotishlar bilan
WMA 24 gacha 96 gacha 8 gacha 768 gacha 2:1, yo'qotishsiz versiya mavjud

Ovozni o'zgartirishning to'liq tsikli: raqamlashtirishdan iste'molchi ijrosigacha

Ovozni konvertatsiya qilishning to'liq tsikli: raqamlashtirishdan ijro etishgacha