Bit, samplingsfrekvens mm när det gäller ljud.

Permalänk

Bit, samplingsfrekvens mm när det gäller ljud.

Hej!
Jag har ett litet problem, jag har tenta imån, (omtenta för att vara exakt) i ljudproduktion.
Ett område jag har svårt att greppa är det där med bit depth, bit rate, samplingsfrekvens, och hur det hänger ihop. Kursböckerna ger inte mycket hjälp märkligt nog.
En av kursböckerna beskriver bit depth som mängden information i "varje smakprov". Jag hänger upp mig på ordet smakprov, vad menas med detta? Är ett smaprov tidsbaserat, eller vad?

Samplingsfrekvensen beskrivs som hur ofta ett "smakprov" tas, återigen, vad menas med smakprov?
Om ett smakprov tas ett visst antal gånger per sekund, vad händer "mellan" smakproven? Om det är smakproven som spelas upp, vad händer då med det som inte tas smakprov av?

Jag förstår dock meningen med detta, t.ex. samplingsfrekvens. Det handlar om att minska mängden information, ta bort överföldig information, så att ljudfilen tar mindre plats.
Men på vilket sätt detta görs, och hur det funkar, det är det jag har väldigt svårt att greppa.

Finns det någon ljudkunnig person här som skulle kunna förklara detta på ett enkelt sätt? Hoppas det inte är allt för komplicerat att skriva ner det.
Jag har försökt hitta en bra förklaring på internet, men jag lyckas inte hitta nån bra förklaring som jag förstår.

Vore väldigt snällt om nån ville hjälpa mig

Tack på förhand!

MVH Björn

Permalänk
Medlem

En ljudsignal är kontinuerlig men en dator kan bara arbeta med diskreta datamängder. Ett "smakprov" eller ett sampel är amplituden på ljudet i det ögonblick det lästes av, samplingsfrekvensen är då hur ofta man läser av den kontinuerliga signalen. "Bit depth" är hur många bitar man behöver för att beskriva värdet på "smakprovet"/samplet, "bit rate" är hur många bitar per tidsenhet som används för att beskriva den avlästa diskreta signalen.

Citat:

vad händer "mellan" smakproven?

ingenting, när vi spelar upp "smakproven"/samplen så kommer det mellan dom att interpoleras fram.

Permalänk

Tänk dig att vi har en analog ljudsignal. Denna signal är tidskontinuerlig och innehåller oändligt mycket information. Nu vill vi göra om signalen till en digital signal eftersom en digital signalprocessor inte klarar av att hantera så mycket data.

Detta gör vi genom att sampla signalen. Att sampla signalen innebär att man plockar ut mätvärden ur signalen med jämna mellanrum. Den nya signalen kommer då att vara en tidsdiskret signal. Med en högre samplingsfrekvens får vi fler mätpunkter per tidsenhet och kommer då att kunna återskapa signalen med en högre noggrannhet (fler frekvenser återskapas).

Men eftersom varje sampel är ett värde med oändlig noggrannhet så måste man även här förkasta data. Här bestämmer förmodligen bitdjupet hur många bitar som ska representera varje sampel. Med fler bita får man en högre noggrannhet på samplet (exaktare nivåer).

Information mellan varje sampel har nu blivit bortkastad och vi har en signal som en processor klarar av att bearbeta.

Man brukar säga att man minst behöver ha dubbelt så hög samplingsfrekvens som den lägsta väsentliga frekvensen i den signal som ska diskretiseras.

Kan tillägga att konsonanter mest består av brus, medan vokaler består av ett par rena frekvenser + övertoner. Detta fenomen används väldigt ofta inom mobiltelefoni.