Audio digitale e teoria sul campionamento

Picander

New member
Apro questo argomento come continuazione della diatriba che prosegue in ogni topic leggermente correlato alla qualità del cd audio, alla sufficienza del campionamento a 44.1 ed altre chicche.
Anch'io ho studiato l'argomento in passato, quindi penso di poter contribuire.
Più avanti posterò qualche immagine dimostrativa, intanto per la discussione pongo alcuni punti che devono essere ricnosciuti da tutti come punto di partenza.

1-una segnale senza armoniche è prodotto esclusivamente da un'onda sinusoidale

2-la lunghezza d'onda della sinusoide è la distanza tra due punti con le stesse proprietà cinetiche

3-un onda seghettata è piena di armoniche
 
L'argomento è tanto interessante quanto complesso. Sono appena uscito da una pessima discussione su un altro forum sullo stesso argomento, finita molto male.

Forse qui riusciremo a discuterne con più calma, ma dammi un po di tempo per riprendermi.
 
:D :D

Volentieri, nel frattempo potresti scaricare il programma goldwave per windows? Niente di eccezionale, ma ha una simpatica feature che ti permette di disegnare l'onda tramite funzioni trigonometriche.
 
Ho seguito quella discussione antani e sono solidale con te. L'argomento è molto interessante, spero di imparare qualcosa di più dai vostri contributi.
 
Io non ho fatto prove comparative in cieco ma sono certo di 2 cose:
- i DVD audio con le incisioni 24/96 di 3 dischi di Alan Parsons suonano decisamente meglio dei loro equivalenti CD (sono dischi che conosco a memoria)
- il filtro passa basso necessario nei convertitori D/A fa molti piu' danni a 22 kHz, anche se viene implementato l'oversampling.
Comunque, IMHO, l'unico caso in cui un file 16/44 e' paragonabile ad uno 24/96 o, peggio, ad un 24/192 e' quando questi ultimi sono generati da un originale a risoluzione inferiore (magari proprio il 16/44 o un 16/48).
 
non posso ancora fare grafici, ma una delle cose incredibili è che una sinusoide di 22050 hz può completamente sparie se fuori fase con la cadenza del campionamento.

Non ci credete? Immaginate una sinusoide, durante un ciclo tocca due volte la linea dello zero (una volta salendo, una volta scendendo).
Se il campionatore (che per rappresentare quella frequenza deve essere minimo doppio) combacerà con i picchi avremo campionato un onda a sega a 22050hz, ma se il campionatore cade nell'incrocio... avremo un silenzio assoluto.

I suoni sopra i 15000hz sono completamente inutili, il problema è che rappresentare verosimilmente l'intorno dei 15000 abbiamo bisogno di ben più di 44.1khz di campionamento.
 
Ultima modifica:
Interessante. Conferma quello che pensavo, cioè che spesso un LP suona meglio di un CD perché i CD vengono maltrattati in fase di mastering.

Vale la pena notare che la dinamica utilizzabile in un LP sta intorno ai 45 dB, e la grande presenza di distorsioni armoniche in altissima frequenza. Mi domando quante queste incidano all'ascolto. Non escludo che un certo livello di distorsione possa persino essere percepito positivamente.

Comunque su questo thread non parlerei ancora di CD vs LP.
 
Ultima modifica:
ben detto! quell'estensione delle frequenze può (ed è molto probabile) essere creato da armoniche di distorsione, non escluderei che lo stesso effetto si possa verificare registrando un cd
 
ecco una prima immagine chiarificatrice

ho generato due file audio con una sinusoide a 11025hz, il file di sopra ha un campionamento a 44,1 mentre quello sotto a 192

la funzione è sin(2*pi*f*t+pi/4) (una nomrale sinusoide, che non parte da zero ma da pigreco/4)

http://picander.dyndns.org/schermata1.png

l'effetto non è così devastante come sembra, l'onda quadra crea solo armoniche superiori (problema evidenziato nel post precedente) che al nostro orecchio non interessano. Il verò problema è che l'ampiezza risulta abbasata notevolmente. Questo dimostra che in un camoionamento a 44.1 già suoni relativmanete bassi come una frequenza a 11025 si possono creari molti problemi di fase con la cadenza del campionatore
 
Ultima modifica:
Beh, qualche anno fa fece piuttosto scalpore, durante la guerra tra DVD-A e SACD, questo esperimento pubblicato su "Surround Professional", che compara un'onda quadra a 10 khz generata da un oscilloscopio, campionata a 44.1, 96, 192 e in DSD

http://web.archive.org/web/20071011...tre.org/surround2002/technology/page_07.shtml

Direi che smentisce piuttosto palesemente sia la teoria che 44.1 basta e avanza, sia che il DSD sia inerentemente superiore al PCM nel riprodurre un fenomeno analogico, sicuramente il PCM 192 offre lo stesso risultato del DSD, ma con molto meno "sporco", dovuto al noise shaping del DSD.
 
Picander l'unica cosa corretta che hai detto finora e' che a 22.050 Hz potremmo avere un problema di ricostruzione. Ora però non ho tempo per approfondire, sto costruendo un bellissimo controsoffitto acustico. Questo si che migliora il suono, mica i 192/24 :D .

La ricostruzione dell'onda quadra e' un finto problema, se questa e' limitata in frequenza.
 
:O e no caro! dimmi dove ho sbagliato!

Anche l'immagine postata è "sbagliata"?:wtf:
 
Ultima modifica:
antani ha detto:
Ora però non ho tempo per approfondire, sto costruendo un bellissimo controsoffitto acustico. Questo si che migliora il suono, mica i 192/24

Anche questa è l'unica cosa giusta che hai detto, finora :):):) (non te la prendere, era solo una battuta su quello che hai scritto a Picander...)

Sono d'accordo che anche una eventuale tecnica di campionamento fantascientifica a 64 bit in virgola mobile, non farà mai così tanto, per la qualità di ascolto, come un ambiente acusticamente buono e un buon posizionamento.

Però, è anche vero che, quando avrai l'ambiente a posto, avrai anche la possibilità di sentire più facilmente le differenze tra 44.1/16 e 192/24.

Per riallacciarmi al discorso dell'altro thread, a proposito della prova d'ascolto in doppio cieco fatta con l'ABX del Foobar, per scoprire eventuali differenze tra 24 e 16 bit alla STESSA frequenza di campionamento:

Mi dicevi che i punti dove si sarebbe sentita di più la differenza, erano solo i passaggi debolissimi, nella qualità del fruscio.

E' vero, questo è quello che ci dice la teoria, dato che il file a 16 bit è ottenuto mediante dithering, che è un modo di aumentare la risoluzione *aggiungendo* rumore che, essendo molto in basso, probabilmente dalle parti di -70 db se non meno, si può sentire la differenza solo alzando moltissimo il volume, nei passaggi bassissimi, se non addirittura di silenzio.

Beh, io *questa* cosa, sinceramente, non l'ho sentita. O meglio, probabilmente l'avrei potuta sentire, se non che era piuttosto tardi, usavo le cuffie, e comunque il volume dal PC più forte di tanto non esce, fai conto che il rumore di fondo era comunque coperto dalla ventola del PC...

In realtà, ho sentito altro: partendo dal presupposto che mi è venuto fuori un punteggio abbastanza buono, cioè 93.7% ( 6 su 7 ), i punti dove mi concentravo di più per cercare di riconoscere le differenze, erano i passaggi più dinamici dove il segnale passava velocemente da piano a forte. La differenza è poca, ma c'è, e sta nel fatto che in una versione c'è più "aria", sembra che il suono faccia meno fatica ad uscire.

E ammetto che le differenze sono poche.

Sono molte di più tra CD e Vinile, ma è chiaro che lì c'è tutta una catena audio completamente diversa, una cosa è mettere a confronto 2 file diversi sul computer, e un'altra è confrontare un CD con un giradischi che ha una testina che ha il suo suono, entra in un pre phono che ha il suo suono, etc.

Per cui, è chiaro che chiunque parli di CD vs Vinile, alla fine sta paragonando *anche* apparecchiature ben diverse tra loro, per non parlare del setup: basta variare il peso di lettura della testina, e il colore del suono cambia, aumenti il peso e i bassi escono fuori, diminuisci troppo ed entra la distorsione...

Ma ammettere che le differenze sono poche, e sostenere che non siano assolutamente udibili e che nessuno è in grado di riconoscere in doppio cieco (ad esempio) 24 bit da 16, sono due cose ben diverse.
 
Picander ha detto:
...Anche l'immagine postata è "sbagliata"?:wtf:
Le immagini mi sembrano corrette e sono anche carine ;) .

Ma quello che hai disegnato è il campionamento di una sinuosoide, non la sinusoide. Se questo campionamento attraversasse una ricostruzione digitale/analogica, in entrambi i casi otterresti la stessa onda, quella di partenza. Non c'è nessuna distorsione di fase, ne riduzione di ampiezza.
 
@ Gattapuffina, a giudicare da quello che scrivi, dopo il test ti sei reso conto del fatto che le macroscopiche differenze fra l'ascolto dei CD vS LP, non sono dovute alle caratteristiche deficitarie del redbook.

Sono proprio per questo genere di considerazioni che ritengo i test in cieco interessanti.

Per quanto riguarda l'udibilità, come hai notato già in cuffia questa è assai problematica, e sbagliarsi è un'attimo (mi sembra tu abbia fatto 15/20). In ambiente diventa praticamente indistinguibile.

Un'altra cosa interessante che consiglio di provare è questa: prima ascoltare sapendo cosa si sta ascoltando, e poi in cieco (anche in cuffia). Serve a rendersi conto di quanto il nostro sistema percettivo sia ingannevole.
 
I principi del campionamento digitale si basano in buona parte sul Teorema di Nyquist Shannon, enunciato per la prima volta nel 1949.

E' quindi molto importante che se ne capisca il senso. Altrimenti non ci potrà essere nessuna discussione seria sull'argomento.

Tale teorema afferma che è possibile ricostruire un segnale acustico senza perdita di informazioni utilizzando una frequenza di campionamento che sia almeno il doppio di quella del segnale campionato. Cioè ad esempio è possibile ricostruire una frequenza di 20.000 Hz utilizzando un campionamento di almeno 40.000 Hz. Tale frequenza è anche conosciuta come frequenza di Nyquist.

Su Wikipedia potete trovare la dimostrazione matematica, comunque intuitivamente questa ricostruzione è possibile in quanto le onde acustiche sono descrivibili in termini trigonometrici. E' come cercare di ricostruire una retta. Noi tutti sappiamo che bastano 2 punti per riuscire a identificarne l'equazione. Analogamente bastano 2 punti per ricostruire un'onda acustica. Se invece di 2 punti ne avrò 4 oppure 100, non fa nessuna differenza, non aumenterò in alcun modo l'accuratezza della ricostruzione.

Consegue dal Teorema di Nyquist che fino alla frequenza di 22.050 Hz, il campionamento dello standard CD (44.100 Hz) è completamente equivalente a campionamenti superiori.

Molte persone immaginano che maggiore è la frequenza di campionamento, più precisa sarà la ricostruzione del segnale, come ad esempio avviene con le fotografie digitali. Non è così! Con un campionamento di almeno 2 volte la frequenza del segnale, la ricostruzione sarà perfetta, anche in termini di ampiezza e di fase.

Ritengo molto importante assimilare questo punto, per cui se qualcuno ha dubbi o non è d'accordo su questo principio, parli ora o taccia per sempre :D .
 
antani ha detto:
Se questo campionamento attraversasse una ricostruzione digitale/analogica

la ricostruzione non fa mica miracoli! Nel cd le informazioni sono scritte come l'immagine di sopra, come può indovinare il dacil picco dell'onda da ricostruire? può solo tirare a indovinare

A porposito di Nyquist, come mi può un dac ricostruire un onda a 22050 hz che entrata in fase con la cadenza del campionatore viene registrata come segnale silenzioso? La definizione data da wikipedia e imprecisa.
 
Ultima modifica:
Antani, eccellente spiegazione, anche per chi ha solo vaghi (ma MOLTO vaghi!) ricordi degli esami di analisi e teoria dei segnali, fatti illo tempore all'università!

Specie l'esempio della ricostruzione di una retta! :)
 
nuovo test: i battimenti
frequenza 11024 (sì un hz in meno), sopra 44.1 sotto 192

http://picander.dyndns.org/schermata3.jpeg

come potete notare il leggero sfasamento della sinusoide con la cadenza del campionamento comporta gravi problemi di ricostruzione dell'ampiezza (chiaramente udibili ad orecciho). Nessun problema con alta risoluzione

edit:
ovvamente sono segnali limite, che mirano a verificare i punti deboli della quantizzazione. Lo stesso errore si verifica dividendo per 4 la frequenza dei 192000, solo che poco ce ne frega che i 44100 si sentano bene o male.
 
Ultima modifica:
Top