Audio digitale e teoria sul campionamento

antani ha detto:
Per cui alla fine in acustica non si parla di "curve generiche" ma sempre di sinusoidi, che possono essere descritte mediante funzioni trigonometriche (seno e coseno).

Uff, non mi fare dire ovvietà! :) Una volta che sommi due (o più) sinusoidi non hai più un onda sinusoidale. Il che significa che aumentano notevolmente le cobinazioni ottenibili con i tre punti campionati.

Fidati: l'interpolazione non è una funzione che riscostruisce esattamente il segnale orginale. Per spiegartelo in termini comprensibili è come se pretendessi di ricostruire un blu-ray da un rip in divx.
La quantizzazione implica perdita, quella definizione su wikipedia sul campionamento senza perdita mi fa abbastanza ridere.

p.s. non parlatemi di seni e coseni: o uno o l'altro se mettete in gioco anche la fase.
 
Ultima modifica:
Un articolo a proposito dell'utilità di preservare frequenze al di sopra dei 20 khz:

http://www.cco.caltech.edu/~boyk/spectra/spectra.htm

La parte più interessante è, ovviamente, quella che discute se, una volta appurato che molti strumenti hanno un significativo contenuto energetico al di sopra dei 20 khz, se questo possa essere in qualche modo percepito:

Leggere il paragrafo X, questa è la frase più interessante:

Given the existence of musical-instrument energy above 20 kilohertz, it is natural to ask whether the energy matters to human perception or music recording. The common view is that energy above 20 kHz does not matter, but AES preprint 3207 by Oohashi et al. claims that reproduced sound above 26 kHz "induces activation of alpha-EEG (electroencephalogram) rhythms that persist in the absence of high frequency stimulation, and can affect perception of sound quality."

Un'intervista all'autore di questo articolo, tradotta in Italiano:

http://www.tnt-audio.com/intervis/boyk.html
 
Quindi se posso riassumere abbiamo due argomenti, che secondo me data la loro importanza richiedono di essere trattati separatamente:

- l'importanza percettiva delle armoniche ultrasoniche
- l'effetto della filtratura in alta frequenza

Partiamo dal primo. Non ho la più pallida idea se le armoniche a 30 kHz mi solletichino la corteccia cerebrale o mi titillino la coclea. Potrebbe benissimo essere.

Una domanda: il vostro impianto di riproduzione ha una risposta in frequenza infinitamente piatta? Io ritengo di avere un impianto in alta frequenza abbastanza sofisticato, visto che ho 2 array di tweeter per un totale di 20 trasduttori. Eppure non credo che si estenda molto oltre i 20 kHz (anzi quando sono a casa faccio una misura). Un impianto medio fa già molta fatica ad arrivare a 20 kHz.


ps. mi è venuto in mente che non posso misurare, il mio microfono non oltrepassa i 20 kHz. Chissà che risposta in frequenza ha il microfono di Norah Jones :what: .
 
Ultima modifica:
gattapuffina ha detto:
Leggere il paragrafo X, questa è la frase più interessante:

'but AES preprint 3207 by Oohashi et al. claims that reproduced sound above 26 kHz "induces activation of alpha-EEG (electroencephalogram) rhythms that persist in the absence of high frequency stimulation, and can affect perception of sound quality."'

beh questo oggettivamente è un nuovo punto di vista, ma mi piacerebbe sapere se c'è qualche dato a supporto di questa idea che per ora pare suggestiva ma poco più.

Sui bassi si sa che il corpo percepisce anche parte del suono, per cui non possiamo escludere che sugli alti funzioni come detto, ma serve qualche dato oggettivo.
 
antani ha detto:
Una domanda: il vostro impianto di riproduzione ha una risposta in frequenza infinitamente piatta? Io ritengo di avere un impianto in alta frequenza abbastanza sofisticato, visto che ho 2 array di tweeter per un totale di 20 trasduttori. Eppure non credo che si estenda molto oltre i 20 kHz (anzi quando sono a casa faccio una misura). Un impianto medio fa già molta fatica ad arrivare a 20 kHz.

non so dirti le sorgenti, ma per gli ampli si arriva facilmente oltre.
Il mio Aeron A4 arriva a -0.5 dB a 20 kHz e -1.5 dB a 30 kHz (AudioReview 04/04).
Ma già il Nad 325 arriva piatto molto oltre i 20 kHz addirittura a 100 kHz sta ancora entro -0.5 dB (AudioReview 11/06).

Poi tempo fa, quando stavo scegliendo cosa comprare, avevo raccolto un po di dati su prodotti di fascia media più o meno noti dati dei costruttori (non so entro quanti dB e il x kHz di uno a -0.5 potrebbe realmente essere meglio del x+delta dichiarato da un altro a -1 dB):

Advance acoustic MAP 103 15-100k
Advance acoustic MAP 105 10-65k
Advance acoustic MAP 305 10-60k
Aeron A1/A2/A4/A160 20-20k
Arcam A65 plus 20-20k
Atoll IN 50 5-80k
Atoll IN 80 5-100k
Audio analogue Primo 20-20k
Audiolab 8000S 20-20k
Cambridge Audio Azur 340/540 5-50k
Denon PMA-500AE/700/1500 20-20k
Harman Kardon HK 970 10-170k
Marantz PM4001 10-30k
Marantz PM6002 10-50k
Marantz PM7001 10-60k
Onkyo A-9211 15-50k
Onkyo A-933 10-60k
Onkyo A-9555 10-100k
Rotel RA-04/05/06 10-40k

non so se il dato costante su vari modelli di alcuni costruttori sia "conservativo", ma di certo molti dichiarano di superare ampiamente i 20 kHz.
 
Ultima modifica:
State dimenticando l'aspetto fondamentale.

Nyquist-Shannon vale solo in casi ideali, come spiega benissimo la pagina di wikipedia in inglese, che consiglio a tutti di leggere.

Spiega chiaramente come in casi reali, con DAC reali, il campionamento non possa riprodurre l'onda originale, ma una finita approssimazione di essa, che si discosta da essa non solo nelle frequenze non udibili, ma in TUTTE le frequenze, essendo una approssimazione.

La pagina di wikipedia spiega bene il motivo di ciò e i principali problemi.

Campionamenti a più alte frequenze riducono gli errori introdotti dai DAC e quindi avvicinano l'approssimazione all'onda originale.

Quale sia la frequenza in HZ, dato il miglior campionatore disponibile oggi, alla quale diventi inudibile la differenza fra onda originale e aprrossimazione, è difficile dirlo.

Io credo che stia in mezzo fra i 48 khz e i 96 khz, per la mia esperienza, potrebbe essere 60, 70 o qualcosa del genere (e quindi a quel punto conviene campionare a 96).

Inoltre e' stato provato più volte che ci sono dei fenomeni di colorazione del suono dati dall'interazione di onde supersoniche (sono detti fenomeni di intermodulazione supersonica) di vari strumenti, che causa che il suono in area udibile venga alterato.

Per cui se i vari strumenti sono registrati da vicino separatamente, il suono raggiunge il microfono prima che interagisca con le altre onde e quindi questa colorazione non viene registrata e quindi bisogna fare in modo che venga riprodotta in ambiente di ascolto, per avere un effetto identico all'originale.

Invece è inutile se registriamo con un unico microfono a distanza di qualche metro: a quel punto il fenomeno di colorazione è gia avvenuto, e la sua parte udibile è stata registrata, quindi le frequenze inudibili non servono più ad una bega, ma non è questo di solito il caso delle registrazioni moderne, dove vengono registrati separatamente da molto vicino i vari strumenti, e poi mixati in maniera asettica e digitale (senza colorazione o interazioni fra le forme d'onda quindi) nel nostro CD/SACD/etc...

Quindi se anche io non potessi sentire 20khz o 25 khz del tutto e se anche i miei diffusori avessero un forte attenuamento sopra i 16-20 khz, registrare le alte frequenze servirebbe a far emettere ai diffusori le onde supersoniche che riprodotte insieme in ambiente interagirebbero tra di loro, causando un 'coloramento' del suono nella parte udibile (20hz-10khz).

Morale, ci sono questi punti fermi PROVATI E RIPORTATI DA WIKIPEDIA STESSA:

A) Un qualunque DAC reale con una qualunque onda reale e complessa, viola il principio di Nyquist-Shannon. E' fisicamente impossibile costruire un DAC che operi su un'onda reale e ne dia una perfetta rappresentazione, a tutte le frequenze. C'è sempre una approssimazione della forma d'onda e questa approssimazione è tanto piu precisa quanto è piu alta la frequenza di campionamento, senza essere MAI perfetta (neanche a 100000000000000000000000000000 khz di campionamento)

B) L'intermodulazione supersonica fa in modo che contino anche le frequenze non udibili, finchè sono riproducibili, con un volume anche attenuato, dal nostro impianto, per 'colorare' la parte udibile.

Queste due cose insieme provano che e' necessario, in un'ottica di alta fedeltà, una frequenza di campionamento più alta.

Se poi la differenza fra i 48 e i 96 sia udibile o meno, non tocca a me dirlo, fate una prova voi stessi. Io l'ho fatta e mi sembra di sentirla, ma non ho mai fatto un test in doppio cieco riguardo questo, quindi no mi fido.

Per me quanto 'sia giusto' per avere l'ottimo è difficile da dirlo, IMHO come detto sta in mezzo fra 48 e 96, quindi vorrei sempre campionamenti a 96 khz, per non rischiare.

E' stato quindi PROVATO che non e' assolutamente vero che campionare a 96 khz è inutile: anzi è molto utile per avere una approssimazione sonora più vicina alla realtà di un ascolto live della musica (forme d'onda più vicine alle originali, colorazioni, etc...).

Il discorso è quale è la soglia dell'udibilità di questa differenza: se sotto i 48 khz, se fra i 48 e i 96, se fra i 96 e i 192.

Io propendo come detto per 48/96 :D

MA LA DIFFERENZA C'E', e a TUTTE le frequenze di emissione, non solo nelle altissime, punto.
 
Ultima modifica:
E' stato quindi PROVATO che non e' assolutamente vero che campionare a 96 khz è inutile
E riprodurre a 96KHz?

Io sono del parere che i 44,1/48KHz siano sufficienti per i nostri ascolti nei nostri ambienti ma allo stesso tempo penso che data la facilità dei mezzi attuali a gestire i 96KHz, se anche questi apportassero miglioramenti minimi e udibili sono da pochissimi, li vorrei usare. I 192KHz invece non li vorrei avere perchè li reputo troppo inutili.

Ciao.
 
Ultima modifica:
antani ha detto:
Il collo di bottiglia di un impianto, dopo l'ambiente, solitamente sono i diffusori.
E-S-A-T-T-O!
costano meno 4 metri di libreria billy presi all'ikea e appoggiati contro il muro della sala( circa 200 euro con mastercard ) del nuovo dac costruito in base ai criteri della velocità di curvatura ( non ha prezzo) :D ... e la diffrenza è notevole già al primo ascolto.
Tornando in topic: parecchi anni fa facemmo diverse prove supportate dalla teoria( io facevo ancora le superiori ma erano già anni che armeggiavo con impianti ad alta fedeltà)io e due miei professori di elettronica accomunati dalla stessa passione.
Allora la diatriba era fra i vecchi dac a 14 bit e i nuovi dac a 16 bit.( circa 23 anni fa)
Usammo un'impianto al di sopra di ogni sospetto sia con diffusori (B&W 801 serie 80) che con un paio di cuffie elettrostatiche della Stax ( sinceramente non ne ricordo il modello)e devo dire che di noi tre l'unico che ne percepiva la differenza era uno solo.
Facemmo una trentina ( o forse più, non ricordo)di prove al buio e lui non ne sbagliò una!
Io e l'altro prof rimanemmo basiti e delusi delle nostre orecchie :( perchè la differenza non la sentivamo o meglio sbagliammo un sacco di volte.
Ma ciò ci permise di capire una cosa: la differenza c'era ma era piccolissima e non tutti erano in grado di percepirla.
Ora si tratta di capire se tale differenza è realmente udibile anche per le differenze di campionamento in un caso pratico e non teorico.
 
concordo! 96khz sono già 6 volte la maggior frequenza udibile.

Tra le considerazioni che farei sul perchè delle scelta fatta per il formato cd terrei in considerazione che un disco da 700MB 20 anni fa era pura fantascenza, all'epoca i personal si scambiavano i dati con i floppy disk da 360 kbyte
 
Picander ha detto:
Tra le considerazioni che farei sul perchè delle scelta fatta per il formato cd terrei in considerazione che un disco da 700MB 20 anni fa era pura fantascenza, all'epoca i personal si scambiavano i dati con i floppy disk da 360 kbyte
bè...diciamo che il cd nasce commercialmente nel 1982, non era la versione da 700 mega ma leggermente inferiore (650MB? non ricordo)ma sono passati già 27 anni.
 
I ragionamento basati sull'intermodulazione supersonica secondo me sfiorano il misticismo. Per quanto teoricamente corretti la loro rilevanza al lato pratico è quantomeno dubbia soprattutto se, come accennavo, teniamo in considerazione i limiti della tecnologia elettromeccanica. Credo che sia molto più probabile udire le già poco udibili distorsioni armoniche e di intermodulazione, che invece ci sono sempre.

Interessante a questo proposito guardare lo spettrogramma della registrazione di un LP, dal link postato da Gattapuffina.

mb-lp-s.gif


Come si nota un LP genera un numero enorme di distorsioni in alta frequenza. Le ritengo distorsioni perché le tracce colorate in frequenza supersonica non credo possono essere state originariamente presenti sul vinile, date le caratteristiche del supporto.

Sono invece d'accordo sul discorso dell'imperfezione dei DAC nel ricostruire correttamente le onde acustiche. Io penso che sia stato questo il principale motivo per cui sin da subito il digitale si è creato la fama di non essere all'altezza dell'analogico.

Però vorrei anche far presente che la tecnologia digitale, e i DAC in primis, si sono evoluti enormemente negli ultimi 30 anni. La potenza di calcolo oggi disponibile in chip da pochi euro era inimmaginabile negli anni 80. Basta leggere le prove strumentali degli ultimi DAC per rendersene conto, dove ormai stiamo raschiando il limite del rumore termico.

Quello che poteva essere udibile in passato non è detto che lo sia anche nel presente.

Personalmente, io non sono affatto contrario ad uno standard a 96/24 (il 192 invece mi sembra proprio una cazzata). Ormai non ci sono più problemi di spazio o potenza di calcolo. Meglio avere margine che non averne. Purtroppo però non sono convinto che si arriverà mai a tale standard. Per questo sarei molto più contento di avere dei 44/16 registrati decentemente, che invece sono una rarità.
 
Se qualcuno volesse condurre delle prove in cieco su diverse cose tra cui anche lunghezza di parola e frequenza di campionamento, qui potete trovare dei file dimostrativi.
 
antani ha detto:
I ragionamento basati sull'intermodulazione supersonica secondo me sfiorano il misticismo (...) Per questo sarei molto più contento di avere dei 44/16 registrati decentemente, che invece sono una rarità.

Non posso fare altro che quotare ogni singola parola e identificare il mio pensiero con il tuo post!

p.s. Come già detto prima nessuno ci dice che le linee verticali di quello spettrogramma non siano rumore. Potrei campionare una radio sintonizzata male e avrei uno spettro molto più ampio :)
 
Leggo solo ora questo post molto interessante, ma mi sembra di capire che ci sia molta confusione sull'argomento e mi permetto, nel mio piccolo di provare a fare un po' di chiarezza.

Partiamo dal descrivere (in modo rozzo non me ne vogliate) un ADC/DAC: in sostanza e senza orpelli è fatto dalla serie di un campionatore e un filtro passa basso. Nessuna magia, ma è funzionale allo scopo.

@Picander: le prove che hai fatto sono del tutto ineccepibili, ma ti limiti all'uscita del campionatore. se tu avessi inserito a valle un filtro passa basso, avresti ottenuto, come ti ha detto Antani, la stessa forma d'onda, ne più ne meno. fai pure la prova: prendi la tua onda campionata da fare schifo (onda quasi quadra o dente di sega),passala con il filtro passa basso e otterrai una sinusoide perfetta (quasi, ora ci arrivo). Nessun algoritmo nessuna interpolazione.

La teoria è nota e non è in discussione.

altra faccenda è l'implementazione pratica e quiu di solito vengono le note dolenti. siamo tutti d'accordo che un dac fatto male suona male, ma non è colpa del DAc in se, ma del fatto che lo producono con i èpiedi per risparmiare. probabilmente un dac 24/192 fatto amle suona meglio di un 16/44 fatto benino, ma dovrei fare delle prove.

rimane il fatto che il poco "spazio" in frequenza per il filtro passa basso possa rendere più difficile fare bene un filtro per 16/44 che non per il 24/192. ovvero che sia più facile (meno costoso) aumentare gli standard di campionamento che l'accuratezza della circuitazione.

Per quanto riguarda l' 2intermodulazione supersonica" mi sembra una cosa tipo l'"effetto pelle" dei cavi. il fanomeno esiste ed è matematicamente dimostrabile (bastano due onde sinusoidali, le formule di prostaferesi e mezzo pomeriggio di pazienza :D), am come tutti i fenomeni di ordine superiore è decisamente tracurabile.
Se è pur vero infatti che la suddetta intermodulazione agisce anche sulle frequenze udibili, è anche vero che l'ampiezza di questo contributo è pari al prodotto delle ampiezze dei segnali che ne danno origine per un qualche fattore che non ho voglia di calcolare ma comunque tale è l'ordine di grandezza. ora senza entrare nel merito numerico, considerate la catena di ascolto ambiente escluso:

sorgente -> dac (filtro Passa basso) -> ampli (passa banda) -> diffusori (passa banda)

alla fine della catena, ciò che è fuori banda è talmente attenuto che un pur esistente contributo in banda udibile sarebbe ben al di sotto del rumore di quantizzazione introdotto dal ADC/DAC.
Sarebbe come dire di riuscire a sentire il fruscio delle casse appoggiando l'orecchio alla griglia con ampli in mute mentre a 1 metro di distanza sta suonando un pezzo dei Metallica da una coppia di Klipsch con un ampli yamaha da 100W per canale ed il volume a palla!! :D

Ricapitolando:

- la teoria non è in discussione
- l'implementazione pratica è critica
- negli ultimi anni la tecnologia ha fatto passi da gigante
- l'intermodulazione supersonica è trascurabile
- il DAC/ADC non è di solito l'anello debole della catena audio.

e in tutto questo non abbiamo considerato l'ambiente, ma questa è un'altra storia...XD

Giancarlo
 
D'accordissimo su quello che dice antani quindi.

Quindi siamo d'accordo su questo, tirando le fila:

A) Da un punto di vista formale, nonostante Nyquist-Shannon, 44/48 khz NON BASTANO, per la 'fallacità' di qualunque DAC reale e l'impossibilità di riprodurre inalterata la forma d'onda originale. C'è SEMPRE una approssimazione, anche con un campionamento a 192khz o 10000000000khz.

B) Inoltre, potrebbe essere un qualche apporto dato dalle alte frequenze (intermodulazione supersonica) sulle frequenze udibili, che altera il suono, con un campionamento a bassa frequenza, questo lo perderei.


Se le 'differenze' introdotte da A e B sulla musica reale siano udibili e quanto siano udibili non è invece chiaro.

Sicuramente tempo fa esistevano DAC che davano campionamenti a 44khz facilmente distinguibili da campionamenti a 96khz (ho fatto io stesso esempi in cieco eli ho riconosciuti).

Secondo me tempo fa la frequenza di campionamento oltre la quale le differenze non erano udibili, era di molto superiore a 44/48 khz.

Con i DAC moderni allo stato dell'arte, questa differenza si è spostata verso il basso e riusciamo ad avere anche degli OTTIMI 44/48 khz, ma imho si sente ancora, con un impianto perfetto, la differenza.

Però ci stiamo avvicinando molto alla soglia di udibilità... quindi potrebbe essere un domani in cui un DAC che campiona a 44 khz produce un file audio INDISTINGUIBILE dallo stesso file campionato a 96khz.

Secondo me NON SIAMO ANCORA A QUESTO PUNTO, ma è opinabile la mia opinione :) Qualcuno potrebbe invece dire che CI SIAMO GIA, e esistono gia DAC validi a tal punto da dare file a 44khz indistinguibili del tutto dai file a 96 khz.

Sicuramente qualunque cosa sopra i 96khz invece è sopra la soglia dell'udibile.... per lo meno per il mio orecchio e dai test che ho fatto :)
 
Vorrei mostrare una cosa, per comprendere l'importanza relativa fra:
- il campionamento e ricostruzione D/A A/D
- la funzione di trasferimento diffusori ambiente

Chi conosce la teoria dei segnali sa che la risposta all'impulso di un sistema descrive le sue caratteristiche in funzione del tempo.

Queste sono le risposte all'impulso nei due casi predetti (la scala è differente a fini illustrativi):



Nel primo caso ho registrato l'uscita analogica della scheda audio, facendo attraversare al segnale una doppia conversione a 44.1/24 (oltre che un cavo di segnale economico).

Nel secondo caso il segnale ha fatto un percorso simile a quello che compie per arrivare al mio orecchio: sorgente, DAC, pre, finale, diffusore, microfono, campionamento 44.1/24.

Nel primo caso la risposta all'impulso è quasi perfetta (una delta di Dirac band limited). Nel secondo caso è....giudicate voi, una specie di mostro, hai voglia a cercare l'errore di quantizzazione :D .
 
Ultima modifica:
gianka ha detto:
fai pure la provao

fatta!

Primo test: la sinusoide è stata disegnata con un amipezza corretta ma fase completamente sbagliata rispetto all'originale.

Secondo test: i battimenti sono rimasti
 
Picander ha detto:
Primo test: la sinusoide è stata disegnata con un amipezza corretta ma fase completamente sbagliata rispetto all'originale.

La fase assoluta di un segnale audio non ha alcun significato pratico.
Sarebbe come iniziare ad ascoltare qualche ms dopo o prima.

Non dico altro per non scatenare flame XD

Picander ha detto:
Secondo test: i battimenti sono rimasti

Potresti specificare meglio? non ho capito che test hai fatto...

@Ligui.Lauro: sostanzialmente concordiamo sull'approccio generale, forse non diamo lo stesso peso alle differenze. detto che 44khz "non bastano" credi davvero che, a meno di componenti insulsi, siano influenti sull'ascolto?
la figura che mostra Antani è eclatante. non so che scheda audio abbia usato, ma di solito PC, schede audio e compagnia non sono il top come qualità della componentistica (anche se nel caso di Antani non mi stupirebbe il contrario XD)

ergo: un DAC moderno e "decente" è praticamente inubile in catene audio di livello medio-alto/alto. l'esoterico lo lascio ad altri...:rolleyes:

Piuttosto mi preoccuperei della fase ADC su cui non hai alcun controllo e che di solito disintegra le registrazioni. forse più che un buon DAC serve un buon CD (ovvero fatto bene), cosa sempre più rara ormai. :(
 
Chiedo venia. Questa è la risposta all'impulso di una doppia conversione. La prima riportata sopra è invece una risposta all'impulso teorica, cioè come dovrebbe essere. Mi sembrava fosse troppo perfetta :stordita: .

Anche questa è comunque molto buona, e il ragionamento rimane invariato, la differenza fra le due situazioni è abissale.

 
Top