Secondo me viene ignorato il fatto che la musica sia molto più "matematica" di quanto si pensi.
Visualizzazione Stampabile
Secondo me viene ignorato il fatto che la musica sia molto più "matematica" di quanto si pensi.
Scusate, non riuscivo a postare prima..
Ragazzi, ma come fa un algoritmo stupido (nel senso che non ha intelligenza e sensibilità musicale umana) a sapere dove e come inserire campioni coerenti con un messaggio musicale originale, se non ha idea di come sia il segnale originale?
Voglio dire...se tu potessi confrontare l'onda originale con l'onda campionata è un conto, ma se non sai com'è fatta l'onda originale, il tuo lavoro di smussatura ed interpolazione non è coerente con ciò che è stato registrato, ma è solo una "smussatura" di ciò che sta nel CD a risoluzione inferiore. :)
Un algoritmo non può "sentire" uno strumento come la nostra mente e quindi capire come potrebbe aumentarne la risoluzione.
Lavora con procedimenti matematici che nulla hanno a che vedere con l'evento originale, ma che si basano su sample precedenti..
Sono d'accordo che è meglio una risoluzione elevata, ma questa deve esserci alla sorgente, quando si converte da analogico a digitale. Non ce la si può inventare a posteriori, non in questo ambito almeno.
Vogliamo spostarci sulle sensazioni?
Personalmente nell'ascolto più "vero" che mi è capitato di fare, la sorgente era un CD 16/44,1kHz senza oversampling. E sembrava di avere i musicisti nella sala, mai sentito nulla di simile se non dal vivo.
Neanche immaginavo di poter sentire la musica in quel modo, da un semplice CD
E non sto parlando del mio impianto o di quello di un parente/amico.
Qualche sostenitore dell'upsampling mi può spiegare come può un algoritmo aggiungere informazioni coerenti con la sorgente, senza sapere com'è questa sorgente?
@rolands: concordo con te sul rumore da evitare, ma occhio alle dichiarazioni che fai su apple, perchè nella scheda tecnica del mac mini è scritto ben chiaro che produce 18dBa in idle misurati al punto di lavoro ;)
http://www.apple.com/it/macmini/specs.html (vedi in fondo a DX)
Se la sala non è minuscola ed un minimo assorbente, è un rumore generalmente inferiore a quello che produce un lettore CD in lettura.
Lo dico perché lo uso in ufficio ed è tra i computer più silenziosi che abbia mai provato (paragonabile ad un fanless con disco meccanico da 3,5" non perfettamente isolato)
Ciao,
Edo
In che senso?Citazione:
Originariamente scritto da brcondor
parli della sezione aurea e delle serie di Fibonacci ?Citazione:
Originariamente scritto da brcondor
Mi spiace non poter entrare nel merito tecnico perchè in questo campo non ho mai studiato. Ma avendo studiato in altri campi la stessa problematica, io non escludo affatto che sia possibile, tanto che esistono strumenti che eseguono l'upsampling: se fosse solamente dannoso, chi nel mondo venderebbe una componente che ti rovina l'ascolto?Citazione:
Originariamente scritto da EdoFede
Allora cercherò di farti esempi legati a cose vere che ho studiato, al posto di parlare al vento con supposizioni. L'occhio umano ha una capacità inimitabile nel riconoscere le forme: un medico puo scorrere minuti e minuti di un tracciato ecg riconoscendo i vari complessi(tratti "distintivi"di determinati accadimenti fisiologici con un pattern molto ben definito sia se fisiologici che patologici: hanno una forma tipica per ogni malattia e per lo stato di salute buona). Per quanto sia stato molto difficile si è riuscito a trovare un algoritmo che "imitasse" l'occhio umano, accorgendosi in maniera automatica di tratti distintivi di una determinata patologia(e fidatevi che è piu complicato di quanto si possa immaginare, anche perchè non si agisce su funzioni ma su una serie di dati). Allora perchè tu escludi categoricamente che possa esistere un algoritmo che vada a rendere il suono piu fluido per l'orecchio umano? Io non so se sia vero, ma non posso escluderlo. Magari chessò mettere tra due armoniche un armonica di frequenza intermedia con ampiezza pari alla media algebrica delle due rende il suono piu gradevole.
ma io non ho escluso nulla di ciò ed ho pure scritto che l'effetto udibile può essere il suono più fluido e piacevole :)Citazione:
Originariamente scritto da brcondor
quello che critico io è chiamare questa cosa (che tra l'altro è puramente soggettiva) un miglioramento, in termini assoluti.
Anche perché il suono più piacevole e fluido non significa più fedele con la registrazione originale, quindi di per sè non è un miglioramento oggettivo, ma qualcosa di strettamente soggettivo e legato, inoltre, alla realizzazione del lettore e dell'impianto.
Non voglio dire che l'upsampling sia un male assoluto, ma vederlo come un miglioramento del segnale originale è, a mio avviso, errato.
E sono comunque convinto che un lettore a risoluzione nativa, realizzato molto bene (purtroppo la quasi totalità degli apparecchi commerciali, anche di cifre assurde, sono ben lontani da questo concetto), possa dare un suono più fedele rispetto ad un ottimo lettore che esegue upscaling.
(N.B. più fedele, non più piacevole)
Giusto per citare un luogo comune...un violino stridente e fastidioso dal vivo, lo dovrebbe essere pure in ascolto registrato, non dovrebbe essere "ammorbidito" o reso piacevole. Questo è il concetto di alta fedeltà che secondo me si sta un po' perdendo (complice anche il fatto che molti non sanno come suona uno strumento dal vivo).
Spero che su questo aspetto siano tutti d'accordo con me.
Ciao,
Edo
tu vedi tutto bianco o tutto nero :-) come sarebbe a dire che non ha un'idea del segnale originale! un'idea ce l'ha eccome e sono i campioni del CD.Citazione:
Originariamente scritto da EdoFede
Banalizziamo: hai un campione con valore 1 e uno con valore 10, in mezzo ci metti 5. OK non sappiamo se in mezzo c'era 4,5 o 6, tuttavia 5 è meglio di niente, non ti pare? Qualcuno potrebbe dire che non c'era nè 4, nè 5 e nè 6, ma 100. Va bene, ma questa informazione se non c'e' sul CD allora non viene comunque riprodotta dal lettore CD tradizionale e l'upsampling non stravolge il suono.
Se poi chi fa l'algoritmo di upsampling ne capisce qualcosa del mestiere, magari sa mettere un valore migliore al mio sciocco esempio e avvicinarsi di più a situazioni reali, magari ripetitive e conosciute.
Ecco non prendermi per un sostenitore, sono semplicemente incuriosito dal fatto che il lettore usato facesse upsampling e non sono convinto come te, che sia una tecnologia messa lì solo per motivi commerciali.Citazione:
Qualche sostenitore dell'upsampling mi può spiegare come può un algoritmo aggiungere informazioni coerenti con la sorgente, senza sapere com'è questa sorgente?
Allora, tornando al discorso, pensa a una sinusoide (un'onda a caso :-) campionala o meglio marca con una penna ad esempio 10 punti equidistanti sull'onda e cancella la sinusoide.
Ora aggiungi dei punti intermedi che seguono idealmente la forma dell'onda che si intuisce dopo il campionamento e ridisegna l'onda.
Ottineni una forma migliore rispetto ad unire i punti con delle rette? Ecco hai fatto un upsampling a mente e ti sei avvicinato alla realtà dal "nulla" :-)
I modelli matematici per unire i punti di una curva fanno qualcosa di questo tipo.
Questo lo fa anche il filtro passabasso dopo il DAC, dato che integra ;)Citazione:
Originariamente scritto da uainot
Idem come sopra, non serve upscalare, l'integrazione la fa già il passabasso che c'è dopo il DAC.Citazione:
Originariamente scritto da uainot
Motivo per cui un CD puó darti una sinusoide a 20kHz perfetta.
Inoltre la musica non sono sinusoidi, ma sono un insieme infinito di transitori..difficile fare un algoritmo che "preveda" l'andamendo di un transitorio, non trovi? :)
Dovrebbe avere "senso musicale" e nel caso, sarebbe pure qualcosa di soggettivo. :)
:fagiano: erano esempi per capire il concetto. l'ho pure scritto che l'esempio era sciocco e che l'onda era presa a caso.
il messaggio come l'ho scritto per intero è semplice e chiaro, ma posso dirtelo ancora con altre parole:
ci sono modelli matematici, che date delle informazioni parziali su un'onda, si propongono di ricostruirla e ci riescono.
Si, ma parli di onde periodiche e quindi prevedibili.
La musica, essendo formata da transitori, è tutt'altro che prevedibile..meno che meno da una funzione matematica ;)
Il concetto è questo, non lo si puó semplificare parlando di onde periodiche (ho risposto per precisare che le operazioni indicate vengono fatte normalmente da un normalissimo filtro).
Ma questi algoritmi di oversampling voi sapete come funzionano e come operano?
Perchè a leggere certe frasi sembra che siano cose mirabolanti mentre, a parer mio, si tratta di banalissimi sample rate converter. ;)
Qualche spiegazione tecnica in merito da chi sostiene i miglioramenti di questa tecnica si puó avere?
Perchè io francamente non ci vedo dietro chissà quali algoritrmi ed elaborazioni complesse...oppure c'è qualcosa che non so io? Se è così mi potete illuminare?
Ciao,
Edo.
Ma secondo te i segnali biologici del corpo sono periodici? Eppure possono essere previsti:P.Citazione:
Originariamente scritto da EdoFede
Sono convinto che il transitorio abbia proprietà simili alla stazionarietà a tratti dell'eeg.
Ovviamente non sto dicendo che dalla prima nota puoi prevedere una nota che viene dopo 10 secondi. Ma ad esempio(metto numeri a caso per semplicità). Campiono a 100hz, ossia prendo un valore ogni 0.01 secondi. COnsidero allora un filtro a media mobile di ordine 5, ossia al posto di usare il valore i-esimo faccio la media dei 5 valori prima e li scrivo sul 5 valore. Ma al posto di scriverlo sostiutendo il mio valore(come si fa in analisi del segnale per pulire un segnale particolarmente "brutto") lo scrivo un mezzo campione dopo. Così ho raddoppiato i campioni che ottengo dal mio bel segnale con valori assolutamente verosimili.
La media mobile viene usata per "smussare" delle curve, quindi valori di rumore che sono scorrelati con il nostro segnale hanno un peso minore e vengono corretti in parte, mentre parti di segnale molto pulite subiscono poche modificazioni.
Questo esempio è un po' piu raffinato del un campione vale 5 l'altro 10 in mezzo ci metto 7.5 come diceva uainot prima. Ed è anche verso della funzione di integrazione del tuo bel filtro attivo passa basso
Facciamo un esempio.
Ho una funzione
y=x^2 + cos(x)+ 3sin(x)
La campiono con un passo di 0.001 e la disegno. Il mio disegno equivale a un fitting dei punti che ho campionato
(prendo il valore i-esimo e tiro una riga fino al valore i+1-esimo).
In questo modo ho il mio "file audio" con un campionamento base.
Se ora considero la funzione in un intorno t compreso tra due campioni,
senza sapere come va la funzione nel resto del mondo ho un'idea di come essa vada(ossia so che è compresa tra i due valori che i miei
campioni assumono).
Nulla mi vieta di usare un fitting diverso e al posto di usare un fitting lineare decido du usare un fitting cubico(collego i due valori
con una cubica y=ax^3+bx^2+c^x+d).
Nessun'altro mi vieta però di usare al posto di una singola cubica due cubiche, una che vada dal valore i-esimo a un valore intermedio che
chiamiamo add1 e l'altra da add1 al campione i+1.
Il campione add1 possiamo calcolare in mille modi, scegliamo di farlo secondo la media mobile: il valore add1 è pari alla media
algebrica di norma 1 dei campioni che vanno da i-2 a i+2. Questo fa si che se ad esempio il valore i-esimo
è rumore e vale ad esempio 15 mentre i+1 vale 2.3 e gli altri 3 valori che consideriamo valgono 2.2 3 1.2. Se facessimo una mera media
algebrica fra i e i+1 otterremmo come valore intermedio 8.65 in questo modo invece 4.7, valore molto piu vicino alla media
dei valori che io ritengo "non rumore".
Allora i miei nuovi campioni sono
i= 2.3
i+1/2=4.7
i+1=15
Avere un valore in mezzo renda il suono piu vicino a quello vero? Non lo so, non penso. Sicuramente renderebbe il passaggio meno
violento"."
Cose ho fatto:
- ho generato una serie random di numeri tra 0 e 1 di 25 campioni
- ho creato una seconda lista in cui tra un campione e l'altro c'era il valore della media mobile di 5 ordine(media aritmetica
fra i 2 valori prima il valore stesso e 2 valori dopo)
- la media mobile comporta un ritardo iniziale, ho quindi spostato le varie serie per farle coincidere
- ho disegnato in un grafico ambedue le serie facendo un fitting che penso sia cubico(lo fa in automatico matlab)
Sopra c'è il grafico della serie con frequenza di campionamento doppia
Sotto quella da 50 valori
COme si vede nel tratteggio, quella con 50 valori ha un andamento che si adatta meglio a un ipotetico segnale reale rispetto a quella
da 25. Dopo lo rifaccio con una funzione nota con 25 campioni, con 50 e la media mobile e infine con 1000 campioni(in matlab
non esiste il concetto di continuità)...
http://imageshack.us/photo/my-images/859/finalee.jpg/
http://img859.imageshack.us/img859/6727/finalee.th.jpg
Uploaded with ImageShack.us
Io continuo a non capire alcune cose:
1) Come si calano questi (interessantissimi) concetti nel campo audio?
2) Come si può parlare di miglioramento, in senso assoluto, di qualcosa che in precedenza non è presente sul segnale? (N.b. parlo di miglioramento del segnale, non di sensazioni all'ascolto)
3) Come si può pensare che un lettore cd abbia la potenza di calcolo necessaria ad applicare gli avanzatissimi processi di elaborazione del segnale che avete citato?
4) Senza scomodare i concetti tecnici...se io campiono un segnale che è un insieme infinito di transitori (quindi con un andamento totalmente imprevedibile), a logica, come posso pensare di ricostruire il segnale originale a posteriori?
In particolare sul punto 3, qualcuno si è posto il dubbio della potenza di calcolo necessaria per fare qualcosa di diverso dall'interpolazione lineare tra due sample?
Qualcuno ha aperto uno di questi lettori ed ha verificato se montando chissà quale processore/software di elaborazione?
Io aprii un CD con oversampling anni fa (mi sembra un cambridge audio, ma non ne sono sicuro) e dentro trovai un semplice sample rate converter...che sicuramente non fa chissà quali elaborazioni sul flusso.
E riguardo al punto 4 io non ho ancora avuto risposte. Ho solo letto di algoritmi iper-complessi (cose molto interessanti, non mi fraintendete), di paragoni con altri campi (a mio avviso poco attinenti), ma nessun ragionamento logico su questo concetto.
Penso di aver espresso ampiamente il mio parere in merito e di aver ben motivato e circostanziato le mie affermazioni.
A questo punto non ho molto da aggiungere alla discussione, mi sa che lascio :)
Ok, hai posto molte domande. Ad alcune ti so rispondere con sicurezza, ad altre meno, quindi evito.
LA potenza di calcolo richiesta per un algoritmo simile al mio è pochissima: considera che un processore da 1 ghz(montato ormaI perfino su alcuni cellulari) ti permette di fare 10^9 operazioni al secondo(in realtà qualcosina in più). L'interpolazione con fitting cubico non è per nulla pesante soprattutto se fatto a real time e non su tutto il segnale in un colpo solo:
-hai bisogno di 3 coefficienti imponendo il passaggio per due punti e la continuità della derivata prima, sono tipo 6 operazioni per ogni coppia di campioni
- per calcolare la media mobile hai bisogno di due operazioni, una sommatoria e dividere per l'ordine della tua meda mobile nonchè altre 6 per fare il fitting
In totale hai bisogno di un 14 operazioni a ogni coppia di campione. Con un campionamento a 44 khz si avrebbero 44*10^3 campioni al secondo, ossia sarebbe necessario un processore da 1.4*4.4 *10^5
servirebbe un esoterico processore da 610 khz(diciamo un procio di 10 anni fa). Quindi con 44 khz di Fc, potrei fare almeno 2.2*10^4 operazioni a campione senza esaurire la potenza di calcolo.
In calcolo numerico(esame che ho dato e che mi è molto piaciuto) una delle problematiche piu importanti è quante operazioni costa un algoritmo...
Riguardo alla tua convinzione ti assicuro che ti sbagli, i transitori possono essere predetti in un intorno ragionevolmente piccolo: l'analisi matematica si base su concetti simili, su approssimazioni infinitesime e asintoticità. L'informatica e la musica sono ambedue figlie della matematica.
Quando ho detto che c'è piu matematica nella musica mi riferivo proprio a questo: non alla serie di fibonacci(cosa estremamente interessante che mi ha sempre stupito) o della sezione aurea, ma proprio di questo.
La musica non è altro che un alfabeto che è possibile trasformare in numeri in maniera abbastanza semplice. Una volta trasformata in numeri può essere trattata con gli strumenti matematici giusti.
Ad esempio, conoscendo lo slew rate massimo utilizzato per registrare un determinato brano(slew rate == massima velocità con cui un operazionale può variare la velocità del suo out dato un in) io posso stimare che un determinato brano sottocampionato non possa variare piu di un tot ogni delta t di tempo e con questo aggiustare la mia media mobile di prima.
Secondo me dovresti provare a imbracciare un sw come matlab e vedere se te ne convinci. Il mio grafico voleva esserne un esempio. Appena ho tempo ti faccio la stessa cosa usando però:
la ricostruzione esatta di una funzione
la sua ricostruzione con un campionamento basso
l'upsampling
Piccola conclusione: io nn ho mai studiato elaborqazione di segnali audio, esisteranno nmila algoritmi migliori del mio
ma anche 30 anni fa :DCitazione:
Originariamente scritto da brcondor
Riporto questo interessante articolo che ho trovato sul web a proposito della questione.
Tratta sia l'oversampling (normalmente presente e con utilità verificata) che l'upsampling (di recente introduzione da parte di alcuni produttori ed abbastanza discusso).
Sono due pagine di articolo:
http://www.audioholics.com/education...-digital-audio
Trattano la questione in modo molto tecnico e circostanziato.
Ciao,
Edo.