Anche secondo me
Visualizzazione Stampabile
Anche secondo me
Superslide, rileggi il io ultimo post che l'ho allugato con una modifica.
Non c'è storia, il test si porta fino in fondo anche se da un cavo esce una pernacchia e dall'altro il canto degli angeli :D :D
No scherzi a parte cerchiamo di concentrarci sull'ascolto e magari procurarci dei cavi che non diano porblemi evidenti (tipo un grosso ronzio di fondo)
Allora,ho riletto .
Vedo che hai iniziato con un bel signori e signore ,io mi auguro vivamente che nessuno dei partecipanti abbia intenzione di portarsi la signora al seguito,perché temo che chiederà il divorzio il giorno successivo per infermità mentale del coniuge .
( e meno male che abbiamo tolto la benda ).
Scherzi a parte ,a me sta bene come la proponi ,ma ci devo riflettere.
Come dici tu in parte e' più facile e in parte no.
Se facciamo come dico io,non solo si dovrebbe indovinare se suona A o B,quindi la differenza ,ma anche la qualita.
In pratica ,alla mia maniera ,alla fine del test,ipotizzando di aver azzeccato 30/30, non solo ho azzeccato sempre la differenza sonica,ma ho anche individuato se suonava il plebeo o il nobile,per 30 /30.
Come dici tu invece ho azzeccato solo la differenza e mi togli la soddisfazione di aver azzecato anche il tipo di cavo.
ritengo sia più completa la mia.
Cosa dici?
Altro dubbio:
Tu dici:
imbroccate voto
15/30 0
18/30 2
21/30 4
24/30 6
27/30 8
30/30 10
Effettivamente ci puo anche stare perché se uno spara a caso teoricamente potrebbe prenderci per il 50% delle volte,
Ma anche no.
Non e'scritto da nessuna parte che se sparo a caso ne indovino meta'.
Come non e'scritto da nessuna parte che se lancio la monetine 30 volta ,per 15 volte esca testa.
Invece io dico:
Ma se ne indovino 15/30 non dovrei averne indovinate il 50%esatto,scientificamente parlando ?
Darmi voto zero mi pare fuori da ogni calcolo matematico.
o sbaglio ?
Andando in percentuale non dovrebbe essere così ?:
15/30 50% azzeccate -voto 5
18/30 60% azzeccate -voto 6
21/30 70% azzeccate -voto 7
24/30 80% azzeccate -voto 8
27/30 90% azzeccate -voto 9
30/30 100% azzeccate -voto 10
La calcolatrice mi da ragione.....
Non solo,dobbiamo anche valutare in quanti fanno il test,perché se lo fa uno da solo e' un conto,se lo fanno in 2 e' un altro.
Su 30 lanci in cui un fenomeno può assumere in modo casuale lo stato A o lo stato B (es. lancio di una monetina), si può ottenere anche 8 volte A e 22 volte B (o viceversa). Rarissimo 7 e 23. L’intervallo di confidenza su una popolazione così piccola (30) è ancora piuttosto ampio nonostante gli stati possibili siano solo 2. Con 5 partecipanti (equivalenti, nell’ipotesi che i partecipanti non si influenzano a vicenda, a 30 x 5 = 150 lanci o prove che dir si voglia), già uno scarto maggiore del +- 18% - 20% (dal 50%) può essere ritenuto estremamente significativo per confermare l’ipotesi di differenza percepibile tra i due cavi.
Propongo, pertanto, la scala d'attendibilità che segue:
75/150: 0
79/150: 4
83/150: 5
86/150: 6
89/150: 8
90/150: 9
94<n<150/150: 9,8
Ciao, Enzo
Per quanto riguarda la questione cavo A - cavo B mi sembra valida la metodologia proposta da Picander: far ascoltare prima i due cavi dicendo quale è A e quale è B, ma senza dire cosa sia il cavo.
L'ascolto può anche essere fatto un paio di volte, non c'è problema, poi si parte con il test e l'unico modo credo sia poi quello di indicare A o B.
Per quanto riguarda il giudizio si può anche lasciare libertà di espressione, chiarendo però che deve essere un giudizio molto sintetico, ci si può anche mettere d'accordo con i termini e su cosa concentrare l'attenzione, senza fare voli pindarici, magari solo quello che ha colpito maggiormente nel bene ed anche nel male, ma, ripeto, una cosa stringata.
Così evitiamo le crocette su risposte preimpostate se sono ritenute troppo vincolanti.
L'importante è verificare cosa è stato attribuito al singolo cavo da parte dei tester, magari è un confronto utile, potrebbe avvalorare ancora di più il risultato, quale che sia.
Una cosa credo vada subito stabilita, visto che già due o tre volte è stata fatta la battuta.
Divieto assoluto di commenti e/o atteggiamenti che possono influenzare gli altri tester e anche nel caso che i tester siano convinti che sia inutile proseguire dopo 3 o 4 test, tanto il risultato è chiaro e scontato, si prosegue sino alla fine, sempre senza commenti o altro., magari la cosa è chiara per un partecipante, ma non per gli altri.
In altre parole: facce da poker.
Direi che questo è tassativo.
L'unico motivo per interrompere la prova è che un cavo (o l'impianto), per qualsivoglia motivo, inizi a dare problemi (collegamento ballerino, ronzii o altro), in tal caso si interrompe, si verifica se si può rimediare e si riprende.
Per quanto riguarda il numero dei tentativi lascio agli statistici, ma sono del parere che 15 risposte esatte su 30 non sono significative, anche se, è vero, che lanciando 50 volte una moneta può sempre uscire testa. (Però se nei Casinò il Rosso e il Nero sono pagati solo 1:1 ci sarà un motivo).
Un suggerimento per la scheda: mettere i test in verticale, uno per riga, inserendo, dopo il numero che indica l'ordine, una casella da lasciare vuota ed in cui alla fine inserire il cavo effettivamente usato (A o B) in modo da vedere subito ad occhio le eventuali differenze.
Ciao
L'affidabilità dell'esperimento è funzione del numero di "lanci" o prove indipendenti (o popolazione). Con 1 persona che fa 30 prove la distribuzione tra A e B di 17 e 13 può essere dovuta al caso per oltre il 50% delle volte, 18 e 12 nel 20%, 20 e 10 nel 4%, 21 e 9 nel 1% dei casi (ovviamente la distribuzione di 15 e 15 è insignificante).
Con 5 persone che non influiscono tra di loro e fanno 30 prove (le 150 totali del mio post precedente) si ottiene che le distribuzione tra A e B di 79 e 71 possono avere un'incidenza dovuta al caso nel 58% delle volte, 83 e 67 il 22%, 86 e 64 il 7%, 89 e 61 il 3%, 90 e 60 il 1.5%, 94 e 56 il 0.5% (ovviamente la distribuzione di 75 e 75 è insignificante).
Ciao, Enzo
P.S: i risultati sopra sono stati ottenuti con 200 lanci da 30 ciascuno e 200 lanci da 150 ciascuno con il generatore di numeri casuali di microsoft excel.
@Superslide
Allora cerco intanto di spiegare perché 15/30 per me significa zero.
Lo scopo del test è sentire quanto si riesce a discernere ad orecchio A da B. Nel momento in cui si dà un risultato pari allo sparare a caso il discernimento è nullo, quindi il risultato è 0.
Perchè questo? Perchè il test è solo tra due scelte e al risultato finale dobbiamo impostare come 0 il risultato che si ottiene a fortuna quando non si riesce a discernere 0. Ti faccio per esempio notare che ottieni 15/30 mettendo A su tutte le caselle. Questo ovviamente non è "fare giusto"
@enzo66
Mi sfugge perchè nella tua tabella ci sia una tale differenza tra la scala fino a voto 9 e sopra il voto 9.
Mi sembra quasi che stiamo alzando i voti per venire incontro alla difficoltà del test. Se dovessi discernere una chitarra e una batteria per me sarebbe importante anche se se ne sbaglia 1 su 1000. Perchè fare differenza su questo tipo di test?
Direi che 24/30 possa quindi essere accettata come spartiacque tra il discernibile e il non. (6 / 10 * 15 + 15)
Ho fatto una prova con oocalc, 150 prove danno un margine di errore piuttosto basso
@Picander
Perché, già con una scheda (di 30 prove), una distribuzione di 24 indovinate e 6 no (o viceversa) è già molto poco probabile che sia dovuta al caso. Non parliamo di 25 indovinate e 5 no (o viceversa). Quest'ultimo caso non si è mai verificato nemmeno su 400 prove da 30.
Nel caso invece di 150 prove già 94 indovinate su 150 (o viceversa) è poco probabile che siano dovute al caso..... Poi, se si pensa che non è impossibile nemmeno l'autocompressione di un gas ma è solo estremamente improbabile..... allora non assegno voti maggiori di 9.8/10.
La differenza tra 9 e 9.8 è dovuta al fatto che nella definizione di entropia c'è di mezzo un logaritmo.
Ciao, Enzo
Per questo per me 24/30 è già un discernimento sufficiente.
l'errore c'è ma può sempre essere in due direzioni. Questo non dovrebbe influire sul voto finale.
Se scomodi una scala logaritmica allora ti chiedo di controllare i calcoli, perchè arrivi lineare fino al voto 9 ;)
Perché il tuo approccio alla valutazione NON è in termini statistici e di probabilità. Non puoi partire da una proporzione e dire così vale 6, così 9. Perché? Perché il numero di tentativi conta tantissimo. Il tuo voto 2 per un risultato di 18/30 è poco ma potrei passartelo, però i conti non tornano più se usi lo stesso criterio della proporzione per valutare un risultato di 180/300.
@Picander
Tieni conto degli arrotondamenti che influiscono molto, inoltre, non sono poi così lineari. Per ultimo il logaritmo diventa quasi piatto (mi sembra che si dica che cresce di ordine minore di qualunque numero reale) a valori elevati.
Ciao, Enzo
P.S. La mia scala è solo una proposta, non è da prendere come oro colato anche se basata su risultati numerici.
Scusate ragazzi ma leggendo questa discussione mi viene da sorridere sempre di più. Io il cavo A dal cavo B lo sento subito anche se non mi dite qual'è prima. Voi non vi rendete conto della differenza sonora che c'è nel cambiare tre di questi cavi dai cordoni originali... Vi accorgerete pure voi che dopo due cambi è ridicolo rifare la prova altre ventotto volte, per me questa è la dimostrazione che di questi cavi non ne avete mai provato uno sul vostro impianto. A parte il tema statistico e scientifico del test, mi sto facendo una cultura in merito, mi sembra che ci stiamo facendo troppe pippe in merito. A casa mia i posti "utili" sono due, forse tre e quindi non ha senso mettere un "inquisito" di lato, anche se la differenza la sentirei pure li.. :)
La maggior parte di voi è convinto che la differenza fra i due trittici sia riconoscibile solo da un pippistrello ma vi assicuro che per uno che ci sente normalmente la differenza è paragonabile a distinguere il blu dal rosso per uno che ci vede, sono convinto che chi verrà a questo test dopo i primi tre o quattro passaggi non riuscirà a stare zitto, faremo tutti una bella risata e andremo a mangiare gnocco e tigelle... :)
La differenza di ampiezza sonora, di profondità dell'immagine, della qualità del dettaglio e della precisione della gamma bassa, della naturalezza delle voci è ENORME fra i due trittici di cavi. Fissiamo la data dai, di parole ne abbiamo spese pure troppe.
Se la differenza è notevole è giusto che alla fine venga misurata (senza interrompersi).
Sul metro di misura è meglio accordarsi prima di fare la prova in modo da accettarla tutti e non cadere nell'errore di dare un'interpretazione a posteriori e far finta che tutti avevano ragione e vinto come fanno i politici.
@gius76
Capisco quello che intendi, ma ad occhio ritengo che la probabilità statistica che state calcolando serva a calcolare il margine di errore, non la valutazione del discernimento che secondo me (sempre pronto a cambiare idea) dovrebbe essere lineare.
Picander non vedo l'ora di vedere la tua espressione al termine dei quattro passaggi di prova... :) Ricordati delle differenze che ti ho scritto nel post precedente.. ;)
Penso che sia ora di dare la disponibilità per una data da parte dei partecipanti. Preferite in settimana o un fine settimana?
Sicuramente avrò un'espressione interessata ;) Ripeto, non vediamola come sfida, ma come un punto fermo da cui far partire una discussione che fino ad ora è stata basata sul non misurabile.
Per me dobbiamo tutti tenere in conto le soprese, per esempio è possibile che un ascoltatore canni tutti e che uno sia un formidabile riconoscitore. Per questo i risultati andranno sia raggruppati, sia considerati singolarmente.