libsim  Versione 7.1.8
Tipi di dato | Funzioni/Subroutine | Variabili
Riferimenti per il modulo modqc

Utilities and defines for quality control. Continua...

Tipi di dato

type  qcpartype
 Definisce il livello di attendibilità per i dati validi. Continua...
 
interface  init
 Variables user in Quality Control. Continua...
 
interface  peeled
 Remove data under a defined grade of confidence. Continua...
 
interface  vd
 Check data validity based on single confidence. Continua...
 
interface  vdge
 Check data validity based on gross error check. Continua...
 
interface  invalidated
 Test di dato invalidato. Continua...
 

Funzioni/Subroutine

elemental logical function vdr (flag)
 Data validity check for confidence. Continua...
 
elemental logical function vdger (flag)
 Data gross error check. Continua...
 
elemental logical function invalidatedr (flag)
 Data invalidated check. Continua...
 
elemental logical function qcsummaryflagr (flag0, flag1, flag2, flag3)
 Check data validity based on multiple confidences. Continua...
 
elemental logical function vdd (flag)
 Data validity check for confidence. Continua...
 
elemental logical function vdged (flag)
 Data gross error check. Continua...
 
elemental logical function invalidatedd (flag)
 Data invalidated check. Continua...
 
elemental logical function qcsummaryflagd (flag0, flag1, flag2, flag3)
 Check data validity based on multiple confidences. Continua...
 
elemental logical function vdi (flag)
 Data validity check for confidence. Continua...
 
elemental logical function vdgei (flag)
 Data gross error check. Continua...
 
elemental logical function invalidatedi (flag)
 Data invalidated check. Continua...
 
elemental logical function qcsummaryflagi (flag0, flag1, flag2, flag3)
 Check data validity based on multiple confidences. Continua...
 
elemental logical function vdb (flag)
 Data validity check for confidence. Continua...
 
elemental logical function vdgeb (flag)
 Data gross error check. Continua...
 
elemental logical function invalidatedb (flag)
 Data invalidated check. Continua...
 
elemental logical function, public qcsummaryflagb (flag0, flag1, flag2, flag3)
 Check data validity based on multiple confidences. Continua...
 
elemental logical function vdc (flag)
 Data validity check for confidence. Continua...
 
elemental logical function vdgec (flag)
 Data gross error check. Continua...
 
elemental logical function invalidatedc (flag)
 Data invalidated check. Continua...
 
elemental logical function qcsummaryflagc (flag0, flag1, flag2, flag3)
 Check data validity based on multiple confidences. Continua...
 
subroutine, public vol7d_peeling (this, data_id, keep_attr, delete_attr, preserve, purgeana)
 Remove data under the predefined grade of confidence. Continua...
 

Variabili

type(qcpartype), public qcpar =qcpartype(10_int_b, 0_int_b, 1_int_b)
 Default: data with confidence less or equal 10 are rejected. Continua...
 

Descrizione dettagliata

Utilities and defines for quality control.

Concise, high-value definitions of Data Quality by expert users, analysts, implementers and journalists. This is a great starting point to learn about Data Quality.

Data Quality: The Accuracy Dimension

"Data quality is defined as follows: data has quality if it satisfies the requirements of its intended use. It lacks quality to the extent that it does not satisfy the requirement. In other words, data quality depends as much on the intended use as it does on the data itself. To satisfy the intended use, the data must be accurate, timely, relevant, complete, understood, and trusted." Jack E. Olson

No Data Left Behind: Federal Student Aid - A Case History

"Data quality institutionalizes a set of repeatable processes to continuously monitor data and improve data accuracy, completeness, timeliness and relevance." Holly Hyland and Lisa Elliott, Federal Student Aid

Data Quality: It's a Family Affair

Data Quality definition: "The state of completeness, consistency, timeliness and accuracy that makes data appropriate for a specific use." Wim Helmer, Dun & Bradstreet

Data Quality and Quality Management - Examples of Quality Evaluation Procedures and Quality Management in European National Mapping Agencies

"Quality is defined as the totality of characteristics of a product that bear on its ability to satisfy stated and implied needs (ISO 8402, 1994). In the new ISO/DIS 9000:2000 standard (2000) the definition of quality is: 'Ability of a set of inherent characteristics of a product, system or process to fulfill requirements of customers and other interested parties.' This indicates that data quality and quality management are very closely related. Data quality is part of the organisation's total quality management." Antti Jakobsson

text below from Wikipedia http://it.wikipedia.org/wiki/Test_di_verifica_d%27ipotesi http://creativecommons.org/licenses/by-sa/3.0/deed.it L'ambito statistico

Nel secondo caso la situazione è modificata in quanto interviene un elemento nuovo, ovvero il caso. Si supponga di avere una moneta recante due facce contrassegnate con testa e croce. Volendo verificare l'ipotesi di bilanciamento della moneta si eseguono 20 lanci e si contano quelli che danno esito testa. La conseguenza del bilanciamento consiste nell'osservare un valore di teste attorno a 10. Tuttavia anche in ipotesi di bilanciamento non si può escludere di osservare 20 teste. D'altronde, l'ipotesi di bilanciamento è logicamente compatibile con un numero di teste variante da 0 a 20. In tale contesto una qualsiasi decisione in merito all'ipotesi da verificare comporta un rischio di errore. Ad esempio rigettare l'ipotesi di bilanciamento della moneta avendo osservato 20 teste su 20 lanci comporta il rischio di prendere una decisione errata. Nel procedere alla verifica dell'ipotesi di bilanciamento della moneta, si ricorre a una variabile casuale X. Tale variabile casuale X è una variabile aleatoria discreta con distribuzione binomiale B(20; 0,5), dove 20 indica il numero di lanci e 0,5 la probabilità che si verifichi l'evento "testa".

Il risultato sperimentale si deve quindi confrontare con tale distribuzione: quanto è distante tale risultato dal valore medio della distribuzione B(20; 0,5)? Per rispondere alla domanda si deve individuare un valore caratteristico della distribuzione B(20; 0,5). Nel nostro caso tale valore caratteristico è il valore medio 20/2 = 10. Per valutare la distanza tra il valore sperimentale e quello atteso si valuta la probabilità di ottenere un valore sperimentale lontano dal valore medio di B(20; 0,5), ossia nel caso che dal nostro esperimento risulti X=15 (15 teste dopo 20 lanci), si calcola P{|X-10|>=15-10} quindi P{X<=5 oppure X>=15}=0,041.

Quindi, usando una moneta ben bilanciata, la probabilità di ottenere un numero di teste X >= 15 (oppure X <= 5) dopo 20 lanci è pari a 0,041 ossia al 4,1%. Giudicando bassa tale probabilità si rifiuterà l'ipotesi di bilanciamento della moneta in esame, accettando quindi il rischio del 4,1% di compiere un errore nel rifiutarla. Di solito, il valore della probabilità adottato per rifiutare l'ipotesi nulla è < 0,05. Tale valore è detto livello di significatività ed è definibile come segue: il livello di significatività sotto l'ipotesi nulla è la probabilità di cadere nella zona di rifiuto quando l'ipotesi nulla è vera. Tale livello di significatività si indica convenzionalmente con α. Il livello di significatività osservato α del test per il quale si rifiuterebbe l'ipotesi nulla è detto valore-p (p-value). Riprendendo l'esempio sopra riportato il valore-p è pari a 0,041. Adottando nell'esempio α = 0,05, si rifiuterà l'ipotesi se P{|X-10|>=x}<0,05. Tale condizione si raggiunge appunto se X<6 oppure X>14. Tale insieme di valori si definisce convenzionalmente come regione di rifiuto. Viceversa l'insieme { 6,7...14} si definisce regione di accettazione. In questo modo si è costruita una regola di comportamento per verificare l'ipotesi di bilanciamento della moneta. Tale regola definisce il test statistico.

In termini tecnici l'ipotesi da verificare si chiama ipotesi nulla e si indica con H0, mentre l'ipotesi alternativa con H1. Nel caso della moneta, se p è la probabilità di ottenere testa in un lancio la verifica di ipotesi si traduce nel seguente sistema:

H_0: p = \frac{1}{2}
H_1: p \ne \frac{1}{2}

Come già osservato, il modo di condurre un test statistico comporta un rischio di errore. Nella pratica statistica si individuano due tipi di errori:

  1. rifiutare H0 quando è vera, errore di primo tipo (α) (o errore di prima specie);
  2. accettare H0 quando è falsa, errore di secondo tipo (β) (o errore di seconda specie).

Tornando all'esempio della moneta in cui la regione di accettazione è data dall'insieme di valori {6..14}, la probabilità di rifiutare H0 quando è vera è stato calcolato pari a 0,041.Tale probabilità rappresenta il rischio di incorrere in un errore di primo tipo e si indica con α. Per valutare la probabilità di un errore di secondo tipo è necessario specificare un valore di p in caso di verità di H1. Si supponga che p=0,80, in tal caso la distribuzione di X è una B(20;0,80)

Con tale distribuzione di probabilità, l'errore di tipo 2 si calcola sommando le probabilità relative ai valori di X della zona di accettazione. Si trova quindi che la probabilità cercata è pari a circa 0,20. Tale probabilità quantifica il rischio di incorrere nell'errore di tipo 2. e si indica convenzionalmente con β. La quantità 1-β si chiama potenza del test ed esprime quindi la capacità di un test statistico riconoscere la falsità di H0 quando questa è effettivamente falsa. La potenza del test trova applicazione nella pratica statistica in fase di pianificazione di un esperimento.

Scope of quality checks on observation values Checks applied to determine the quality of an observation can range from the very simple to the very complex. In roughly increasing order of complexity they can include:


Generated with Doxygen.