Outils :Vous avez un site web ? Un blog ?
Technorati reactions rencontre |
Informationsqualität oder Datenqualität bezeichnet die Qualität, also Relevanz und Korrektheit von Informationen. Sie beschreibt, wie gut eine Information (bzw. ein Datensatz) geeignet ist, die Realität zu beschreiben, das heißt, inwieweit sie ein Modell tatsächlicher Situationen bildet. Insbesondere besagt sie, wie verlässlich eine Information ist und inwieweit man sie als Grundlage für eine Planung des eigenen Handelns verwenden kann.
Die Informationsqualität muss von der reinen Bedeutsamkeit (der Semantik) und vom formalen Informationsgehalt (der statistischen Signifikanz) unterschieden werden.
Es gibt eine große Zahl von Qualitätskriterien, deren Bedeutung vom Kontext und der Verwendung der Daten bzw. Informationen abhängt. Typische, häufig verwendete Qualitätskriterien sind die Korrektheit, Vollständigkeit, Relevanz, Konsistenz.
Die IQ-Community (Information Quality) betrachtet die Qualität von Informationen (nach R. Wang) nach folgenden Kategorien und Dimensionen:
Eine Systematik zur Ermittlung der Bedürfnisse der Informationsnutzer finden Sie hier: Datei:DQ-in-design-ICIQ-2005.pdf
Die Deutsche Gesellschaft für Informations- und Datenqualität (DGIQ) hat auf Basis des Bewertungssystems von R. Wang eine deutsche Übersetzung vorgeschlagen. Sie empfiehlt, diese im deutschen Sprachraum einheitlich zu verwenden. Sie ist als freier Download verfügbar unter Download deutsche Übersetzung
Der Begriff der Informationsqualität wird in verschiedenen Bereichen in Hinblick auf unterschiedliche Aspekte verwendet.
Zur Optimierung der Informationsqualität in Informationssystemen wird die Qualität einzelner Datenquellen und Datensätze mittels einer Kostenfunktion anhand verschiedener Kriterien bewertet. Anhand von Präferenzen über die Qualitätskriterien kann eine Anfrage an das Informationssystem so optimiert werden, dass die Antwort eine möglichst hohe Informationsqualität besitzt!
Das Verbessern der Datenqualität wird Datenbereinigung genannt.
Inhaltsverzeichnis |
Eurostat definiert Datenqualität nach folgenden Gesichtspunkten:[1]
Statistik bzw. Regionen, Teilgruppen, Zeit
In den Natur- und Gesellschaftswissenschaften spricht man besonders in Bezug auf Messungen und Erhebungen von Datenqualität. Dabei spielen vor allem Störeinflüsse, die Präzision der Messung und die Größe der Datenbasis, also die Anzahl der Messungen bzw. Befragungen, eine Rolle: Je weniger mögliche Störeinflüsse es gibt, je präziser die Messung und je größer die Anzahl der der Messungen ist, desto genauer bilden die resultierenden Daten die Realität ab und desto besser ist damit die Datenqualität. Wichtig ist es dabei, zu bedenken, dass eine gute Datenqualität allein nicht ausreicht, um ein gutes Modell zu konstruieren: hierfür muss auch die Interpretation der Daten insbesondere in Bezug auf die Kausalität korrekt sein.
Der Zweck von Nachrichtenagenturen und Geheimdiensten ist es, Informationen von möglichst guter Qualität zu sammeln und zur Verfügung zu stellen. Dabei ist es vor allem entscheidend, dass aus der Menge der zur Verfügung stehenden Daten diejenigen ausgewählt werden, die für das Klientel relevant sind, und dass diese in eine konsistente Form gebracht werden, ohne die Aussage zu verzerren. Insbesondere sollen Irrtümer und Fehlinformationen ausgeschlossen werden, häufig indem Nachrichten anhand mehrerer Quellen überprüft werden.
In der Wirtschaft ist Informationsqualität von zentraler Bedeutung, weil auf der Basis von Informationen Entscheidungen gefällt, Marktchancen bewertet, Verhandlungen geführt werden und vieles mehr, und all das kann nur so gut sein wie die zugrunde liegenden Daten bzw. Informationen. Oft wird der Begriff Datenqualität als Synonym verwendet, obwohl streng genommen Informationsqualität korrekter ist.
Informationsqualität kann sich auf verschiedene Vorstellungen beziehen:
Eine schlechte Informationsqualität kann weitreichende Folgen haben, wenn sie nicht frühzeitig erkannt wird:
Beispiele: