Warum und wie nutzt man Datenvisualisierung? Merkmale der visuellen Art der Informationsdarstellung

„Man sagt, ein Bild sagt mehr als tausend Worte, und das stimmt, solange das Bild gut ist.“ Bogenschütze

Mit zunehmender Menge der gesammelten Daten wird es selbst bei Verwendung noch so leistungsstarker und vielseitiger Data-Mining-Algorithmen immer schwieriger, die erhaltenen Ergebnisse zu „verdauen“ und zu interpretieren. Und wie Sie wissen, ist eine der Aufgaben des Data Mining die Suche nach praktisch nützlichen Mustern. Ein Muster kann nur dann praktisch nützlich sein, wenn es konzeptualisiert und verstanden werden kann.

Im Jahr 1987 wurden auf Initiative des ACM SIGGRAPH IEEE Computer Society Technical Committee of Computer Graphics aufgrund der Notwendigkeit, neue Methoden, Werkzeuge und Datentechnologien einzusetzen, entsprechende Aufgaben im Bereich der Visualisierung formuliert.

Zu den Methoden der visuellen oder grafischen Darstellung von Daten gehören Grafiken, Diagramme, Tabellen, Berichte, Listen, Blockdiagramme, Karten usw.

Traditionell wurde die Visualisierung als Hilfsmittel zur Datenanalyse angesehen, doch mittlerweile deuten immer mehr Untersuchungen auf ihre eigenständige Rolle hin.

Herkömmliche bildgebende Verfahren können folgende Anwendungen haben:

dem Benutzer Informationen in visueller Form präsentieren;

Beschreiben Sie kompakt die dem Originaldatensatz innewohnenden Muster.

Dimensionalität reduzieren oder Informationen komprimieren;

Lücken im Datensatz schließen;

Finden Sie Rauschen und Ausreißer in einem Datensatz.

Visualisierung von Data-Mining-Tools

Jeder der Data-Mining-Algorithmen verwendet einen spezifischen Visualisierungsansatz. In früheren Vorlesungen haben wir uns mit einer Reihe von Data-Mining-Methoden befasst. Im Zuge der Nutzung jeder der Methoden bzw. ihrer Softwareimplementierung erhielten wir bestimmte Visualisierer, mit deren Hilfe wir die durch die Arbeit der entsprechenden Methoden und Algorithmen erzielten Ergebnisse interpretieren konnten.

Bei Entscheidungsbäumen handelt es sich um eine Visualisierung des Entscheidungsbaums, eine Liste von Regeln und eine Kontingenztabelle.

Bei neuronalen Netzen kann dies je nach Tool die Netzwerktopologie sein, ein Diagramm der Änderungen der Fehlergröße, das den Lernprozess demonstriert.

Für Kohonen-Karten: Eintrittskarten, Ausgangskarten, andere spezifische Karten.

Bei der linearen Regression wird die Regressionsgerade als Visualisierungshilfe verwendet.

Für Clustering: Dendrogramme, Streudiagramme.

Streudiagramme und Diagramme werden häufig zur Bewertung der Leistung einer Methode verwendet.

Alle diese Arten der visuellen Darstellung oder Anzeige von Daten können eine der folgenden Funktionen erfüllen:

sind eine Veranschaulichung der Konstruktion eines Modells (z. B. eine Darstellung der Struktur (Graph) eines neuronalen Netzwerks);

helfen, die erzielten Ergebnisse zu interpretieren;

sind ein Mittel zur Beurteilung der Qualität des konstruierten Modells;

Kombinieren Sie die oben genannten Funktionen (Entscheidungsbaum, Dendrogramm).

Visualisierung von Data-Mining-Modellen

Die erste Funktion (Veranschaulichung der Modellkonstruktion) ist im Wesentlichen eine Visualisierung des Data-Mining-Modells. Es gibt viele verschiedene Möglichkeiten, Modelle darzustellen, aber grafische Darstellungen bieten dem Benutzer den größten „Wert“. Der Benutzer ist in den meisten Fällen kein Modellierungsspezialist; meistens ist er ein Experte auf seinem Fachgebiet. Daher sollte das Data-Mining-Modell in der dafür natürlichsten Sprache dargestellt werden oder zumindest eine Mindestanzahl unterschiedlicher mathematischer und technischer Elemente enthalten.

Daher ist Verfügbarkeit eines der Hauptmerkmale des Data-Mining-Modells. Dennoch gibt es eine so gängige und einfachste Möglichkeit, ein Modell als „Black Box“ darzustellen. In diesem Fall versteht der Benutzer das Verhalten des von ihm verwendeten Modells nicht. Doch trotz des Missverständnisses erhält er das Ergebnis – identifizierte Muster. Ein klassisches Beispiel für ein solches Modell ist das neuronale Netzwerkmodell.

Eine andere Möglichkeit, ein Modell darzustellen, besteht darin, es auf intuitive und verständliche Weise darzustellen. In diesem Fall kann der Benutzer tatsächlich verstehen, was „im Inneren“ des Modells passiert. Auf diese Weise ist es möglich, seine direkte Beteiligung am Prozess sicherzustellen.

Solche Modelle bieten dem Benutzer die Möglichkeit, seine Logik mit Kollegen, Kunden und anderen Benutzern zu diskutieren oder zu erklären.

Das Verständnis des Modells führt zum Verständnis seines Inhalts. Durch das Verständnis steigt das Vertrauen in das Modell. Ein klassisches Beispiel ist ein Entscheidungsbaum. Der erstellte Entscheidungsbaum verbessert das Verständnis des Modells wirklich, d. h. das verwendete Data-Mining-Tool.

Zusätzlich zum Verständnis bieten solche Modelle dem Benutzer die Möglichkeit, mit dem Modell zu interagieren, ihm Fragen zu stellen und Antworten zu erhalten. Ein Beispiel für eine solche Interaktion ist das Was-wäre-wenn-Tool. Mithilfe des Dialogs „systemuser“ kann sich der Benutzer ein Verständnis für das Modell verschaffen.

Kommen wir nun zu den Funktionen, die dabei helfen, die Ergebnisse der Erstellung von Data-Mining-Modellen zu interpretieren und auszuwerten. Dabei handelt es sich um alle Arten von Grafiken, Diagrammen, Tabellen, Listen usw.

Beispiele für Visualisierungstools, die zur Bewertung der Qualität eines Modells verwendet werden können, sind ein Streudiagramm, eine Kontingenztabelle und ein Diagramm der Änderungen der Fehlergröße.

Streudiagramm ist ein Diagramm der Abweichung der vom Modell vorhergesagten Werte von den tatsächlichen Werten. Diese Diagramme werden für kontinuierliche Größen verwendet. Eine visuelle Beurteilung der Qualität des konstruierten Modells ist erst am Ende des Modellbauprozesses möglich.

Kontingenztabelle Wird zur Auswertung der Klassifizierungsergebnisse verwendet. Solche Tabellen werden für verschiedene Klassifizierungsmethoden verwendet. Wir haben sie bereits in früheren Vorlesungen verwendet. Eine Beurteilung der Qualität des konstruierten Modells ist erst am Ende des Modellbauprozesses möglich.

Diagramm der Änderung des Fehlerwerts. Die Grafik zeigt die Änderung der Fehlergröße während des Modellbetriebs. Während des Betriebs neuronaler Netze kann der Benutzer beispielsweise die Fehleränderung der Trainings- und Testsätze beobachten und das Training stoppen, um ein „Übertraining“ des Netzes zu verhindern. Dabei können die Qualität des Modells und seine Änderungen direkt während des Modellaufbauprozesses beurteilt werden.

Beispiele für Visualisierungstools, die bei der Interpretation des Ergebnisses helfen, sind: Trendlinie in der linearen Regression, Kohonen-Karten, Streudiagramm in der Clusteranalyse.

Visualisierungsmethoden

Visualisierungsmethoden werden je nach Anzahl der verwendeten Messungen üblicherweise in zwei Gruppen eingeteilt:

Darstellung von Daten in einer, zwei und drei Dimensionen;

Darstellung von Daten in vier oder mehr Dimensionen.

Darstellung von Daten in einer, zwei und drei Dimensionen

Diese Methodengruppe umfasst bekannte Methoden zur Darstellung von Informationen, die der menschlichen Vorstellungskraft zugänglich sind. Fast jedes moderne Data-Mining-Tool umfasst visuelle Darstellungsmethoden aus dieser Gruppe.

Abhängig von der Anzahl der Dimensionen der Darstellung können diese auf folgende Weise erfolgen:

univariate Messung, oder 1-D;

bivariate Messung, oder 2-D;

dreidimensionale oder Projektionsmessung, oder 3-D.

Es ist zu beachten, dass das menschliche Auge zweidimensionale Darstellungen von Informationen am natürlichsten wahrnimmt.

Bei der Verwendung der zwei- und dreidimensionalen Darstellung von Informationen hat der Benutzer die Möglichkeit, die Muster des Datensatzes zu erkennen:

seine Clusterstruktur und Verteilung von Objekten in Klassen (z. B. in einem Streudiagramm);

topologische Merkmale;

Vorhandensein von Trends;

Informationen über den relativen Speicherort der Daten;

das Vorhandensein anderer Abhängigkeiten, die dem untersuchten Datensatz innewohnen.

Wenn der Datensatz mehr als drei Dimensionen hat, sind folgende Optionen möglich:

die Verwendung mehrdimensionaler Methoden zur Darstellung von Informationen (sie werden weiter unten besprochen);

Dimensionsreduzierung auf ein-, zwei- oder dreidimensionale Darstellung. Es gibt verschiedene Möglichkeiten, die Dimensionalität zu reduzieren, eine davon – die Faktorenanalyse – wurde in einer der vorherigen Vorlesungen besprochen. Selbstorganisierende Kohonen-Karten werden verwendet, um die Dimensionalität zu reduzieren und gleichzeitig Informationen auf einer zweidimensionalen Karte visuell darzustellen.

Darstellung von Daten in mehr als 4 Dimensionen

Darstellungen von Informationen in vier oder mehr Dimensionen sind für die menschliche Wahrnehmung unzugänglich. Es wurden jedoch spezielle Methoden entwickelt, um es einem Menschen zu ermöglichen, solche Informationen anzuzeigen und wahrzunehmen.

Die bekanntesten Methoden der mehrdimensionalen Informationsdarstellung:

parallele Koordinaten;

∙ „Chernovs Gesichter“;

Radarkarten.

Parallele Koordinaten

In parallelen Koordinaten werden Variablen horizontal kodiert, die vertikale Linie definiert den Wert der Variablen. Ein Beispiel für einen Datensatz, der in kartesischen Koordinaten und parallelen Koordinaten dargestellt wird, ist in Abb. dargestellt. 16.1. Diese Methode zur Darstellung mehrdimensionaler Daten wurde 1985 von Alfred Inselberg erfunden.

Dieser Artikel wurde von einem Vertreter von DevExpress verfasst und in einem Blog auf HabraHabr veröffentlicht.

Medizinische Forscher haben herausgefunden, dass ein Mensch nur 70 % der darin enthaltenen Informationen aufnimmt, wenn die Gebrauchsanweisung eines Arzneimittels nur Text enthält. Wenn man die Anleitung mit Bildern ergänzt, versteht die Person bereits 95 %.

Es ist offensichtlich, dass Menschen dazu veranlagt sind, visuelle Informationen zu verarbeiten. Die Datenvisualisierung eignet sich nicht nur hervorragend für die Verarbeitung durch unser Gehirn, sondern hat auch mehrere Vorteile:

  • Konzentrieren Sie sich auf verschiedene Aspekte von Daten


Mithilfe von Grafiken können Sie die Aufmerksamkeit des Lesers leicht auf die roten Indikatoren lenken.

  • Analyse eines großen Datensatzes mit komplexer Struktur
  • Die Informationsüberflutung einer Person reduzieren und ihre Aufmerksamkeit aufrechterhalten
  • Eindeutigkeit und Klarheit der Ausgabedaten
  • Hervorhebung der in Informationen enthaltenen Zusammenhänge und Beziehungen


Wichtige Daten sind in der Grafik leicht zu erkennen.

Ästhetischer Anreiz


Ästhetisch ansprechende Grafiken machen die Datenpräsentation eindrucksvoll und einprägsam.

Edward Tufte, Autor einiger der besten Bücher zum Thema Visualisierung, beschreibt Visualisierung als ein Werkzeug zur Darstellung von Daten; Ermutigung des Betrachters, über das Wesentliche nachzudenken, nicht über die Methodik; Vermeiden Sie eine Verzerrung der Aussagekraft der Daten. Anzeige vieler Zahlen auf kleinem Raum; Darstellung eines großen Datensatzes als kohärentes und einheitliches Ganzes; Ermutigung des Betrachters zum Vergleichen von Daten; dienen ziemlich klaren Zwecken: Beschreibung, Recherche, Bestellung oder Dekoration ().

Wie nutzt man die Datenvisualisierung richtig?

Der Erfolg der Visualisierung hängt direkt von der richtigen Anwendung ab, nämlich von der Wahl des Diagrammtyps, seiner richtigen Verwendung und Gestaltung.


Der Erfolg einer Visualisierung hängt zu 60 % von der Wahl des Diagrammtyps ab, zu 30 % von der richtigen Verwendung und zu 10 % von der richtigen Gestaltung.

Korrekter Diagrammtyp

Mit einem Diagramm können Sie die durch die Daten vermittelte Idee am vollständigsten und genauesten ausdrücken. Daher ist es sehr wichtig, den geeigneten Diagrammtyp auszuwählen. Die Auswahl kann mit folgendem Algorithmus getroffen werden:

Visualisierungsziele- Dies ist die Umsetzung des Hauptgedankens von Informationen. Dazu müssen die ausgewählten Daten angezeigt werden, welche Wirkung erzielt werden soll - Beziehungen in den Informationen identifizieren, Verteilung der Daten, Zusammensetzung oder Vergleich anzeigen von Dateien.


Die erste Zeile zeigt Diagramme mit dem Zweck, die Beziehungen in den Daten und die Verteilung der Daten darzustellen, und die zweite Zeile dient dazu, die Zusammensetzung und den Vergleich der Daten anzuzeigen.

Beziehungen in Daten- dadurch sind sie voneinander abhängig, die Verbindung zwischen ihnen. Mithilfe von Beziehungen können Sie das Vorhandensein oder Nichtvorhandensein von Abhängigkeiten zwischen Variablen ermitteln. Wenn die Hauptidee der Informationen die Formulierungen „bezieht sich auf“, „nimmt ab/zunimmt bei“ enthält, dann sollten Sie sich bemühen, die Zusammenhänge in den Daten genau darzustellen.
Bei der Verteilung von Daten geht es darum, wie sie relativ zu etwas angeordnet sind und wie viele Objekte in bestimmte aufeinanderfolgende Bereiche numerischer Werte fallen. Die Grundidee wird die Formulierungen „im Bereich von x bis y“, „Konzentration“, „Häufigkeit“, „Verteilung“ enthalten.

Datenzusammensetzung- Daten kombinieren, um das Gesamtbild als Ganzes zu analysieren, Komponenten vergleichen, die einen Prozentsatz eines bestimmten Ganzen ausmachen. Schlüsselbegriffe für die Zusammensetzung sind „aus x % zusammengesetzt“, „Anteil“, „Anteil am Ganzen“.

Datenvergleich – Kombinieren von Daten, um bestimmte Indikatoren zu vergleichen und festzustellen, wie Objekte zueinander in Beziehung stehen. Es handelt sich auch um einen Vergleich von Komponenten, die sich im Laufe der Zeit ändern. Schlüsselbegriffe für Ideen beim Vergleich sind „mehr als/weniger als“, „gleich“, „Änderungen“, „Erhöhungen/Verringerungen“.

Nachdem Sie den Zweck der Visualisierung definiert haben, müssen Sie den Datentyp bestimmen. Sie können in ihrer Art und Struktur sehr heterogen sein, unterscheiden im einfachsten Fall jedoch zwischen kontinuierlichen numerischen und zeitlichen Daten, diskreten Daten, geografischen und logischen Daten. Kontinuierliche numerische Daten enthalten Informationen über die Abhängigkeit eines numerischen Werts von einem anderen, beispielsweise Graphen von Funktionen wie y=2x. Kontinuierliche Zeit enthält Daten über Ereignisse, die über einen bestimmten Zeitraum auftreten, beispielsweise ein täglich gemessenes Temperaturdiagramm. Diskrete Daten können Abhängigkeiten von kategorialen Mengen enthalten, beispielsweise ein Diagramm der Anzahl der Warenverkäufe in verschiedenen Geschäften. Geografische Daten enthalten verschiedene Informationen zu Standort, Geologie und anderen geografischen Indikatoren. Ein Paradebeispiel ist eine reguläre geografische Karte. Logische Daten zeigen die logische Anordnung von Komponenten relativ zueinander, beispielsweise einen Stammbaum.


Diagramme kontinuierlicher numerischer und zeitlicher Daten, diskreter Daten, geografischer und logischer Daten.

Je nach Ziel und Daten können Sie den für sie am besten geeigneten Zeitplan auswählen. Am besten ist es, Vielfalt um der Vielfalt willen zu vermeiden und nach dem Prinzip „Je einfacher, desto besser“ zu wählen. Verwenden Sie bestimmte Diagrammtypen nur für bestimmte Daten. In anderen Fällen sind die gängigsten Diagramme gut geeignet:

  • linear
  • mit Flächen
  • Spalten und Histogramme (Balken)
  • Kreisdiagramm (Kuchen, Donut)
  • Polarkarte (Radar)
  • Streudiagramm (Streuung, Blase)
  • Karten
  • Bäume (Baum, mentale Karte, Baumkarte)
  • Zeitdiagramme (Zeitleiste, Gantt, Wasserfall).

Liniendiagramme, Flächendiagramme und Histogramme können mehrere Werte in einem Argument für eine Kategorie enthalten, die entweder absolut (dann wird bei diesen Diagrammtypen das Präfix „stacked“ hinzugefügt) oder relativ (vollständig gestapelt) sein können.


Diagramm mit gestapelten Werten und mit vollständig gestapelten Werten

Bei der Auswahl eines geeigneten Diagramms können Sie sich an der folgenden Tabelle orientieren, die auf Basis dieses Diagramms erstellt wurde und:


Richtige Verwendung eines Diagramms

Es ist nicht nur wichtig, den richtigen Diagrammtyp auszuwählen, sondern ihn auch richtig zu verwenden:

  • Es ist nicht erforderlich, das Diagramm mit vielen Informationen zu laden. Die optimale Anzahl verschiedener Datentypen und Kategorien beträgt nicht mehr als 4-5, andernfalls ist es ratsamer, ein solches Diagramm in mehrere Teile zu unterteilen.


Ein solches Diagramm kann mit Spaghetti verglichen werden und wird besser in mehrere Diagramme unterteilt.

Wählen Sie den richtigen Maßstab und Maßstab für das Diagramm aus. Bei Histogrammen und Flächendiagrammen ist es vorzuziehen, die Werteskala bei Null zu beginnen. Versuchen Sie, keine umgekehrten Skalen zu verwenden – dies führt den Betrachter sehr oft hinsichtlich der Daten in die Irre.


Eine falsche Skala wirkt sich negativ auf die Wahrnehmung von Daten aus. Im ersten Fall ist der Maßstab falsch gewählt, im zweiten Fall ist der Maßstab invertiert.

  • Bei Tortendiagrammen und Grafiken, die einen Prozentsatz eines Gesamtanteils darstellen, sollte die Summe der Werte immer 100 % ergeben.
  • Für eine bessere Wahrnehmung der Daten ist es besser, die Informationen auf der Achse zu organisieren – entweder nach Wert, alphabetisch oder nach logischer Bedeutung.

Korrekte Gestaltung des Zeitplans

Nichts ist für das Auge schöner als gut gestaltete Grafiken, und nichts verdirbt Diagramme mehr als das Vorhandensein von grafischem „Müll“. Grundprinzipien des Designs:

  • Verwenden Sie Paletten mit ähnlichen, nicht hellen Farben und beschränken Sie sich auf einen Satz von sechs Teilen
  • Hilfs- und Nebenleitungen sollten einfach und nicht auffällig sein


Hilfslinien in einem Diagramm sollten die Aufmerksamkeit nicht vom Hauptgedanken der Daten ablenken.

  • Verwenden Sie nach Möglichkeit nur horizontale Achsenbeschriftungen.
  • Für Flächendiagramme ist es vorzuziehen, eine Farbe mit Transparenz zu verwenden;
  • Verwenden Sie für jede Kategorie im Diagramm eine andere Farbe.

Schlussfolgerungen

Visualisierung- ein leistungsstarkes Werkzeug zur Übermittlung von Gedanken und Ideen an den Endverbraucher, ein Assistent zur Wahrnehmung und Analyse von Daten. Aber wie alle Werkzeuge muss es zu seiner eigenen Zeit und an seinem eigenen Ort verwendet werden. Andernfalls können Informationen langsam oder sogar falsch wahrgenommen werden.


Die Diagramme zeigen die gleichen Daten, die wichtigsten Visualisierungsfehler werden links angezeigt und rechts korrigiert.

Bei geschickter Anwendung kann die Datenvisualisierung Material beeindruckend, interessant und einprägsam machen.

Das Senden Ihrer guten Arbeit an die Wissensdatenbank ist ganz einfach. Nutzen Sie das untenstehende Formular

Studierende, Doktoranden und junge Wissenschaftler, die die Wissensbasis in ihrem Studium und ihrer Arbeit nutzen, werden Ihnen sehr dankbar sein.

Gepostet auf http://www.allbest.ru/

MERKMALE DER VISUELLEN METHODE DER INFORMATIONSPRÄSENTATION

Vashunina I.V.

Die im Artikel gezogenen Schlussfolgerungen zu den Besonderheiten der visuellen Informationsvermittlung basieren auf den Ergebnissen einer experimentellen Untersuchung der Wahrnehmung kreolisierter Texte (Texte mit Illustrationen). Im Rahmen der Studie wurde festgestellt, dass es möglich ist, durch die Verwendung bestimmter Bildparameter (Farbraum, geometrische Formen, Anordnung von Bildelementen) verbal nominierte Qualitäten visuell darzustellen und die statische Wahrscheinlichkeit der Visualisierung einer bestimmten Qualität zu bestimmen. Die Idee, dass Konzepte visuell dargestellt werden können, ist nicht neu. Die Möglichkeit, abstrakte Konzepte zu visualisieren, wurde von A. Paivio vorgeschlagen. Basierend auf dem Material der russischen Sprache wurde diese Idee in den Werken von V.F. entwickelt. Petrenko. Das Erkennen der Existenz einer Semantik von Farbe und geometrischer Form ist ohne das Erkennen der Visualisierbarkeit einer Vielzahl von Konzepten unmöglich. Basierend auf den Ergebnissen unserer Forschung möchten wir einige Merkmale der visuellen Methode der Informationspräsentation und ihre Unterschiede zur verbalen Methode hervorheben.

Durch die Analyse experimenteller Daten konnten wir die allgemeinste Schlussfolgerung ziehen, dass es unmöglich ist, denselben Inhalt auf unterschiedliche Weise, verbal und visuell, absolut identisch zu vermitteln. Verbal präsentierte Informationen können grundsätzlich nicht mit visuell präsentierten Informationen identisch sein (eine Ausnahme wäre wahrscheinlich die Beschreibung von Grafiken und Diagrammen). Und dies erklärt sich nicht nur aus den Einschränkungen, die durch die Möglichkeiten des Formulars entstehen. Viel wichtiger sind die inhaltlichen Unterschiede. Beim Wahrnehmen, wie E.S. schreibt. Kubryakov: „Zunächst wird die mentale Struktur des Wahrgenommenen gebildet (normalerweise ist sie, wie es scheint, reicher als das Konzept, da sie mit einem reichen Netzwerk taktiler Empfindungen verbunden ist, die von außen wahrgenommen werden, mit der Darstellung des Visuellen Aussehen des Objekts, seine physikalischen Eigenschaften wie Größe, Lage, Form, Geruch usw.)“ . Im Zuge der „Konditionierung“ kommt es zu „einer gewissen Reduzierung des vorhandenen Bildes einer Sache, der Wahl des Merkmals oder der Merkmale, die das Objekt als Ganzes darstellen können“. Das heißt, der Prozess der Symbolisierung eines Bildes ist ein Prozess seiner Reduktion. Abgesehen von der Frage, wie genau die für eine bestimmte Kategorie von Objekten relevanten und im Bild enthaltenen Merkmale bestimmt werden, stellen wir lediglich fest, dass in vielen Fällen weder Farbe noch räumliche Anordnung (und manchmal auch geometrische Form) im Bild enthalten sind. Das heißt, diese Zeichen unterliegen einer Reduzierung. Mit ihnen verschwindet natürlich auch der Inhalt, den sie transportieren können.

Schauen wir uns einige Beispiele an. Wie im Forschungsprozess festgestellt wurde, verwirklicht das Bild einer runden Form nicht nur den Begriff „rund“, sondern teilweise (mit unterschiedlicher Wahrscheinlichkeit) auch den Begriff „schwer“, „weich“, „schlaff“. Der dabei entstehende Begriffskomplex „rund, etwas schwer, etwas weich, etwas träge“ lässt sich nur schwer in Worte fassen (wie der Ausdruck „etwas…“ zeigt, der sehr bedingt ist und den Inhalt des Bildes annähernd wiedergibt) . Und offensichtlich wird sich der Inhalt dieses Bildes vom Inhalt des Wortes „gerundet“ unterscheiden. Betrachten wir das Bild, das die Farbe Orange im Bewusstsein hervorruft. Diese Farbe wird mit Feuer, Hitze, Sonnenuntergang, Süden, Orangen assoziiert und wird als warm, fröhlich, trocken, lebhaft, unruhig, aktiv, fröhlich, strahlend, laut, frisch, schön, sauber, jung empfunden. Der verbale Ausdruck dieses Begriffskomplexes ist eher konventionell. Das Farbempfinden ist synthetisch, also eine Verschmelzung der aufgeführten verbalen Merkmale, die sich durch ein einfaches Experiment leicht verifizieren lässt. Es reicht aus, einen beliebigen gemalten Raum zu betrachten, und die Farbe wird ein ganzheitliches Gefühl hervorrufen, das dann in seine Bestandteile zerlegt und nur bewusst verbalisiert werden kann. Wir betrachten ein solches verbale Merkmal als den Inhalt eines Farbreizes, obwohl sein Inhalt tatsächlich dieselbe primäre ganzheitliche Empfindung ist. „Die „Konditionalisierung“ der Welt führt zu einer strengeren Fixierung bestimmter Vorstellungen im menschlichen Geist“, allerdings werde mit der Verbalisierung das Primärbild einer Reduktion unterliegen.

Während des Experiments wurden die Visualisierungsfähigkeiten von 50 Qualitäten ermittelt, und in keinem Fall wurde eine eindeutige Übereinstimmung zwischen „Qualität und visuellem Bildparameter“ festgestellt. Auch wenn eine verbal bezeichnete Qualität in 100 % der Fälle eine einzige Variante der visuellen Darstellung aufweist, erweist sich der Inhalt des entsprechenden Bildparameters als umfassender. Beispielsweise wird die Definition von „blass“ zu 100 % durch die Verwendung blasser Töne im Bild visualisiert. Allerdings hat der visuelle Parameter „pale“ auch eine inhaltliche Komponente „light“, die im Wort „pale“ fehlt. Das heißt, wenn man dieses visuelle Merkmal als „blass“ verbalisiert, wird nur ein Teil seiner Bedeutung kodiert. Da wir die Möglichkeiten der visuellen Darstellung inhaltlich völlig unterschiedlicher Merkmale untersucht haben, kann kaum davon ausgegangen werden, dass andere Konzepte über grundsätzlich andere Visualisierungsmöglichkeiten verfügen.

Darüber hinaus werden Spracheinheiten in bestimmte Wortarten (Substantive, Adjektive, Verben) unterteilt, „die bei ihrer Verwendung unterschiedliche Bewusstseinsstrukturen aktivieren und in uns unterschiedliche Assoziationen, Eindrücke, Bilder, Bilder, Szenen usw. hervorrufen: unterschiedliche Ideen und unterschiedliche Arten von Darstellungen.“ Die Unterteilung verbalisierter Bedeutungsbestandteile in Wortarten, also in Gegenstände, Handlungen und Zeichen, ist auf die Unvermeidlichkeit des Auftretens morphologischer Kategorien in der verbalen Sprache zurückzuführen. Um beispielsweise die Farbe Orange zu charakterisieren, ist die Unterscheidung „Feuer brennend brennend“ überhaupt nicht wichtig. Wie von E.S. Kubryakov zufolge können dieselben Entitäten durch unterschiedliche Wortarten kodiert werden. Dahinter stecken jedoch etwas andere Vorstellungen: Beispielsweise wird die Idee der Dynamik mit der Verwendung verbaler Prädikate verbunden, und die Idee der Statik wird mit der Verwendung nonverbaler Prädikate verbunden. Dieser Inhalt ergänzt den Inhalt des Farbreizes, der je nach seinen Eigenschaften (Farbton, Sättigung, Helligkeit) selbst ein Gefühl von Dynamik oder Statik erzeugen kann. So kommt es bei der Verbalisierung einerseits zu einer Reduzierung der visuellen Informationen (unvermeidlich im Prozess der Symbolisierung) und andererseits zu deren Hinzufügung aufgrund der spezifischen Eigenschaften verbaler Einheiten (ebenfalls unvermeidlich aufgrund der Teilung). Wörter in Wortarten umwandeln).

Das Fehlen einer Eins-zu-eins-Entsprechung zwischen verbalen und visuellen Einheiten bestätigt die Annahme unterschiedlicher Realitätsaufteilungen im Prozess der Verarbeitung verbaler und visueller Informationen. Dies bedeutet einerseits, dass das Ergebnis der Verarbeitung inhaltlich unterschiedliche Einheiten und Strukturen sein wird, und andererseits, dass die Existenz von verbalen und visuellen Einheiten gleichen Inhalts ausgeschlossen ist.

Bei der Verarbeitung visueller Informationen ist die Einheit ein Objekt oder, falls nicht vorhanden, ein separater Parameter, beispielsweise eine Farbe oder Form. Wenn wir Objekte im Bild als Inhalt hervorheben, nehmen wir eine Synthese des Inhalts des im Bild dargestellten realen Objekts der Realität, der Farbempfindung und der Formempfindung wahr. Es ist die Synthese dieser Inhalte, für deren Entstehung das Verhältnis der Komponenten wichtig ist und nicht die Einzelwerte des Objekts, der Farbe und der Form. Beim Betrachten eines Bildes nehmen wir das Gesamtbild wahr, was zur Entstehung komplexer synthetischer Einheiten führt. Der genaue Inhalt dieser Einheiten lässt sich nur schwer in Worte fassen. Jeder kennt die Situation, wenn man bei der Beschreibung von Bildern das Gefühl hat, dass die verbale Sprache unzureichend und ungenau ist, dass etwas fehlt oder falsch formuliert ist. Wir glauben, dass der Grund dafür in der unterschiedlichen Aufteilung der Realität während der Wirkung der Mechanismen der Verarbeitung verbaler und visueller Informationen liegt, die es uns nicht erlaubt, die visuelle „Sprache“ auf absolut identische Weise ins Verbale zu „übersetzen“.

All dies eröffnet einen neuen Ansatz für das Problem der Illustration verbaler Texte. Es beleuchtet vier Aspekte.

Erstens kann die Illustration eines verbalen Textes als Versuch betrachtet werden, die Bestandteile des Bildes einer Situation, die im Prozess der Verbalisierung zwangsläufig reduziert wurde, wiederherzustellen und den durch die Verwendung sprachlicher Einheiten eingeführten Inhalt aus diesem Bild zu entfernen. Wir verwenden das Wort „Versuch“, weil der Autor der Illustration sich nicht genau vorstellen kann, welches Bild der Situation im Kopf des Autors des verbalen Textes existierte (es wird angenommen, dass es sich um verschiedene Personen handelt). Das Situationsbild wird durch die Wiederherstellung formaler Merkmale (Farbe, Form, räumliche Anordnung der Elemente) mit der damit verbundenen Wirkung auf den Rezipienten bereichert. Offensichtlich lässt sich nach der Lektüre über einen Mann im roten Hemd nicht mit Sicherheit sagen, ob das Bild des Autors die Semantik der Farbe (feierliches Rot, fröhliches Rot, blutiges Rot, flammendes Rot) enthielt, die dann während der Verbalisierung verschwand, oder ob Der Autor operierte von Anfang an mit verbalen Einheiten. Der Illustrator löst dieses Problem selbst und stützt sich dabei auf die inhaltlichen und konzeptionellen Informationen des verbalen Textes. E.S. Kubryakova bemerkt: „Der Unterschied in den sprachlichen Formen bei der Vermittlung ähnlicher Inhalte weist darauf hin, dass dieser Inhalt selbst mit unterschiedlichen Nuancen dargestellt wird und letztendlich bei der Benennung unterschiedliche Bilder des Signifikats hervorruft.“ Jedes sprachliche Zeichen und/oder jeder sprachliche Ausdruck hinterlässt seine Spuren in den Ideen, die er anregt.“ Daher „spiegelt oder zeigt die Sprache nicht nur die Realität, wie wir sie uns vorzustellen gewohnt sind: Sie strukturiert sie weitgehend selbst, denn sie diskretisiert alles Existierende, sie erschafft sie selbst.“ Das Bild „löscht“ den Abdruck des Einsatzes sprachlicher Mittel aus dem Bild der Situation, „erodiert“ etwas die durch die Sprache geschaffene Struktur, „belebt“ das dem Wortgebrauch zugrunde liegende figurative Prinzip wieder und befriedigt so den Wunsch des Einzelnen danach bringen Bedeutungen in ihrem Bewusstsein „zur sinnlichen Objektivität der Welt“ zurück. Gleichzeitig können neue Bilder in den Köpfen der Empfänger auftauchen, da „im Kopf einer Person viele Fragmente der Realität durch Bilder dargestellt werden und vieles in das Sichtfeld gelangen und gesehen (und verstanden) werden kann, ohne dass eine …“ besondere Bezeichnung dafür.“ Konzepte und Ideen sind unabhängig von der Sprache, einige Bilder haben keine verbalen Bezeichnungen (oder diese Bezeichnungen sind ungenau, das Gefühl ist durch Unbestimmtheit und Mehrdeutigkeit gekennzeichnet (was beispielsweise eher der Semantik von Farben als von Wörtern entsprechen kann), diese Merkmale Funktionsstörungen des Bewusstseins führen dazu, dass Teilbilder eher visuell als verbal dargestellt werden können. Wenn der Illustrator die Absicht des Autors verzerrt (absichtlich oder unabsichtlich), dann „führt“ die Illustration den Rezipienten davon ab, die Bedeutung des ihr innewohnenden verbalen Textes durch den Autor zu verstehen, und trägt in gewissem Maße zur Schaffung einer neuen Bedeutung bei anders als das Original. In den allermeisten Fällen geschieht genau das, da der Illustrator die Subjektivität seiner Wahrnehmung praktisch nicht loswerden kann.

Zweitens vereint die Illustration die visuellen Bilder, die bei der Wahrnehmung eines verbalen Textes in den Köpfen der Rezipienten entstehen. E.S. Kubryakova bemerkt: „Imaginative Darstellungen sind subjektiv und nicht konventioneller Natur, und selbst wenn es einen realen Bezugspunkt für sie gibt, können sie in den Köpfen verschiedener Menschen unterschiedliche Darstellungen haben.“ Die Gültigkeit dieser Aussage wird durch die Reaktion der Betrachter auf Illustrationen berühmter literarischer Werke und Verfilmungen bestätigt: Die Wirkung enttäuschter Erwartungen zeigt sich oft dann, wenn die visuelle Verkörperung nicht den Vorstellungen der Rezipienten entspricht. Die Illustration eines dem Rezipienten unbekannten Textes soll zur Entstehung visueller Bilder führen, die der Künstler vorschlägt.

Drittens (und das ist besonders wichtig) ist die Illustration im Wesentlichen ein Versuch, das Bild des Inhalts eines verbalen Textes neu zu strukturieren. Durch die Verwendung von Bildparametern, die einen dreidimensionalen Inhalt haben (z. B. eine große oder kleine Farbgebung) und daher ein großes Wirkungspotenzial haben, wird die Wirkung der Wahrnehmung von verbalen Texten deutlich verstärkt. Daher sollte die Frage der Illustration verbaler Texte unter dem Gesichtspunkt der Zweckmäßigkeit einer inhaltlichen Änderung betrachtet werden.

Viertens müssen wir berücksichtigen, dass die Erstellung von Texten für die Massenkommunikation pragmatische Ziele verfolgt. In der Sozialpsychologie gibt es zwei Möglichkeiten, die Einstellungen von Menschen zu ändern: zentrale und periphere. Der zentrale Weg ist die Überzeugung, und der periphere Weg besteht darin, das Thema oder den Gegenstand der Einstellung mit positiven oder negativen Zeichen zu verknüpfen. Und wenn der Zweck der Erstellung eines verbalen Textes darin besteht, die Einstellungen der Rezipienten entlang des zentralen Weges zu verändern, dann ist die Illustration eine der Optionen für den peripheren Weg, die unter Bedingungen der Nichtkritik seitens der Rezipienten durchgeführt wird. Für den Fall, dass die aus der Abbildung gewonnenen Informationen (und deren Wirkung von den Empfängern nicht wahrgenommen wird) erheblich vom Inhalt des verbalen Textes abweichen (oder ihm widersprechen), gibt es allen Grund, von einem Versuch auszugehen, die Wahrnehmung der Informationen zu manipulieren seitens der Macher des CT.

Literatur

Visualisierung kreolisierter Textinformationen

1. Vashunina I.V. Das Zusammenspiel visueller und verbaler Komponenten bei der Wahrnehmung kreolisierter Texte. Nischni Nowgorod, 2007.

2. Wygotski L.S. Psychologie der Kunst. M., 1987.

3. Kubryakova E.S. und andere. Ein kurzes Wörterbuch kognitiver Begriffe. M., 1996.

4. Kubryakova E.S. Sprache und Wissen. Auf dem Weg zum Erwerb von Sprachkenntnissen: Wortarten aus kognitiver Sicht. Die Rolle der Sprache beim Verständnis der Welt. M., 2004.

5. Leontyev A.N. Aktivität. Bewusstsein. Persönlichkeit. M., 1975.

6. Tarasov E.F. Die Rolle der emotionalen und ästhetischen Organisation von Sprachbotschaften in der Massenkommunikation // Emotionale Wirkung der Massenkommunikation. M., 1978..

Gepostet auf Allbest.ru

Ähnliche Dokumente

    Wesen, Typen, Eigenschaften, Wirkungen der Wahrnehmung. Funktionen und Merkmale der visuellen Wahrnehmung. Durchführung einer Studie unter Studierenden zur Ermittlung der Merkmale der Wahrnehmung aggressiver Reize in Abhängigkeit von den bereitgestellten Informationen und Analyse der Ergebnisse.

    Kursarbeit, hinzugefügt am 18.03.2015

    Allgemeine Vorstellung von Wahrnehmung. Wahrnehmungsentwicklung im Vorschulalter (5-6 Jahre). Ermittlung der Fähigkeit eines Kindes, die Form von Objekten ganzheitlich wahrzunehmen, des Stands seiner grafischen Fähigkeiten und der Fähigkeit, asymmetrische Bilder zu erstellen.

    Kursarbeit, hinzugefügt am 19.02.2011

    Psychologische Analyse kognitiver Prozesse beim Lesen von Texten: Das Problem der Beziehung zwischen der Wahrnehmung und dem Verständnis eines fremdsprachigen Textes durch Schüler. Untersuchungen der Augenbewegungen beim Lesen komplexer Texte. Der Einfluss der Zweisprachigkeit auf die Entwicklung von HMF: eine neuropsychologische Analyse.

    Zusammenfassung, hinzugefügt am 18.03.2010

    Grundlegende mentale Prozesse. Reflexion der Eigenschaften von Objekten und Phänomenen der materiellen Welt. Theorien, die die Natur menschlicher Empfindungen erklären. Grundlegende Eigenschaften der Darstellung. Allgemeine Merkmale der Wahrnehmung. Die Beziehung zwischen Empfindungen, Wahrnehmungen und Ideen.

    Zusammenfassung, hinzugefügt am 30.11.2015

    Lebensqualität als Bestandteil moderner Wissenschaft. Psychologische Aspekte der Wahrnehmung von Lebensqualitätskomponenten. Ganzheitliche subjektiv-evaluative Komponenten der Lebensqualität. Analyse einer Studie zur Wahrnehmung der Lebensqualität durch die Bevölkerung der Region Astrachan.

    Dissertation, hinzugefügt am 08.11.2011

    Analyse der operativen und offiziellen Aktivitäten des Grenzdienstes der Russischen Föderation. Merkmale der Entwicklung der Wahrnehmungskonstanz bei Grenzschutzbeamten. Beobachtung ist die am weitesten entwickelte Form der absichtlichen Wahrnehmung. Grundübungen zur Entwicklung der Wahrnehmung.

    Kursarbeit, hinzugefügt am 02.08.2012

    Ansätze in- und ausländischer Psychologen zur Erforschung der visuellen Wahrnehmung und des räumlichen Denkens bei Kindern. Ergebnisse einer experimentellen Studie zur Entwicklung der visuellen Wahrnehmung und des räumlichen Denkens bei Grundschulkindern.

    Zusammenfassung, hinzugefügt am 13.10.2015

    Die Idee der Zeit in verschiedenen wissenschaftlichen Konzepten. Psychologische Merkmale von Kindern im Grundschulalter. Methoden zur experimentellen Untersuchung der Abhängigkeit der Zeitvorstellung bei Grundschulkindern von der vorherrschenden Denkweise.

    Dissertation, hinzugefügt am 01.10.2011

    Das Problem der positiven Persönlichkeitsentwicklung und der Bildung einer positiven Weltwahrnehmung bei modernen Schulkindern. Positive persönliche Eigenschaften und ihre Beziehungen zu Wertorientierungen der Persönlichkeit eines Teenagers. Geschlechtsmerkmale der Entwicklung ihrer Qualitäten.

    Dissertation, hinzugefügt am 16.06.2017

    Das Studium der Empfindung und Wahrnehmung als Reflexion der Eigenschaften und Qualitäten von Objekten oder Phänomenen im Bewusstsein. Aufmerksamkeit als Konzentration des Bewusstseins einer Person auf bestimmte Arten von Aktivitäten. Der Prozess der Vorstellungskraft und des Denkens. Die Bedeutung von Gedächtnis und Sprache für den Menschen.

Mit zunehmender Menge der gesammelten Daten wird es selbst bei Verwendung noch so leistungsstarker und vielseitiger Data-Mining-Algorithmen immer schwieriger, die erhaltenen Ergebnisse zu „verdauen“ und zu interpretieren. Und wie Sie wissen, ist eines der Prinzipien von DM die Suche nach praktisch nützlichen Mustern. Ein Muster kann nur dann praktisch nützlich sein, wenn es konzeptualisiert und verstanden werden kann.

Zu den Methoden der visuellen oder grafischen Darstellung von Daten gehören Grafiken, Diagramme, Tabellen, Berichte, Listen, Blockdiagramme, Karten usw.

Traditionell wurde die Visualisierung als Hilfsmittel zur Datenanalyse angesehen, doch mittlerweile deuten immer mehr Untersuchungen auf ihre eigenständige Rolle hin.

Herkömmliche bildgebende Verfahren können folgende Anwendungen haben:

dem Benutzer Informationen in visueller Form präsentieren;

beschreiben Sie kompakt die dem Originaldatensatz innewohnenden Muster;

Dimensionalität reduzieren oder Informationen komprimieren;

Lücken im Datensatz schließen;

Suchen Sie Rauschen und Ausreißer im Datensatz.

Visualisierungsmethoden

Bildgebende Verfahren werden, abhängig von der Anzahl der verwendeten Messungen, akzeptiert

in zwei Gruppen eingeteilt:

Darstellung von Daten in einer, zwei und drei Dimensionen;

Darstellung von Daten in vier oder mehr Dimensionen.

Darstellung von Daten in mehr als 4 Dimensionen

Darstellungen von Informationen in vier oder mehr Dimensionen sind für die menschliche Wahrnehmung unzugänglich. Es wurden jedoch spezielle Methoden entwickelt, um es einem Menschen zu ermöglichen, solche Informationen anzuzeigen und wahrzunehmen.

Die bekanntesten Methoden der mehrdimensionalen Informationsdarstellung:

parallele Koordinaten;

„Chernovs Gesichter“;

Radarkarten.

Darstellung räumlicher Eigenschaften

Ein eigener Bereich der Visualisierung ist die visuelle Darstellung

räumliche Eigenschaften von Objekten. In den meisten Fällen heben solche Tools einzelne Regionen auf der Karte hervor und kennzeichnen sie je nach Wert des analysierten Indikators in unterschiedlichen Farben.



Die Karte wird als grafische Oberfläche dargestellt, die Daten in Form einer dreidimensionalen Landschaft aus beliebig definierten und positionierten Formen (Balkendiagramme mit jeweils individueller Höhe und Farbe) anzeigt. Mit dieser Methode können Sie die quantitativen und relationalen Merkmale räumlich orientierter Objekte klar darstellen

Daten und erkennen schnell Trends darin.

Data-Mining-Prozess. Domänenanalyse. Formulierung des Problems. Datenaufbereitung.

Data-Mining-Prozess. Anfangsstadien

Der DM-Prozess ist eine Art Erkundung. Wie jede Forschung besteht dieser Prozess aus bestimmten Phasen, einschließlich Elementen des Vergleichs, der Typisierung, der Klassifizierung, der Verallgemeinerung, der Abstraktion und der Wiederholung.

Der DM-Prozess ist untrennbar mit dem Entscheidungsprozess verbunden.

Der DM-Prozess erstellt ein Modell und der Entscheidungsprozess basiert auf diesem Modell.

Betrachten Sie den traditionellen DM-Prozess. Es umfasst die folgenden Schritte:

Analyse des Themenbereichs;

Darstellung des Problems;

Datenaufbereitung;

Baumodelle;

Testen und Bewerten von Modellen;

Auswahl des Modells;

Anwendung des Modells;

Korrektur und Aktualisierung des Modells.

In dieser Vorlesung werfen wir einen genaueren Blick auf die ersten drei Phasen des Data Mining-Prozesses.

Die restlichen Schritte werden in der nächsten Vorlesung besprochen.

Stufe 1. Domänenanalyse

Studie- Dies ist der Prozess der Erkenntnis eines bestimmten Themenbereichs, Objekts oder Phänomens mit einem bestimmten Zweck.

Der Forschungsprozess besteht in der Beobachtung der Eigenschaften von Objekten, um aus Sicht des Fachforschers wichtige natürliche Zusammenhänge zwischen Indikatoren dieser Eigenschaften zu identifizieren und zu bewerten.

Die Lösung jedes Problems in der Softwareentwicklung muss mit dem Studium des Fachgebiets beginnen.

Fachbereich- ist ein geistig begrenzter Bereich der Realität, der einer Beschreibung oder Modellierung und Forschung unterliegt.

Der Themenbereich besteht aus Objekten, die sich durch Eigenschaften auszeichnen und in bestimmten Beziehungen zueinander stehen oder auf irgendeine Weise interagieren.

Fachbereich- das ist Teil der realen Welt, sie ist unendlich und enthält beides

signifikante und nicht signifikante Daten aus Sicht der durchgeführten Forschung.

Der Forscher muss in der Lage sein, einen wesentlichen Teil davon zu identifizieren. Zum Beispiel bei der Lösung des Problems „Soll ich einen Kredit vergeben?“ Alle Daten über das Privatleben des Klienten sind wichtig, einschließlich der Frage, ob der Ehegatte berufstätig ist, ob der Klient minderjährige Kinder hat, welchen Bildungsstand er hat usw. Um ein anderes Bankproblem zu lösen, werden diese Daten absolut unwichtig sein. Die Wesentlichkeit der Daten hängt somit von der Wahl des Fachgebiets ab.