Name: Lavanya, M.: Vision-basierte Deep-Web-Datenextraktion für Web-Dokument-Clustering
Brand: Verlag Unser Wissen
SKU: 9786205023426

1

Vision-basierte Deep-Web-Datenextraktion für Web-Dokument-Clustering

DE NW

ISBN: 9786205023426 bzw. 6205023423, in Deutsch, Verlag Unser Wissen, neu.

€ 79,90
unverbindlich

Lieferung aus: Deutschland, zzgl. Versandkosten.
Der VDEC-Ansatz besteht aus zwei Phasen: 1) Vision-basierte Webdatenextraktion und 2) Clustering von Webdokumenten. In Phase 1 werden die Webseiteninformationen in verschiedene Chunks segmentiert, aus denen überschüssiges Rauschen und doppelte Chunks mit Hilfe von drei Parametern wie Hyperlink-Anteil, Rauschwert und Kosinusähnlichkeit entfernt werden. Um die relevanten Chunks zu identifizieren, werden drei Parameter wie die Relevanz des Titelworts, die auf der Häufigkeit von Schlüsselwörtern basierende Chunk-Auswahl und Positionsmerkmale verwendet, und dann wird aus diesen Hauptchunks eine Reihe von Schlüsselwörtern extrahiert. Schließlich werden die extrahierten Schlüsselwörter mit Hilfe von Fuzzy C-Means Clustering (FCM) einem Webdokumentencluster unterzogen. Die vorgeschlagene visuelle Datenextraktion für das Deep Web wurde implementiert und mit einem synthetischen Datensatz getestet. Die Ergebnisse werden mit zwei existierenden Algorithmen verglichen, zum einen mit dem Vision-based Data Record Extraction (ViDE) und zum anderen mit dem Mining Data Region (MDR) Algorithmus. Aus den experimentellen Ergebnissen, die auf zwei verschiedenen synthetischen Datensätzen durchgeführt wurden, geht hervor, dass die vorgeschlagene VDEC-Methode stabile und gute Ergebnisse von etwa 99,2 % und 99,1 % Genauigkeit in beiden Datensätzen mit verschiedenen Schwellenwerten erzielen kann. 22.0 x 15.0 x 1.2 cm, Buch.

Mehr beobachten speichern

Bestellen bei Thalia.de

bezahlter Link

2

Symbolbild

Lavanya, M.

Vision-basierte Deep-Web-Datenextraktion für Web-Dokument-Clustering

~DE NW

ISBN: 9786205023426 bzw. 6205023423, vermutlich in Deutsch, Verlag Unser Wissen, neu.

€ 79,90
unverbindlich

Lieferung aus: Deutschland, zzgl. Versandkosten.
Der VDEC-Ansatz besteht aus zwei Phasen: 1) Vision-basierte Webdatenextraktion und 2) Clustering von Webdokumenten. In Phase 1 werden die Webseiteninformationen in verschiedene Chunks segmentiert, aus denen überschüssiges Rauschen und doppelte Chunks mit Hilfe von drei Parametern wie Hyperlink-Anteil, Rauschwert und Kosinusähnlichkeit entfernt werden. Um die relevanten Chunks zu identifizieren, werden drei Parameter wie die Relevanz des Titelworts, die auf der Häufigkeit von Schlüsselwörtern basierende Chunk-Auswahl und Positionsmerkmale verwendet, und dann wird aus diesen Hauptchunks eine Reihe von Schlüsselwörtern extrahiert. Schließlich werden die extrahierten Schlüsselwörter mit Hilfe von Fuzzy C-Means Clustering (FCM) einem Webdokumentencluster unterzogen. Die vorgeschlagene visuelle Datenextraktion für das Deep Web wurde implementiert und mit einem synthetischen Datensatz getestet. Die Ergebnisse werden mit zwei existierenden Algorithmen verglichen, zum einen mit dem Vision-based Data Record Extraction (ViDE) und zum anderen mit dem Mining Data Region (MDR) Algorithmus. Aus den experimentellen Ergebnissen, die auf zwei verschiedenen synthetischen Datensätzen durchgeführt wurden, geht hervor, dass die vorgeschlagene VDEC-Methode stabile und gute Ergebnisse von etwa 99,2 % und 99,1 % Genauigkeit in beiden Datensätzen mit verschiedenen Schwellenwerten erzielen kann.

Mehr beobachten speichern

Bestellen bei Buecher.de

bezahlter Link

Vision-basierte Deep-Web-Datenextraktion für Web-Dokument-Clustering2 Angebote vergleichen

Vision-basierte Deep-Web-Datenextraktion für Web-Dokument-Clustering

Vision-basierte Deep-Web-Datenextraktion für Web-Dokument-Clustering

Vision-basierte Deep-Web-Datenextraktion für Web-Dokument-Clustering
2 Angebote vergleichen