In Geschäftsidee, Idee - Web, Innovation

Kann Diffbot die Suche revolutionieren?

Die Google-Suchroboter suchen nicht nach Sinnzusammenhängen, sondern nach „Textschnipseln“. Deshalb gelingt es selten, wenn man nach einem bestimmten Begriff in Google sucht, dass man dank der Suchtrefferanzeige in Google auf Anhieb die Webseiten findet, die einem bei der weiteren Recherche zum entsprechenden Thema wirklich weiterhelfen können. Die Hoffnung besteht seit Jahren darin, dass semantische Websuchalgorithmen hier Abhilfe schaffen. Wirklich überzeugende Ergebnisse habe ich bisher noch nicht finden können. Jetzt bin ich dank Technology Review auf das StartUp und Suchroboter Diffbot gestoßen.

Rachel Metz beschreibt in seinem TR-Artikel die Funktionsweise wie folgt: „Das US-Start-up Diffbot … aus dem kalifornischen Palo Alto hat einen semantischen Erkennungsroboter für Websites entwickelt, der sich über eine eigene Programmierschnittstelle (API) in andere Anwendungen integrieren lässt. Das System kann die verschiedenen Objekte, die eine Internet-Seite ausmachen, „lesen“. Das soll Inhalteanbietern dann erlauben, Bereiche von Websites beispielsweise für mobile Anwendungen aufzubereiten oder das Absuchen großer Web-Angebote erleichtern, um die wirklich relevanten Teile zu finden.“

Spannend finde ich, dass man mit Hilfe von Diffbot nicht nur themenrelevante Webseiten schnell finden kann, sondern auch den Content der eigenen Webseite schnell und effektiv aufbereiten lassen kann. Das kann nicht nur hilfreich sein, um den Content für mobile Angebote aufzubereiten, sondern um ganz neue Contentformate entwickeln zu können. Bis zu einem gewissen Umfang ist die Leistung von Diffbot sogar kostenfrei. Nur wer Diffbot überdurchschnittlich intensiv nutzt, muss dafür bezahlen. Das klingt nach einem durchdachten Einnahmenmodell. Das kann ein Grund sein, warum auch VC-Investoren schon begeistert werden konnten.

Rachel Metz beschreibt im TR-Artikel die Entstehung und aktuellen Entwicklungsstand: „Diffbot-Gründer Mike Tung hat die Grundzüge seines Verfahrens vor einigen Jahre an der Stanford University entwickelt, als er dort seinen Masterstudiengang ablegte. Die Diffbot-API ist für einzelne Kunden bereits seit dem vergangenen Jahr verfügbar. Sie kann aktuell zwei Arten von Web-Seiten analysieren: Auf Artikelseiten identifiziert Diffbot Schlagzeilen, Haupttext, Bilder und Tags, auf regulären Homepages werden grundlegende Layout-Elemente wie Headerbilder, Links zu Artikeln und Werbung identifiziert. Aktuell nutzen mehrere Tausend Programmierer den Dienst und analysieren jeden Monat über 100 Millionen URLs, sagt Tung.“

Noch steht Diffbot am Anfang. Von den 18 Webseiten-Haupttypen hat Diffbot gerade 2 Typen erfasst. Es fehlen noch Typen wie Produkt-, Jobseiten oder Fotogalerien. Die 2 Mio. USD, die von VC´s eingesammelt wurden, sollen u.a. darauf verwendet werden, um die anderen Webseitentypen auch erfassen zu können. Wer mehr über Diffbot erfahren will, dem sei obiges Interview zwischen dem Diffbot-Gründer Mike Tung und Robert Scoble empfohlen. Mehr Infos gibt u.a. bei Techcrunch. Ich bin zuversichtlich, dass wir von Diffbot noch viel hören werden.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.