staging.inyokaproject.org

Dezentrale Suchmaschine YaCy in Version 1.0 erschienen

software.png

Die freie Peer-to-Peer-Suchmaschine YaCy besteht mittlerweile aus über 600 einzelnen Knoten – Zeit für ein 1.0-Release.

Dem YaCy-Projekt sind zentrale Suchmaschinen seit langem ein Dorn im Auge. Sie entscheiden darüber, welche Seiten besucht werden durch beispielsweise eine personalisierte Suche – was nur zu Zensur und Missbrauch einlade, so die Entwickler von YaCy. Daher wurde eine freie Software geschaffen, die verteiltes Suchen erlaubt.

YaCy_logo.png
YaCy Logo

Verteilt bedeutet, dass im Prinzip jeder, der mitmachen möchte Teil des Suchnetzwerkes sein kann. Dazu installiert man sich die Software der Suchmaschine auf seinen Rechner und basierend auf dem Peer-to-Peer-Prinzip werden gefundene Seiten ausgetauscht und untereinander vernetzt. Dabei kann nach der Philosophie jeder seine eigene Suche abstimmen, so lassen sich unter anderem Relevanz-Kriterien festlegen. Schließlich legt der eine mehr Wert auf populäre, unterhaltsame Artikel, während der andere eher ein Faible für wissenschaftlich korrekte Arbeit hat.

Allerdings bedeutet das auch, dass man keine wirkliche Kontrolle über die Indexierung der Webseiten hat. Es besteht also das Problem ungewollt Seiten aufzurufen und zu indizieren, deren Inhalt nicht dem geltenden Recht entsprechen. Ob und wie das zu rechtlichen Problemen führen kann, scheint (noch?) unklar. Außerdem wird bei Peer-to-Peer von gutwilligen Nutzern ausgegangen, mit etwas Aufwand ließe sich aber auch Spam verbreiten – was natürlich nicht im Sinne des Projektes ist.

Eine zentrale Idee des Projektes ist es die Privatsphäre des Einzelnen zu erhalten und den Datenschutz herzustellen. So werden Suchbegriffe verschlüsselt, bevor sie weiter versendet werden. Auch die Möglichkeit einer Zensur bestimmter Webseiten ist nahezu ausgeschlossen, da hierfür alle Knoten im YaCy-Netzwerk vom Zensor kontrolliert werden müssten.

Dabei kann die Suchmaschine nicht nur für das Durchsuchen des gesamten Internets genutzt werden, sondern auch für die Suche auf einem Portal eignet sie sich: Die Free Software Foundation nutzt sie zum Beispiel.

Ob und wann YaCy dem Ziel nahe kommt zentrale Suchmaschinen abzulösen und den Weg zu freiem Informationszugang zu ebnen, bleibt allerdings abzuwarten. Das liegt zum einem an der geringeren Verbreitung und zum anderen an der noch eingeschränkten Bekanntheit von YaCy.

Quellen: Pro-Linux, YaCy.net 🇩🇪 , Kopie der Announcement-Mail 🇬🇧

Veröffentlicht von Keba | 29. November 2011 22:00 | Kategorie: Software | # Fehler im Artikel melden

zerwas

Avatar von zerwas
1 29. November 2011 23:17

Ein wichtiges Projekt, das es verdient unterstützt zu werden.

Wutze

2 30. November 2011 00:58

Die Idee dahinter ist sicher nicht schlecht. Unterstützung verdient so eine Idee mit Sicherheit. Ob es aber zu einem Ersatz taugt? Das hat hier weniger mit einer Verbreitung und Bekanntheit zu tun als mit technischer Machbarkeit.

Denn wenn ich mir ansehe was für ein Aufwand an Technik notwendig ist nur um allein die englische Wikipedia zu durchforsten?! 1,3 Terrabyte, so in der Größenordnung etwa? Wie soll das für das ganze Internet funktionieren?

Also ich bin hier skeptisch ...

EnTeQuAk

Avatar von EnTeQuAk
3 30. November 2011 05:40

@2: So, wie das Torrentprinziep viele Petabyte an Daten zu sehr guten Datenraten tagtäglich durch das Internet jagt, auch hier ist ein enorm großer Datenspeicher vorhanden - und YaCy funktioniert schlicht und einfach nach dem selben Prinziep. Das Problem was ich eher sehe, ist das YaCy bezüglich der Heuristik derzeit massive Probleme hat und bis auf Domainspezifische Indices aus dem Internet verglichen mit anderen Suchmaschinen eher schlechte Ergebnisse zurückliefert, kann aber auch eher eine persönliche Meinung sein das ich nur nach dem falschen gesucht habe ☺

YaCy besitzt mitlerweile auch enorme Indiziergeschwindigkeiten, mitsamt dem Remote-Index-Trigger frisst sich der Cluster ja derzeit mit ~260.000 Pages per Minute durchs Netz, das war vor 2 Jahren noch anders, und auch die Benutztung der JVM hat sich gebessert meiner Meinung, früher hat sich YaCy gern aufgehangen, bisher auch nichts wieder davon gesehen.

Alles in allem: 👍

burli

Avatar von burli
4 30. November 2011 11:20

Hab sie gestern mal ausprobiert. Für den Laien viel zu unübersichtlich. Allein deshalb schon nicht massentauglich, es sei denn, man bietet einen öffentlich zugänglichen Server.

Wer hinter einem Router sitzt muss da eine Portweiterleitung einrichten, sonst bringt das auch wenig.

Außerdem nicht gerade ressourcenschonend. Rechner mit 2GB und weniger brauchen das denke ich nicht als Dauerinstallation.

Ubuntu_Neuling_1981

Avatar von Ubuntu_Neuling_1981
5 30. November 2011 18:22

YaCy erst mal testen … ob das gut ist ?!

Ryuno-Ki

Avatar von Ryuno-Ki
6 30. November 2011 19:16

Grundsätzlich bin ich so einem Projekt gegenüber aufgeschlossen - allerdings muss ich leider immer öfter feststellen, dass Google dennoch die besten (im Sinne von Treffergenauigkeit und Umfang) Ergebnisse liefert :-/

Nichtsdestotrotz versuche ich es anfangs mit alternativen Suchmaschinen.

Frage: Kann man YaCy auch ohne Installation nutzen? Wenn ja, wie?

Wutze

7 1. Dezember 2011 02:56

@3 Mit einem Torrent ja auch möglich. Nur müssten dann mehrere Suchmaschinen (Installationen) miteinander interagieren, damit nicht ein und die selbe Seite von (Beispielsweise) Wikipedia mehrfach und demnach unsinnigerweise zum gleichen Zeitpunkt mehrfach indiziert werden. Im Moment ist es aber eher so, dass sich jede Installation in der Hinsicht nur um sich selbst kümmert. Wenn ich das ganze da richtig verstanden habe. Und wenn ich mir deren Forum so durchlese sind da teils aberwitzige Maschinen dabei. So 90GB RAM und mehr, damit eben solche umfangreichen Webseiten tatsächlich auch ohne Probleme indiziert werden können. Ganz zu schweigen vom Plattenplatz, den man notwendigerweise benötigt.

Wie gesagt, die Idee dahinter ist nicht schlecht. Jedoch bin ich mir fast sicher, dass dieses Konzept ohne "Zentrale" keinen Erfolg haben dürfte. Denn hört einer der Betreiber auf, wars das mit diesen Datensätzen da. Die sind dann weg und man müsste von vorne anfangen.

Wie gesagt, die Idee find ich cool, aber ich bin momentan nicht wirklich überzeugt davon. Ich würd es zwar gerne testen, aber ich mag nun auch nicht meinen Server damit "belasten". Der hat an sich genug anderes zu tun. Wenn auch nicht ständig ;o)

ann

8 1. Dezember 2011 21:21

YaCy Paket in Arbeit

kili4n

9 2. Dezember 2011 21:43

@7: Sicherlich ist eine dezentrale Suchmaschine wesentlich schwieriger umzusetzen wie eine zentrale. Wenn ein Betreiber aufhört ist das nicht weiter schlimm, da die RWI (Reverse Word Indexes) über DHT auf andere Peers verteilt wird, und so die Daten im Idealfall in mehrfacher Redundanz vorliegen.

Ich freu mich schon auf die FreedomBox. Jeder hat sein eigenes Social Network laufen (z.B. Diaspora), und seine eigene Suche ( YaCy ). Und das ganz ohne große Firmen, die nur "Böses" wollen ☺ Edit: YaCy läuft auch ganz gut auf jedem Desktop-PC.

gothiccry

Avatar von gothiccry
10 3. Dezember 2011 09:13

@8: Wäre cool ☺ !!!

burli

Avatar von burli
11 3. Dezember 2011 10:32

@9: Du hast noch einen eigenen Jabber Chat Server vergessen. 😉 Wobei Jabber nicht wirklich "verteilt" ist sondern einfach nur aus einer beliebigen Anzahl an Servern besteht.

Und gibt es eigentlich noch andere (verteilte) Dienste in der Art?

kili4n

12 4. Dezember 2011 00:24

@11: klar. Spontan faellt mir das anonymisierungnetzwerk i2p ein. Es gibt diverse verteilte emailsysteme. bittorrent noch vielleicht ☺

Schallrauch

13 4. Dezember 2011 14:59

Da ich gerade am Überlegen bin, ob es nicht Alternativen zur ewigen Googelei gibt, scheint mir dieses Projekt sehr interssant zu sein.

Folgender Satz aus dem Bericht macht mir aber die größten Sorgen: "Ob und wie das zu rechtlichen Problemen führen kann, scheint (noch?) unklar."

Technische und organisatorische Dinge lassen sich auf die Reihe kriegen, wenn aber erst mal die Juristen loslegen, wird's haarig. Ich bin keiner von denen, aber mir fiel beim Lesen des Artikel gleich der Begriff "Störerhaftung" ein, mit dem unsere Gerichte immer wieder um sich werfen.

Sild

14 4. Dezember 2011 21:41

@13: Es gibt auch so andere Suchmaschinen als Google.

Ich benutze in der Regel ecosia.org und bei Problemen scroogle.org

jakon

Lokalisierungsteam

15 4. Dezember 2011 22:02

@12: Verteilte E-Mail-Systeme? Hört sich aufregend an. 😉 Dann erhalten ganz viele unbekannte Server meine E-Mails? 😀

E-Mail ist eigentlich doch an sich verteilt: Es gibt viele Server die untereinander kommunizieren können.

zephir

Avatar von zephir
16 6. Dezember 2011 13:27

@13:

Folgender Satz aus dem Bericht macht mir aber die größten Sorgen: "Ob und wie das zu rechtlichen Problemen führen kann, scheint (noch?) unklar."

Wenn es funktioniert wird sich früher oder später auch unsere Regierung daran stören, da es unzensiert und ohne zentrale Kontrolle ist. Die Argumentation wird zwar nicht einfach, schließlich indixiert auch Google rechtlich bedenkliche Seiten und kommt damit durch, aber da wird sich schon ein weg finden, da bin ich gnaz pessimistisch.

knutselaar

17 7. Dezember 2011 15:51

Ich finde auch, dass sowas wie YaCy dringend noetig ist... zumal wg. der marktbeherrschenden Stellung von Gugl. Vielleicht spende ich den YaCY-Machern mal was... (Hier uebrigens ecosia.org am Start, und wenn ich doch Gugl nutze, nur mit Adblock).

--stefan--

18 9. Dezember 2011 17:42

Ich habe mir gerade ecosia.org angesehen und bin auf folgenden Artikel gestoßen: http://www.greencomputingportal.de/artikel/gruene-suchmaschinen-was-steckt-dahinter/

Den sollten sich die Befürworter dieser Suchmaschine mal ansehen. Er gibt zumindest zu denken.