Sie sind hier

Kommandozeilentools

Indexieren verschiedener Datenquellen ist z.B. für die Integration in bestehende Infrastruktur und Zusammenspiel mit bestehenden Tools sowie für maßgeschneiderte und feine Steuerung auch nach Unix- und Linux-Philosophie sehr einfach mittels Kommandozeilentools z.B. in Skripten, für regelmässige Aufrufe per Cron oder für Administrationsarbeiten per Kommandozeile möglich:

Datei indexieren

So wird eine einzige Datei indexiert:

solr-index-file Dateiname

Verzeichnis indexieren

So wird ein Verzeichnis bzw. alle darin und in Unterverzeichnissen enthaltenen Dateien indexiert:

solr-index-dir Verzeichnisname

Verzeichnisse beobachten

Verzeichnis beobachten und neue oder geänderte Dateien sofort indexieren (sehr schnelle Auffindbarkeit bei neuen Dateien oder Änderungen bei im Vergleich zu ständigen Aufrufen von solr_indexdir geringer Ressourcenverbrauch, vor allem zwischen Millionen von Dateien und im Gigabyte und Terabytebereich):

solr-monitordir Verzeichnisname

Wird beim Aufruf kein Verzeichnis als Parameter angegeben, werden die in der Konfigurationsdatei /etc/solr/monitor angegebenen Verzeichnisse monitored.

RSS-Newsfeeds indexieren

So werden alle im RSS-Feed verlinkten Artikel abgerufen und indexiert:

solr-index-rss http://www.opensemanticsearch.de/feed

Twitter indexieren

So werden Tweets indexiert:

solr-index-twitter --timeline @opensemsearch
solr-index-twitter --search #OpenSemanticSearch

Mehr zu Parametern und Optionen unter Twitter bzw. Tweets indexieren