Indexieren verschiedener Datenquellen ist z.B. für die Integration in bestehende Infrastruktur und Zusammenspiel mit bestehenden Tools sowie für maßgeschneiderte und feine Steuerung auch nach Unix- und Linux-Philosophie sehr einfach mittels Kommandozeilentools z.B. in Skripten, für regelmässige Aufrufe per Cron oder für Administrationsarbeiten per Kommandozeile möglich:
Datei indexieren
So wird eine einzige Datei indexiert:
solr-index-file Dateiname
Verzeichnis indexieren
So wird ein Verzeichnis bzw. alle darin und in Unterverzeichnissen enthaltenen Dateien indexiert:
solr-index-dir Verzeichnisname
Verzeichnisse beobachten
Verzeichnis beobachten und neue oder geänderte Dateien sofort indexieren (sehr schnelle Auffindbarkeit bei neuen Dateien oder Änderungen bei im Vergleich zu ständigen Aufrufen von solr_indexdir geringer Ressourcenverbrauch, vor allem zwischen Millionen von Dateien und im Gigabyte und Terabytebereich):
solr-monitordir Verzeichnisname
Wird beim Aufruf kein Verzeichnis als Parameter angegeben, werden die in der Konfigurationsdatei /etc/solr/monitor angegebenen Verzeichnisse monitored.
RSS-Newsfeeds indexieren
So werden alle im RSS-Feed verlinkten Artikel abgerufen und indexiert:
solr-index-rss http://www.opensemanticsearch.de/feed
Twitter indexieren
So werden Tweets indexiert:
solr-index-twitter --timeline @opensemsearch
solr-index-twitter --search #OpenSemanticSearch
Mehr zu Parametern und Optionen unter Twitter bzw. Tweets indexieren