2018-10-03 07:44:32

Dropbox Suchmaschine Nautilus

Mit Nautilus führt Dropbox eine neue, personalisierte Volltext-Suchmaschine ein, die in den vergangenen Monaten von einem auf die Suchinfrastruktur spezialisierten Team bei Dropbox entwickelt wurde.

Dropbox möchte allen Nutzern helfen, die jeweils relevantesten Dokumente für eine bestimmte Suchanfrage zu finden, und zwar auf möglichst effiziente und stets topaktuelle Weise. Das erfordert die Fähigkeit, sich maschinelle Intelligenz in verschiedenen Stadien in der Such-Pipeline zunutze zu machen – angefangen bei inhaltsspezifischem maschinellen Lernen (wie z. B. Systeme für das Bildverständnis) bis hin zu Lernsystemen, die in der Lage sind, Suchergebnisse anhand der jeweiligen Nutzervorlieben besser einzustufen. Darüber hinaus erfordern solche Systeme zahlreiche Iterationen, bis sie passgenau funktionieren. Daher ist es entscheidend, mit verschiedenen Algorithmen und Subsystemen zu experimentieren und das System Schritt für Schritt zu optimieren. 

Im Gegensatz zu Web-Suchmaschinen spielten bei der Entwicklung von Nautilus nicht nur unterschiedliche Vorlieben und Verhaltensweisen bei Suchläufen eine Rolle, sondern auch die Tatsache, dass jeder Nutzer Zugriff auf einen individuellen Dokumentensatz hat. Zudem ändern sich Teile der Inhalte, die für die Suche indexiert sind, recht häufig. Beispielsweise bei Nutzern, die an einem Bericht oder einer Präsentation arbeiten. Im Zuge der Erarbeitung werden immer wieder neue Versionen gespeichert, was sich auf die Suchbegriffe auswirken kann, über die das Dokument abrufbar sein sollte.

Zu Beginn des Nautilus-Projekts hat sich Dropbox die folgenden Hauptziele gesteckt:

  • Best-in-Class-Performance, Skalierbarkeit und Zuverlässigkeit zu bieten, um dem Datenvolumen gerecht zu werden
  • Eine Grundlage für die Implementierung intelligenter Ranking- und Retrieval-Features für Dokumente zu schaffen
  • Ein flexibles System zu erstellen, in dem Entwickler die Pipelines für die Indexierung und das Query Processing für laufende Experimente problemlos anpassen können
  • Zuverlässige Sicherheitsmaßnahmen bereitstellen, um optimalen Datenschutz der Nutzer zu gewährleisten

Nach einer ausgiebigen Qualifizierungsphase ist Nautilus nun die primäre Suchmaschine bei Dropbox und wird auch in Zukunft kontinuierlich verbessert und weiterentwickelt. 

log

Druckversion