In der Übersicht
Das Projekt zielt auf die Konzeption und Umsetzung eines Proof-of-Concepts (PoC) für eine KI-unterstützte Enterprise Search Engine, welche die Nutzung heterogener und überwiegend unstrukturierter Unternehmensdaten ermöglicht. Ausgangspunkt ist die Situation, dass die vorhandenen Datenbestände des Unternehmens über mehrere operative Systeme verteilt sind, darunter Fileserver, MailStore und ERP-Systeme, und bisher nur eingeschränkt systematisch durchsucht und ausgewertet werden können. Gleichzeitig besteht ein strategisches Interesse daran, Künstliche Intelligenz künftig stärker für Wissensmanagement, Entscheidungsunterstützung und Prozessautomatisierung einzusetzen.
Der geplante PoC verfolgt daher zwei zentrale Zielsetzungen: Erstens soll eine technische Grundlage für eine strukturierte Datenorganisation geschaffen werden, indem eine automatisierte Ingestion- und Indexierungs-Pipeline entwickelt wird, die bestehende Datenquellen virtuell integriert, ohne die Originaldaten zu migrieren. Zweitens soll eine KI-gestützte Suchfunktion realisiert werden, die es Mitarbeitenden ermöglicht, Informationen über natürliche Sprachabfragen zu finden. Die Suchoberfläche wird dabei hybride Suchmethoden kombinieren, also sowohl klassische keywordbasierte als auch semantische Suchverfahren, und Antworten mit nachvollziehbaren Quellenangaben liefern. Hierbei sollen insbesondere Benutzerberechtigungen für die Sicherheit zentral sind.
Das Projekt umfasst mehrere Arbeitspakete. Zunächst erfolgt eine strukturierte Voranalyse geeigneter Standardsoftwarelösungen für Enterprise Search, wobei Kriterien wie Sicherheitsmechanismen, Integrationsfähigkeit, API-Offenheit sowie KI- und RAG-Fähigkeiten berücksichtigt werden. Darauf aufbauend wird eine Datenpipeline implementiert, welche ausgewählte Datenquellen erschliesst, Metadaten extrahiert und Inhalte für semantische Suchverfahren aufbereitet. Anschliessend wird eine prototypische Chatbot-Oberfläche entwickelt, die auf Retrieval-Augmented Generation (RAG) basiert und mithilfe lokaler Sprachmodelle Antworten generiert.