Markdown, lokale Dateien und Wissensgraphen – wie sich Unternehmenswissen ohne SaaS-Lock-in strukturieren lässt
SerieUnternehmenswissen KI-fähig machen
Teil 2 von 4
Teil 1 dieser Serie hat das Problem benannt: Unternehmenswissen ist verstreut, und KI kann ohne strukturierten Kontext wenig damit anfangen. Bevor es um KI geht, muss aber das Wissen selbst geordnet werden. Genau hier setzt dieser Teil an – am Beispiel von Obsidian, einem Werkzeug, das sich besonders gut eignet, weil es einfach genug für den Alltag und offen genug für spätere Automatisierung ist.
Wichtig vorweg: KI spielt in diesem Artikel bewusst noch fast keine Rolle. Die Frage lautet zunächst nur: Wie organisiert man Unternehmenswissen überhaupt sinnvoll?
Was Obsidian ist
Obsidian ist im Kern eine Anwendung zum Schreiben und Verknüpfen von Notizen. Was es von den meisten Tools unterscheidet, ist die Grundlage: Jede Notiz ist eine schlichte Markdown-Datei, die als reine Textdatei auf der eigenen Festplatte liegt. Es gibt keine Datenbank im Hintergrund, kein proprietäres Format, keinen Pflicht-Cloud-Account. Obsidian ist im Grunde ein eleganter Editor über einem Ordner voller Textdateien.
Diese Einfachheit ist kein Mangel, sondern der eigentliche Vorteil. Eine Sammlung von Markdown-Dateien ist das wohl langlebigste Format, das man für Wissen wählen kann. Es lässt sich mit jedem Texteditor öffnen, mit jedem Werkzeug durchsuchen, mit Git versionieren und von jedem Programm weiterverarbeiten – auch von einem KI-System. Genau diese Maschinenlesbarkeit wird in den späteren Teilen der Serie zur entscheidenden Eigenschaft.
Warum Markdown relevant ist
Markdown ist eine einfache Auszeichnungssprache: Überschriften, Listen, Links und Hervorhebungen werden mit wenigen Zeichen markiert, der Text bleibt aber lesbar. Für ein Unternehmens-Gehirn ist das aus mehreren Gründen die richtige Wahl.
Markdown ist zukunftssicher, weil es reiner Text ist. Ein Word-Dokument von vor fünfzehn Jahren öffnet sich heute oft nur noch mit Mühe; eine Textdatei von vor fünfzig Jahren öffnet sich immer. Markdown ist versionierbar: Weil es Text ist, lässt sich mit Git Zeile für Zeile nachvollziehen, wer was wann geändert hat – dieselbe Disziplin, die in der Softwareentwicklung längst selbstverständlich ist. Und Markdown ist strukturiert genug für Maschinen: Überschriften und Abschnitte geben einem KI-System genau die Gliederung, die es braucht, um Wissen in sinnvolle Einheiten zu zerlegen.
Lokale Dateien statt SaaS-Lock-in
Der zweite große Unterschied zu Werkzeugen wie Notion liegt im Hosting-Modell. Bei einem reinen Cloud-Dienst liegen die Inhalte auf fremden Servern, in einem Format, das man nicht kontrolliert, erreichbar nur über die Schnittstellen, die der Anbieter vorsieht. Solange alles funktioniert, ist das bequem. Problematisch wird es bei Preisänderungen, Funktionsabschaltungen, Ausfällen – oder wenn sensible Daten das Haus gar nicht erst verlassen dürfen.
Obsidian dreht das um. Die Daten liegen lokal, das Werkzeug greift nur darauf zu. Daraus ergeben sich mehrere konkrete Vorteile:
Datensouveränität. Kundendaten, interne Prozesse, Vertragsdetails – nichts davon verlässt zwangsläufig die eigene Infrastruktur. Für regulierte Branchen und DSGVO-sensible Kontexte ist das oft kein Komfort-, sondern ein Ausschlusskriterium. Dieselbe Logik trägt später die Wahl der KI-Modelle, wie der Artikel zu serverloser KI und Datenschutz zeigt.
Offlinefähigkeit. Das Wissen ist auch ohne Internetverbindung verfügbar. Es gibt keine Abhängigkeit von der Verfügbarkeit eines externen Dienstes.
Keine Vendor-Lock-in-Falle. Weil die Inhalte einfache Dateien sind, ist ein Wechsel jederzeit möglich. Man ist nicht an Obsidian gebunden – die Dateien funktionieren auch ohne. Das nimmt der Entscheidung das Risiko: Sie ist umkehrbar.
Die Grundbausteine: Vault und Struktur
Der zentrale Begriff in Obsidian ist der Vault – nichts anderes als ein Ordner, der alle Notizen eines Wissensbereichs enthält. Ein Unternehmen kann mit einem einzigen Vault für das gesamte Wissen starten oder mehrere Vaults für klar getrennte Bereiche anlegen (etwa interne Prozesse versus Kundenwissen).
Innerhalb des Vaults entsteht die eigentliche Ordnung über die Ordnerstruktur. Es gibt keine vorgeschriebene Form, aber eine sinnvolle Struktur orientiert sich an der Arbeitsrealität des Unternehmens:
Diese Struktur ist ein Beispiel, kein Dogma. Entscheidend ist, dass sie der Denkweise des Unternehmens folgt und nicht einer abstrakten Theorie. Wissen, das so abgelegt ist, wie es im Alltag entsteht und gebraucht wird, wird auch gepflegt. Eine zu kunstvolle Struktur verkommt dagegen schnell zur Karteileiche.
Was hineingehört
Ein Unternehmens-Gehirn lebt von dem Wissen, das sonst nirgends sauber abgelegt ist. Vier Kategorien sind besonders wertvoll:
Prozesse und SOPs. Wie läuft das Onboarding ab? Wie wird ein Angebot erstellt? Was passiert im Eskalationsfall? Genau dieses Prozesswissen ist es, das bei Personalwechsel verloren geht – und das, sauber dokumentiert, später auch von einer KI als verlässliche Grundlage genutzt werden kann.
Kundenwissen. Nicht die Stammdaten aus dem CRM, sondern der Kontext: Vorgeschichte, Besonderheiten, getroffene Absprachen, sensible Punkte. Das ist das Wissen, das sonst nur in einzelnen Köpfen existiert.
Kampagnen und Projekte. Was wurde versucht, was hat funktioniert, was nicht, und warum. Dieses Erfahrungswissen verhindert, dass dieselben Fehler doppelt gemacht werden.
Entscheidungen. Eine oft unterschätzte Kategorie: festzuhalten, warum etwas so entschieden wurde. Solche Entscheidungsarchive verhindern, dass Diskussionen im Kreis laufen, und sie geben späteren Lesern – Menschen wie Maschinen – den fehlenden Kontext.
Wissensgraphen: Verknüpfung statt Hierarchie
Die zweite Säule neben der Ordnerstruktur sind Verknüpfungen. In Obsidian wird mit einer einfachen Klammer-Schreibweise von einer Notiz auf eine andere verwiesen. Aus diesen Verweisen entsteht automatisch ein Netz – der Wissensgraph, den Obsidian auch visuell darstellen kann.
Dieses Netz bildet ab, wie Wissen tatsächlich zusammenhängt: Ein Kunde hängt an einem Projekt, das Projekt an einem Prozess, der Prozess an einer Entscheidung. Eine reine Ordnerhierarchie kann das nicht leisten, weil eine Datei nur in einem Ordner liegen kann – Wissen aber zu vielen Dingen gleichzeitig gehört. Die Verknüpfungen lösen dieses Problem, ohne die Ablage zu verdoppeln.
Für den späteren KI-Einsatz sind diese expliziten Verbindungen Gold wert. Sie sind bereits eine Form von strukturiertem Kontext – maschinenlesbare Aussagen darüber, was womit zusammenhängt. Wie aus diesem Netz ein echter Wissensgraph für Maschinen wird, ist Thema von Teil vier.
Vom Einzelplatz zum Team
Obsidian ist zunächst eine lokale Anwendung für einen Rechner. Für den Unternehmenseinsatz braucht es eine Synchronisation. Hier gibt es bewusst mehrere Wege, gestaffelt nach Anspruch:
Für kleine Setups genügt der offizielle Sync-Dienst oder eine geteilte Ablage über vorhandene Mittel. Für technisch versierte Teams bietet sich Git an – derselbe Mechanismus, mit dem Software versioniert wird, mit vollständiger Änderungshistorie und nachvollziehbarem Wer-hat-wann-was. Für datenschutzkritische Umgebungen lässt sich die Synchronisation über die eigene Infrastruktur lösen, etwa über ein NAS, Nextcloud oder einen selbst betriebenen Sync. Das Wissen bleibt dann vollständig im eigenen Haus – eine Grundlage, die mit der lokalen KI-Infrastruktur aus den späteren Teilen zusammenpasst und sich an Setups wie lokaler Hardware mit Proxmox anschließen lässt.
Der nächste Schritt
An diesem Punkt existiert ein geordneter, lokaler, maschinenlesbarer Wissensbestand – aber noch keine KI, die damit arbeitet. Das ist Absicht. Eine gute Wissensstruktur ist die Vorbedingung, nicht das Ergebnis von KI-Einsatz.
Teil 3 verbindet beide Welten: Er zeigt, wie KI über RAG wirklich auf diesen Wissensbestand zugreift – mit Embeddings, semantischer Suche und Vektordatenbanken – und welche Rolle dabei lokale und europäische Modelle spielen. Erst dann wird aus dem geordneten Vault ein Unternehmens-Gehirn, das auf Fragen antwortet.